Forum "Analyse phylogénétique"

Thread subject: Arbre

[ Return to forums ]
Arbre
chengbams
22 Apr 2024 13:11
Non evaluated contribution

Professeur,j'ai quelque questions sur cet arbre.Dans la dernière leçon, je vous ai demandé si cet arbre est correct, et vous avez dit que bien que la partie ci-dessus soit un peu mélangée, il n’y a pas de groupe externe dans le groupe d’etude qui contient les protéine interne, donc c’est correct, mais dans le arbre de distance, nous voyons que les protéines sont en dehors du groupe d’etude, et qu’elles constituent un groupe distinct, donc je veux confirmer si cet arbre est correct, pourquoi les deux graphiques sont-ils incohérents ?

PhyML(5)

b.distance

B_WIRTH_WUT_24
25 Apr 2024 11:52
Game master

Bonjour,

 

pourquoi les deux graphiques sont-ils incohérents ?

==> Vous faites la reconstruction phylogénétique avec 2 méthodes différentes (Maximum de vraissemblance et Distance). Ces deux méthodes n'utilisent pas les mêmes critères pour construire les arbres. Par conséquent, le résultat obtenu peut être un peu différent en fonction de la méthode utilisée. C'est d'ailleurs votre cas. Vous avez des différences entre les 2 arbres qui sont liées à la méthode de reconstruction utilisée. 

==> C'est pour cela qu'on vous demande de discuter la congruence entre les deux arbres, de discuter la topologie des 2 arbres, pour voir si vous avez des différences entre les deux, ou si les deux sont strictement identiques (cf paragraphe 1 demandé) :

1. Congruence entre les deux arbres
    -> Décrivez la topologie de chacun des arbres: quels différents groupes monophylétiques observez-vous? 
    -> Est-ce que les deux arbres racontent la même histoire évolutive?
    -> Identifiez les points communs, ainsi que les incohérences éventuelles.

1ère remarque sur vos arbres : Ces deux arbres ne sont pas encore enracinés. Il vous faudra aussi coller dans l'annotathon les arbres enracinés sur le groupe extérieur (cf option reroot outgroup dans Treedyn).

- Pour l'arbre avec la méthode de distance, il faudra enraciner votre arbre sur la branche rouge qui regroupe la majorité des séquences du groupe externe.
Avec cet arbre, vous séparez presque les deux groupes (étude et extrene), à une exception près, la séq BBCCOH1.
Vous avez donc une séquence du groupe externe dans le groupe d'étude : c'est une incohérence avec la taxonomie de référence.
MAIS ce n'est pas grave ! Il faut juste essayer d'expliquer cette incohérence.
Ceci est lié à un événement évolutif (transfert horizontal de gène (HGT) ou duplication).
Le plus probable ici, est que la bactérie BBCCOH1 (du groupe externe) a reçu le gène étudié ici à partir d'une bactérie qui elle appartient au groupe d'étude. C'est un transfert horizontal de gène entre espèces différentes.

Il faut donc discuter ceci dans le paragraphe 2 :
2. Cohérence avec la phylogénie des espèces de référence   -> Les groupes d'étude et extérieurs sont-ils bien séparés?   -> vos arbres phylogénétiques de gènes sont-ils cohérents avec les arbres des espèces ("arbre de la vie")?   -> repérez tout écart avec la phylogénie de référence, et proposez des hypothèses (HGT, duplication de gènes...)

- Pour votre arbre PhyML, il y a plus de mélanges, vous n'arriverez pas à sortir toutes les séquences du groupe externe.
Enracinez votre arbre sur un groupe qui contient la majorité des séquences du groupe externe : par exemple, la branche rouge qui présente la valeur de 0,32.
ATTENTION, l'enracinement avec treedyn dans phylogeny.fr va vous faire perdre les valeurs de support de noeuds (bug avec cet outil), donc :
- soit vous conservez l'arbre PhyML présenté ci-dessus, AVEC les valeurs de support de noeuds, et vous AJOUTEZ l'arbre PhyML enraciné qui aura perdu les valeurs de  support de noeuds;
- soit vous refaites votre arbre PhyML sur le site miroir, http://phylogeny.lirmm.fr/.

Pour l'arbre PhyML, vous aurez donc plus de séquences du groupe externe dans le groupe d'étude : ce n'est pas grave !
C'est une incohérence avec la taxonomie de référence, qu'il faut essayer d'expliquer comme pour l'arbre de distance.
Et c'est une différence avec l'arbre de distance, qu'il faut mentionner !

Enfin, dans l'arbre PhyML, la protéine étudiée émerge dans un groupe monophylétique contenant QUE des séquences du groupe d'étude
et dans l'arbre de distance, elle est proche de ce même groupe.
Mais dans les deux arbres, la protéine étudiée est inclus dans le groupe d'étude.
Et même si vous avez quelques séquences du groupe externe dans le groupe d'étude, vous avez tout de même plus de 90% de séquences du groupe d'étude. On peut donc considérer ce groupe d'étude comme monophylétique, et par conséquent, vous pouvez conclure sur l'appartenance taxonomique de votre séquence.

Bon travail,
Bénédicte WIRTH