Forum "Analyse phylogénétique"

Thread subject: Questions sur la construction des arbres

[ Return to forums ]
Questions sur la construction des arbres
AnaisE
20 Mar 2021 23:59
Non evaluated contribution

Bonjour,

 

J'aurais quelques questions concernant la construction des arbres :

  1. Il n'y a pas de "résultats bruts" à indiquer dans cette section ?
  2. Quel niveau de détail est attendu dans les noms des séquences de l'arbre (class, ordre, famille) ? Pourriez-vous me dire entre mes arbres 1 et 2 ce qui correspond le mieux ?
  3. Pourquoi n'est-ce pas un problème s'il y a des incohérences dans la répartition des branches du groupe extérieur ?
  4. La construction de mes arbres est très sensible aux séquences que je sélectionne pour l'alignement multiple. Si je choisis quelques séquences de Pelagibacter avec une E-valeur inférieur à e-90, je ne parviens plus forcément à séparer mon groupe d'étude de mon groupe extérieur. Est-ce normal, je ne suis vraiment pas au clair sur la manière de choisir les séquences...
Meglecz20CTES
21 Mar 2021 15:55
Game master

Re-bonjour Anaïs,


1.    Il n'y a pas de "résultats bruts" à indiquer dans cette section ?

 

Vous pouvez mettre les arbres en format newick. Cela aide à revenir sur la structure de l’arbre si nécessaire.


2.    Quel niveau de détail est attendu dans les noms des séquences de l'arbre (class, ordre, famille) ? Pourriez-vous me dire entre mes arbres 1 et 2 ce qui correspond le mieux ?

 

Cela dépend de groupe d’étude choisi. Je dirais un niveau taxonomique inférieure de groupe d’étude est optimale. Par exemple, dans votre cas le groupe d’étude est un ordre, et l’affichage des familles pourra être utile pour le groupe d’étude. Pour le groupe extérieur, le niveau ordre est déjà bien. Par simplicité, vous pouvez laisser affiché les lignées jusqu’aux familles, mais choisissez le code couleur en fonction des ordres (comme dans votre arbre2).

L’intérêt de laisser les familles affichées est qu’occasionnellement, cela nous aide d’être plus précises. Par exemple si vous aviez eu plusieurs familles des Pelagibacteriales, et les familles se séparaient dans l’arbre, vous auriez pu assigner l’ORF à une famille à la place de l’ordre.


3.    Pourquoi n'est-ce pas un problème s'il y a des incohérences dans la répartition des branches du groupe extérieur ?

 

Sur base d’une seule protéine, il est difficile à construire un arbre fiable, qui reflète l’histoire évolutive de tous les groupes de différents niveaux. Dans un monde simple avec une BDD complète et précise, on pourra, attendre des arbres phylogénétiques parfaits où la topologie reflète la phylogénie. Dans les conditions réelles, il faut compter avec des séquences qui évoluent avec de vitesses différentes entre groupes, qui ne sont pas assez ou trop diversifiées entre des groupes pour dégager un signal phylogénétique clair, les transferts horizontaux, les duplications des gènes, des informations partielles ou erronées dans les BDD. Tout ceci complexifie très considérablement notre travail. On réduit, donc l’objective : Si on arrive à séparer les groupes d’étude et extérieur pour la majorité des séquences, cela nous donne un indice assez fort pour assigner une séquence au groupe d’étude.  

 

4.    La construction de mes arbres est très sensible aux séquences que je sélectionne pour l'alignement multiple. Si je choisis quelques séquences de Pelagibacter avec une E-valeur inférieur à e-90, je ne parviens plus forcément à séparer mon groupe d'étude de mon groupe extérieur. Est-ce normal, je ne suis vraiment pas au clair sur la manière de choisir les séquences...

 

Pelagibacterales bacterium, Candidatus Pelagibacter, Pelagibacteraceae bacterium sont de façon à dire, que ces séquences viennent de l’ordre de Pellagibacteriales (ou de la famille Pelagibacteraceae) mais des espèces ne sont pas encore décrites ou définies. Souvent ces séquences viennent des projets métagénomiques. Nous devons prendre ces appartenances avec précaution. Il est possible que la taxonomie de certaines séquences soit erronée.
De règle générale, il faut tenter à représenter tous les sous-groupes des groupes d’étude et extérieur, mais pour chaque sous-groupe, il est préférable de choisir des séquences avec les meilleurs E-valeur. Ceci va aider à faire un alignement fiable et construire un arbre phylogénétique raisonnable.

 

Bon travail,

Emese Meglecz

 

AnaisE
21 Mar 2021 16:13
Non evaluated contribution

D'accord, c'est très clair, merci beaucoup.