Forum "Analyse phylogénétique"

Thread subject: choix du groupe externe

[ Return to forums ]
choix du groupe externe
chloegouyet
12 Apr 2019 14:17
Non evaluated contribution

Je reposte ici ma question :

Bonjour,

J'ai une question à propos du choix du groupe externe, j'ai un doute. Ci-joint, il y a la synthèse des classifications taxonomiques des protéines alignées par BLASTp contre NR.

 

Il me semble que je ne peux pas prendre Flavobacteriia en groupe d'étude car la classe ayant la meilleure e-valeur n'est pas connue, il n'est donc pas possible de savoir si ces hits avec une meilleure e-value feront partie du groupe d'étude ou du groupe externe. Donc le meilleur hit du groupe d'étude n'aura pas forcément une e-value inférieure à celle du groupe extérieur. L'arbre n'est alors pas correct.

Je pensais alors prendre en groupe d'étude Bacteroidetes, seulement la moins bonne e-value du groupe d'étude des Bacteroidetes est 5e-57, tandis que la meilleure E-value du groupe extérieur des Bacteria non-Bacteroidetes est 9e-70. Donc le meilleur hit du groupe d'étude n'aura pas forcément une e-value inférieure à celle du groupe extérieur. L'arbre n'est alors pas correct. 

Je ne peux pas non plus prendre les eucaryotes en groupe externe car il n'y aura pas assez de séquences.

 

Est-ce que quelque chose m'a échappée ? ou bien il est impossible de faire un arbre correct pour cet ORF ?

 

En vous remerciant,

Bien cordialement,

 

J'ai lu votre premier réponse mais je n'ai pas un groupe monophylétique dans mon arbre qui contient
•    l’ORF,
•    les séquences annotées comme Bacteroidetes (sans plus de détail)
•    Les Flavobactériia

Je ne peux pas assigner votre ORF à un taxon plus précis que Bacteroidetes

Meglecz18CTES
12 Apr 2019 19:18
Game master

Bonjour Chloé,


En effet, ce n’est pas un cas facile.

Dans votre alignement les 4 dernières séquences me semblent partielles et en général la fin de l’alignement comporte beaucoup des gaps. Ceci vous donne un nombre de positions relativement faibles pour construire un arbre phylogénétique.

Option A. Enlevez les 4 séquences partielles, et essayez de baisser le stringence (être moins stricte) de l’étape de Gblocks. (Vous avez des cases à cocher sur la page de phylogeny.fr juste avant l’étape de Gblocks). Ceci va probablement augmenter le nombre des positions retenu par Gblock.

Si cela n’aide pas à séparer les bactériodetes et les autres séquences (c’est possible), alors option B.

Option B : Dans ce cas vous ne pouvez pas déterminer à l’avance le groupe d’étude. Gardez que des séquences de bactériodetes en espérant d’obtenir un bon alignement. Ce n’est pas improbable, car vous allez enlever des séquences des autres phyla. Regardez, s’il y a moyen d’obtenir un groupe monophylétique qui inclue l’ORF et d’autres séquences pour pouvoir l’assigner l’ORF à un taxon. Utilisez ce groupe pour enraciner l’arbre.
Cette méthode n’est pas très orthodoxe, mais comme vous avez de meilleurs hits avec la lignée incomplète, on fait comme on peut.

Bon travail,
Emese