|
Pitite question au sujet des arbres... |
TAMT 20 Nov 2007 16:59
Contribution: Pertinent |
Bonjour,
J\'ai une question à propos d\'un résultat d\'arbre phylogénique obtenu. Plus exactement, je suis surpris par la place que prend mon ORF dans cet arbre. Je récapitule mon raisonnement: j\'ai choisi mon groupe d\'étude(alphaprotéobactéries) en prenant une 15aine de séquences ayant des scores élevé et apartenant toute aux alphaprotéobactéries. j\'ai choisi ensuite mon groupe extérieur en prenant 4 sequences avec les meilleurs scores possibles tout en n\'étant pas des alphaprotéo (cyano, gammaprotéo,...). Donc en théorie, mon ORF devrait apparaître plus \"proche\" des alpha que de mon groupe extérieur. Or, c\'est l\'inverse. A tous les coups mon ORF est placé dans les branches de mon groupe extérieur.
Pourais-je avoir une explication? Si vous avez compris bien sûr...
TAMT |
luluemmy 20 Nov 2007 20:59
Contribution: Constructive |
Si je ne dis pas de bêtise, il me semble que les séquences choisies pour le groupe d'étude doivent être représentatives de ce groupe d'étude!! Ne prendre que les meilleures introduit donc un biais et ceci est également valable pour le groupe extérieur. |
Brochier_BC07 21 Nov 2007 6:43 Game master |
Vous avez tout à fait raison. Par exemple si l'arbre des organismes est celui représenté ci-dessous, et que vous n'échantillonnez que les séquences avec un fort score vous allez omettre des séquences cruciales pour pouvoir conclure que votre ORF est probablement issue du groupe d'étude que vous avez choisi.
+------- Alpha <= Non incluse +---| | +------- Alpha <= Non incluse -| +------- ORFX +---| +--- Alpha <= Incluse +---| +-- Alpha <= Incluse +-| +-- Alpha <= Incluse
Arbre obtenu: L'ORF n'émerge pas dans le groupe d'étude.
+------- ORFX externe au groupe d'étude -----| +--- Alpha <= Incluse +---| +-- Alpha <= Incluse +-| +-- Alpha <= Incluse
L'autre possibilité est que le groupe extérieur ait été mal défini au départ. En effet, plus forte similarité n'est pas systématiquement équivalent à plus proche parenté. Et donc des séquences étant plus similaires à des alpha-protéobactéries ne sont pas obligatoirement des alpha-Protéobactéries.
+----- A (Alpha-protéobactéries) | -| +------------ B (Firmicutes) +---| +- C (ORF X)
Dans l'exemple ci-dessus, B et C sont plus proches parents, mais A et C sont plus similaires...
+------- A (ORF X) | -| +- B (Alpha-protébactéries) +---| +- C (Gamma-Protéobactéries)
De même, ci-dessus, A n'est pas plus apparenté à B qu'à C. Comment va se comporter le taxonomy report ?
Céline Brochier |
TAMT 23 Nov 2007 19:26 Non evaluated contribution |
oki merci de nous éclairer!! |