Forum "Analyse phylogénétique"

Thread subject: arbres non conformes à la phylogénie de référence, difficiles à interpreter

[ Return to forums ]
arbres non conformes à la phylogénie de référence, difficiles à interpreter
oralma
19 Apr 2010 19:31
Non evaluated contribution
Bonjour,
j'ai des difficultés avec la construction de mes arbres. J'ai choisi comme groupe d'étude les bactéries et donc comme groupe extérieur les archées et les eucaryotes, ayant des homologues dans tous ces groupes. Les 2 arbres obtenus avec PhyML et BioNJ mélangent les bactéries et les eucaryotes, et sont enracinés avec le groupe des archées. Les bactéries entre elles ne suivent pas non plus la phylogénie de référence. J'ai des valeurs de bootstrap très petites pour certaines branches (ex: 0.09) ce qui ne me semble pas être non plus un bon élément. Mais je ne sais pas exactement quelle est la signification de cette grandeur.
J'ai pensé que la construction étrange de l'arbre pouvait être due au peu de position conservées dans l'alignement multiple après Gblocks (117 sur 448). Mais le problème est aussi que ma protéine est assez courte par rapport à ces homologues parce que je n'ai que le début d'un ORF. J'ai essayé de changer les paramètres de la curation (moins restrictifs) et je conserve alors des parties d'alignements après la fin de ma protéine, ce qui recouvre un peu mieux les alignements totaux des autres séquences. Mais j'obtiens au final les mêmes arbres à peu de choses près.
En changeant les représentants de mon groupe extérieur (possible car beaucoup d'homologues)je n'arrive pas non plus à de beaux arbres.
Existe-t-il des paramètres dans phylogeny pour améliorer les arbres obtenus, ou puis je les interpréter comme ils sont (transfert de gènes entre bactéries et eucaryotes?, mais alors pourquoi un tel mélange dans les branches...)? Ma séquence apparait toujours parmis les alpha-protéobactéries, ce qui me donne déjà une information importante, mais je ne comprends pas le reste des arbres.
cordialement
c_petitjean_10
19 Apr 2010 19:49
Game master
Bonjour,

Votre hypothèse a priori et votre analyse de l'arbre me parait correcte. Et en effet, il est possible que vous ayez peu de signal dans votre alignement ou une protéine avec une histoire très compliquée.
Tout d'abord, ne perdez pas de vue l'objectif de votre travail. Vous devez annoter cette séquence, dire d'où elle provient et quelle pourrai etre sa fonction, pas faire une étude phylogénétique fine de la famille d'homologue de votre protéine.

Ainsi, vous dites que votre séquence semble toujours sortir dans un groupe d'alpha protéobactérie, si ce nœud est bien soutenu, peut être pouvez vous faire un nouvel échantillonnage taxonomique en vue d'un placement plus sur de votre séquence.
(Vous avez commencer par une analyse à grande échelle, qui vous permet de définir une nouvelle hypothèse à tester.)
Si vous choisissez des séquences d'organismes plus proche, il est possible que vous ayez plus de signal dans votre alignement, car vos séquences seront moins divergentes entre elles.
Le résultat n'est pas garanti et gardez en tête vos premiers arbres afin de ne pas faire de surinterprétation, mais n'hésitez pas à tester.

Bonne annotation.

C. Petitjean