jash 24 Mar 2012 16:49 Contribution non évaluée |
Bonjour,
Notre séquence d'étude présente un très grand nombre d'homologues (nous en avons conservé 533). Cependant, après voir choisi 10 séquences de notre groupe d'étude (les Firmicutes) et 10 séquences de groupe extérieur (des bactéries donc), l'alignement mutiple ne donne quasiment aucun domaine de conservation : PNNPTG est le seul site conservé de plus de trois acides aminés. Ainsi, quand on effectue le "curation set" avec GBlocks, aucun arbre ne peut être réalisé car le logiciel dit que l'alignement n'est pas correct.
Ce cas de figure peut-il arriver (évolution convergente ?) ou avons nous fait une erreur (dans le choix des séquences ou des groupes d'études)?
Merci d'avance,
HAAG Aurélie et SOULA Julie |
C_Brochier_12 24 Mar 2012 17:06 Maître de jeu |
Bonjour,
Vous avez effectivement un problème. Quand on regarde les scores et les evalues des séquences que vous avez choisies, certaines ont des evalues très basses et d'autres très élevées. Ceci suggère que vous avez sélectionné des séquences qui ne sont pas des homologues ou des homologues trop lointain. Il semble donc que vous ayez mal défini votre score/evalue seuil.
Par ailleurs, le taxonomy report ne semble pas en adéquation avec votre blast contre nr. Or quand vous faites une sélection d'homologues en vue de l'analyse phylogénétique vous devez choisir vos séquences parmi l'échantillon le plus vaste, cad à partir de nr.
Bonne continuation
Céline Brochier
|