Forum "Analyse phylogénétique"

Sujet de discussion: alignement multiple et arbre

[ Retour aux forums ]
alignement multiple et arbre
luluemmy
1 Dec 2007 11:18
Contribution: Pertinent
Bonjour,
Dans la correction de notre séquence on nous dit: "votre alignement multiple est mauvais, et inclut manisfestement des séquences non homologues (ex: Strtub, avec un score de 36, est plus que douteuse...);
vous auriez du remarqué qu'il n'y avait aucune position conservée...A revoir absolument!"

Cette séquence Strtub fait partie de notre groupe extérieur, qui sont les Bacteria; je croyais qu'il fallait inclure pour faire un arbre un maximum de séquences pour chaque groupe taxonomique choisi
afin d'avoir la meilleure représentation de ce groupe et qu'il ne fallait pas "sélectionner" les séquences qui nous arrangent. Sur ce il me vient une question: où place t'on la limite entre les séquences
douteuses et les séquences éloignées  mais à inclure?? Y a t'il un score minimal associé à une e-value minimale à ne pas dépasser??
Je vous remercie, bon weekend
Brochier_BC07
1 Dec 2007 11:26
Maître de jeu
Bonjour,

Il y a une condition incontournable à l'inclusion de séquences pour analyses, c'est que la séquence soit homologue aux séquences que vous étudiez.

Avez-vous vérifié que la séquence en question est homologue à votre ORF.
Une chose que vous auriez du percevoir au cours de vos analyses, c'est qu'il n'y a pas de e-value, de score minimal comme critère de l'homologie.

La démarche type d'analyse est la suivante:

1/ Examen des alignements 2 à 2 pour voir où placer la limite entre les séquences homologues de votre ORF et les séquences non homologues de votre ORF (utilisation de tous les indices à votre disposition: score, e-value, mais aussi, qualité des alignements 2 à 2, longueur des subject vs longueur du query; longueur de l'alignement local par rapport à la longueur du subject et du query; % et type des résidus conservés, similaires...).
=> Cela vous indique la e-value max et le score min pour la sélection des séquences.

2/ Examen du tax report pour définir un groupe d'étude et un groupe extérieur compatible avec l'homologie de séquences.

3/ Choix des séquences pour représenter au mieux la diversité du groupe d'étude et du groupe extérieur (en restant toujours compatible avec l'homologie des séquences).

4/ Alignement multiple en vérifiant que des séquences non homologues, partielles... ne se sont pas glissées par erreur. Si de telles séquences sont présentes les retirer et refaire l'alignement multiple.

On vous a prévenu que cette étape était probablement la plus difficile. Il n'y a pas moyen de la faire de manière mécanique.

Bon courage pour la fin

Céline Brochier