Forum "Alignement multiple: CLUSTALW"

Sujet de discussion: un souci avec l'alignement

[ Retour aux forums ]
un souci avec l'alignement
HajarIslem
29 Oct 2020 14:11
Contribution non évaluée

Bonjour Mme,

On n'arrive toujours pas à poursuivre notre travail et on pense que la séquence n'est pas bonne c'est pour ca on a toujours des mauvais alignements.

Je vous adresse ce message pour vous demander de nous aider à trouver le souci avec notre séquence et de nous guider si c'est possible à trouver la solution.

Merci pour votre écoute.

Cordialement.

TOUMI Islem , BOUAMOUT Hajar.

 

PHingamp_PGF20
3 Nov 2020 17:57
Maître de jeu

Bonjour,

L'alignement multiple actuellement présent dans la fiche d'annotation de HMP1_9149030.52  est en effet inexploitable : il semblerait que les séquences soumises à cet alignement multiple ne soient pas toutes homologues (rappelons que seules des séquences homologues doivent être alignées avec ces outils bioinformatiques).

Si les séquences présentes au format FASTA dans la rubrique "Rapport Taxonomique" sont celles soumises à l'alignement multiple (ce qui semble probable car elles ont les mêmes identifiants, par exemple "BPARMM1"), alors en effet ceci confirme que les séquences alignées ne sont probablement pas toutes homologues : seules trois de ces séquences (BPGEEK1, BPBBBB1, BPBBBB2) semblent homologues à l'ORF (E-Value de 6e-19 à 1e-48, dont l'une étrangement courte d'à peine 70AA), les autres ont des E-values bien trop élevés dans le BLASTp de l'ORF (jusqu'à 5,5) et ne sont donc probablement pas des homologues de l'ORF, et n'ont donc pas leur place dans un alignement multiple.

Aussi je ne comprends pas pourquoi avoir retenu les Gammaprotéobactéries (très rare homologues, meilleure E-Value=2e-37) comme groupe d'étude, alors que les plus proches homologues dans le BLASTp de l'ORF proviennent des Firmicutes (centaines d'homologues, meilleures E-Values < 1E-180) ?

Cet ORF a une répartition étonnament restreinte au sein des bactéries représentées dans RefSeq, avec l'essentiel des homologues concentrés dans deux ordres des Firmicutes : les Lactobacillales et les Bacillales. Le meilleur score dans chacun de ses deux ordres est peut-être assez significatif (826 versus 719) pour proposer le premier comme groupe d'étude (et ainsi les autres Firmicutes comme groupe extérieur) ? On ne peut pas utiliser les E-Value pour vérifier l'écart significatif de qualité d'alignements entre ces deux taxons, car dans les deux ordre ces E-Value est tellement faible (<1E-180) qu'il est est arrondi à zéro. C'est pourquoi dans ce cas particulier, on peut utiliser les scores à la place des E-Value.