Forum "Annotathon: généralités, fonctionnement & bugs"

Sujet de discussion: présence de N et X dans les séquences

[ Retour aux forums ]
présence de N et X dans les séquences
KrimsBen
17 Oct 2018 17:08
Contribution non évaluée

Bonjour, j'ai un problème, je viens de me rendre compte que ma séquence nucléotidique et d'acide aminés comprenaient des caractères inconnus (N et X), est-ce que je peux continuer l'annotation de celle-ci car je me retrouve avec un nombre d'acide aminés pour l'ORF différent dans mon tableau et dans l'annotation.

Merci d'avance.

PH_PGF18
22 Oct 2018 10:35
Maître de jeu

Bonjour,

C'est sûr que s'il y a trop de "N" (donc des positions dans la séquence qui n'ont pas pu être séquencées avec suffisamment de fiabilité), ça risque de se traduire (mauvais jeu de mot) par trop de "X" dans la protéine, ce qui diminue d'autant l'information disponible pour prédire fonction et origine taxonomique... La question est donc combien de N/X sont présents dans votre ORF (ailleurs ce n'est pas gênant): a priori s'il vous reste >60 AA sans "X", ça peut passer. Dans votre cas (HMP2_7863020.14) il semblerait qu'il n'y ait pas de X dans votre ORF? Par contre tous les codons sont à compter pour les longueurs d'ORF, même ceux avec des N/X.

Bonne journée!