Forum "Annotathon: généralités, fonctionnement & bugs"

Thread subject: présence de N et X dans les séquences

[ Return to forums ]
présence de N et X dans les séquences
KrimsBen
17 Oct 2018 17:08
Non evaluated contribution

Bonjour, j'ai un problème, je viens de me rendre compte que ma séquence nucléotidique et d'acide aminés comprenaient des caractères inconnus (N et X), est-ce que je peux continuer l'annotation de celle-ci car je me retrouve avec un nombre d'acide aminés pour l'ORF différent dans mon tableau et dans l'annotation.

Merci d'avance.

PH_PGF18
22 Oct 2018 10:35
Game master

Bonjour,

C'est sûr que s'il y a trop de "N" (donc des positions dans la séquence qui n'ont pas pu être séquencées avec suffisamment de fiabilité), ça risque de se traduire (mauvais jeu de mot) par trop de "X" dans la protéine, ce qui diminue d'autant l'information disponible pour prédire fonction et origine taxonomique... La question est donc combien de N/X sont présents dans votre ORF (ailleurs ce n'est pas gênant): a priori s'il vous reste >60 AA sans "X", ça peut passer. Dans votre cas (HMP2_7863020.14) il semblerait qu'il n'y ait pas de X dans votre ORF? Par contre tous les codons sont à compter pour les longueurs d'ORF, même ceux avec des N/X.

Bonne journée!