Bonjour,
C'est sûr que s'il y a trop de "N" (donc des positions dans la séquence qui n'ont pas pu être séquencées avec suffisamment de fiabilité), ça risque de se traduire (mauvais jeu de mot) par trop de "X" dans la protéine, ce qui diminue d'autant l'information disponible pour prédire fonction et origine taxonomique... La question est donc combien de N/X sont présents dans votre ORF (ailleurs ce n'est pas gênant): a priori s'il vous reste >60 AA sans "X", ça peut passer. Dans votre cas (HMP2_7863020.14) il semblerait qu'il n'y ait pas de X dans votre ORF? Par contre tous les codons sont à compter pour les longueurs d'ORF, même ceux avec des N/X.
Bonne journée!