Bonjour,
J'ai un soucis par rapport à cette séquence : j'ai décidé de me concentrer sur l'ORF 2, et lorsque je fais mes analyses avec BLAST NR en blastp, je me retrouve avec un alignement de 100%, puis un second de 81,90% ce qui m'indique que je devrai arrêter mes analyses et chercher une autre séquence à annoter.
Or, quand j'utilise Refseq_protein, toujours en blastp, mon % d'identité le plus élevé se trouve être à 62,91% qui est bien en-dessous de la limite des 95% établie.
Dois-je continuer avec cette séquence en me basant sur refseq_protein ? Ou plutôt chercher une autre séquence à annoter ?
Lequel a le plus "d'importance" entre nr et refseq_protein ?
En vous remerciant d'avance,
Eva.
Refseq_protein a moins de séquences, mais les informations sont plus fiables que dans la DBB nr.
Vous pouvez continuer vos analyses avec refseq.
Il est vrai que les meilleurs %identités sont un peu faibles, mais si vous obtenez un alignement multiple de bonne qualité (par beaucoup de gaps, présence des positions conservées) et vous avez un arbre interprétable, vous pouvez analyser cette séquence.
Bon travail, Emese Meglecz