Forum "Annotathon: généralités, fonctionnement & bugs"

Thread subject: Important! BDD refseq_protein vs. NR

[ Return to forums ]
Important! BDD refseq_protein vs. NR
Meglecz20CTES
22 Mar 2021 8:20
Game master

Bonjour à tous,


Site à une discussion initié par Anaïs (http://annotathon.org/?seeThread=2859). Je modifie un peu les règles du jeu d’Annotathon.

 

Les bases des données sont en évolution continue. Le BDD nr accumule de plus en plus des séquences environnementales, dont l’annotation n’est pas tout à fait certaine. Ceci le rend son utilisation plus compliquée, mais donne la possibilité de trouver des homologues plus proches.

En même temps, la BDD refseq_protéine contient des informations plus fiables, mais au champ taxonomique plus restreint. Comme sa taille augment en continu ce désavantage diminue.  


Il est peut-être temps à changer la BDD qu’on utilise pour l’Annotathon. Je vous laisse le choix entre le BDD ref_seq protéine et NR.  Vous pouvez expérimenter avec les deux BDD, pour faire votre choix. Il ne n’est pas nécessaire à présenter les résultats des deux analyses, présentez uniquement celui de votre choix.

 

Bon travail,
Emese Meglecz

 

ThomasW
16 Apr 2021 18:06
Non evaluated contribution

Bonjour,

 

Une question au sujet de la BDD ref_seq protéine : j'ai remarqué que le meilleur hit a souvent un % d'identité inférieur aux résultats de NR. Du coup, j'imagine que certaines séquences peuvent avoir leur meilleur hit < à 90% sur ref_seq proteine et > à 90% sur NR. Est-ce que cela pose un problème et si oui, devons nous vérifier avant d'aller plus loin sur la séquence ?