Forum "Recherche d'homologues: BLAST"

Thread subject: Définition du seuil dans NR

[ Return to forums ]
Définition du seuil dans NR
louiselisa
29 Oct 2014 17:31
Non evaluated contribution
Bonjour,
Nous avons eu du mal à définir notre seuil de e value pour la banque NR. On observe une continuité dans les e values ainsi qu'une continuité dans les fonctions pour chaque hit. Nous avons donc arbitrairement défini notre e value seuil à 1e-10. nous considérons donc comme homologue tous les hits se trouvant en dessous ce seuil. Avons nous fait le bon choix?
P_Hingamp14
3 Nov 2014 17:47
Game master
Je suis surpris que vous écriviez "On observe une continuité [...] dans les fonctions" car et jetant un rapide coup d'oeil à votre BLASTp contre NR, je trouve plus d'une définition pour les hits BLAST:

AIR synthase related
diaminopimelate epimerase
phosphoribosylglycinamide synthetase
phosphoribosylformylglycinamidine synthetase
formylglycinamidine ribonucleotide
similar to PfpI endopeptidase

C'est aussi en contradiction avec votre actuel "catalogue des fonctions" du BLAST qui ne contient que:

Phosphoribosylformylglycinamidine synthase

De deux choses l'une:

- ou bien toutes les fonctions des hits BLAST (et pas seulement l'unique fonction relevée dans votre tableau) sont cohérentes du début à la fin du listing (des synonymes en quelque sorte) et suggèrent que tous les hits BLAST sont homologues => dans ce cas le E-value seuil est donc la E-value maximale observée (2e-06)

-ou bien une de ces fonctions d'un (ou plusieurs) hits BLAST (au dessus de 1e-10 seulement, car en dessous ce sont des homologues quasi certains) ne semble pas du tout cohérente avec le reste (le premier "intru" non homologue en quelque sorte) => dans ce cas le E-value seuil est donc juste inférieure à la E-value de ce premier non homologue (mais a priori au dessus de 1e-10)

Dans tous les cas, dans l'état actuel de vos annotations, la E-value seuil de 1e-10 n'est pas du tout logique!