Forum "Recherche d'homologues: BLAST"

Thread subject: Définition de la e-value seuil dans SP

[ Return to forums ]
Définition de la e-value seuil dans SP
B_Wirth_23
10 Apr 2023 11:59
Game master

Question du groupe paunon, Séq Cv2f_10955030.65 :

Voici une capture d'écran de notre Blastp contre SP mais nous ne savons pas où situer la e-value seuil sachant que nos valeurs vont jusqu'à 0,025 et que la fonction est la même pour nos 470 séquences ("Full=Phosphoglucosamine mutase").

 

Réponse :

(J’ai refait le blast pour avoir l’intégralité du résultat.)

 

Pour déterminer la e-value seuil, c’est-à-dire la limite entre homologues probables et probables non-homologues, il faut :

- Regarder la progression des e-values : augmentation graduelle et linéaire, ou saut de e-values (et dans ce cas, vérifier la valeur des e-values au niveau du saut (entre e-80 et e-30) ;

- Puis, regarder si il y a une rupture dans les fonctions.

 

Dans votre cas, vous n’avez pas de saut de e-value, mais une augmentation graduelle et linéaire des e-values.

 

On regarde alors les dénominations fonctionnelles, pour voir s’il y a une rupture de fonction, un changement de fonction, que l’on pourrait utiliser pour marquer cette limite.

Mais dans votre cas, il n’y a pas non plus de changement de fonction : vous n’avez que des phosphogucomutase et/ou phosphomannomutase tout le long du résultat de blast, jusqu’à la dernière e-value, qui est élevée dans votre cas (0,025).

 

Or, vos derniers résultats de blast, vos dernières e-values (e-5, e-4, e-3), sont des résultats moyennement significatifs, pour lesquels on n’est pas sûr de l’homologie : il vaut donc mieux, dans votre cas, fixer la e-value seuil, par défaut, à 1.e-10.

Mais cette valeur sera à justifier dans votre travail.

 

En effet, dans le cas général : pour des e-values < à 1.e-10, on est quasiment sûr de l’homologie.

(MAIS ATTENTION : parfois, certains d’entre vous pourront avoir un seuil un peu inférieur à 1.e-10 (cf saut de e-value ou rupture de fonction).

Pour définir la e-value seuil, il faut donc être prudent à partir d’une e-value de e-10 : à partir de ces e-values, vous pouvez entrer dans la zone d’ombre (mélange de séq homologues et non-homologues).

 

Bon travail,

BW