Forum "Domaines conservés: INTERPRO"

Thread subject: e-value pour les domaines protéiques

[ Return to forums ]
e-value pour les domaines protéiques
luluemmy
1 Dec 2007 21:06
Contribution: Pertinent
    bonsoir, pour notre ORF on n'a trouvé un domaine protéique conservé, O méthyl transférase. on nous indiquez
une e-value de 4.10e-05 par rapport à laquelle on a dit "notons que la e-value associée n'est que 4.10e-05
ce qui n'est pas excellent. On peut alors se demander si ce domaine est réel dans notre ORF ou s'il a été
trouvé "au hasard""

  MAIS d'aprés la correction on a pas vraiment compris le sens de cette evalue :"attention
à l'interprétation de l'evalue concernant les domaines protéiques: les alignement se font sur des régions
beaucoup plus courtes, et les evalue sont fatalement plus élevés;".

le problème c'est que l'on n'arrive pas à comprendre LE TRUC !!!

est-ce que ça veut dire qu'une evalue de 4.10e-5 pour les alignements de recherche de domaines protéiques
est meilleure dans le sens "résultat dû au hasard pas trés probable car evalue relativement faible pour
des comparaisons de séquence courtes" que si on a la même valeur pour des alignements 2 à 2 dans un Blast
pour qui ont interprèterait cette evalue comme mauvaise dans le sens "ces homologies sont probablement
dues aux hasard car evalue trop élevée"

bon j'espère que vous y avez compris quelque chose car comme vous le voyez je suis pas sûre que tout ça
soit trés claire dans ma tête!!!!

merci d'avance pour votre réponse
Herrmann_BC07
1 Dec 2007 22:45
Game master
Bonsoir,

l'evalue n'est pas un chiffre magique qui permet de trancher à tous les coups sur la validité
ou nom d'un alignement. C'est une "aide à la décision", mais au final, il faudrait
aller regarder l'alignement lui même pour trancher.
Interproscan fait des "alignements" entre les domaines protéiques contenus dans Interpro
et votre séquence. Il calcule un score de cet alignement, et une evalue.
Les domaines protéiques sont souvent décrits par des modèles statistiques comme les
matrices poids-position ou les modèles de markov cachés, et les "alignements" ne sont pas vraiment
comparables à ceux faits p.ex. par blast entre 2 séquences; l'interprétation de l'evalue
est donc un peu différente.
Par ailleurs, vous avez du faire l'expérience en 2è année qu'un alignement entre 2 séquences A et B
ne donne absolument pas la même evalue s'il est fait contre swissprot ou nr. La taille
de la ban que de données influence l'evalue, même si l'alignement dans
les 2 cas est rigoureusement identique, et que la conclusion sur "homologie ou pas" est
la même dans les 2 cas, malgré les evalue différents.
En conclusions, seule l'analyse de l'alignement lui même permet de trancher, et c'est
plutôt rassurant qu'il faille l'oeil de l'expert humain...

Bon courage pour la suite

Carl