Forum "Recherche d'homologues: BLAST"

Thread subject: Définition du score seuil

[ Return to forums ]
Définition du score seuil
K-RoW
14 Apr 2010 12:09
Non evaluated contribution
Bonjour,
Après avoir fait un blastp contre Nr et Swissprot, on n'a pas vraiment de saut dans les scores ou dans un autre paramètre.
Le seul saut est de 211 à 172.
Est ce qu'on peut considérer 211 comme le score seuil sachant que les séquences ayant un score inférieur ont quand même un bon score et une Evalue jusqu'a 4e-41 ?
De plus, si on regarde les séquences, ceux sont toutes des aminotransferases.
Merci
c_petitjean_10
14 Apr 2010 13:49
Game master
Bonjour,

Attention, chercher le "score seuil" ne veut pas dire "chercher une cassure dans les scores".
Une recherche par blast est une recherche de similarité. Les séquences que vous obtenez sont donc plus ou moins similaires à la votre. A ce moment là vous devez faire la différence entres les séquences qui sont des homologues à la votre et celles qui bien que similaires, ne sont pas homologues.

Sur ce, je vous renvoi aux autres discussion de ce sous forum, sur lesquels des questions très proches ont été posés!

Bonne annotation.
C. Petitjean
K-RoW
14 Apr 2010 14:16
Non evaluated contribution
Merci pour votre réponse.
Quand je regarde les alignements 2 à 2 j'ai l'impression que toutes les séquences sont homologues à la mienne et c'est pour ça que je n'arrive pas à définir de score seuil.
Si je garde les 13 premières séquences, on a des Gaps de 0 et 1%, des scores de 211 à 228 et de très faibles Evalue.
Est-ce que cela suffit pour l'arbre ? Est-ce qu'il est plus intéressant d'avoir peu de séquences de qualités ou plus de séquences mais avec moins de similarités ?
c_petitjean_10
14 Apr 2010 14:40
Game master
Bonjour,

Pour répondre simplement à votre question: oui 13 séquences suffisent pour faire une analyse phylogénétique.
Mais il est très important de considérer tout les homologues de votre séquence pour pouvoir définir un groupe d'étude et extérieur.
Vous devez aussi analyser le taxonomy report pour essayer de comprendre la répartition de votre séquences dans les différents groupes du vivant.
N'oubliez pas que plus de milles génomes sont actuellement entièrement séquencés, et que beaucoup d'autres séquences sont présentes sur la NR.
Si vous avez l'impression que tous les résultats sont des homologues, demandez plus de résultats de blast.

Encore une fois, ces points ont déjà été discuter, en cours, en tp et sur d'autres discussion de ce sous forum.
Je vous encourage à poser des questions, mais aussi à parcourir le forum et a essayer des solutions déjà proposées à d'autres.
Les sites NCBI, phylogeny.fr et autres ne sont pas en accès restreint! Faites des tests!

Bonne annotation!

C. Petitjean




adecam
30 Apr 2010 8:47
Non evaluated contribution
Bonjour,
nous avons un problème pour définir le score seuil; nous hésitons entre 2scores seuil.
Le premier : on observe un saut au niveau des e-values, un saut du recouvrement
Avec ce score on obtient seulement 9séquences homologues.
Avec ce score on obtient uniquement 2espèces pour le groupe d'étude et 6pour le groupe extérieur (et 3 ne sont pas utilisables). On ne pense pas que ça soit suffisant pour réaliser une phylogénie représentative. C'est pour cela que nous avons une seconde hypothèse:

Le second: pas de saut des e-values, mais un saut du recouvrement. On obtient alors 18séquences homologues ce qui nous permettrait d'avoir un groupe d'étude plus grand.

L'étude de la phylogénie ne nous permet pas de favoriser l'une des 2hypothèses.

Merci
c_petitjean_10
30 Apr 2010 19:05
Game master
Bonjour,


Le seuil entre les homologues à votre séquences et les non-homologues doit être défini selon plusieurs paramètres et pas uniquement la e value, ou le pourcentage de recouvrement.
Vous devez analyser les alignements deux à deux, et touts les critères associés, les annotations de vos séquences...

Cette question a déjà été posée sur le forum, je vous invite donc à le parcourir, je pense que vous pourrez trouver des pistes pour prendre une décision.

Bonne annotation.

C. Petitjean