Forum "Recherche d'homologues: BLAST"

Thread subject: valeur seuil

[ Return to forums ]
valeur seuil
oralbre
12 Apr 2010 14:59
Non evaluated contribution
bonjour,
lorsqu'on effectue un blast vs nr à 1000 et qu'on ne trouve pas de valeur seuil doit on obligatoirement faire un blast vs nr à 5OOO
c_petitjean_10
12 Apr 2010 15:27
Game master
Bonjour,

Dans votre analyse de blast, vous devez trouver la limite entre les séquences homologues claire à votre séquences et les séquences non homologues à la votre.
Une fois que vous avez défini quels sont les homologues à votre séquences, vous devrez définir vos groupe d'étude et extérieur.
Si en demandant 1000 resultats, vous n'avez que des séquences homologues, vous devez refaire un blast et demander 5000 résultats.
En effet, si vous n'avez pas la totalité des homologues, il est très possible que cela fausse vos choix de groupes d'étude et extérieur.

Dans tout les cas n'oubliez pas que choisir le seuil necessite une analyse de plusieurs paramètres, et pas seulement de la eValue.

Vous rencontrez ce problème sur le fragment GOS_1553010?


Bonne annotation.

C. Petitjean

oralbre
12 Apr 2010 16:14
Non evaluated contribution
oui en fait après un blast vs nr à 1000 séquences je ne trouve pas de score très élevé (max 55.1) et des evalue assez bas (minimum 3e-6) qui sont de plus très proche les uns des autres pour les séquences.
Si  je m'interesse au valeur de gap et d'identité je ne vois pas non plus de grande différence entre les séquences
c_petitjean_10
12 Apr 2010 16:31
Game master
Je vous rappelle encore une fois que le seuil que vous devez définir est la différence entre les homologues et les non homologues.

Étant donné vos résultats de blast, pensez vous que demander 5000 résultats de blast soit pertinent?
Dans tout les cas, NCBI est en utilisation illimité jusqu'à présent, donc n'hésitez pas à faire des tests!

oralbre
12 Apr 2010 17:20
Non evaluated contribution
j'obtiens essentiellement des bactéries je pense que faire un blast avec 5000 résultats me permettrait peut etre d'obtenir d'autre organismes. Mais ce n'est pas le cas, les résultats sont floues, il ne me permettent pas de conclure si les séquences sont vraiment des homologues de ma séquence. Je ne vois donc pas du tout comment définir un groupe d'étude et externe
c_petitjean_10
12 Apr 2010 17:35
Game master
Quel est l'eValue la plus haute que vous obtenez avec 1000 résultats?
Pensez vous que 5000 résultats peuvent vous permettre d'obtenir plus de résultats en conservant les autres options du blast tel quelles?
Et même dans le cas où vous obtenez plus de résultats, est-il pertinent d'utiliser des séquences ayant des eValue de cet ordre?

Par ailleurs, si vous considérez que tous vos résultats sont des séquences homologues, vous devez tous les considérer pour l'étude. Au contraire, si pour vous aucun n'est homologue, vous ne devez pas les utiliser.
Une fois que vous aurez posé ce paramètre, vous pourrez définir vos groupes d'étude et extérieur.

Il est possible que vos resultats ne vous permettent pas de definir de façon claire un groupe exterieur et un groupe d'étude. Dans ce cas, vous devrez utiliser l'ensemble de séquences que vous avez défini comme homologue comme groupe d'étude, sans poser d'hypothèse plus fine à priori.
Dans ce cas, c'est au moment de l'analyse de l'arbre phylogénétique que vous devrez essayer de faire la différence entre le groupe d'appartenance de votre séquences et un groupe extérieur

Dernière chose, vous avez peu de résultats sur la NR, avez vous pensez à faire un blast sur une autre banque de donnée? la banque environnementale par exemple?


Bonne annotation.

C. Petitjean
oralbre
12 Apr 2010 18:57
Non evaluated contribution
je n'arrive pas à décider a part de facon arbitraire si je dois ou non considérer les séquences comme homologues. A partir de quels parametres  ou valeurs obtenus pourrais je conclure de leur homologie?
J'ai quand meme réalisé un blast contre la banque environnementale j'obtient 20 séquences  dont 4 avec des  scores très supérieurs aux autres (dont un avec les resultats suivant Identities = 141/141 (100%), Positives = 141/141 (100%), Gaps = 0/141 (0%)
ceci veut il dire que cette séquence est exactement la mienne?).Dois je pour autant ne plus tenir compte des resultats avec nr? Quel est la différence entre nr et environnemtale.
c_petitjean_10
12 Apr 2010 19:57
Game master
En ce qui concerne la définition de l'homologie de vos séquences, je comprends que ce soit difficile, mais je ne peux (ne veux et ne dois) pas prendre la décision pour vous!  

Vous avez déjà travailler sur d'autres séquences, essayer de vous référer à ce que vous avez déjà vu; lisez les aides proposés par l'annotathon (FAQ, règles du jeux...).
Observez les alignements deux à deux...
Encore une fois rien de vous empêche de faire plusieurs tests avec différentes sélections, et de choisir la meilleure option en fonction des résultats obtenus.


En ce qui concerne la banque environnementale, je vous renvoi à la discussion nommée "blast" de ce sous forum, où j'ai expliqué ce qu'était la banque environnementale.

dans tout les cas, ce sont des séquences de même nature que sur la NR, protéiques.
Donc vous pouvez tout à fait utiliser l'ensemble des résultats que vous obtenez.
Pourquoi vous priver d'une partie des résultats?

bons tests!

C. Petitjean
BoyLlo
24 Apr 2010 23:02
Non evaluated contribution
Bonjour
un score max de 55 et une e-value est de0,001  j'obtiens des résultats similaire en blast vs swissprot  et en blast X contre nr et en tblastn contre nr est ce suffisant pour affirmer que mes séquence ne sont pas homologues?
Cependant je remarque  la présence de 2 homologue dans le blastP contre la banque environnementale puis je faire un arbre cohérent à ces résultats?
Merci
c_petitjean_10
25 Apr 2010 18:43
Game master
Bonjour,

Comme déjà expliqué plusieurs fois sur le forum.
Le score n'est pas un argument suffisant pour définir ou non l'homologie.
Vous avez un grand nombre de paramètres a étudier avant d'arriver à cette conclusion.

En ce qui concerne les deux homologues trouvés, ce n'est pas suffisant pour faire un arbre phylogénétique.
En effet, considérez qu'une reconstruction d'arbre est la recherche des relation de parentés. Entre trois séquences, vous trouverez toujours les même relations de parentés.
Par contre, vous pouvez les utilisez pour une partie de votre analyse et pour vous aider à conclure sur votre ORF.

Bonne annotation.
C. Petitjean