Forum "Recherche d'homologues: BLAST"

Thread subject: blast

[ Return to forums ]
blast
lad2010
14 Apr 2010 10:42
Non evaluated contribution
bonjour
peut on se servir du Blastp contre swissprot s'il est correct pour trouver le seuil et trouver les différents gpes ??
Si non, mon blastp contre nr ne me donne auccune fracture permettant de determiner le seuil meme avec 20000 sequences. Le meilleure identité est de 38 pour cent . que dois je faire??

merci
C_Brochier_10
14 Apr 2010 11:52
Game master
Bonjour,

Cette question a déjà été abordée plusieurs fois.
Déjà, faites attention, la limite entre séquences homologues et non homologues n'est pas forcément représenté par une "fracture". Je précise ce point car plusieurs d'entre-vous sont à la recherche de fracture alors que la transition peut être continue.
Vous devez regarder les alignements 2:2 pour trouver la limite.

Par rapport à votre question, si après 1000 ou 5000 blast toutes vos séquences sont homologues (ceci arrive de plus en plus fréquemment pour les protéines ubiquistes), vous avez deux options:
- soit avec les séquences que vous avez de quoi définir un groupe d'étude et un groupe extérieur de manière non ambigüe, dans ce cas vous pouvez passer à la suite.
- soit vous n'avez pas une vision suffisamment large du paysage des homologues et dans ce cas, je vous recommande de faire des blast ciblés sur les groupes pour lesquels vous n'avez pas suffisamment d'information. Ex. si tous vos hits sont des bactéries et que voulez savoir si vous avez des homologues chez les archaea et les eucaryotes pour éventuellement constituer un groupe extérieur, faites un blast en ciblant uniquement les séquences d'archaea et un autre en ne ciblant que les séquences eucaryotes (je vous renvoie au cours pour savoir comment est-ce qu'on fait).

Bonne continuation,

Céline Brochier

lad2010
14 Apr 2010 16:47
Non evaluated contribution
merci pour vos renseignements
lad2010
14 Apr 2010 16:57
Non evaluated contribution
pour le seuil peut on prendre une sequence avec une identité de 40 pour cent au lieu des 30 pour cent normal ?
c_petitjean_10
14 Apr 2010 17:57
Game master
Bonjour,

Je ne comprends pas bien votre question.
Votre score seuil n'est pas lié à UNE séquence.
Vous devez faire la différence entre les homologues et les non homologues à votre séquence.
Et pour ça, vous devez analyser plusieurs paramètres, le % d'identité en effet, mais aussi, le score, le pourcentage de gap, le recouvrement de l'alignement, la qualité des alignements 2 à 2, le taxonomy report...

Je vous invite aussi à parcourir les autres discussions de ce sous forum, où des pistes ont déjà été proposées.

C. Petitjean
lad2010
15 Apr 2010 12:11
Non evaluated contribution
bonjour,
est il possible de n'avoir que des homologues ?
Meme avec 20000 lors du blast j'ai 37 pour cent comme pourcentage d'identité minimum.
jai entendu que le seuil tournait pres des séquences avec 30 pour cent d'identité.
Je ne sais plus quoi faire ?
merci
C_Brochier_10
15 Apr 2010 12:57
Game master
Bonjour,

Je vous invite à relire les posts de ce fil de discussion ainsi que les autres postes du forum car cette question a déjà été abordée plusieurs fois.

Juste pour mémoire, le score seuil définissant la frontière entre séquences homologues et non homologues ne se résume pas à une e-value type ni à un % d'identité (cf cours, TP, et post du forum).

Bonne continuation,

Céline Brochier
lad2010
15 Apr 2010 14:07
Non evaluated contribution
merci
oralemilie
22 Apr 2010 11:36
Non evaluated contribution
Bonjour,
je suis en train d'effectuer mon BLAST contre nr et  je pense avoir trouver un score seuil raisonnable de 66.2. Lorsque je consulte le taxonomy report, ce score seuil n'apparait pas; je ne vois que les séquences qui ont un score seuil au dessus de 90.
De plus, en consulatnt ces séquences, je me suis rendue compte que mes séquences que je considérais comme homologues sont issues de beta-gamma-alpha protéobactéries, de   firmicutes, de gramm + .... Je me demande alors comme je vais pouvoir construire un arbre correct...
c_petitjean_10
22 Apr 2010 11:53
Game master
Bonjour,

Si vous ne voyez pas apparaitre le score de 66 dans le lineage report, c'est du à la façon dont est il est organisé.

Le Lineage report affiche en premier l'espèce dont est issue la séquence la plus similaire à la votre pour le blast, avec son score, et le nombre de resultats (hits, séquences) trouvés pour cette espèce.
Elle ne sera cité qu'une seule fois.
Si la séquence ayant un score de 66 est issue d'une espèce pour laquelle une séquence avec un meilleur score a été trouvée, vous ne la verrez pas apparaitre dans le lineage report.
Par contre, sous le lineage report, vous sont indiqué toutes les séquences trouvées, classée par espèces.


Pour votre seconde question, je ne comprends pas vraiment ce que vous voulez dire ou où est le problème? pouvez-vous être plus explicite svp?

C. Petitjean
oralemilie
22 Apr 2010 13:21
Non evaluated contribution
En fait, en fixant mon score seuil a 66.2 je me rends compte que mes séquences ayent un score seuil supérieur à celui ci sont ici de plusieurs groupes taxonomique: gama, beta alpha bactéries, gramm + ..etc.Je me demande alors comment je vais pouvoir fixer mon groupe d'étude et mon groupe extérieur.

Pour ce qui est de votre première réponse je ne comprends pas pourquoi ce score n'apparait pas du tout sur mon taxonomy report...
c_petitjean_10
22 Apr 2010 15:09
Game master

Tout d'abord, le lineage report.
Si toutes les séquences ayant un score inférieur ou égale à 66.2, sont issues d'espèces qui portent une séquence plus similaire à la votre (donc avec un score plus haut) elles n'apparaitrons pas, car seule la séquence avec le plus haut score apparait pour chaque espèce.

Si vous voulez vérifier, prenez le nom de l'espèce dont provient la séquence avec un score de 66.2 et cherchez cette espèce dans les resultats du blast et dans le lineage report. Vous verrez qu'elle apparait déjà avec une séquences ayant un score plus haut que 66.2.


Pour l'autre question, je ne comprend toujours pas ou est le problème.
Vous avez défini quels sont les homologues de votre séquence.
Vous devez maintenant choisir un groupe d'étude et un groupe extérieur et vous avez différents groupes taxonomiques parmi vos homologues; c'est plutôt bien?
Pouvez-vous m'expliquer exactement ce qui vous bloque dans ce choix?


C. Petitjean
Tikycat
22 Apr 2010 22:51
Non evaluated contribution
Bonsoir
j'ai un petit soucis avec ma séquence. Voila j'ai fait un blast P contre nr mon meilleur score est de 35, contre swissprot mon meilleur score est de 40 et je ne trouve aucun homologue contre la banque environnementale. Pour vérifier j'ai fait un blast x et je trouve le meilleur score est de 40 et pour mon t blast n le meilleur score est de 44,3.est ce suffisant pour pouvoir en conclure que je n'ai aucune séquence homologue ?
c_petitjean_10
23 Apr 2010 10:30
Game master
Bonjour,

Encore une fois, le score n'est pas le seul critère sur lequel vous devez vous baser pour définir l'homologie de vos séquence. Vous devez analyser les alignements et le taxonomy report, et justifier votre choix.

En ce qui concerne le blastx, l'important est surtout de savoir si une autre ORF de votre séquence nucléique a des homologues. Car si c'est le cas, peut être est ce le signe que votre ORF n'est pas codante. Si ce n'est pas le cas, encore une fois expliquez et justifiez!

Bonne annotation.

C. Petitjean