Forum "Recherche d'homologues: BLAST"

Sujet de discussion: Détermination du seuil

[ Retour aux forums ]
Détermination du seuil
pascaleceline
20 Apr 2009 22:55
Contribution non évaluée
Bonjour,

J’ai effectué le Blast p contre la banque nr mais j’ai du mal à trouver le seuil qui sépare les séquences homologues des séquences non homologues: le résultat de mon Blast présente les trois premières séquences homologues avec un score maximum de 449 et un E value de 1e-124, mais toutes les séquences d’après ont un score qui passe à 189 et une Evalue à 2e-46 puis qui diminuent de façon progressive, et surtout après les trois premières séquences les alignements deux à deux ne concernent que quelques acides aminés mais plus des domaines entiers de la protéines comme c’est le cas pour les trois premières séquences.
Il me semble donc que je dois fixer le seuil après ces trois premières séquences, est-ce possible? Et si oui, comment construire un arbre si le résultat du Blast ne me donne que trois séquences homologues?

Merci d’avance pour votre réponse
Cordialement
LENA Céline et MANSOUR Pascale
Brochier09
21 Apr 2009 8:31
Maître de jeu
Bonjour,

Avant tout je pense qu'il y a une erreur de copier/coller entre les alignements et les descriptions entre les blast swissprot et nr.
Je ne comprends pas trop cette phrase "après les trois premières séquences les alignements deux à deux ne concernent que quelques acides aminés mais plus des domaines entiers de la protéines comme c’est le cas pour les trois premières séquences"

Je vous rappelle rapidement les règles à voir si vous avez à faire à des homologues:
- regardez le % de similarité et d'identité
- les résidus similaires sont-ils bien répartis sur l'ensemble de l'alignement
- quels % de la longueur de la séquence représente l'alignement ? (vous pouvez aussi regarder si ce % varie par rapport à vos séquences qui sont très similaires (celles avec les e-value < 10-100))
- est-ce que les annotations changent
...

Si vous avez des doutes, vous pouvez prendre les séquences query au format fasta et faire une recherche de domaine avec interrpro pour voir si vous récupérez des domaines similaires à ceux de votre séquence, dans ce cas là cela signifie qu'elles sont homologues.

Cordialement,

Céline Brochier