Forum "Recherche d'homologues: BLAST"

Thread subject: homologie et QuickGO

[ Return to forums ]
homologie et QuickGO
LAETITIA
24 Mar 2019 18:15
Non evaluated contribution

Bonjour Madame,

Dans cette séquence, il me semble qu'il y a beaucoup d'homologues :

- rRNA maturation factor

- rRNA maturation RNAse YbeY

- metaloprotein, YbeY

...

Cependant, il me semble aussi qu'il y a des fonctions qui ne sont pas homologues :

- spore protein maturation A-like protein

- heat shok protein

- cysthationine gamma synthase protein

...

Mon soucis est que j'ai du mal à trouver précisément dans QuickGO une des séquences qui me semble homologue. Il y a une quantité astronomique de dénomination et je n'arrive pas à savoir laquelle regarder. Du coup, je n'ai pas le moyen de confirmer que les séquences que je pense comme non homologues, le sont vraiment.

Quelle est la marche à suivre pour s'y retrouver parmi tout ce capharnaüm ?

Bien à vous !

Laetitia.

Meglecz18CTES
25 Mar 2019 17:55
Game master

Bonjour Laetitia,


Dans la pratique, il suffit de vous concentrer sur les hits qui ont une E-valeur relativement élevée (à partir de 1e-20). Dans le doute, soyez plutôt conservatrice, et choisissez un seuil assez bas, mais pas plus bas que 1-e20.

Si vous avez beaucoup de courage :
Pour les fonctions qui n’ont pas l’air d’être homologues, mais leurs E-valeurs est quand même assez faible (par exemple spore maturation protein A-like protéine 7,00E-31) regardez l’alignement de BLAST. Est-ce la même région qui est alignée que pour les fonctions qui semblent homologues ? Trouvez-vous des sites de quelques AA qui ont l’air d’être fortement conservées ? Trouvez-vous cette conservation dans ces alignements douteux ? Si oui, la protéine peut être mal annotée.

Bon courage,
Emese Meglecz

LAETITIA
26 Mar 2019 7:12
Non evaluated contribution

Bonjour Madame,

Je vous remercie de votre réponse !

Lorsque j'ai fais TaxList, j'ai remarqué qu'en bas il y a des "erreurs" de répertoriées. Est-ce qu'il s'agit là des séquences non-homologues, comme normalement dans la TaxList nous sommes censés avoir que des homologues ?

De plus, dans BLATp, ils précisent "specific hit" et "non specific hit". Qu'est-ce que cela signifie ? Est-ce que ça a un rapport avec l'homologie des séquences ?

Bien à vous !

Laetitia.

Meglecz18CTES
26 Mar 2019 17:29
Game master

Bonjour Laetitia,


Vous parlez de lignes suivantes, quand on fait tourner TaxReport
Erreurs:
Sequence retrieval failure : WP_132032863.1 rRNA maturation RNase YbeY [Flavobacterium circ...  187        1e-58  63%         
Sequence retrieval failure : WP_132109709.1 rRNA maturation RNase YbeY [Flavobacterium sp. ...  186        5e-58  63%         
Sequence retrieval failure : WP_131421886.1 MULTISPECIES: rRNA maturation RNase YbeY [Flavo...  184        5e-57  62%         
Sequence retrieval failure : WP_132066017.1 rRNA maturation RNase YbeY [Flavobacterium sp. ...  183        8e-57  62%         

Ce sont des erreurs très probablement liées aux mises à jour de base de données locale d’amnotathon. Je pense que cet outil ne communique pas directement avec NCBI, mais utilise la base de données nr téléchargée sur le serveur. Vous pouvez ignorer ces messaages.

"specific hit" et "non specific hit"
Je colle. Pouvez-vous me dire où vous voyez des hits spécifiques et non spécifiques ?

Bonne soirée,
Emese Meglecz