Forum "Recherche d'homologues: BLAST"

Thread subject: Recherche d'Homologues avec Swissprot

[ Return to forums ]
Recherche d'Homologues avec Swissprot
CGBenoit
3 Mar 2022 19:20
Non evaluated contribution

Bonjour,

J'ai de manière assez récurrente la présence (ou conservation) des 2 sites surlignés (comme dans les sq ci-dessous), qui contiennent 2 ou voire 3 nucléotides rares (W F), sur les dernières séquences proposées par Swissprot.

Cependant, ces sq ont des %id < 30, %similarité < 45 et des gaps parfois > 10. Les Query Coverage (56% et 32%) et les E-values sont assez "faibles" (0.002 et 0.003)

Pourriez m'aider à déterminer s'il s'agirait ou non d'homologues ?

Merci de votre aide,

Capucine 

 

 

>RecName: Full=Cercosporin MFS transporter CTB4; AltName: Full=Cercosporin toxin biosynthesis cluster protein 4 [Cercospora nicotianae]
Sequence ID: A0ST42.1 Length: 512
Range 1: 55 to 231

Score:43.5 bits(101), Expect:0.002, 
Method:Compositional matrix adjust., 
Identities:45/188(24%), Positives:78/188(41%), Gaps:19/188(10%)

Query  1    LGRSKVDHSKPLTHREILIIMSGLMTGLLLAALDQTIVSTALKSIVEDFNGLNHYTWV--  58
            +G     + + L +    +I   L    L      ++   A   + E+F  L   T V  
Sbjct  55   IGEDDKGNPQNLPYWRKWVITMSLALYALSTTFSSSVFGAATHVLAEEF-ALPAETVVLG  113

Query  59   VTAYLLTSTASTPLY-GKISDLYGR-RPVYQ----FSIIMFLIGSFLAGASTSMEQLIIT  112
             T+  +   A+ P++ G  S+ +GR RP+      F+++   I       + S+  + I 
Sbjct  114  CTSLFMVGFATGPIFWGPFSEAFGRTRPLLAGYLGFAVLQLPIAD-----ARSLTSICIL  168

Query  113  RAIQGLGAGGLMGLTFVIIGDIVAPRERGKYQGLFGAVWGVSSVAGPLLGGFFSDNATIL  172
            R + G        +   I+ DI +PRERG      GA   +  + GPL+G     +  + 
Sbjct  169  RFLGGFFGAAPSSILSGILADIWSPRERGFAMPTVGAFLTIGPILGPLIG-----SVLVQ  223

Query  173  GITGWRWI  180
             + GWRWI
Sbjct  224  SVLGWRWI  231
 

 

>RecName: Full=Multidrug transporter FLR1; AltName: Full=Drug:H(+) antiporter FLR1; Short=DHA FLR1; AltName: Full=Flucytosine exporter FLR1 [[Candida] glabrata CBS 138]
Sequence ID: Q6FRT6.1 Length: 557
Range 1: 179 to 275

Score:42.7 bits(99), Expect:0.003, 
Method:Compositional matrix adjust., 
Identities:28/103(27%), Positives:47/103(45%), Gaps:6/103(5%)

Query  81   GRRPVYQFSIIMFLIGSFLAGASTSMEQLIITRAIQGLGAGGLMGLTFVIIGDIVAPRER  140
            GR PVY  +  +F +       + +   L+I R I G+     +      +GDIV+    
Sbjct  179  GRLPVYMITFFLFTMLQIGCALAPNFAGLVILRFITGVLCSPALSTGGATLGDIVS----  234

Query  141  GKYQGLFGAVWGVSSVAGPLLGGFFSDNATILGITGWRWIFYI  183
                         Y      L       +W + +VA P+L       A+++                      WRWIF++
Sbjct    235  QNYLALVLGLWSIGAVAAPVLAPLLG--ASMVVAKDWRWIFWL  275

OphePing
3 Mar 2022 20:37
Non evaluated contribution

D'après ce que j'ai compris des explications, avec ces résultats de query, Evalue, identities, positives et gaps ça me semble être des homologues. En plus s'ils reviennent de manières récurrente dans les résultats d'analyse ça confirme aussi.

Brochier_22
5 Mar 2022 10:13
Game master

Bonjour,

 

Interpréter ce type de résultat est toujours difficile. 

Les critères à prendre en compte sont bien sur :

- le % identities et le %positives

- le %gaps

- la présence de résidus rares conservés

mais également la longueur des séquences et le query_coverage

 

Dans votre cas, la séquence query présente 300 aa, mais est probablement incomplète en 3'.

Les homologues détectés par blast présentent une longueur plutôt de l'ordre de 500 aa.

 

Le query_coverage des séquences subject présentant le plus fort score est de l'ordre de 90%, beaucoup de séquences avec un score et une evalue moyennes présentent un query coverage de 50%, alors que les séquences avec les scores et les evalues les plus faibles présentent un query coverage de 30% ou moins.

 

En résumé, les alignements que vous présentez ci-dessus présentent de motifs conservés impliquant des résidus rares ce qui est un argument fort soutenant l'hypothèse que les séquences sont homologues. Une hypothèse alternative pourrait être que les sequences subjects présentent une zone conservée avec le query sans pour autant qu'on puisse considérer que les séquences sont homologue, ce qui est compatible avec le faible query_coverage que vus observez.

 

Pour prendre une décision, je vous conseille de faire une recherche de domaine avec interpro à partir des séquences subject pour lesquelles vous avez des doutes. Si vous retrouvez les même domaines fonctionnels que ceux du query ou des signatures rapprochant la séquence query et les subjects d'une même famille, alors, c'est argument très fort en faveur de l'hypothèse que les séquences sont homologues. Si vous ne retrouvez pas de point commun entre les signatures associées à la séquence query et les signatures associées aux subjects, vous pourrez rejeter l'hypthèse.

 

Cordialement,

 

Céline Brochier