Forum "Recherche d'homologues: BLAST"

Thread subject: utilisation du blast x et interprétation de ce que l'on y trouve

[ Return to forums ]
utilisation du blast x et interprétation de ce que l'on y trouve
lakisemedo
27 Apr 2011 1:25
Non evaluated contribution
Bonsoir

Après avoir réalisé l'alignement multiple de notre orf avec ses homologues, on se rend compte que la méthionine choisi comme codon start est fausse (sachant que notre orf est censé être complet en 5' et 3'). En effet, en prenant l'orf en entier et en refaisant l'alignement multiple, on trouve un bloc très conservé en amont de la méthionine supposée codon start.
On a alors fait un blast x (car peu sensible au erreur de séquençage). Le logiciel trouve de nombreux homologues dans le même cadre de lecture que notre orf. Est ce que cela confirme qu'il y a bien eu une erreur de séquençage?
De plus, je ne comprends pas pourquoi on ne ne peut pas se servir des résultats du blast x pour faire la suite de l'étude?
Est-ce parce que l'on trouve de meilleurs hits avec le blastp?

Nous avons du mal à interpréter les résultats du blast x. Des régions apparaissent en petite lettre, la séquence query va de 25 à 850 alors les séquences subject va de 250 à 350 par exemple.
(copié collé du meilleur hit du blast x)
>ref|ZP_02190832.1|  Divalent cation transporter [alpha proteobacterium BAL199]
gb|EDP62413.1|  Divalent cation transporter [alpha proteobacterium BAL199]
Length=520

Score =  259 bits (662),  Expect = 4e-67
Identities = 157/281 (56%), Positives = 206/281 (73%), Gaps = 0/281 (0%)
Frame = +1

Query  25   ENFYSIFIIDPGQrllgvlslskllsnkrsirlkDIMDNNFQSVDVERDQEEIALLFQQY  204
            ++FY+I+ +DP  R +G L LS LL  KR +R+ DI   +F+ + V  DQEE+ALLF+QY
Sbjct  240  DDFYAIYAVDPAHRPVGELVLSHLLRTKRPVRVSDIARKDFRRIPVTMDQEEVALLFRQY  299

Query  205  ALVDLAVTDKADRiigviifddivdviKEEAEEDFFGLGGVSDGSIRTSIYKTLKDRFSW  384
             LV   V  + +R++GVI  DD+VDVI EEAEED   LGGV++  +  S++ T + RF W
Sbjct  300  GLVAAPVVGEDERLLGVITVDDVVDVIDEEAEEDLMRLGGVTEVDLYGSLWDTARARFPW  359

Query  385  LSVNLVTAIIASMVIGLFQEEIEKIVALAVLMPIVASMGGNAGTQTVTVAVRALATRQLS  564
            L VNL TAI AS+VIG F   IEK+VALAVLMPIVASMGGNAGTQT+TVAVRA+A R L
Sbjct  360  LVVNLGTAIAASVVIGFFDAAIEKVVALAVLMPIVASMGGNAGTQTLTVAVRAMAMRDLD  419

Query  565  YINLQKFVLRESWVGMFNGVLFAIFSSILAYFWFNDFQIAIIMSASMVINLLLAGILGTL  744
              N  KFV +E+ VG  NGV+FA+  + ++  WF D QIA I++ +MV+NLL+AG++GTL
Sbjct  420  TRNAMKFVAKETLVGSLNGVVFAVLVAGVSMLWFGDVQIAWIIAVAMVLNLLVAGLVGTL  479

Query  745  IPLSLNKFKIDPAISSTILLTTATDVIGFFTFLGLAAWVIL  867
            IPL L + K+DPA++S + LTT TDV+GFF FLGLA  V+L
Sbjct  480  IPLGLERIKVDPAVASGVFLTTVTDVVGFFVFLGLATLVLL  520


merci

L.Semedo

C_Brochier_11
28 Apr 2011 10:13
Game master
Bonjour,

Les informations que vous avez fournies sont insuffisantes pour comprendre votre problème.
Précisez svp:
- quelle est la position de votre ORF par rapport au fragment d'ADN génomique que vous étudiez.
- Pourquoi pensez-vous que votre ORF est complet en 5'
- l'alignement obtenu avec blastx à partir de la région génomique qui est dans le même cadre de lecture que votre ORF mais qui offre un alignement localisé en dehors de l'ORF définie par ORF finder.

Céline Brochier
lakisemedo
29 Apr 2011 16:10
Non evaluated contribution
Bonjour

En fait, notre orf commence à la position 10 et se termine en position 867 sachant que la longueur de notre séquence nucléique est de 996pb.
De ce fait, orf finder a détecté un codon stop en amont et en aval de ces deux positions.
En toute logique, un codon start se situe forcément entre ces deux positions.(d'apès orf finder, à la position 133).

C'est pourquoi on a décidé de continuer nos recherches avec le codon start.

Pourtant lorsqu'on fait l'alignement multiple, la méthionine qui est censé être le codon start, elle s'aligne à une méthionine interne pour tous les autres homologues. D'aileurs, notre protéine(245aa) est bien plus courte que ses homologues(à peu près 450aa).
On nous a alors demandé pourquoi notre protéine ne s'alignait pas dès le début avec les autres homologues et de revérifier les résultats de orf finder.

Je pense avoir compris grâce à votre 3ième question : l'alignement que blast x sort correspond à l'orf définis par orf finder. Il n'y a pas de d'alignement localisé en dehors de l'orf défini par orf finder.

Il semble ne pas y avoir d'erreur de séquençage.

Notre protéine est donc tout simplement plus courte que ses homologues.

merci.

E_Meglecz_11
2 May 2011 9:42
Game master
Bonjour,

Dans le BLASTx les positions de query sont en nucléotides, tandis que les positions de sujet en aa.

La partie de l'alignement BLASTx que j'ai recopié ici, correspond à la traduction de votre séquence dans le cadre +1 entre la position 25 et 133 en nucléotide et position 9 et 45 en aa, où le dernière aa est le Méthionine supposé codon start. Donc revoyez votre conclusion.


Query  25   ENFYSIFIIDPGQrllgvlslskllsnkrsirlkDIM
            ++FY+I+ +DP  R +G L LS LL  KR +R+ DI
Sbjct  240  DDFYAIYAVDPAHRPVGELVLSHLLRTKRPVRVSDIA

Il faudra aussi expliquer la présence de premier codon STOP dans la traduction du cadre +1.
Vous avez déjà évoqué l'erreur de séquençage. Cela peut être un remplacement erroné d'une base ou un ajout ou omission d’une base. Je vous laisse décider entre ces solutions.

Emese Meglecz
lakisemedo
2 May 2011 21:27
Non evaluated contribution
Bonsoir

Au vu de ce que vous avez dit, je n'avais rien compris...
Mais merci pour les éclairements.

En fait, le blastx confirme ce dont on se doutait dès le blastp contre nr : la méthionine (que l'on pensait être codon start) est une méthionine interne, comme chez tous les autres homologues. En effet, toute protéine commence par un codon start or ici, le logiciel s'aligne avec les homologues bien avant la méthionine supposée codon start. De plus, il détecte beaucoup acides aminés conservés en amont de la méthionine.

Forcément s'il y avait réellement un codon stop en 5', la méthionine détectée par orf finder serait le codon start. Ce n'est pas le cas donc c'est qu'il y a un souci au niveau de ce codon stop,il n'est pas réelle.

Plusieurs éléments nous pousse dans cette direction :_notre protéine s'aligne parfaitement bien en 3' avec ses homologues (blastp) et quand on regarde les 100 premiers alignements, dont le score est supérieur à 200, on peut voir que l'alignement se termine à la position 867 (ou un peu avant) de la séquence nucléotidique ce qui est en accord avec la position 3' de l'orf.
_Les alignement commenceraient au niveau de la méthionine supposée codon start et pas avant.

Il a donc surement eu une erreur (de séquençage,ou une insertion...) qui a fait apparaitre un codon stop précoce dans le cadre de lecture 1 d'où le fait que le logiciel orf finder nous donne cette méthionine comme codon start.

Notre séquence nucléique est donc surement tronquée en 5' d'où le fait que notre protéine ne s'aligne pas dès le début avec ses homologues.

merci beaucoup.

Semedo