|
utilisation du blast x et interprétation de ce que l'on y trouve |
lakisemedo 27 Apr 2011 1:25 Non evaluated contribution |
Bonsoir
Après avoir réalisé l'alignement multiple de notre orf avec ses homologues, on se rend compte que la méthionine choisi comme codon start est fausse (sachant que notre orf est censé être complet en 5' et 3'). En effet, en prenant l'orf en entier et en refaisant l'alignement multiple, on trouve un bloc très conservé en amont de la méthionine supposée codon start. On a alors fait un blast x (car peu sensible au erreur de séquençage). Le logiciel trouve de nombreux homologues dans le même cadre de lecture que notre orf. Est ce que cela confirme qu'il y a bien eu une erreur de séquençage? De plus, je ne comprends pas pourquoi on ne ne peut pas se servir des résultats du blast x pour faire la suite de l'étude? Est-ce parce que l'on trouve de meilleurs hits avec le blastp?
Nous avons du mal à interpréter les résultats du blast x. Des régions apparaissent en petite lettre, la séquence query va de 25 à 850 alors les séquences subject va de 250 à 350 par exemple. (copié collé du meilleur hit du blast x) >ref|ZP_02190832.1| Divalent cation transporter [alpha proteobacterium BAL199] gb|EDP62413.1| Divalent cation transporter [alpha proteobacterium BAL199] Length=520
Score = 259 bits (662), Expect = 4e-67 Identities = 157/281 (56%), Positives = 206/281 (73%), Gaps = 0/281 (0%) Frame = +1
Query 25 ENFYSIFIIDPGQrllgvlslskllsnkrsirlkDIMDNNFQSVDVERDQEEIALLFQQY 204 ++FY+I+ +DP R +G L LS LL KR +R+ DI +F+ + V DQEE+ALLF+QY Sbjct 240 DDFYAIYAVDPAHRPVGELVLSHLLRTKRPVRVSDIARKDFRRIPVTMDQEEVALLFRQY 299
Query 205 ALVDLAVTDKADRiigviifddivdviKEEAEEDFFGLGGVSDGSIRTSIYKTLKDRFSW 384 LV V + +R++GVI DD+VDVI EEAEED LGGV++ + S++ T + RF W Sbjct 300 GLVAAPVVGEDERLLGVITVDDVVDVIDEEAEEDLMRLGGVTEVDLYGSLWDTARARFPW 359
Query 385 LSVNLVTAIIASMVIGLFQEEIEKIVALAVLMPIVASMGGNAGTQTVTVAVRALATRQLS 564 L VNL TAI AS+VIG F IEK+VALAVLMPIVASMGGNAGTQT+TVAVRA+A R L Sbjct 360 LVVNLGTAIAASVVIGFFDAAIEKVVALAVLMPIVASMGGNAGTQTLTVAVRAMAMRDLD 419
Query 565 YINLQKFVLRESWVGMFNGVLFAIFSSILAYFWFNDFQIAIIMSASMVINLLLAGILGTL 744 N KFV +E+ VG NGV+FA+ + ++ WF D QIA I++ +MV+NLL+AG++GTL Sbjct 420 TRNAMKFVAKETLVGSLNGVVFAVLVAGVSMLWFGDVQIAWIIAVAMVLNLLVAGLVGTL 479
Query 745 IPLSLNKFKIDPAISSTILLTTATDVIGFFTFLGLAAWVIL 867 IPL L + K+DPA++S + LTT TDV+GFF FLGLA V+L Sbjct 480 IPLGLERIKVDPAVASGVFLTTVTDVVGFFVFLGLATLVLL 520
merci
L.Semedo
|
C_Brochier_11 28 Apr 2011 10:13 Game master |
Bonjour,
Les informations que vous avez fournies sont insuffisantes pour comprendre votre problème. Précisez svp: - quelle est la position de votre ORF par rapport au fragment d'ADN génomique que vous étudiez. - Pourquoi pensez-vous que votre ORF est complet en 5' - l'alignement obtenu avec blastx à partir de la région génomique qui est dans le même cadre de lecture que votre ORF mais qui offre un alignement localisé en dehors de l'ORF définie par ORF finder.
Céline Brochier |
lakisemedo 29 Apr 2011 16:10 Non evaluated contribution |
Bonjour
En fait, notre orf commence à la position 10 et se termine en position 867 sachant que la longueur de notre séquence nucléique est de 996pb. De ce fait, orf finder a détecté un codon stop en amont et en aval de ces deux positions. En toute logique, un codon start se situe forcément entre ces deux positions.(d'apès orf finder, à la position 133).
C'est pourquoi on a décidé de continuer nos recherches avec le codon start.
Pourtant lorsqu'on fait l'alignement multiple, la méthionine qui est censé être le codon start, elle s'aligne à une méthionine interne pour tous les autres homologues. D'aileurs, notre protéine(245aa) est bien plus courte que ses homologues(à peu près 450aa). On nous a alors demandé pourquoi notre protéine ne s'alignait pas dès le début avec les autres homologues et de revérifier les résultats de orf finder.
Je pense avoir compris grâce à votre 3ième question : l'alignement que blast x sort correspond à l'orf définis par orf finder. Il n'y a pas de d'alignement localisé en dehors de l'orf défini par orf finder.
Il semble ne pas y avoir d'erreur de séquençage.
Notre protéine est donc tout simplement plus courte que ses homologues.
merci.
|
E_Meglecz_11 2 May 2011 9:42 Game master |
Bonjour,
Dans le BLASTx les positions de query sont en nucléotides, tandis que les positions de sujet en aa.
La partie de l'alignement BLASTx que j'ai recopié ici, correspond à la traduction de votre séquence dans le cadre +1 entre la position 25 et 133 en nucléotide et position 9 et 45 en aa, où le dernière aa est le Méthionine supposé codon start. Donc revoyez votre conclusion.
Query 25 ENFYSIFIIDPGQrllgvlslskllsnkrsirlkDIM ++FY+I+ +DP R +G L LS LL KR +R+ DI Sbjct 240 DDFYAIYAVDPAHRPVGELVLSHLLRTKRPVRVSDIA
Il faudra aussi expliquer la présence de premier codon STOP dans la traduction du cadre +1. Vous avez déjà évoqué l'erreur de séquençage. Cela peut être un remplacement erroné d'une base ou un ajout ou omission d’une base. Je vous laisse décider entre ces solutions.
Emese Meglecz |
lakisemedo 2 May 2011 21:27 Non evaluated contribution |
Bonsoir
Au vu de ce que vous avez dit, je n'avais rien compris... Mais merci pour les éclairements.
En fait, le blastx confirme ce dont on se doutait dès le blastp contre nr : la méthionine (que l'on pensait être codon start) est une méthionine interne, comme chez tous les autres homologues. En effet, toute protéine commence par un codon start or ici, le logiciel s'aligne avec les homologues bien avant la méthionine supposée codon start. De plus, il détecte beaucoup acides aminés conservés en amont de la méthionine.
Forcément s'il y avait réellement un codon stop en 5', la méthionine détectée par orf finder serait le codon start. Ce n'est pas le cas donc c'est qu'il y a un souci au niveau de ce codon stop,il n'est pas réelle.
Plusieurs éléments nous pousse dans cette direction :_notre protéine s'aligne parfaitement bien en 3' avec ses homologues (blastp) et quand on regarde les 100 premiers alignements, dont le score est supérieur à 200, on peut voir que l'alignement se termine à la position 867 (ou un peu avant) de la séquence nucléotidique ce qui est en accord avec la position 3' de l'orf. _Les alignement commenceraient au niveau de la méthionine supposée codon start et pas avant.
Il a donc surement eu une erreur (de séquençage,ou une insertion...) qui a fait apparaitre un codon stop précoce dans le cadre de lecture 1 d'où le fait que le logiciel orf finder nous donne cette méthionine comme codon start.
Notre séquence nucléique est donc surement tronquée en 5' d'où le fait que notre protéine ne s'aligne pas dès le début avec ses homologues.
merci beaucoup.
Semedo |
|