Forum "Alignement multiple: CLUSTALW"

Sujet de discussion: Pause D'AA

[ Retour aux forums ]
Pause D'AA
ElisaM
16 Apr 2021 10:01
Contribution non évaluée

Bonjour,

Mon alignement clustal est le suivant, je me demandais pourquoi à deux positions différentes il y avait une grande "pause" d'AA similaire, la peut-il venir d'une fusion de gènes? Où est-ce des parties on codantes ou peu importante en terme d'évolution qui ont été "effacé" chez certains individus?

Meric

 

 

CLUSTAL FORMAT: MUSCLE (3.8) multiple sequence alignment


BPAPPC2_Ba      -------MSGSVNKVILLGNLGRDPEIRSMQSGKKMASFSIATSKRWKDRNTQEQKENTS
BPAPP3_Bac      -------MVGSVNKAILLGNLGRDPEIRSMQSGSKMASFSIATSKRWKDRNTQEQKEKTS
BPAPu1_Bac      -------MVGSVNKVILLGNLGRDPEIRSMQSGSKMANFSIATSKRWKDRNTQEQKEKTS
BPAPP2_Bac      -------MAGSVNKVILIGNLGKDPDVRSTSNGGRFASFSIATSTKYRNKETQQLEDKTE
OMRGCv2_95      YLLIKKFMAGSVNKVILLGNLGKDPDIRATQAGSRLASFSIATSTKYRNKDTQQLEDKTE
BPAPP1_Bac      -------MAGSVNKVILLGNLGKDPDIRATSAGSRLASFSIATSTKYRNKETQQLEDKTE
BPAPPC3_Ba      -------MAGSLNKVFLIGRLGNDPDIKSTQNGKSVAILSLATSESWKDKNTGEKKEKTE
BPAPPC1_Ba      -------MASSLNKVMLIGNLGADPIIRQTQDGKKLAQLSLATSESWKDKNTGERRDKTQ
BPAHCC2_Ba      -------MAGSVNKVTLIGRLGKDPEVRNSPDGSKIVTMSVATSETWKDRASGERKERTE
BPAHCC1_Ba      -------MAGSVNKVILVGNLGRDPEVRHMQDGNKVVQLSVATSEAWKDRTTGERRDRTE
BPARRN1_Ba      -------MAGSVNKVILIGNLGKEPEVRSLQNGGKVCTLRIATSETWKDRGTGERQERTQ
BPARA1_Bac      -------MAGSVNKVILVGNLGRDPEVRNTQSGSKIVNLAIATSDTWNDRNTGERRDRTE
BPARRO1_Ba      -------MAGSVNKVILIGNLGRDPEIRSMQNGQKVANLALATSENWRDKQSGERRERTE
BPARTT1_Ba      -------MAG-VNKVILVGNLGRDPEVRTSQDGSKIVNLNIATSESWKDRATGERKEKTE
BPARAG1_Ba      -------MAGSVNKVILIGNLGRDPEVRNTQDGGKVVNFTLATSETWNDRASGERKERTE
BPARAA1_Ba      -------MAGSVNKVILVGNLGKDPDVRSSQSGSKIVSFSLATSDTWNDRASGERRERTE
BPARAK1_Ba      -------MAGSVNKVILVGNLGKDPEVRTSQSGAKIVSLTLATSDTWNDRASGERRERTE
BPARR1_Bac      -------MAGSVNKVILVGNLGRDPEVRFSQDGKKIVNMSLATSESWNDRDTGERREKTE
BPARAA2_Ba      -------MAGSVNKVILVGNLGRDPEIRTSQSGQKIASLSVATSDTWNDRTSGERRERTE
BPARRT1_Ba      -------MAGSVNKVILIGNLGRDPEVRSTQDGMKIVNLAVATSETWRDRQSGERRERTE
BPARRT2_Ba      -------MAGSVNKVILIGNLGRDPEVRTMNNGGKVVNLSVATSETWRDKNSGERQEKTE
                       * . :**. *:*.** :* :.    *  .  : :***  :.:. : :  :.*.

BPAPPC2_Ba      WHNIVVFNEGLVDVIERYIKKGSKIYVEGELSTRKYQDK-DGNDKYTTEVVLQGYNSTLT
BPAPP3_Bac      WHNIVVFGDGLVDIVEKYVKKGSKIYVEGELQTRKWQDK-DGNDRYTTEVILQGYNCNLT
BPAPu1_Bac      WHNIVIFGDGLVDIVEKYVKKGSKVYVEGELQTRKWQDQ-EGKDRYTTEVILQGYNCNLT
BPAPP2_Bac      WHRVIIFNEKLADISEKYLKKGSKIYLEGQLQTRKY-EQ-DGVTKYTTEVVIPNFGGVLT
OMRGCv2_95      WHRVVVFNDKLADICEKYLRKGSKIYIEGQLQTRKWTDN-NGVDKYTTEVVIPNYSGVLT
BPAPP1_Bac      WHRVVVFNDKLADVCEKYLRKGSKVYVEGQLQTRKWTDN-NGVDKYTTEVVIPNYSGVLT
BPAPPC3_Ba      WHRVVIFNEGLVNVVQKYLKKGAQVYVEGQISTTKYTDN-NGQEKFSTQIVLQGYNSTLT
BPAPPC1_Ba      WHRIVIFNDGLAGVVENYLKKGSKIYIEGQLQTRKFTDN-NGVEKYTTEVVLANYNGTLT
BPAHCC2_Ba      WHRVVIFNEKLGEIAERYLKKGGQVYLEGSLQTRKWTDP-QGIEKYTTEVVIQRYRGELT
BPAHCC1_Ba      WHRVVIFNDRIAEIAERYLKKGAKVFLEGQLQTRKWTDQASGQEKYTTEIVIQKYKGELT
BPARRN1_Ba      WHSVVIFNENLVGVAERFLKKGSKVYIEGQLETRKWQDQ-QGQERYTTEVVLRQFRGELT
BPARA1_Bac      WHRVVIFNERVGDVAERYLRKGRKVYIEGELRTRKWTDQ-QGVEKYTTEVVIDRFRGNLV
BPARRO1_Ba      WHRVVIFNENLIEIAEKYLRKGSKIYIEGSLQTRKWQDQ-SGQEKYTTEIVLQRYRGELT
BPARTT1_Ba      WHRVVIFNPHLGDIAERYLKKGSTVYIEGALQTRKWTDQ-SGQEKYSTEVVIGRFKGELT
BPARAG1_Ba      WHRVVVFNDRLADIAERYLRKGTKVYVEGALQTRKWTDQ-AGQEKYTTEVVISRFRGEIT
BPARAA1_Ba      WHRVVIFNERLADVAERFLRKGRKVYLEGSLQTRKWTDQ-GGQERFTTEVIVDRFRGELV
BPARAK1_Ba      WHRVVIFNERIGDVAERFLRKGRKVYLEGSLQTRKWTDQ-SGQDRYTTEVVVDRFRGDLV
BPARR1_Bac      WHRIVIFNDRLADVAEKYLKKGSKIYVEGQLQTRKWTDN-AGVEKYSTEVVLQNFRGELT
BPARAA2_Ba      WHRVVVFNDRIADVAERFLRKGRKVYVEGTLQTRKWTDQ-SGQEKYTTEIVLDRFRGELV
BPARRT1_Ba      WHRVVIFNERLAEVAEKFLRKGSKVYVEGALQTRKWTDQ-QGQEKYTTEVVLQRFRGELT
BPARRT2_Ba      WHRVVIFNEKLGEVAERFLKKGSKVYVEGALQTRKWTDQ-SGTEKYSTEVVLQRFRGELT
                ** :::*.  :  : :.::.**  :::** : * *: :   *  .::*::::  :   :.

BPAPPC2_Ba      MLDSRNSGSASIE-----------------------------EAPNXSSLDSXLEDTLDS
BPAPP3_Bac      LLDTRNNSQTSSN-----------------------------NNDQIDDSKSIEDDSIES
BPAPu1_Bac      LLDSRNQSNNSLE-----------------------------SQSESMQDNSISDDSFGS
BPAPP2_Bac      MLDSRSQSDS--------------------------------NQQTDQIESAADASVSPT
OMRGCv2_95      MLDTRSQSSVSE------------------------------ESNNNQLDSAADEAMGGS
BPAPP1_Bac      MLDSRSQSTIS-------------------------------DDNSSQIDSAADEALGGP
BPAPPC3_Ba      MLGGSNKA----------------------------------IESGIDQDTSSNLPSDES
BPAPPC1_Ba      MLDSRGGGSS--------------------------------DFGGESSPQIDQDMSQDS
BPAHCC2_Ba      LLESKGGSEGYSN---------DFD-------------TSPLGSGGGSSDPFSVAPAGGS
BPAHCC1_Ba      LLDSRGEGSSS-------------------------------QVGESHTDYQPQRMAAGA
BPARRN1_Ba      LLDGREGGGMGAGAGGASYDDRGGD-------------YGGGGYGGGSSYGGGGGGSYGG
BPARA1_Bac      LLDSQRGGGDGGGYGDDGYDG-GYG-------------DGGSNWAGG---GSAPAGRGGA
BPARRO1_Ba      MLDGRADGGSGSGGG-------SGG-------------GSGGGYESAQDDYSGGAASGPA
BPARTT1_Ba      LLGGRGDSGGGGG-----------G-------------YGG-GGGGY---DESPRQGGGG
BPARAG1_Ba      MLDSRSGGEGA-------------G-------------EGG-GYRSA---PAQRAPSGGG
BPARAA1_Ba      LLDNKGNSEGGGNYPPPNN---GEN-------------SRSSTYGGQSANSGSAGGGWDA
BPARAK1_Ba      LLDSNRGGEGGGDDMGGGYGG-G-G-------------YGG-GSGGG---YSAPARSQPQ
BPARR1_Bac      MLDTRGGG----------------------------------GSGGDVQEPDYGPGPGAP
BPARAA2_Ba      LLDGRGSGEGEEGGGGSSGYG-GAE-------------SDG-GFGGG---GGTPRRIGGA
BPARRT1_Ba      MLDGRGEGGGGAEFGGGDDFGGGAGGGFGGGQGGGGRRGGGGGYGGGRGGQGGGTGGGQG
BPARRT2_Ba      MLDGKGGGGGGAG---------GGD-------------DYGDDYGGGGGGNGGGGRSSGG
                :*     .                                                    

BPAPPC2_Ba      QVSDSX---------------------------DLDDXIPF
BPAPP3_Bac      QNNDSN---------------------------DLDEDIPF
BPAPu1_Bac      NSSDSS---------------------------DLDEDIPF
BPAPP2_Bac      EDNSTA----S----------------------KLDDDIPF
OMRGCv2_95      ETSTAE---------------------------QLDDDIPF
BPAPP1_Bac      DNSTAE---------------------------QLDDDIPF
BPAPPC3_Ba      VSKT-----------------------------KIDDEVPF
BPAPPC1_Ba      NFSSSD----DL---------------------DIDDEIPF
BPAHCC2_Ba      KGFD-----------------------------DLNDDIPF
BPAHCC1_Ba      EGASVA----NLTS-------------------DLEDEIPF
BPARRN1_Ba      GGGDYG----GGNRGGGSRGGSGGGSSRPSPAADLDDEIPF
BPARA1_Bac      GGRGQQ----GGNFGGG----AGWDSSSGQGDQALDDEIPF
BPARRO1_Ba      GSPARG----GS---------------------DLDDEIPF
BPARTT1_Ba      GGGGRQ----GGG--------QSWEP--PA---DMDDEIPF
BPARAG1_Ba      SGFGGG----SSRPASGG---SGWE---PSHGGDLDDEIPF
BPARAA1_Ba      SGSGGS----G----------------------DLDDEIPF
BPARAK1_Ba      RNNDRP----A-GGGGGSTG-GGWDA--PAGGSDLDDEIPF
BPARR1_Bac      GATD-----------------------------DLDDDIPF
BPARAA2_Ba      SGAGGA----GGARKSAPASPGGWDA--PSG--DLDDEIPF
BPARRT1_Ba      GGFGGGYDDYGSDYGGGSSGGGRGGAGGGGGSNDLDDEIPF
BPARRT2_Ba      GGGRKP----SG---------------------PIDDDIPF
                                                  ::: :**
 

Meglecz20CTES
17 Apr 2021 14:35
Maître de jeu

Bonjour Élisa,

 

C’est très probablement une (ou plusieurs) insertion ou délétion (indel).
On ne peut pas parler d’une région non codante, car on compare des séquences des protéines. Les régions des séquences moins importantes pour la fonction de la protéine peuvent accumuler des mutations. Souvent ce sont des substitutions, mais il peut y avoir des indels. Les indels peuvent être très courtes (un nucléotide ou acide aminé) ou plus longues.


Bon travail,
Emese Meglecz