Forum "Alignement multiple: CLUSTALW"

Sujet de discussion: alignement

[ Retour aux forums ]
alignement
Fanny_Smahan
7 Nov 2020 20:15
Contribution non évaluée

Bonjour monsieur, J'étais en train de mettre nos analyses des alignements multiples au propre quand je me suis aperçue que les chiffres ne collaient pas, nous avons au total une petite dizaine d' a.a vers les positions 90 et 410, alors que tout le reste de la séquence est entre les positions 600 et 1000. Est-il possible que ces quelques premiers acides aminés soient un genre d'artefact ? Comment pouvons-nous les analyser ? Bonne soirée à vous

PHingamp_PGF20
7 Nov 2020 21:39
Maître de jeu

Je suis pas totalement certain d'avoir saisi votre question, mais en effet l'alignement multiple est très complexe, avec vertaines régions truffées d'INDELS, probablement parce que les différentes séquences sont de longueur très différentes (et certaines semblent immenses) ? Dans ce cas de séquences de longueur très différentes, les logiviels tels que MUSCLE ont du mal à placer correctement les INDELs, en particulier aux extrémités... Heureusement que ces homologues ont un "coeur" bien conservé qui s'aligne facilement, car en dehors de ce coeur d'alignement c'est vraiment la pagaille... Donc artefacts d'alignements oui, très probablement.

Au fait bien vu pour le code des séquences pour l'alignement au format GBLOCKS, parce que j'ai cru avant de le remarquer ne pas pouvoir interpréter cet alignement :)

Par contre j'ai l'impression que les deux alignements (CLUSTAL et GBLOCKS) ne sont pas exactement les mêmes (cf ci-dessous) ? Ou alors j'ai mal compris, car les séquences ne sont pas ordonnées pareil.

PS: votre arbre PhyML n'est pas tout à fait enraciné correctement (la racine doit être entre la branche menant au dernier ancètre commun groupe d'étude et celle menant au dernier ancètre commun groupe extérieur. Actuellement la racine est interne au groupe extérieur)

 


BFCCOO1          ------------------------------------------------------------	0
BFCCCB1          ------------------------------------------------------------	0
Translation      ------------------------------------------------------------	0
BFCCRF1          ------------------------------------------------------------	0
BFCCRA1          ------------------------------------------------------------	0
BFCCOu1          ------------------------------------------------------------	0
BFCCRA2          ------------------------------------------------------------	0
BFCCRC1          ------------------------------------------------------------	0
BFEEEE1          --------MARRYETITELYSKTVAGLAAPQAWQSFLTTACHNFRLPFDEQVLLYAQRPD	52
BFCC1            --------MAIRYKALTELYQETQRKVTAPAEWRQFLTSACRNYRLSFDEQLLVYAQRPD	52
BFEEE1           --------MAIRYKALTELYQETQRKVTAPAEWQQFLTSACRNYRLSFDEQLLVYAQRPD	52
BFCCLD1          --------MAIRYKALTELYHETQRSVTAPAQWQAFLASACRNYRLSFDEQLLVYAQRPD	52
BFCCCH1          --------MAILYKALTELYRETQRKVTAPSEWQAFLAAACRNYRLTFDEQLLVYAQRPD	52
BFC1             --------MAIRYKALTELYQETQRSVTAPDQWRAFLASACRNYRLSFHEQLLVYAQRPD	52
BFCCEE1          --------MAIRYKALTELYRETQRSVTAPDQWRAFLASACRNYRLSFDEQLLVYAQRPD	52
BFCCL1           --------MAIRYKALTELYLETQRSVTAPDQWRAFLASACRNYRLSFDEQLLVFAQRPD	52
BFEEEM1          --------MAIRYKALTELYRETQRSVTAPDQWRAFLASACRNYRLSFDEQLLVYAQRPD	52
BFCCRP1          --------MAIRYKALTELYQETQRSVTAPDQWRAFLASACRNYRLSFDEQLLVYAQRPD	52
BFCCRF2          --------MAIRYKALTELYQETQRSVTAPDQWRAFLASACRNYRLSFDEQLLVYAQRPD	52
BFTTPP2          -----MPRYDIVDLS-RTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPK	54  *
BFTTPF1          -----MPRYDIVDLS-RTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPK	54  *  //////////////////////////////////////////////////////
BFTTPP1          -----MPRYDIVDLS-RTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPK	54  *  Séquences du Groupe extérieur (extrêmement conservées)
BFT1             MRRDKMPRYDIVDLS-RTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPK	59  *  //////////////////////////////////////////////////////
BFBLEE1          -----MPRYDIVDLS-RTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPK	54  *
BFCCRF3          ---------------------------------MNYLDVAARLYRYSFKDTLLIHAQRPD	27
BFCCEA1          ------------------------------------------------------------	0
BFTTTT1          -----MSDKAQAY-A-QLAEETAKSLTKSLANWTGFLTTVGRLYKYPYHEQLMIYAQRPD	53
BFCCRB1          -----MPSKVQLY-A-QMADRTAEQITGSYQKWTAFLTTAARLYKYPYNEQLMIFAQRPE	53
BFCCOD1          -----MPSKVQLY-A-QMADRTAEQITGSYQKWTAFLTTAARLYKYPYNEQLMIFAQRPE	53
BFEEEA1          -----MPTKAELY-A-QMADKVATQLTGSWQEWAGFLTTASRLYKYPFHEQLMIYAQRPD	53
BFEEEH1          -----MPTKAELY-A-QMADKVATQLTGSWQEWAGFLTTAARLYKYPFHEQLMIYAQRPD	53
BFCCRP2          -----MPTKAEFY-R-QMAEQVSTRLVGSWKEWTAFLTTAARLYKYPFHEQMMIYAQRPD	53
BFCCRH1          -----MPSKAEFY-R-QMAEQVSTQLVGSWKEWTAFLTTAARLYKYPFHEQMMIYAQRPD	53
BFCCCB2          -----MPSKTEFY-R-QMADHVATQLTGSWQEWAGFLTTAARLYKYPFHEQLLIYAQRPD	53
                                                                             
                         10        20        30        40        50        60
                 =========+=========+=========+=========+=========+=========+
S01              ------------------------------------------------------------
S02              -----MPRYDIVDLSRTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPKA
S03              MRRDKMPRYDIVDLSRTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPKA
S04              -----MPRYDIVDLSRTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPKA
S05              -----MPRYDIVDLSRTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPKA
S06              -----MPRYDIVDLSRTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPKA
S07              ------------------------------------------------------------
S08              ------------------------------------------------------------
S09              ------------------------------------------------------------
S10              ------------------------------------------------------------
S11              ---MKDATFGN--ACRNSDRENAFLEGA-EAIRRIVSESGDLRLAKLYYDMPAFHTRMHQ
S12              ---MEEDGFAY-------------------------------------------------
S13              --------------------------------MNYLDVAARLYRYSFKDTLLIHAQRPDA
S14              ----MARRYET--ITELYSKTVAGLAAP-QAWQSFLTTACHNFRLPFDEQVLLYAQRPDA
S15              ----MAIRYKA--LTELYHETQRSVTAP-AQWQAFLASACRNYRLSFDEQLLVYAQRPDA
S16              ----MAIRYKA--LTELYQETQRKVTAP-AEWRQFLTSACRNYRLSFDEQLLVYAQRPDA
S17              ----MAIRYKA--LTELYQETQRKVTAP-AEWQQFLTSACRNYRLSFDEQLLVYAQRPDA
S18              ----MAILYKA--LTELYRETQRKVTAP-SEWQAFLAAACRNYRLTFDEQLLVYAQRPDA
S19              ----MAIRYKA--LTELYRETQRSVTAP-DQWRAFLASACRNYRLSFDEQLLVYAQRPDA
S20              ----MAIRYKA--LTELYQETQRSVTAP-DQWRAFLASACRNYRLSFHEQLLVYAQRPDA
S21              ----MAIRYKA--LTELYLETQRSVTAP-DQWRAFLASACRNYRLSFDEQLLVFAQRPDA
S22              ----MAIRYKA--LTELYQETQRSVTAP-DQWRAFLASACRNYRLSFDEQLLVYAQRPDA
S23              ----MAIRYKA--LTELYQETQRSVTAP-DQWRAFLASACRNYRLSFDEQLLVYAQRPDA
S24              ----MAIRYKA--LTELYRETQRSVTAP-DQWRAFLASACRNYRLSFDEQLLVYAQRPDA
S25              ------------------------------------------------------------
S26              ------------------------------------------------------------
S27              ----MSDKAQA--YAQLAEETAKSLTKSLANWTGFLTTVGRLYKYPYHEQLMIYAQRPDA
S28              ----MPSKVQL--YAQMADRTAEQITGSYQKWTAFLTTAARLYKYPYNEQLMIFAQRPEA
S29              ----MPSKVQL--YAQMADRTAEQITGSYQKWTAFLTTAARLYKYPYNEQLMIFAQRPEA
S30              ----MPTKAEL--YAQMADKVATQLTGSWQEWAGFLTTASRLYKYPFHEQLMIYAQRPDA
S31              ----MPTKAEL--YAQMADKVATQLTGSWQEWAGFLTTAARLYKYPFHEQLMIYAQRPDA
S32              ----MPTKAEF--YRQMAEQVSTRLVGSWKEWTAFLTTAARLYKYPFHEQMMIYAQRPDA
S33              ----MPSKAEF--YRQMAEQVSTQLVGSWKEWTAFLTTAARLYKYPFHEQMMIYAQRPDA
S34              ----MPSKTEF--YRQMADHVATQLTGSWQEWAGFLTTAARLYKYPFHEQLLIYAQRPDA