Je suis pas totalement certain d'avoir saisi votre question, mais en effet l'alignement multiple est très complexe, avec vertaines régions truffées d'INDELS, probablement parce que les différentes séquences sont de longueur très différentes (et certaines semblent immenses) ? Dans ce cas de séquences de longueur très différentes, les logiviels tels que MUSCLE ont du mal à placer correctement les INDELs, en particulier aux extrémités... Heureusement que ces homologues ont un "coeur" bien conservé qui s'aligne facilement, car en dehors de ce coeur d'alignement c'est vraiment la pagaille... Donc artefacts d'alignements oui, très probablement.
Au fait bien vu pour le code des séquences pour l'alignement au format GBLOCKS, parce que j'ai cru avant de le remarquer ne pas pouvoir interpréter cet alignement :)
Par contre j'ai l'impression que les deux alignements (CLUSTAL et GBLOCKS) ne sont pas exactement les mêmes (cf ci-dessous) ? Ou alors j'ai mal compris, car les séquences ne sont pas ordonnées pareil.
PS: votre arbre PhyML n'est pas tout à fait enraciné correctement (la racine doit être entre la branche menant au dernier ancètre commun groupe d'étude et celle menant au dernier ancètre commun groupe extérieur. Actuellement la racine est interne au groupe extérieur)
BFCCOO1 ------------------------------------------------------------ 0
BFCCCB1 ------------------------------------------------------------ 0
Translation ------------------------------------------------------------ 0
BFCCRF1 ------------------------------------------------------------ 0
BFCCRA1 ------------------------------------------------------------ 0
BFCCOu1 ------------------------------------------------------------ 0
BFCCRA2 ------------------------------------------------------------ 0
BFCCRC1 ------------------------------------------------------------ 0
BFEEEE1 --------MARRYETITELYSKTVAGLAAPQAWQSFLTTACHNFRLPFDEQVLLYAQRPD 52
BFCC1 --------MAIRYKALTELYQETQRKVTAPAEWRQFLTSACRNYRLSFDEQLLVYAQRPD 52
BFEEE1 --------MAIRYKALTELYQETQRKVTAPAEWQQFLTSACRNYRLSFDEQLLVYAQRPD 52
BFCCLD1 --------MAIRYKALTELYHETQRSVTAPAQWQAFLASACRNYRLSFDEQLLVYAQRPD 52
BFCCCH1 --------MAILYKALTELYRETQRKVTAPSEWQAFLAAACRNYRLTFDEQLLVYAQRPD 52
BFC1 --------MAIRYKALTELYQETQRSVTAPDQWRAFLASACRNYRLSFHEQLLVYAQRPD 52
BFCCEE1 --------MAIRYKALTELYRETQRSVTAPDQWRAFLASACRNYRLSFDEQLLVYAQRPD 52
BFCCL1 --------MAIRYKALTELYLETQRSVTAPDQWRAFLASACRNYRLSFDEQLLVFAQRPD 52
BFEEEM1 --------MAIRYKALTELYRETQRSVTAPDQWRAFLASACRNYRLSFDEQLLVYAQRPD 52
BFCCRP1 --------MAIRYKALTELYQETQRSVTAPDQWRAFLASACRNYRLSFDEQLLVYAQRPD 52
BFCCRF2 --------MAIRYKALTELYQETQRSVTAPDQWRAFLASACRNYRLSFDEQLLVYAQRPD 52
BFTTPP2 -----MPRYDIVDLS-RTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPK 54 *
BFTTPF1 -----MPRYDIVDLS-RTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPK 54 * //////////////////////////////////////////////////////
BFTTPP1 -----MPRYDIVDLS-RTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPK 54 * Séquences du Groupe extérieur (extrêmement conservées)
BFT1 MRRDKMPRYDIVDLS-RTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPK 59 * //////////////////////////////////////////////////////
BFBLEE1 -----MPRYDIVDLS-RTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPK 54 *
BFCCRF3 ---------------------------------MNYLDVAARLYRYSFKDTLLIHAQRPD 27
BFCCEA1 ------------------------------------------------------------ 0
BFTTTT1 -----MSDKAQAY-A-QLAEETAKSLTKSLANWTGFLTTVGRLYKYPYHEQLMIYAQRPD 53
BFCCRB1 -----MPSKVQLY-A-QMADRTAEQITGSYQKWTAFLTTAARLYKYPYNEQLMIFAQRPE 53
BFCCOD1 -----MPSKVQLY-A-QMADRTAEQITGSYQKWTAFLTTAARLYKYPYNEQLMIFAQRPE 53
BFEEEA1 -----MPTKAELY-A-QMADKVATQLTGSWQEWAGFLTTASRLYKYPFHEQLMIYAQRPD 53
BFEEEH1 -----MPTKAELY-A-QMADKVATQLTGSWQEWAGFLTTAARLYKYPFHEQLMIYAQRPD 53
BFCCRP2 -----MPTKAEFY-R-QMAEQVSTRLVGSWKEWTAFLTTAARLYKYPFHEQMMIYAQRPD 53
BFCCRH1 -----MPSKAEFY-R-QMAEQVSTQLVGSWKEWTAFLTTAARLYKYPFHEQMMIYAQRPD 53
BFCCCB2 -----MPSKTEFY-R-QMADHVATQLTGSWQEWAGFLTTAARLYKYPFHEQLLIYAQRPD 53
10 20 30 40 50 60
=========+=========+=========+=========+=========+=========+
S01 ------------------------------------------------------------
S02 -----MPRYDIVDLSRTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPKA
S03 MRRDKMPRYDIVDLSRTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPKA
S04 -----MPRYDIVDLSRTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPKA
S05 -----MPRYDIVDLSRTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPKA
S06 -----MPRYDIVDLSRTIYLAKEEFKKDIKKYEEYLKVSGNNYKYPYIHQISIYNMDPKA
S07 ------------------------------------------------------------
S08 ------------------------------------------------------------
S09 ------------------------------------------------------------
S10 ------------------------------------------------------------
S11 ---MKDATFGN--ACRNSDRENAFLEGA-EAIRRIVSESGDLRLAKLYYDMPAFHTRMHQ
S12 ---MEEDGFAY-------------------------------------------------
S13 --------------------------------MNYLDVAARLYRYSFKDTLLIHAQRPDA
S14 ----MARRYET--ITELYSKTVAGLAAP-QAWQSFLTTACHNFRLPFDEQVLLYAQRPDA
S15 ----MAIRYKA--LTELYHETQRSVTAP-AQWQAFLASACRNYRLSFDEQLLVYAQRPDA
S16 ----MAIRYKA--LTELYQETQRKVTAP-AEWRQFLTSACRNYRLSFDEQLLVYAQRPDA
S17 ----MAIRYKA--LTELYQETQRKVTAP-AEWQQFLTSACRNYRLSFDEQLLVYAQRPDA
S18 ----MAILYKA--LTELYRETQRKVTAP-SEWQAFLAAACRNYRLTFDEQLLVYAQRPDA
S19 ----MAIRYKA--LTELYRETQRSVTAP-DQWRAFLASACRNYRLSFDEQLLVYAQRPDA
S20 ----MAIRYKA--LTELYQETQRSVTAP-DQWRAFLASACRNYRLSFHEQLLVYAQRPDA
S21 ----MAIRYKA--LTELYLETQRSVTAP-DQWRAFLASACRNYRLSFDEQLLVFAQRPDA
S22 ----MAIRYKA--LTELYQETQRSVTAP-DQWRAFLASACRNYRLSFDEQLLVYAQRPDA
S23 ----MAIRYKA--LTELYQETQRSVTAP-DQWRAFLASACRNYRLSFDEQLLVYAQRPDA
S24 ----MAIRYKA--LTELYRETQRSVTAP-DQWRAFLASACRNYRLSFDEQLLVYAQRPDA
S25 ------------------------------------------------------------
S26 ------------------------------------------------------------
S27 ----MSDKAQA--YAQLAEETAKSLTKSLANWTGFLTTVGRLYKYPYHEQLMIYAQRPDA
S28 ----MPSKVQL--YAQMADRTAEQITGSYQKWTAFLTTAARLYKYPYNEQLMIFAQRPEA
S29 ----MPSKVQL--YAQMADRTAEQITGSYQKWTAFLTTAARLYKYPYNEQLMIFAQRPEA
S30 ----MPTKAEL--YAQMADKVATQLTGSWQEWAGFLTTASRLYKYPFHEQLMIYAQRPDA
S31 ----MPTKAEL--YAQMADKVATQLTGSWQEWAGFLTTAARLYKYPFHEQLMIYAQRPDA
S32 ----MPTKAEF--YRQMAEQVSTRLVGSWKEWTAFLTTAARLYKYPFHEQMMIYAQRPDA
S33 ----MPSKAEF--YRQMAEQVSTQLVGSWKEWTAFLTTAARLYKYPFHEQMMIYAQRPDA
S34 ----MPSKTEF--YRQMADHVATQLTGSWQEWAGFLTTAARLYKYPFHEQLLIYAQRPDA