Forum "Analyse phylogénétique"

Thread subject: problème d'arbre

[ Return to forums ]
problème d'arbre
mamagaga
25 Nov 2008 18:24
Non evaluated contribution
Bonjour,

Nous sommes le binôme mamagaga et nous avons un problème pour faire nos arbres.

En effet, dans notre rapport taxonomique nous avons des bons scores pour des a-proteobactéries,des g-poteobactéries ainsi que pour les autres proteobactéries. Nous avons également des scores acceptables pour d'autres bactéries comme les firmicutes. De plus, des eucaryotes comme la drosophile ou des primates, ont également des scores corrects.
Afin de trouver notre groupe d'étude, car vu les bons scores des eucaryotes on nous a dit que ce ne serait pas une endosymbiose mitochondriale (mais dans ce cas là qu'est-ce-que c'est?), on nous a conseillé de faire un arbre général avec beaucoup d'a-proteobactéries, des g-proteobactéries et quelques b-, d- et e-proteobactéries, de même que quelques firmicutes. Cet arbre nous a suggéré que notre séquence faisait partie des g-proteobactéries.
Suite à cela, nous avons donc réalisé un arbre plus étoffé avec plus de g-proteobactéries et en prenant comme groupe extérieur les e-proteobactéries. Seulement là nous avons été confrontées à plusieurs problèmes : le premier est que, bien que nous renseignons une séquence de e-proteobactérie comme groupe extérieur, le site refusait de raciner notre arbre (nous avons refait la manipulation avec un enseignant pour vérifier!!); ensuite, que ce soit avec la méthode prot-pars ou neighboor-joining, notre séquence n'est pas nichée comme l'attendions parmi les g-proteobactéries. En effet, l'arbre avec port-pars nous montre notre séquence "exilée" des autres, et donc des g-proteobactéries, et l'arbre avec neighboor-joining nous la montre entre les g- et les e-proteobactéries.
Ensuite, comme ce résultat était totalement innatendu, nous avons fait, comme on nous l'a conseillé, un arbre avec seulement les séquences de g- et d'e-proteobactéries utilisées pour faire l'arbre général. Le site n'a encore pas voulu raciné notre arbre mais nous avons alors obtenu un arbre où notre séquence est liée à deux g-proteobactéries (les deux mêmes avec laquelle elle est liéee dans la plupart des arbres effectués) et ensuite reliés aux e-proteobactéries puis aux autres g-proteobactéries. Encore une fois notre séquence n'est pas nichée dans les g-proteobactéries.
On nous a alors conseillé ensuite de réaliser un arbre avec les séquences de g-proteobactéries utilisées dans l'arbre général et de changer le groupe extérieur en utilisant les séquences de firmicutes utilisées pour faire l'arbre général. Avec la méthode prot-pars, notre séquence se trouve "exilée" des autres, alors qu'avec la méthode neighboor-joining elle se situe exactement entre les firmicutes et les g-proteobactéries (cette fois-ci notre arbre a pu être raciné avec une séquence de firmicutes).

Après avoir montrer nos résultats à un enseignant, celui-ci nous a répondu qu'il ne savait pas ce que cela signifiait.

Nous nous posons donc les questions suivantes :
- que signifient les scores assez élevés retrouvés chez des eucaryotes?
- peut-on déduire quelque chose de ces arbres?
- si oui, peut alors affirmer l'appartenance à un groupe taxonomique? ou peut-on juste supposer que notre séquence appartient à un sous-groupe de g-proteobactéries pas encore découvert?
- si non, que doit-on faire?

Merci d'avance

Marie Guerin et Gaëlle Bonnefoi (binôme mamagaga)

ps : tous nos arbres sont dans notre annotathon sous la rubrique bloc-notes
Hingamp_BC08
27 Nov 2008 15:48
Game master
Bonjour,

"vu les bons scores des eucaryotes on nous a dit que ce ne serait pas une endosymbiose mitochondriale" -> je ne comprends pas la logique? Quand on a de bons scores avec des alpha-protéo et des scores moindres mais significatifs avec des eucaryotes, il faut chercher à savoir si les homologues dans les eukaryotes ne sont pas des "ex-alpha" mitochondriales. J'ai cherché dans vos hits BLAST, et j'ai trouvé au moins un hit eukarote qui mentionne explicitement l'origine mitochondriale (banque SWISSPROT, donc annotations assez fiables):
P38323: "Mitochondrial clpX-like chaperone MCX1", Saccharomyces cerevisiae (Baker's yeast)
Il est donc assez plausible que vos homologues eucaryotes soient des HGT d'alpha (donc pas des candidats au groupe extérieur!).

Pour ce qui est de vos arbres, j'ai d'abord cherché à faire un arbre raciné sur l'hypothèse "Gr étude=protéo Gr Ext=autres bactéries" qui me parait toute indiquée au vu du tax report!

Je suspecte que votre problème vient du fait que vous n'avez pas renommé vos séquences dans le format FASTA (or il faudra donner le nom du groupe ext). J'ai donc repris votre propre jeu de séquences au format FASTA avec plein de protéo et une poignée de firmicutes (l'idéal serait de prendre un groupe extérieur avec une firmicute, une aquificale, une thermotogale etc), j'ai renommé dans les FASTA une des firmicutes "fout" (pour firmicute outgroup!) pour pouvoir donner son nom exact dans la case "outgroup" (notez qu'il faudrait renommer toutes les séquences) et j'ai refait un alignement multiple, puis une phylogénie sur Phylogénie.fr et ça donne un arbre absolument magnifique qui place votre ORF dans... là je vous laisse conclure:
        +---fgi_78043800_ref_YP_359189.1__ATP-dependent_protease_ATP-bi    
  +-----8
  !     +--------fgi_121534155_ref_ZP_01665980.1__ATP-dependent_Clp_protease    
  !  
  !                                 +agi_71083580_ref_YP_266299.1__ATP-dependent_protease_ATP-bi    
  !                              +--2
  !                              !  +agi_91761999_ref_ZP_01263964.1__ATP-dependent_clp_proteinas    
  !              +---------------4
  !              !               ! +agi_207082801_gb_EDZ60227.1__ATP-dependent_Clp_protease__AT    
  !              !               +-3
  !              !                 +GOS_691020_Translation_{1-504_indirect_strand}    
  !           +-30  
  !           !  !       +------agi_163736127_ref_ZP_02143546.1__ATP-dependent_Clp_protease    
  !           !  !  +---15  
  !           !  !  !    +-----agi_85704730_ref_ZP_01035831.1__ATP-dependent_protease_ATP-    
  !           !  !  !  
  !           !  +-29     +-----agi_84701521_ref_ZP_01016096.1__ATP-dependent_protease_ATP-    
  !           !     !  +-20  
  !           !     !  !  +--------agi_148259929_ref_YP_001234056.1__ATP-dependent_protease_AT    
  !           !     +-23  
  !           !        !    +----agi_156450055_ref_ZP_02056436.1__ATP-dependent_Clp_protease    
  !           !        +---14  
  !           !             +----agi_39936025_ref_NP_948301.1__ATP-dependent_protease_ATP-bi    
  !        +-31  
  !        !  !         +---------ggi_77165152_ref_YP_343677.1__ATP-dependent_protease_ATP-bi    
  !        !  !      +-19  
  !        !  !      !  +---------ggi_88800032_ref_ZP_01115602.1__ATP-dependent_protease_ATP-    
  !        !  !      !  
  !        !  !   +-22     +------ggi_113970829_ref_YP_734622.1__ATP-dependent_protease_ATP-b    
  !        !  !   !  !  +-17  
  !        !  !   !  !  !  +-------ggi_27363511_ref_NP_759039.1__ATP-dependent_protease_ATP-bi    
  !        !  !   !  !  !  
  !        !  !   !  +-18       +ggi_51595310_ref_YP_069501.1__ATP-dependent_protease_ATP-bi    
  !        !  !   !     !    +-11  
  !        !  !   !     !    !  +-ggi_77974302_ref_ZP_00829843.1__COG1219__ATP-dependent_prot    
  !        !  !   !     +---13  
  !     +-35  +--25          !     +ggi_195940567_ref_ZP_03085949.1__ATP-dependent_protease_ATP    
  !     !  !      !          !  +-10  
  !     !  !      !          +-12  +ggi_16763830_ref_NP_459445.1__ATP-dependent_protease_ATP-bi    
  !     !  !      !             !  
  !     !  !      !             +ggi_206579207_ref_YP_002240082.1__ATP-dependent_Clp_proteas    
  !     !  !      !  
  !     !  !      !  +----------bgi_30248063_ref_NP_840133.1__ATP-dependent_protease_ATP-bi    
  !     !  !      +-21  
  !     !  !         !      +--bgi_56478266_ref_YP_159855.1__ATP-dependent_protease_ATP-bi    
  !  +-34  !         +------9
  !  !  !  !                +--bgi_119898361_ref_YP_933574.1__ATP-dependent_protease_ATP-b    
  !  !  !  !  
  !  !  !  !   +-------------agi_189182914_ref_YP_001936699.1__ATP-dependent_Clp_proteas    
  !  !  !  +--16  
  !  !  !      +---------------agi_157964842_ref_YP_001499666.1__ATP-dependent_protease_AT    
  !  !  !  
  !  !  !                               +agi_58699474_ref_ZP_00374209.1__ATP-dependent_Clp_protease_    
  !  !  !  +----------------------------1
  !  !  !  !                            +-agi_58584809_ref_YP_198382.1__ATP-dependent_protease_ATP-bi    
27-33  +-26  
  !  !     !          +----------agi_57238934_ref_YP_180070.1__ATP-dependent_protease_ATP-bi    
  !  !     +----------5
  !  !                +----------agi_88607602_ref_YP_505536.1__ATP-dependent_protease_ATP-bi    
  !  !  
  !  !            +-------------egi_118474538_ref_YP_891518.1__ATP-dependent_protease_ATP-b    
  !  !  +---------7
  !  !  !         ! +---------egi_152990291_ref_YP_001356013.1__ATP-dependent_protease_AT    
  !  !  !         +-6
  !  +-32           +----------------egi_32266682_ref_NP_860714.1__ATP-dependent_protease_ATP-bi    
  !     !  
  !     !  +------------dgi_116747550_ref_YP_844237.1__ATP-dependent_protease_ATP-b    
  !     +-28  
  !        !  +----------dgi_108761752_ref_YP_630244.1__ATP-dependent_protease_ATP-b    
  !        +-24  
  !           +------------dgi_191162563_ref_ZP_03024442.1__ATP-dependent_Clp_protease    
  !  
  +-------------fout