Forum "Analyse phylogénétique"

Sujet de discussion: Groupe extérieur

[ Retour aux forums ]
Groupe extérieur
LBMH
25 Apr 2018 16:48
Contribution non évaluée

Bonjour, 

Dans notre rapport taxonomique vous nous avez demandez de prendre dans un premier temps en groupe d'étude l'ensemble des bactéries. Mais je n'arrive pas à déterminer avec certitude quel groupe extérieur l'on doit prendre. J'ai effectué un arbre en choisissant les eucaryotes comme groupe extérieur, mais il n'est pas clairement visible sur l'arbre (http://www.phylogeny.fr/alacarte.cgi?workflow_id=a75f703b7d4a7fa5dd0feb279f79ff72&tab_index=5.2 ; probablement encore disponible via le lien sinon en format texte plus bas) , et on se retrouve avec des branches ayant une valeur de 0, notamment la branche de notre ORF. Doit-on utiliser un autre groupe extérieur? Si oui lequel? Celui avec les bactéries ayant les E-value la plus élevée?

Par ailleurs comment afficher la valeur des branches des arbres en format texte? Merci.

 

                                                  -------0.2------
 
                      +----------------BB1_Bacteria_Bacteroidetes_E-value=2e-62_Bacteria_Bacteroidetes
                      |
                      |               +---BBFF1_Bacteria_Bacteroidetes_Flavobacteriia_Flavobacteriales_E-v
        +-------------+      +--------+
        |             |      |        +------BBFF2_Bacteria_Bacteroidetes_Flavobacteriia_Flavobacteriales_E-v
        |             +------+
        |                    |     +------------BBSSSP2_Bacteria_Bacteroidetes_Sphingobacteriia_Sphingobacterial
        |                    |     |
        |                    +-----+  +------BBSSSP1_Bacteria_Bacteroidetes_Sphingobacteriia_Sphingobacterial
        |                          +--+
        |                             +------BBSSSS1_Bacteria_Bacteroidetes_Sphingobacteriia_Sphingobacterial
        |
        |                               +---------------BPA1_Bacteria_Proteobacteria_Alphaproteobacteria_E-value=7e-59_B
        |                           +---+
        |                           |   +----------EVSETS4_Eukaryota_Viridiplantae_Streptophyta_Embryophyta_Tracheo
        |            +--------------+
        |            |              |
        |         +--+              +--------BPARRN1_Bacteria_Proteobacteria_Alphaproteobacteria_Rhodobactera
        |         |  |
        |         |  |   +--------------BPARC1_Bacteria_Proteobacteria_Alphaproteobacteria_Rhizobiales_C
        |         |  +---+
        |       +-+      +-------------------EMCCVE1_Eukaryota_Metazoa_Chordata_Craniata_Vertebrata_Euteleost
        |       | |
        |       | |                +--------BPARAu1_Bacteria_Proteobacteria_Alphaproteobacteria_Rhodospirill
        |       | +----------------+
        |       |                  +------------EMAHIP1_Eukaryota_Metazoa_Arthropoda_Hexapoda_Insecta_Pterygota
        |       |
        |       |                          +-EVSETS1_Eukaryota_Viridiplantae_Streptophyta_Embryophyta_Tracheo
        |       |                        +-+
   +----+-------+                        | +--EVSETS3_Eukaryota_Viridiplantae_Streptophyta_Embryophyta_Tracheo
   |    |       |           +------------+
   |    |       |      +----+            +--EVSETS2_Eukaryota_Viridiplantae_Streptophyta_Embryophyta_Tracheo
   |    |       |      |    |
   |    |       |      |    +------------BPARBR1_Bacteria_Proteobacteria_Alphaproteobacteria_Rhizobiales
   |    |       |  +---+
   |    |       |  |   |                  +----BPACCB1_Bacteria_Proteobacteria_Alphaproteobacteria_Caulobactera
   |    |       |  |   +------------------+
   |    |       +--+                      +---------BAAACM1_Bacteria_Actinobacteria_Actinobacteridae_Actinomycetales
   |    |          |
   |    |          +-------------------------BPASEE1_Bacteria_Proteobacteria_Alphaproteobacteria_Sphingomonad
 +-+    |
 | |    |      +--------------------------------------Translation_of_ORF_number_1_in_reading_frame_1_on_the_direct_str
 | |    +------+
 | |           |
 | |           +----------------------------------------BPECCC1_Bacteria_Proteobacteria_Epsilonproteobacteria_Campylobac
 | |
 | |                       +--------------------EADSSS1_Eukaryota_Alveolata_Dinophyceae_Suessiales_Symbiodiniace
 | |      +----------------+
 | |      |                +-----------------------BCCT1_Bacteria_Cyanobacteria_Chroococcales_Thermosynechococcus_E
 | |      |
 | |      |            +-------------------------------BDDDDD1_Bacteria_Deinococcus-Thermus_Deinococci_Deinococcales_De
 | +------+     +------+
 |        |  +--+      +-----------------------BFCCEE1_Bacteria_Firmicutes_Clostridia_Clostridiales_Eubacteriac
 |        |  |  |
 |        |  |  +---------------------BFNSVM1_Bacteria_Firmicutes_Negativicutes_Selenomonadales_Veillo
 |        +--+
 |           |   +------------BFBPB1_Bacteria_Firmicutes_Bacillales_Paenibacillaceae_Brevibaci
 |           +---+
 |               |          +-------------------BFBJ1_Bacteria_Firmicutes_Bacillales_Jeotgalicoccus_E-value=2e-5
 |               +----------+
 |                          +---------BFBBB1_Bacteria_Firmicutes_Bacillales_Bacillaceae_Bacillus_E-val
 |
 |     +--------------------------------BPDDDD1_Bacteria_Proteobacteria_Deltaproteobacteria_Desulfobacte
 |-----+
 |     +----------------BPDDGG1_Bacteria_Proteobacteria_Deltaproteobacteria_Desulfuromon
 |
 |                     +----------BPBNNC1_Bacteria_Proteobacteria_Betaproteobacteria_Neisseriales
 |                     |
 |                +----+      +-----------------------BPBBBC1_Bacteria_Proteobacteria_Betaproteobacteria_Burkholderial
 |                |    +------+
 |                |           +---------------BPBBBR1_Bacteria_Proteobacteria_Betaproteobacteria_Burkholderial
 |                |
 |          +-----+          +---------------BPGS1_Bacteria_Proteobacteria_Gammaproteobacteria_Solimonas_E-va
 |          |     |          |
 |          |     |     +----+
 |          |     |     |    +-------------------BPGXX1_Bacteria_Proteobacteria_Gammaproteobacteria_Xanthomonadal
 |          |     +-----+
 |          |           |     +-----------BPGPPP1_Bacteria_Proteobacteria_Gammaproteobacteria_Pseudomonada
 |          |           |     |
 +----------+           +-----+   +-----------------BPG2_Bacteria_Proteobacteria_Gammaproteobacteria_E-value=6e-59_B
            |                 |   |
            |                 +---+    +--------BPGPPP2_Bacteria_Proteobacteria_Gammaproteobacteria_Pasteurellal
            |                     +----+
            |                          |       +--------BPG1_Bacteria_Proteobacteria_Gammaproteobacteria_E-value=1e-65_B
            |                          +-------+
            |                                  +--------BPGEEE1_Bacteria_Proteobacteria_Gammaproteobacteria_Enterobacter
            |
            +---------------BNNNN1_Bacteria_Nitrospirae_Nitrospirales_Nitrospiraceae_Nitrosp

 

B_Wirth_18
25 Apr 2018 17:57
Maître de jeu

Bonjour,

Avez-vous bien compris pourquoi vous ne pouviez pas vous focaliser sur le groupe des alpha- dans un 1er temps ? cf les gammes d'-evalues très proches entre tous les groupes bactériens. Le différentiel d'e-value est très faible entre les divers groupes bactériens. Voire même chez les euK que vous avez dans le rapport taxo ! Ce qui s'explique car il existe un lien entre seq euK et seq d'alpha- : quel est ce lien ?

Auquel cas, il faudrait même une 1ere phylogénie GE = ensemble du vivant : bacteries + euK + archae, qui serait alors non racinée.

Si on prend un GE = toutes les bactéries, quel sera le groupe externe dans ce cas ?

Rappel cf doc Phylogénie section TP sur Ametice :

1/ Définir le groupe d’étude de telle sorte qu’il représente une lignée taxonomique réelle. Ce doit être un groupe monophylétique. ⇒ Choisir les séquences parmi l’ensemble de ces lignées de telle sorte que l’ensemble des lignées soit représentées.
2/ Définir un groupe extérieur constitué de l’ensemble des lignées de même niveau taxonomique que le groupe d’étude. ⇒ Choisir les séquences parmi l’ensemble de ces lignées de telle sorte que l’ensemble des lignées soit représentées.

==> quelles sont LES lignées de même niveau taxo que toutes les bactéries ?

==> d'où l'indication sur les blast à refaire pour définir le groupe externe dans ce cas : Pour la sélection des séq du groupe externe, il vous faudra absolument refaire un blastP vs NR en spécifiant dans le champ "Organism" (sous le champ "Database") => "Archaea", afin d'identifier des séq homologues chez les archae (décrivez et expliquez le résultat obtenu, c'est intéressant), et vous pouvez faire la même chose en précisant "Eukaryota", afin d'identifier toutes les séq homologues chez les euK (décrivez et expliquez le résultat obtenu, c'est intéressant également).

==> Il faut absolument faire cette phylogénie large dans un 1er temps. Si sur cette phylogénie, votre protéine se rapproche des alpha- (vous pourrez donc sur-représenter les alpha- sur cette 1ere phylo), alors elle justifiera une 2eme phylogenie plus restreinte sur le groupe des alpha- (la phylogenie que vous avez faite, qu'il faudra un peu modifier concernant le choix des seq et le choix du groupe externe).

==> vous pouvez sur-représenter les alpha- sur cette 1ere phylo, voire les proteo-, mais attention, il faut représenter l'ensemble des groupes taxo bacteriens. Sur-représenter les Bacteroidetes n'est pas nécessaire !

==> que les séq euK se mélangent dans l'arbre avec les alpha- (surtout celles de votre rapport taxo avec les e-values les plus faibles) est logique, car il existe un lien entre alpha- et euK : quel est ce lien ???
B_Wirth_18
25 Apr 2018 18:37
Maître de jeu

"mais attention, il faut représenter l'ensemble des groupes taxo bacteriens. Sur-représenter les Bacteroidetes n'est pas nécessaire !"

==> je viens de revérifier votre table 5 et comprends mieux la sur-représentation des Bacteroidetes et firmicutes. C'est simplement que vous avez très peu de seq pour les autres groupes taxo bactériens.

==> Il faudra donc bien mentionner cela dans le paragraphe panorama taxomique : vous avez une répartition particulière des séq !

- beaucoup de séq d'alpha-, autres proteo-, Bacteroidetes et firmicutes.

- très peu de seq (1, 2, généralment moins de 10) dans les autres groupes taxo bactériens

- 2-3 seq homologues chez les archae (de mémoire) cf le blast à faire

- et des seq euK (blast à faire également, pour voir si vous obtenez des e-values plus élevées, ou si ce ne sont que des seq liées aux alpha)

==> Dans ce cas, et vu l'arbre ci-dessus : peut etre peut on essayer GE : proteo- et externe : autres bactéries (Sur larbre ci-dessus, on pourrait sortir un certains nb de seq bactériennes de l'arbre pour en faire le groupe externe).

==> le but étant de voir si votre séq de l'ORF s'intègre dans le groupe des alpha- (pas le cas ci-dessus), si elle est apparentée aux alpha- (difficile à dire sur cet arbre d'autant que l'homologue le plus proche est une Epsilonproteobacteria, si elle s'intègre au protéo-... Le but est de justifier votre 2eme phylo "restreinte sur le groupe des alpha-"...

==> il vous faudra probablement essayer plusieurs sélections de séq... votre rapport taxo n'est pas simple !

N'hésitez pas si vous avez d'autres questions.

Bon travail

BW