Forum "Analyse phylogénétique"

Thread subject: e-value Groupe d'étude

[ Return to forums ]
e-value Groupe d'étude
ThomasW
16 Apr 2021 13:51
Non evaluated contribution

Bonjour,

 

Sur cette séquence, j'ai choisi comme groupe d'étude Alphaproteobacteria:Rhodobacterales et tous les autres ordres d'alphaproteobactéries comme groupe extérieur.

 

Classification nb lines nb hits min E-value max E-value
Bacteria:Proteobacteria:Alphaproteobacteria:Rhodobacterales 161 392 1E-141 5E-12
Bacteria:Proteobacteria:Alphaproteobacteria 29 141 8E-44 3E-12
Bacteria:Proteobacteria:Alphaproteobacteria:Sphingomonadales 417 1150 1E-27 6E-12
Bacteria:Proteobacteria:Alphaproteobacteria:Hyphomicrobiales 664 1653 2E-26 6E-12
Bacteria:Proteobacteria:Alphaproteobacteria:Rickettsiales 4 20 1E-25 1E-16
Bacteria:Proteobacteria:Alphaproteobacteria:Rhodospirillales 118 292 1E-25 6E-12
Bacteria:Proteobacteria:Alphaproteobacteria:Pelagibacterales 3 6 2E-22 1E-19
Bacteria:Proteobacteria:Alphaproteobacteria:Hyphomonadales 13 27 1E-16 5E-12
Bacteria:Proteobacteria:Alphaproteobacteria:Magnetococcales 1 1 5E-14 5E-14
Bacteria:Proteobacteria:Alphaproteobacteria:Parvularculales 6 13 6E-14 2E-12
Bacteria:Proteobacteria:Alphaproteobacteria:Maricaulales 5 8 8E-14 6E-12
Bacteria:Proteobacteria:Alphaproteobacteria:Caulobacterales 1 4 1E-12 1E-12
Bacteria:Proteobacteria:Gammaproteobacteria 17 121 6E-28 5E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Nevskiales 21 39 6E-22 6E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Xanthomonadales 99 230 2E-20 6E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Oceanospirillales 30 54 3E-19 4E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Chromatiales 43 86 4E-19 6E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Alteromonadales 69 142 3E-18 5E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Cellvibrionales 23 49 8E-18 5E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Methylococcales 8 12 1E-16 4E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Thiotrichales 17 54 1E-15 5E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Vibrionales 19 56 4E-15 4E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Enterobacterales 16 37 2E-15 6E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Legionellales 9 14 4E-15 6E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Pseudomonadales 21 61 2E-14 6E-12
Bacteria:Proteobacteria:Gammaproteobacteria:Aeromonadales 2 2 7E-14 7E-13
Bacteria:Proteobacteria:Gammaproteobacteria:Salinisphaerales 1 1 1E-13 1E-13
Bacteria:Proteobacteria:Betaproteobacteria 8 68 2E-21 1E-12
Bacteria:Proteobacteria:Betaproteobacteria:Burkholderiales 369 917 2E-20 6E-12
Bacteria:Proteobacteria:Betaproteobacteria:Nitrosomonadales 11 18 3E-19 1E-12
Bacteria:Proteobacteria:Betaproteobacteria:Neisseriales 34 73 4E-18 6E-12
Bacteria:Proteobacteria:Betaproteobacteria:Rhodocyclales 35 88 2E-17 6E-12
Bacteria:Proteobacteria:Deltaproteobacteria:Myxococcales 8 30 2E-20 2E-12
Bacteria:Proteobacteria:Deltaproteobacteria 3 58 4E-19 2E-12
Bacteria:Proteobacteria:Deltaproteobacteria:Desulfobacterales 19 35 3E-16 6E-12
Bacteria:Proteobacteria:Deltaproteobacteria:Syntrophobacterales 8 13 3E-16 3E-12
Bacteria:Proteobacteria:Deltaproteobacteria:Syntrophorhabdales 5 5 2E-14 1E-12
Bacteria:Proteobacteria:Deltaproteobacteria:Desulfuromonadales 7 13 1E-13 5E-12
Bacteria:Proteobacteria:Deltaproteobacteria:Desulfurellales 6 12 3E-13 4E-12
Bacteria:Proteobacteria:Deltaproteobacteria:Desulfovibrionales 6 7 6E-13 5E-12

 

Comme je suis souvent confronté à des arbres mélangés, et que j'avais de très nombreuses séquences dans le groupe d'étude, je n'ai d'abord pris que celles qui avaient les meilleures e-valeurs.

J'ai alors obtenu (pour la première fois, malgré les 30 séquences de mon panier !) un arbre où les deux groupes étaient bien distincts et que j'ai pu enraciné sans problème (il n'est pas en couleur mais j'ai indiqué la séparation entre les deux groupes :

 

       +------------+ BPAR1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobacterale                        
    +--+ 0.840000                                                                                             
    |  +---------+ BPARRM1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobactera                           
    |                                                                                                         
    |                    ++ BPARRL1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobactera                  
    |                +---+ 0.974000                                                                           
    |           +----+ 0.961000RRC1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobactera                  
    |           |    |                                                                                        
    |        +--+ 0.530000RRN1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobactera                       
 +--+ 0.919000  |                                                                                             
 |  |        |  +--------+ BPARR2-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobacteral                   
 |  |        |                                                                                                
 |  | +------+ 0.981000  +----+ BPARRY1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobactera              
 |  | |      |         +-+ 0.688000                                                                           
 |  | |      |  +------+ 0.979000RO1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobactera                 
 |  | |      |  |      |                                                                                      
 |  | |      +--+ 0.213000--+ BPARR3-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobacteral                
 |  +-+ 0.821000|                                                                                             
=|    |         +----------+ BPARRM2-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobactera                 
 |    |                                                                                                       
 |    |     +-+ BPARR1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobacteral                              
 |    +-----+ 0.991000                                                                                        
 |          | OMRGCv2-9718150-Traduction-958-1698-sens-direct                                                 
 | ################################################################################################                
 |       +-----------+ BPARR4-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodospirilla                       
 |  +----+ 0.883000                                                                                           
 |  |    +-----------------+ BPAHRu1-Bacteria-Proteobacteria-Alphaproteobacteria-Hyphomicrobi                 
 |  |                                                                                                         
 +--+ 0.869000------+ BPASSN1-Bacteria-Proteobacteria-Alphaproteobacteria-Sphingomonad                        
    |   |                                                                                                     
    |   |           ++ BPAR3-Bacteria-Proteobacteria-Alphaproteobacteria-Rickettsiales                        
    +---+ 0.202000--+ 0.980000                                                                                
        | |         +--+ BPAR2-Bacteria-Proteobacteria-Alphaproteobacteria-Rickettsiales                      
        +-+ 0.929000                                                                                          
          |       +-------------------------+ BPACC1-Bacteria-Proteobacteria-Alphaproteobacteria-Caulobacteral
          |       |                                                                                           
          +-------+ 0.744000----------+ BPAM1-Bacteria-Proteobacteria-Alphaproteobacteria-Magnetococcale      
                  |  |                                                                                        
                  +--+ 0.202000---+ BPAHHH1-Bacteria-Proteobacteria-Alphaproteobacteria-Hyphomonadal          
                     |  |                                                                                     
                     +--+ 0.960000--------+ BPAMRR1-Bacteria-Proteobacteria-Alphaproteobacteria-Maricaulales  
                        +--------+                                                                            
                                 +----+ BPAPPA1-Bacteria-Proteobacteria-Alphaproteobacteria-Parvularcula      
                                                                                                              
 |-------|------|-------|------|-------|-----                                                                 
 0    0.25    0.5    0.75      1    1.25                                                                      
 substitutions/site                            

 

Par contre, dès que j'inclus des séquences de Rhodobacterales dont l'e-valeur est inférieure à 1e-20, je me retrouve à nouveau avec les deux groupes mélangés.

Est-ce qu'il existe une solution à mon problème ?

 

AnaisE
16 Apr 2021 21:06
Non evaluated contribution

J'ai remarqué la même chose dans mes séquences (comme si les E-valeurs similaires avaient tendance à se regrouper...). Cela dit, il me semble qu'il est préconisé de ne garder que les meilleurs hits de chaque sous-groupes et de ne pas prendre d'E-valeurs trop basses dans le groupe d'étude, car cela peut être dû à des problèmes. 1e-20 me paraît très élevé par rapport à 1e-141, en ce qui me concerne je n'oserais de toute façon pas prendre en dessus.

Meglecz20CTES
17 Apr 2021 15:11
Game master

Bonjour Thomas,


Si je ne me trompe pas, l’alignement dans l’annotathon correspond à votre arbre copié ici. Vous avez deux séquences dedans avec des indels très longs. Donc déjà en choisissant des séquences avec les meilleurs Evaleurs, il y a deux séquences qui divergent fortement. Choisir des séquences avec des Evaleurs élevées c’est équivalent à demander des complications. La qualité de l’alignement sera probablement moins bonne et donc l’arbre moins fiable.


Vous avez raison que dans un monde idéal, on devrait être capable de retracer la phylogénie même si on inclut toutes les séquences homologues. Mais le monde est imparfait : http://annotathon.org/?seeThread=2859

 

Bon travail,
Emese Meglecz