Forum "Analyse phylogénétique"

Thread subject: Test duplication

[ Return to forums ]
Test duplication
ThomasW
11 Apr 2021 16:10
Non evaluated contribution

Bonjour,

 

Suite à la vidéo sur la duplication, j'ai fait le test avec les 4 séquences provenant de seulement 2 génomes que tblastn avait donné. J'ai aussi refait la sélection des séquences dans tax report avec uniquement les e-valeurs soulignées de mon groupe d'étude.

Le résultat est le suivant avec en vert mon groupe d'étude et en bleu les séquences du tblastn :

 

                          +----------+ BPAHCC1-Bacteria-Proteobacteria-Alphaproteobacteria-Holosporales       
                       +--+ 0.780000                                                                          
                    +--+ 0.429000----------+ BPAPPC1-Bacteria-Proteobacteria-Alphaproteobacteria-Pelagibacter 
                    |  |                                                                                      
                    |  +--------------------+ BPARG1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodospirilla
                    |                                                                                         
                    |+----+ BPASSS1-Bacteria-Proteobacteria-Alphaproteobacteria-Sneathiellal                  
                    ||                                                                                        
                   ++|0.830000PAR1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodospirillal                 
                   |||    ++ 0.770000                                                                         
                   |||    |++ OMRGCv2-9718010-Traduction-1-1068-sens-indirect                                 
                   |||  +-+ 0.481000                                                                          
                   |||  | |   ++ BPAR2-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodospirillal             
                   |++ 0.187000 0.988000                                                                      
                   | |  | 0.706000ARR1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodospirilla              
                   | |  |                                                                                     
                   | | ++-0.794000AKKK1-Bacteria-Proteobacteria-Alphaproteobacteria-Kiloniellale              
                   | | ||                                                                                     
                   | | ||+----+ BPAHM1-Bacteria-Proteobacteria-Alphaproteobacteria-Hyphomicrobia              
                  ++ 0.290000                                                                                 
                  || +-++0.87600000 Test-1b-Pararhodospirillum-photometricum-DSM-122-chromosome-DSM           
                  ||   | +-----+ 0.998000                                                                     
                  ||   |       | Test-1a-Pararhodospirillum-photometricum-DSM-122-chromosome-DSM              
                  ||   |                                                                                      
                  ||   +------+ BPAR4-Bacteria-Proteobacteria-Alphaproteobacteria-Rickettsiales               
                  ||                                                                                          
                  ||+---------+ BPAMME1-Bacteria-Proteobacteria-Alphaproteobacteria-Maricaulales              
                  |||                                                                                         
                  |||    +-+ BPASu1-Bacteria-Proteobacteria-Alphaproteobacteria-Sphingomonada                 
                  ||| +--+ 0.937000                                                                           
                  ||| | 0.705000EEE1-Bacteria-Proteobacteria-Alphaproteobacteria-Emcibacteral                 
                 +++0.83200000                                                                                
                 || | |-------+ BPARRR1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodothalass              
                 || |++ 0.592000                                                                              
                 || |||+----+ BPAIII1-Bacteria-Proteobacteria-Alphaproteobacteria-Iodidimonada                
                 || ||++ 0.824000                                                                             
                 || ++ 0.774000PAKKK2-Bacteria-Proteobacteria-Alphaproteobacteria-Kordiimonada                
                 ||  |                                                                                        
                 ||  |  +---+ BPAMMM1-Bacteria-Proteobacteria-Alphaproteobacteria-Minwuiales-M                
               +-+|0.789000.882000                                                                            
               | ||     +--------------+ BPAM1-Bacteria-Proteobacteria-Alphaproteobacteria-Magnetococcale     
               | ||                                                                                           
               | ||  +----+ BPARAO1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodospirill                  
               | |+--+ 0.926000                                                                               
               | |   +--------+ BPARGG1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodospirill              
               | |                                                                                            
           +---+ 0.570000---+ BPARRP1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodobactera                
           |   | +-+ 0.831000                                                                                 
           |   |   +------+ BPAMMR1-Bacteria-Proteobacteria-Alphaproteobacteria-Micropepsale                  
           |   |                                                                                              
           |   |   +---------+ BPAHH1-Bacteria-Proteobacteria-Alphaproteobacteria-Hyphomonadale               
      +----+ 0.7130000.552000                                                                                 
      |    |   ++ 0.634000+ BPACCB1-Bacteria-Proteobacteria-Alphaproteobacteria-Caulobactera                  
      |    |    |                                                                                             
 +----+ 0.899000+--------------+ BPAPPM1-Bacteria-Proteobacteria-Alphaproteobacteria-Parvularcula             
 |    |    |                                                                                                  
 |    |    +------+ BPAR3-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodospirillal                          
 |    |                                                                                                       
=|    +-------+ BPAREE1-Bacteria-Proteobacteria-Alphaproteobacteria-Rhodospirill                              
 |                                                                                                            
 +-----+ Test-2b-Roseomonas-stagni-DSM-19981-whole-genome-shotgun-sequenc                                     
 |                                                                                                            
 +--------+ Test-2a-Roseomonas-stagni-DSM-19981-whole-genome-shotgun-sequenc  

 

Finalement, les séquences provenant du même génome sont regoupées. Comme pour ma question précédente, je me demande si la taille de l'ORF ne provoque pas des homologies qui n'en sont pas ?

La curation était aussi très importante : 142 (18% of the original 748 positions)

 

 

Meglecz20CTES
13 Apr 2021 22:01
Game master

Bonjour Thomas,


Je peux difficilement interpréter votre arbre. C’est très bizarre que les séquences de même génome se retrouvent très proches dans l’arbre. Cela ressemble aux duplications multiples et très récentes.
Avez-vous regardé si les différentes régions du même génome qui s’alignent avec l’ORF sont proches au bien distinct ?

 

La faible proportion des positions retenue par Gblock est clairement due au fait que l’ORF est partiel, mais comme vous avez un nombre acceptable des positions restant (142), cela ne pose pas de problème. 

 

Il me semble que vous avez modifié votre sélection des séquences depuis que j’ai regardé l’alignent multiple la dernière fois. La similarité entre les homologues est assez claire sur la quasi-totalité de l’alignement. Je ne mettrai pas en question de l’homologie des séquences.


Par contre, je ne vois pas les séquences tests dans l’alignement.


Je suis perplexe devant vos résultats.
Cordialement,
Emese Meglecz