Forum "Analyse phylogénétique"

Thread subject: tblastn : très nombreuses séquences homologues pour un même génome ?

[ Return to forums ]
tblastn : très nombreuses séquences homologues pour un même génome ?
ThomasW
11 Apr 2021 15:59
Non evaluated contribution

Bonjour,

 

En travaillant sur cette séquence je me suis retrouvé dans la même situation que sur ma première séquence, avec les espèces de mon groupe d'étude (Flavobacteriia cette fois-ci) éparpillées dans l'arbre.

J'ai donc voulu vérifier s'il y avait une duplication et en effectuant un tblastn avec l'ORF, j'ai eu de très nombreux génomes avec plusieurs séquences homologues (jusqu'à 19 !).

Les e-valeurs sont différentes mais certaines restent très petites. Je me demande quand même si cela ne peut pas être du à la grande taille de l'ORF (528 aa) qui provoquerait des correspondances plus nombreuses mais moins identiques ?

 

La taille de l'ORF explique peut-être aussi le faible % de conservation à l'étape de curation ? (environ 25% je crois)

Je me demande en fait si mes séquences sont vraiment homologues ?

 

Meglecz20CTES
12 Apr 2021 17:21
Game master

Bonjour Thomas,


En effet,  le début de l’alignement multiple laisse un doute. Il n’est pas exclu que vous ayez un domaine partagé entre plusieurs protéines. Du coup, les parties des protéines qui correspondent au domaine alignement bien, mais pas le début des séquences, qui elles ne sont pas homologues.

 

Le fait que vous avez trouvé plusieurs régions du même génome significativement similaire à l’ORF semble confirmer cette hypothèse et rend l’analyse phylogénétique trrèèès compliquée.


Bon courage,
Emese Meglecz