|
Surprise lors de l'arbre phylogénétique |
MARFE 2 Mar 2011 14:13 Contribution non évaluée |
Bonjour,
J'ai un gros problème de compréhension de ma séquence... Quand je fais le Blastp vs NR, les séquences homologues avec le score le plus élevé (436) appartiennent au groupe des gamma-protéobactéries, d'autres séquences avec un score élevé (385) appartiennet au groupe des beta-protéobactéries. J'en ai donc déduis que ma séquence appartenait à cette lignée. OR quand je fais le Blastp vs Swissprot, j'obtiens très peu de séquences, une vingtaine, et elles appartiennent à l'organisme Mus Musculus, donc la souris avec des scores et des E-values faible, en dessous du seuil d'homologie que j'ai fixé à 2e-15. sp|Q8R5M5.1|ACMSD_RAT RecName: Full=2-amino-3-carboxymuconate... 69.3 3e-11 sp|Q54LN9.1|ACMSD_DICDI RecName: Full=2-amino-3-carboxymucona... 69.3 3e-11 sp|Q8TDX5.1|ACMSD_HUMAN RecName: Full=2-amino-3-carboxymucona... 68.9 3e-11
Je n'ai pas tellement tenu compte de ce Blast à cause des résultats et puis trouver de l'ADN de souris dans un lagon...
J'ai donc choisi comme groupe d'étude les gamma et béta-protéobactéries et comme groupe extérieur les alpha puisque ces groupes font partie de la même lignée (et vous donniez un exemple dans le guide pour trouver les groupes). En faisant mon arbre phylogénétique, j'observe que toutes les séquences de mon groupe extérieur et d'étude sont mélangées avec ma séquence "au milieu" j'ai un enracinement avec 1 séquence appartenant à mon groupe d'étude. Ce qui est déjà assez mal en point. Je décide de continuer l'arbre jusqu'au bout car en lisant le guide, je me suis aperçue que ma séquence peut correspondre au cas difficile d'interprétation II avec donc des transferts horizontaux. Mais en arrivant à l'étape où l'on colorie les séquences avec les informations de GenBank surprise, je vois que ma séquence appartient aux Eucaryotes et plus particulièrement à Mus Musculus...
-----0.1---- +---------Variovorax_paradoxus_S110_gi_239820413 | | +--------------Burkholderia_sp._CCGE1003_gi_307726364 | | | +---+ +------Catenulispora_acidiphila_DSM_44928_gi_256393078 | | +---------------------+ | | +--------Rhodococcus_opacus_B4_gi_226363134 ++ | || | +-------Marinomonas_sp._MWYL1_gi_152997940 || | +---+ || | | | || |+-------------+ +--------Reinekea_sp._MED297_gi_88799832 || || | || || +------Vibrio_furnissii_CIP_102972_gi_260767373 |+----+| | || +---------Marinobacter_algicola_DG893_gi_149375866 | || +-+ | || | +---------Mus_musculus_gi_2043020 | || | | || | +------gamma_proteobacterium_NOR5-3_gi_254514753 | || |+-+ | || +--+| +-----------Pseudoalteromonas_atlantica_T6c_gi_109900187 | || | || | || | || +-Xanthomonas_axonopodis_pv._aurantifolii_str._11122_gi_294625150 | ++ | || | | | | || ++-Xanthomonas_axonopodis_pv._citri_str._306_gi_21244874 | | | ++ || | | | | || +--Xanthomonas_oryzae_pv._oryzae_PXO99A_gi_188579181 | | | | || | +--+ | +---+ | +---++-+ +Xanthomonas_oryzae_pv._oryzicola_BLS256_gi_166710252 | | | | | | | | | | | | | | | | | | +-+ | | | | | | | | +-----Xanthomonas_oryzae_pv._oryzae_KACC10331_gi_58584182 | | | | | +--+ | | | | | | | +-Xanthomonas_campestris_pv._campestris_str._ATCC_33913_gi_21233454 | | | | | | | | | | | +-----------Rhizobium_leguminosarum_bv._viciae_3841_gi_116248945 | | +-+ | | | | +-----------------------gamma_proteobacterium_HTCC2207_gi_90415597 | | | | | | +Arthrobacter_sp._FB24_gi_116662340 | | | +-+ +-+ | | | +Arthrobacter_phenanthrenivorans_Sphe3_gi_323471617 | | | | +--------+ | | | | | +-Arthrobacter_keyseri_gi_13242047 | | | +---+ | | | | +----------Streptomyces_albus_J1074_gi_239980389 | | | +---+ | | | +----------Kitasatospora_setae_KM-6054_gi_311900863 +----------------------+ | | | | | | | | | |------Rhodoferax_ferrireducens_T118_gi_89899152 | | | | | | | +---Azoarcus_sp._BH72_gi_119898833 | | | | | +----Curvibacter_putative_symbiont_of_Hydra_magnipapillata_gi_260222184 | | | +-Comamonas_testosteroni_KF-1_gi_221066557 | +--------------------------------------------------------------------Burkholderia_sp._H160_gi_209516885
Je suis un peu perdue pour tout avouer, je ne m'attendais pas du tout à avoir un résultat de ce genre. Pouvez vous me conseiller sur les marches à suivre dans ce cas la? Parce que si ca appartient vraiment à Mus Musculus tout mon raisonnement à partir du Blast est faux.
Merci d'avance Marion Sarkissian |
C_Brochier_11 2 Mar 2011 14:21 Maître de jeu |
Bonjour,
La grande différence que vous observez entre les blast contre swiss-prot et contre nr illustre le fait que ces banques ont des contenus différents. En effet, nr contient beaucoup plus de séquences que swiss-prot. Le fait que vous n'observiez pas les gamma/beta/alpha-protéobactéries comme meilleurs hit dans swiss-prot (alors que c'est le cas contre nr) indique que swiss-prot ne contient les homologues les plus proches de votre séquence.
En ce qui concerne "la surprise" au moment du renommage des séquences, c'est probablement un bug. L'application qui permet de renommer les séquences correctement est très utile (puisqu'elle vous évite de le faire à la main), mais elle n'est pas parfaite. Il peut donc y avoir quelques erreurs. En conséquence il est très important que vous vérifiez bien que les noms affichés automatiquement correspondent bien aux bons organismes. Dans votre cas, il faudra renommer votre séquence manuellement au moment où vous ferez le copier/coller de l'arbre au format texte dans l'annotathon.
Céline Brochier |
MARFE 2 Mar 2011 14:38 Contribution non évaluée |
Bonjour,
Donc si je comprends bien ma séquence ne correspond pas à un ADN de Mus Musculus? Parce que j'ai fait un petit parallèle avec la profondeur à laquelle ma séquence a été récupéré, l'endroit fait 30 cm de profondeur et elle a été prise à 20 cm, sait-on jamais peut-être qu'une souris a "perdu" un fragment d'ADN. Ce qui m'a surprise c'est que ca correspond avec ce que dit la banque Swissprot. Je vais refaire l'arbre une nouvelle fois peut être que j'obtiendrais un résultat différent. Et pour les groupes d'étude et extérieur? L'hypothèse de transferts horizontaux de gènes est cohérent? Je laisse l'arbre comme ca ou je dois choisir un autre groupe extérieur pour tenter d'enraciner correctement l'arbre?
Merci d'avance
Marion Sarkissian |
MARFE 2 Mar 2011 14:42 Contribution non évaluée |
Rebonjour,
Et si je garde mon groupe extérieur alpha-protéobactéries, est-ce que je sélectionne le 'Reroot'? Parce qu'il est impossible dans mon cas d'enraciner en choisissant des séquences.
Merci
Marion Sarkissian |
E_Meglecz_11 2 Mar 2011 17:12 Maître de jeu |
Bonjour,
3 remarques :
1. Le numéro de votre séquence est GOS_2043020 ce qui a été interprété comme numéro de gi pendant la visualisation de votre arbre. En réalité de gi2043020 correspond à une séquence EST provenant de souri, mais c’est de pur hasard.
2. Vous ne pouvez pas utiliser un score seuil déterminé sur la base de BLAST contre nr pour un BLAST contre le la banque Swissprot car le E-value dépend de la taille de la banque. Donc une séquence présente dans une petite banque ne va pas donner le même E-value, que le même séquence dans une grande banque.
3. Vous n’avez pas bien observé et décrit les gammes des scores obtenus pour les différents groupes taxonomiques. Vérifiez la gamme des scores pour les gamma-proteobacteria, pour le proteobacteria (hors gamma), pour les bactéries (hors proteobacteria) etc. Cela changera votre interprétation.
Emese Meglecz
|