Forum "Recherche d'ORF"

Thread subject: Analyse des résultats

[ Return to forums ]
Analyse des résultats
ChaDev
18 Oct 2020 12:36
Non evaluated contribution

Bonjour monsieur,

j'ai une question concernant la rédaction des analyses

dans les règles du jue il est écrit

 -> citez vos sources, de préférence sous forme de liens, par ex:
        "les homologues sont des epimerase (cf. Fiche SWISSPROT MJ0211)"

Pour l'ORF que j'ai choisi, les premières sorties de mon BLASTp NR sont des acyl-Coa déshydrogénases, alors que les premières sorties de mon BLASTp Swissprot sont des glutaryl-Coa déshydrogénases.

Du coup je ne sais pas trop comment justifier.

P.S : on ne peut pas faire de blast contre ref seq, il y a une erreur

Merci bon dimanche

Charlène

ChaDev
18 Oct 2020 15:28
Non evaluated contribution

Finalement j'ai répondu moi même à ma question... la glutaryl-Coa déshydrogénase fait partie de la famille des acyl-Coa déshydrogénases.

Désolé pour le dérangement !

PHingampMM20
19 Oct 2020 19:18
Game master

Bonjour,

Oui il est classique que les annotations de fonctions des séquences varient au sein d'une banque (ça dépend de l'annotat.eur.rice...), ça varie aussi d'une banque à l'autre (voyez une fiche SP versus une fiche NR), et bien sûr ça varie en fonction de la qualité des alignements, donc des E-value (mais là c'est plus du bruit "humain", c'est du signal biologique). Et donc souvent le premier hit RefSeq ayant un E-value bien plus faible que le premier hit SP, ces derniers peuvent avoir des variations de fonctions, par exemple on passe d'une enzyme avec un substrat particulier pour les homologues le splus proches dans RefSeq, à une enzyme avec un substrat différent pour les homologues plus distants de SP...

Ca pourrait bien être exactement la situation avec cet ORF : le meilleur hit NR est à 2e-129, alors le meilleur hit SP est à 6e-48, donc 80 logs d'écart, là on n'est plus dans l'épaisseur du trait, mais à des années lumières, donc pas étonnant que ça varie un peu côté fonction ! Et encore le coeur de métier de l'enzyme reste très gentiment bien constant : dehydrogenase :)

Et oui on a eu d'énormes problèmes avec le BLAST au NCBI la semaine dernière, grosses pannes visiblement, et aucune explication ou avertissement sur leur site web :( Blast is our tool, but your problem...

ChaDev
20 Oct 2020 13:31
Non evaluated contribution

Bonjour,

merci pour cette réponse, j'ai aussi remarqué que les organismes des premiers hit de SP sont assez improbables ! (bovin, singe, cohon...)

Après j'ai pu constater que cette famille de protéines est présente au sein de tous les domaines du vivant, et que mes protéines qui la compose ont des séquences en général très conservées, ce qui justifierait de bons hits pour de tels organismes ?

Pour le blast je me suis finalement rendue compte que je m'étais totalement trompée de banque sans faire attention ! J'avais choisie la banque RefSeq_select au lieu de RefSeq_protein...

Donc depuis plus de problèmes pour le blast !

ChaDev
20 Oct 2020 13:39
Non evaluated contribution

Une autre question par rapport aux fiches SP

Vu les organismes de mes premiers hits, est ce qu'il est cohérant de me baser sur leurs fiches pour l'analyse approfondie des AA remarquables ?

Merci :)

PHingampMM20
20 Oct 2020 14:32
Game master

Oui en effet il existe certainement des gènes qui descendent directement de LUCA, et peut-être même certains ont été conservés dans tous les descendants des trois domaines de la vie. Pour ceux-ci, on s'attendrait donc à les trouver dans la très longue liste des homologues. Mais on peut aussi s'attendre à ce que des homologies aussi distantes (on parle de milliers de millions d'années) deviennent difficiles à détecter par la seule comparaison de séquences (BLAST), je serais donc particulièrement méfiant en observant que seulement 50 logs de E-values séparent des alignements entre des homologues bactériens (les meilleurs hits NR) et des alignements bactérie/cochon (meilleur hit SP). De fait, quand on ouvre la fiche SP du meilleur hit chez nos cousins les cochon (P81140), qu'est-ce qu'on constate avec stupéfaction, de la définition même de cet protéine ?...

Ceci doit en partie répondre à la deuxième question, peut-on utiliser un homologue de cochon pour aligner avec des protéines de bactéries ?

ChaDev
20 Oct 2020 16:16
Non evaluated contribution

Je ne suis pas sûre de d'avoir suivi votre démarche...

Qu'est ce que je devrai constater ?

Pour moi ce n'est pas pertinant de comparer des homologues d'organismes aussi éloignés

PHingampMM20
20 Oct 2020 16:25
Game master

Cette séquence de cochon, meilleur hit dans SP, est une séquence mitonchondriale, dont l'origine n'est pas verticale, mais via un HGT "récent" (l'endosymbiose d'une alphaprotéobactérie dans l'ancêtre des eucaryotes). Le dernier ancêtre commun entre l'ORF bactérienne et ce gène porcin ne remonte donc pas à LUCA, ce qui explique pourquoi l'alignement du BLAST reste aussi excellent, car on ne compare pas un gène porcin hérité de LUCA, mais un gène d'origine bactérienne "hébergé" dans un génome porcin... Si cette explication est exacte, alors si on ajoute cet homologue "porcin" dans un arbre d'homologues bactériens, il devrait émerger au sein des protéobacteries (et non à l'éxtérieur de la branche des bactéries si c'était un gène descendant verticalement de LUCA).

ChaDev
20 Oct 2020 16:28
Non evaluated contribution

Je ne suis pas sûre de d'avoir suivi votre démarche...

Qu'est ce que je devrai constater ?

Pour moi ce n'est pas pertinant de comparer des homologues d'organismes aussi éloignés

ChaDev
20 Oct 2020 16:31
Non evaluated contribution

Je comprend mieux merci !!

Donc si on considère des gènes mitochondriaux il n'est pas incohérant de comparer une bactérie et un cochon ?