Forum "Recherche d'ORF"

Thread subject: choix de L'ORF

[ Return to forums ]
choix de L'ORF
MarvinOstagh
5 Oct 2014 9:38
Contribution: Pertinent
Bonjour comme vous pouvez le voir ci-dessous j'ai cherchait des ORF avec les codons initiateurs (ORF 5 et 6=), et je remarque que L'ORF 2 est identiques ( à 30 nt prés) au regard des deux blast ils sont quasiment identiques mais quelques différences. J'aimerais savoir lequel choisir pour l'optimisation des résultats, sachant que l'ORF 2 est plus long et avec une plage de E-value plus interessante et l'ORF 6 qui possède un codon start.
Merci d'avance pour votre réponse.
Martin MESTDAGH
P_Hingamp14
6 Oct 2014 12:17
Game master
Bonjour,

Il n'y a globalement pas vraiment d'utilité de la recherche d'ORF en exigeant que l'ORF démarre par un codon initiateur. En effet, absolument rien ne dit dans cette recherche ORFinder très basique que le codon d'initiation sera le premier ATG trouvé, or c'est tout ce que fait ORFinder dans ce mode de recherche: il sélectionne le codon d'initiation le plus en amont possible. Avec les outils que vous connaissez, il faut a minima effectuer un alignement multiple avec les homologues pour poser l'hypothèse de quel codon d'initiation serait le plus probable.

Tout au plus, et seulement dans le cas où vous avez un STOP en amont, cette recherche ORFinder en mode "atg,gtg,ctg,ttg" peut permettre d'éliminer de votre traduction les acides aminés entre le STOP en amont et le premier codon d'initiation potentiel (donc des acides aminés qui ne seront probablement pas traduits [i]in vivo[/i] donc inutiles dans la recherche BLASTp). Mais même avec cette approche, si c'est le 10ème codon "atg,gtg,ctg,ttg" dans ce cadre de lecture qui est le véritable codon d'initiation, alors votre traduction en mode "atg,gtg,ctg,ttg" contiendra malgré tout aussi des acides aminés erronés entre le "faux" premier codon d'initiation et le "vrai" 10ème codon d'initation...

De plus, dans votre cas votre ORF "any codon" s'étend 3 - 1163 (sur 1163pb), c'est à dire qu'il n'y a pas de STOP en amont (gène incomplet en 5'). Dans ce cas précis, il n'est pas du tout justifié de faire la recherche en mode "atg,gtg,ctg,ttg"! En effet, comme vous l'avez remarqué ceci repousse le début de l'ORF à la position 30 qui est le premier codon "atg,gtg,ctg,ttg". Or comme il est fort possible que votre ORF soit incomplète et commence donc en amont de votre premier nucléotide disponible, votre recherche d'ORF en mode "atg,gtg,ctg,ttg" vous fournit un ORF tronqué de 10 acides aminés! D'ailleurs les résultats du BLAST montrent assez clairement que l'ORF 3 - 1163 s'aligne parfaitement dès le premier AA à ses homologues, donc que l'ORF 30 - 1163 serait se priver de 10 AA très certainement très réels...

Donc dans votre cas il n'y a aucune justification à faire la recherche d'ORF en mode "atg,gtg,ctg,ttg" et vous pouvez (devez) même retirer ces deux résultats bruts de vos annotations.

J'en profite pour souligner que sauf erreur de ma part, je n'ai pas vu votre ORF d'intéret dans l'alignement multiple (en tout cas aucune séquence de l'alignement multiple n'a de nom évoquant votre ORF), or c'est ici que se discute et se corrige éventuellement la position de début de la partie codante.