Forum "Recherche d'ORF"

Thread subject: ORF complet ou non

[ Return to forums ]
ORF complet ou non
MaeBinaud
30 Mar 2022 14:16
Non evaluated contribution

Bonjour,

Sur la séquence suivante j'ai quelques difficultés pour savoir si les ORF trouvés sont complets ou non.

 

L'ORF n°2 commence au 3ème nucléotide, il n'y a donc pas un multiple de 3 avant, on ne peut donc pas savoir si il y a un codon STOP ou non avant,  cela signifie-t-il qu'il est incomplet en 5' ?

 

Je rencontre la même difficulté avec l'extrémité 3' de l'ORF n°1, qui s'arrête seulement 2 nucléotides avant la fin de la séquence, de plus sur la traduction on voit qu'il n'y a pas de codons STOP à la fin de la séquence, dois-je donc en conclure que l'ORF s'arrête la car il n'y a pas de multiple de 3 après et qu'il est donc incomplet en 3' ?

 

J'ai rencontré le même problème sur une autre séquence.

 

Ces ORF étant assez long pensez-vous que je puisse continuer de les annoter même s'ils sont incomplets ?

 

D'avance merci,

Maë Binaud.

Meglecz21CTES
30 Mar 2022 14:37
Game master

Bonjour Maë,


Oui, vous avez bien compris. Un ORF qui commence ou se termine à moins de 3 nt de l'extrémité de la séquence est très probablement incomplet.


Référez vous à cette discussion pour voir que les ORF incomplet ne sont pas rares:
http://annotathon.org/?seeThread=3240


Si le morceau de l’ORF inclus dans la séquence est assez long, vous pouvez l’analyser sans problème. Ne l’oubliez pas de donner une estimation de nombre de aa ou nt manquant à l'extrémité incomplet sur base de l’alignement multiple que vous allez faire.
Bon travail,
Emese Meglecz

 

MaeBinaud
30 Mar 2022 14:41
Non evaluated contribution

D'accord, merci.

 

Bonne journée.

MaeBinaud
30 Mar 2022 15:39
Non evaluated contribution

Re bonjour,

excusez moi de encore vous déranger, sur cette même séquence, après BLAST je ne sais pas trop comment analyser les résultats obtenus pour qualifier les ORF.

 

En effet, les ORF 1 et 2 se chevauchent uniquement sur une dizaine de nucléotides et sont tous 2 assez longs et incomplet.

Je pense pouvoir affirmer que l''ORF1 est known ( 4958 hits de fonctions connues) mais l'ORF 2 me pose problème. Il a une centaine de hits, peut il etre codant également ? ( il chevauche l'ORF 1 mais très peu...)

Au vu de sa taille, d'autant plus qu'il est incomplet il me semble étonnant de le qualifier de faux positif.

 

De plus, parmis les meilleurs hits de l'ORF il y en a avec des fonctions connues et des hypothetical, ainsi s'il était codant j'aurais du mal à choisir entre known et novel.  j'ai vraiment du mal à qualifier cet ORF.

 

Merci d'avance pour votre aide.

Meglecz21CTES
30 Mar 2022 16:02
Game master

Re-bonjour Maë,


Le chevauchement est en effet assez court (11nt). De plus, pensez au fait que vous avez utilisé “any codon” pour la recherche d’ORF. Ceci veut dire que le début de l’ORF probablement n’est pas précis, car on n‘a pas cherché des codons d’initiation, mais on a pris le premier codon après le codon stop. Il sera possible d' affiner la position de début sur base de l'alignement multiple, et donc le chevauchement réel entre ces deux ORF sera probablement plus petit.

 

S’il y a des hits significatifs de l’ORF 2 alors il ne peut pas être un faux positif.


Pour choisir entre novel ou known: Si la majorité des séquences ont une fonction et ils sont cohérentes entre elles, alors vous pouvez choisir known, même s’il a des homologues insuffisamment annotés.
Sinon, c’est votre choix, mais expliquez brièvement pourquoi vous penchez vers votre solution. (Pour me faciliter la tâche, copier les résultats de BLAST de l’ORF2 aussi dans Annotathon)