Forum "Recherche d'ORF"

Thread subject: ORF non complet / classification

[ Return to forums ]
ORF non complet / classification
retenodus
21 Feb 2023 19:24
Non evaluated contribution

Bonjour,

 

Avec les annotations déjà données, est ce que cela signifie qu'il n'y a rien d'intéressant ici et que je passe à une autre annotation ?

 

En effet, puisqu'il faut éliminer les ORF chevauchants de petite taille, je peux éliminer les ORF 2,3,4 qui chevauchent ORF1.

Néanmoins ORF1 n'est pas complet, ni en 5' ni en 3'. Est ce que dans ces conditions, il faut éliminer l'ORF sans aller plus loin ? Ou est ce que ce n'est pas important ?

 

Si je vais plus loin, et que je fais un BLAST sur l'ORF 1, je trouve:

                                                                   Score     E      Max
Sequences producing significant alignments:                       (Bits)  Value   Ident

MAP03754.1 hypothetical protein [Halieaceae bacterium]             767     0.0     97%         
HCG94909.1 TPA: hypothetical protein [Halieaceae bacterium]        766     0.0     97%         
MCH1602177.1 DNA polymerase Y family protein [Luminiphilus sp.]    750     0.0     95%         
MAK69795.1 hypothetical protein [Halieaceae bacterium]             744     0.0     95%         
RPG89008.1 DNA polymerase Y family protein [Cellvibrionales ba...  742     0.0     94%         
MAR28334.1 hypothetical protein [Gammaproteobacteria bacterium]    742     0.0     94%         
NCG07655.1 hypothetical protein [Gammaproteobacteria bacterium]    734     0.0     92%         
MCH1445620.1 DNA polymerase Y family protein [Luminiphilus sp.]    734     0.0     92%         
MAJ27687.1 hypothetical protein [Halieaceae bacterium]             661     0.0     94%   

 

(et beaucoup d'autres ensuite).
Puisque l'énoncé dit que ça ne soit pas être a dessus de 95% est ce que c'est une confirmation qu'il faut que je passe à une autre annotation ?

 

Par ailleurs, ce BLAST montre que que les 2 premiers sont hypothetical, le 3è est connu. Si je continuais avec cet ORF, faudrait il mettre connu puisqu'on a quelque chose de très proche connu ? Ou novel parce que le plus proche est hypothetical ?

 

Merci,

Bonne journée,

Grégoire

marieb
21 Feb 2023 21:32
Non evaluated contribution

Tu dois passer à une autre annotation car le % d'identités est trop élevé :(

Bon courage

mb roblot

Meglecz23CTES
22 Feb 2023 8:47
Game master

Bonjour,


L’ORF peut-être incomplète. Si la partie de l’ORF que vous avez est assez longue ça ne pose pas de problème pour les analyses.

 

Si vous avez des homologues avec de fonctions connues, la présence des homologues non annotées (hypothetical protein) ne pose pas de problème non plus.

 

Par conte Marieb a raison, les meilleurs homologues sont trop proches (>95%idnetitté), donc il faudra abandonner cette séquence.

 

 

Bon travail,
Emese Meglecz