Forum "Recherche d'ORF"

Sujet de discussion: Résultats bruts

[ Retour aux forums ]
Résultats bruts
mrsingh
23 Aug 2020 12:18
Contribution non évaluée

Bonjour, 

Voici ce que j'ai trouvé pour cette séquence: Résultats bruts

ORF Finder results

Results for 1090 residue sequence "OMRGCv2_9081010 [ TARA OCEANS OM-RGCv2 : Trades Biome : [SPO] South Pacific Ocean : : [SPSG] South Pacific Subtropical Gyre Province, North and South TARA_098_MES_0.22-3 ]" starting "CCCGAAATGA"


 

>ORF number 1 in reading frame 1 on the direct strand extends from base 25 to base 252. GCTTCGATCGTAATAGGCAGCCAGATATCGACACCCATTAAATGCCATGGAATCGAAATT TCTTCGACAAAAACATCTAGATCGCGAAACGCGTCTGCTGCACAGCGTACTTTTTCATCA ACATCTGGCTCCGAAACATCGTGCCCGAATCCTTCCTTGACCAGCCCAATTCTCATTTCT TTGACTGGCGCTCCCAAACTATCGGTGTACCGATGTGTCTTAACGTGA >Translation of ORF number 1 in reading frame 1 on the direct strand. ASIVIGSQISTPIKCHGIEISSTKTSRSRNASAAQRTFSSTSGSETSCPNPSLTSPILIS LTGAPKLSVYRCVLT* >ORF number 2 in reading frame 1 on the direct strand extends from base 553 to base 801. ACGGGTCCTGTGGCATTAGTAAAACTGCTGCCCGAATGGCAAAAATATTCACAGTGTGCT TTTCCTGAAATTTCACCACCAGCATCGAGAATTCGACTGACAATTGTCGCGTCGATCTCA GGGACATACCCTTCTAAAATTGATGACCCATCCATCATTGGGACATCTGCAACCATCACG TTGTCTTTAAGGACAATTTTTTTACCTTCTAACTTTCCTTTAGGCGCGCCTTTAATAGCA GTTTTGTAA >Translation of ORF number 2 in reading frame 1 on the direct strand. TGPVALVKLLPEWQKYSQCAFPEISPPASRIRLTIVASISGTYPSKIDDPSIIGTSATIT LSLRTIFLPSNFPLGAPLIAVL* >ORF number 3 in reading frame 1 on the direct strand extends from base 817 to base 1047. GAATTTTCTTCATCTGATGGTCGATATCCAGACGTTCTTGGATATTTAACGCTTGGCAGA TTGTCAGGTAAGGAATCAAGTACATTGTATGAGTCAATCGACTTTCGCATCAGTTCAATA TATGTCGTTAGTTCCGAGTCAGTAACAGACAAGCCCGTGCGCGTTGAGATCTCTCGAAGC TGCTCAATGGTCGGCAGTGGAACACTCATAATAATTTTCTCTCCCTCGTAA >Translation of ORF number 3 in reading frame 1 on the direct strand. EFSSSDGRYPDVLGYLTLGRLSGKESSTLYESIDFRISSIYVVSSESVTDKPVRVEISRS CSMVGSGTLIIIFSPS* >ORF number 1 in reading frame 2 on the direct strand extends from base 248 to base 541. CGTGATCACTTCGAGGATCGTACCCATCTCGACCTGCGATCACTTCTAAAAGCAACGCGT TGTCAGCAACATTGGCAGTCATTGGTCCCGCATGATCTATGTACGTTTCCATGGGGATCA TCCCCGTGTACGGCACGAGCCCATGCGTGGGTTTCATTCCATAAATACCACTGTAGGACG ATGGAATACGAATTGAGCCTCCCTGGTCTGCCCCAATCGCCATATCTGCTTCGCCTAAAG CCACTAAGACGGCACTGCCCGATGACGAACCACCAGCCGAAAACCCCATTTTGA >Translation of ORF number 1 in reading frame 2 on the direct strand. RDHFEDRTHLDLRSLLKATRCQQHWQSLVPHDLCTFPWGSSPCTARAHAWVSFHKYHCRT MEYELSLPGLPQSPYLLRLKPLRRHCPMTNHQPKTPF* >ORF number 1 in reading frame 3 on the direct strand extends from base 105 to base 296. ATCGCGAAACGCGTCTGCTGCACAGCGTACTTTTTCATCAACATCTGGCTCCGAAACATC GTGCCCGAATCCTTCCTTGACCAGCCCAATTCTCATTTCTTTGACTGGCGCTCCCAAACT ATCGGTGTACCGATGTGTCTTAACGTGATCACTTCGAGGATCGTACCCATCTCGACCTGC GATCACTTCTAA >Translation of ORF number 1 in reading frame 3 on the direct strand. IAKRVCCTAYFFINIWLRNIVPESFLDQPNSHFFDWRSQTIGVPMCLNVITSRIVPISTC DHF*

Meglecz19CTES
23 Aug 2020 16:59
Maître de jeu

Bonjour,

Ne copiez pas les résultats dans le message. Je peux voir vos annotations bien plus clairement grâce au lien vers votre séquence.

Pour cette séquence, il y a 5 ORF potentiels sur le brin direct, et 3 sur le brin indirect. Représentez-les tous dans le tableau et sur le schéma.
Pourquoi avez-vous choisi l’ORF1 ? Il est très cours (75 aa) et vous n’avez pas trouvé des homologues. Vous ne pouvez donc pas le classer comme ORF kown, et ne peut pas continuer les analyses avec. Vérifiez tous les ORF pour voir si cette séquence est adaptée à votre travail. Sinon, regardez bien le vidéo sur le BLASTx, qui montre comment parcourir rapidement plusieurs séquences avant de trouver une qui vous convient. (https://amupod.univ-amu.fr/video/2346-recherche-rapide-de-la-sequence-a-annoter/)

Bon travail,
Emese Meglecz

mrsingh
9 Sep 2020 8:28
Contribution non évaluée

Bonjour  Mme Meglecz, 

 

Je m'excuse de vous déranger, ce serait pour une question technique, 

Lorsque j'essaye de rentrer mes résultats bruts et que j'analyse les s"quences d'ORF à étudier afin de retrouver la phylogénie et la taxinomie, je me confronte à des doutes car je suis tombé sur un échantillon contenant plusieurs ORF et dont j'hésite à savoir si il s'agit d'un orf connu, ou novel ou faux positif sachant que par définition le plus long orf est celui à étudier, et que ceux qui se chevauchent avec ce dernier sont des faux positifs potentiels.

Sur annotathon je suis également confronté à des orf moins longs que d'autres mais qui sont choisi par les bases de données ( sachant que leur codon stop est soit en 5' soit en 3' à la fin du brin direct ou indirect). *Pouvez-vous m'éclairer concernant ce problème svp?

PS: j'ai fait une erreur lorsque j'ai malencontreusement cliqué sur le panier et ajouté 4 échantillons de plus...

Seront-ils à étudier pour les examens du  23 septembre ou bien y-aura t-il un échantillon à choisir parmi ceux proposés pour l'oral?

 

Très cordialement.

Mr. SINGH

Meglecz19CTES
9 Sep 2020 9:56
Maître de jeu

Bonjour M. Singh,


« Lorsque j'essaye de rentrer mes résultats bruts et que j'analyse les s"quences d'ORF à étudier afin de retrouver la phylogénie et la taxinomie, je me confronte à des doutes car je suis tombé sur un échantillon contenant plusieurs ORF et dont j'hésite à savoir si il s'agit d'un orf connu, ou novel ou faux positif sachant que par définition le plus long orf est celui à étudier, et que ceux qui se chevauchent avec ce dernier sont des faux positifs potentiels. »


Il est très fréquent de trouver plusieurs ORFs dans la même séquence. Vous devez classifier chaque ORF en ‘known’, ‘novel’, ‘ORFan’ ou faux positif. En toutes les catégories vous pouvez avoir plusieurs ORF (même pour le known). Parmi les ORF known (si vous en avez plusieurs), vous devez sélectionner un seul que vous allez étudier en détail par la suite. J’ai posé un critère supplémentaire pour l’ORF à étudier : ORF ne peut pas avoir plus que 90% identité avec son meilleur hit BLAST.
Dans le pratique vous devrez donc trouver un ORF, qui a
•    Plus que 1000 homologues BLAST (avoir assez de séquences pour sélectionner des homologues pour la phylogénie)
•    Les fonctions de la plupart des homologues devraient être connues (pour déduire la fonction de l’ORF)
•    L’ORF devrait avoir > 100-150 aa, sinon la phylogénie risque d’être insatisfaisant
•    %identité entre ORF et meilleur hit < 90% pour ne pas avoir une tache trop facile

Cet ORF est souvent le plus long, mais pas nécessairement. Il est aussi possible, que la séquence que vous analysez ne contienne pas d’ORF adaptée a votre analyse. Dans ce cas, il faut essayer une autre séquence.


"Sur annotathon je suis également confronté à des orf moins longs que d'autres mais qui sont choisi par les bases de données ( sachant que leur codon stop est soit en 5' soit en 3' à la fin du brin direct ou indirect). *Pouvez-vous m'éclairer concernant ce problème svp?"


Les ORF ne sont pas nécessairement complètes. Le fragment d’ADN que vous analysez est un morceau aléatoire du génome, il ne couvre donc pas nécessairement la longueur totale d’un ORF (voir cours écrit sur les ORF). Vous pouvez choisir un ORF partiel, si le morceau couvert par votre séquence est assez long."

"PS: j'ai fait une erreur lorsque j'ai malencontreusement cliqué sur le panier et ajouté 4 échantillons de plus...
Seront-ils à étudier pour les examens du  23 septembre ou bien y-aura t-il un échantillon à choisir parmi ceux proposés pour l'oral?"

NON. Il faut choisir un seul ORF d’une seule séquence et faire des analyses complètes de cet ORF. Il est fréquent de parcourir plusieurs séquences avant de trouver une qui vous convienne.

 

Corialement,

Emese Meglecz

 

mrsingh
9 Sep 2020 12:16
Contribution non évaluée

Bonjour, 

C'est parfait je vous remercie, 

Je vais donc suivre ces indications.

Très cordialement .