Bonjour M. Singh,
« Lorsque j'essaye de rentrer mes résultats bruts et que j'analyse les s"quences d'ORF à étudier afin de retrouver la phylogénie et la taxinomie, je me confronte à des doutes car je suis tombé sur un échantillon contenant plusieurs ORF et dont j'hésite à savoir si il s'agit d'un orf connu, ou novel ou faux positif sachant que par définition le plus long orf est celui à étudier, et que ceux qui se chevauchent avec ce dernier sont des faux positifs potentiels. »
Il est très fréquent de trouver plusieurs ORFs dans la même séquence. Vous devez classifier chaque ORF en ‘known’, ‘novel’, ‘ORFan’ ou faux positif. En toutes les catégories vous pouvez avoir plusieurs ORF (même pour le known). Parmi les ORF known (si vous en avez plusieurs), vous devez sélectionner un seul que vous allez étudier en détail par la suite. J’ai posé un critère supplémentaire pour l’ORF à étudier : ORF ne peut pas avoir plus que 90% identité avec son meilleur hit BLAST.
Dans le pratique vous devrez donc trouver un ORF, qui a
• Plus que 1000 homologues BLAST (avoir assez de séquences pour sélectionner des homologues pour la phylogénie)
• Les fonctions de la plupart des homologues devraient être connues (pour déduire la fonction de l’ORF)
• L’ORF devrait avoir > 100-150 aa, sinon la phylogénie risque d’être insatisfaisant
• %identité entre ORF et meilleur hit < 90% pour ne pas avoir une tache trop facile
Cet ORF est souvent le plus long, mais pas nécessairement. Il est aussi possible, que la séquence que vous analysez ne contienne pas d’ORF adaptée a votre analyse. Dans ce cas, il faut essayer une autre séquence.
"Sur annotathon je suis également confronté à des orf moins longs que d'autres mais qui sont choisi par les bases de données ( sachant que leur codon stop est soit en 5' soit en 3' à la fin du brin direct ou indirect). *Pouvez-vous m'éclairer concernant ce problème svp?"
Les ORF ne sont pas nécessairement complètes. Le fragment d’ADN que vous analysez est un morceau aléatoire du génome, il ne couvre donc pas nécessairement la longueur totale d’un ORF (voir cours écrit sur les ORF). Vous pouvez choisir un ORF partiel, si le morceau couvert par votre séquence est assez long."
"PS: j'ai fait une erreur lorsque j'ai malencontreusement cliqué sur le panier et ajouté 4 échantillons de plus...
Seront-ils à étudier pour les examens du 23 septembre ou bien y-aura t-il un échantillon à choisir parmi ceux proposés pour l'oral?"
NON. Il faut choisir un seul ORF d’une seule séquence et faire des analyses complètes de cet ORF. Il est fréquent de parcourir plusieurs séquences avant de trouver une qui vous convienne.
Corialement,
Emese Meglecz