Bonjour Mme Meglecz, je viens de lire le début de votre correction et je patiente comme vous me l'avez indiqué.
J'ai effectivement fait quelques erreurs (de syntaxe ou de choix des mots cohérents) lors de ma rédaction car faute de temps (pouvant parfois amener à une confusion) concernant les ORF known, novel ou faux positifs. J'avais également mis en copié-collé certaines règles du jeu en guise de réponse afin de repérer ce qui était demandé (bien que cela ne parait pas utile) car je suis novice concernant l'outil d'Annotathon ... lorsque vous dites - "Je suis d'accord que l'ORF8 est known mais pas pour les raisons que vous avez citées." - L'ORF par définition à choisir parmi ceux détectés doit être le plus long (possèdant le plus d'acides aminés) d'après ce que j'ai lu dans le cours, dont vos critères demandaient plus de 60 codons et ne contenant pas de codons stop. Il était aussi mentionné dans le cours "qu'au sens strict, un ORF est composé d’un codon d’initiation (ATG le plus souvent), suivi des codons qui déterminent une suite d’acides aminés puis se termine par un codon STOP. Tous ces codons sont consécutifs et ils sont dans le même cadre de lecture. Au sens large, un ORF est une suite de codons (consécutifs, dans le même cadre de lecture) sans codon STOP.", c'est là que viendrait mon ambiguité du choix du critère "known" vu que le codon Stop est situé sur l'ORF8 "probablement" après la base 1520 en 3'. Toujours d'après le cours " Plus l'ORF est long, plus c’est probable que la région soit codante et inversement. Cette recherche va donner beaucoup d’ORFs, mais la majorité seront des faux positifs : des ORF qui ne correspondent pas à un gène codant. En cas de faux positifs le manque de codon STOP dans la séquence est dû au hasard. Autrement dit, dans une séquence aléatoire, on attend en moyenne un codon STOP tous les 21 codons. il est très peu probable de trouver par hasard une centaine de codons consécutifs sans codon STOP. Il y a donc une bonne raison de penser qu’un ORF long est codant.".
Pour Blastx, j'avais testé chaque ORF séparément, car en ayant lancé Blastn, je n'obtenais pas les mêmes résultats car je n'avais que l'ORF5 contenant 5000 séquences (hits) et non pas l'ORF 8 à étudier (Known). J'aurais du utiliser 10 au lieu de 100 comme vous me l'avez indiqué.
Du coup pour le Blast x contre NR et le Swissprot j'avais pas pu obtenir de résultats pour la deuxième ligne, j'ai donc supposé que les résultéts Blastx contre NR était le plus fiable et utilisé par la suite pour établir l'arbre phylogénétique...
J'ai pris 2 groupes d'études qui m'ont paru cohérent malgré la différence de séquences...
J'ai quand même pu faire le rapprochement taxinomique et voir la similarité avec les bactéria bactérioidetes...
Je reconnais que l'arbre obtenu n'est pas génial... il m'a fallu patienter plus d'1h30 pour l'avoir...
J'attends du coup vos instructions avant l'examen.
Je vous remercie infiniment.
Mr SINGH