Bonjour,
Lorsque j'ai fait mon blast, il y avait 2 orfs sur ma séquence de 182 et 206 aa avec 87 et 88 % d'id. Mais quand j'ai cherché en détails, je ne trouve pas les mêmes orfs et le plus grand orf est 170 aa( celui que j'ai choisi). Est- ce normal ?
Les ORF affichées dans la partie ORFinder sont correctes. Comment avez-vous obtenu les ORF par BLAST ? Comme l’ORF Finder a une approche « gourmand » ce n’est pas logique de trouver des ORF plus grandes que par ORF Finder. Seule possibilité que je peux imaginer, c’est que la séquence contienne un codon STOP erroné, qui arrête l’ORFinder prématurément.
Pour l'alignement multiple, je ne sais pas quelles séquences choisir car pour mon groupe d'étude ( flavobacteria),il y a 62 groupes soulignés.
La taxonomie est hiérarchique. Donc chaque groupe taxonomique est composé des sous-groupes, et les sous-groupes eux aussi ont des sous-(sous) groupes, etc. Il faut tenter de bien représenter de la variabilité d’un groupe. Par exemple dans le cas de classe de Flavobacteriia, il faut représenter tous les ordres s’il y en a plusieurs (par exemple Flavobacteriales) et puis les différentes familles (Flavobacteriaceae, Weeksellaceae, Schleiferiaceae…) des chaque ordre.
Comment savoir quelle est la valeur seuil ? Est ce 1e-84 ?
L'E-valeur seuil sépare les homologues et les non-homologues. Si votre dernier E-valeur est encore très petite (par exemple < 1e-10), vous pouvez probablement conclure que tous les hits sont homologues et vous ne pouvez pas déterminer le seuil. Vous pouvez seulement dire que c’est plus grand que l’E-valeur la plus élevée que vous avez. Si l’E-valeur la plut haute est relativement grande, il faut regarder des fonctions des hits pour voir s’ils sont tous compatibles avec la fonction des meilleurs hits. Si oui, vous pouvez conclure que tous les hits sont homologues. Au cas contraire, il faudra établir la valeur seuil à la plus petite E-valeur qui a une fonction incompatible.
J'ai essayé de continuer en sélectionnant une vingtaine de séquences pour le groupe d'étude, mais j'obtiens 119 positions sur 336, soit seulement 35%;
Tant qu’il vous reste une bonne centaine de positions pour faire la phylogénie, et que les nœuds de l’arbre sont généralement robustes, ce n’est pas un problème.
Le pourcentage est bas dans votre cas, car il y a une dizaine de séquences qui sont nettement plus longues en Nter que les autres. Vérifiez, si la fonction de ces séquences est identique aux fonctions des autres et/ou si elles se regroupent dans le même groupe taxonomique. Ça sera intéressant à discuter.
Bon travail,
Emese Meglecz