Re-Bonjour,
Réponse en plusieurs points :
1) Concernant la phylogénie du groupe des Bactéroidètes, elle a un peu changé par rapport à la phylogénie simplifiée présentée dans les FAQ et dans le document Phylogénie déposé sur AMETICE. Comme vous le voyez bien dans votre rapport taxonomique, et dans votre table 5 : le phylum (ou groupe monophylétique) des Bactéroidètes est composé de plusieurs classes (Flavobacteriia, Cytophagia, Bacteroidia, Chitinophagia, Sphingobacteriia et Saprospiria). Chacune de ces classes formant aussi un groupe monophylétique.
De plus, votre groupe d'étude choisi DOIT être monophylétique.
Par conséquent, si vous choisissez comme groupe d'étude, les 3 groupes (Flavobacteriia, Cytophagia, Bacteroidia) : ce groupe d'étude est-il bien monophylétique d'après vous ? Ou est-ce un groupe paraphylétique ? Ce groupe d'étude est-il donc bien valide ?
2) D'après votre table 5, vous avez effectivement 7 log d'écart entre le groupe des Flavobacteriia et celui des Cytophagia. Mais regardez bien le groupe taxonomique suivant : celui des protéobactéries => e-value minimale = 1E-116, soit seulement 6 log d'écart avec le groupe des Flavobacteriia.
Qu'est-ce que cela signifie ? Vous avez une ou des séquences très similaires (quasiment aussi similaire que dans le groupe des Flavobacteriia) dans le groupe des protéobactéries. Il faudrait alors aussi tenir compte du groupe des protéobactéries pour établir votre groupe d'étude monophylétique...
Dans votre cas, vous ne tiendrez pas compte du groupe des protéobactéries pour 3 raisons :
- Une seule séquence de protéobactérie a une e-value aussi faible (E-116). L'e-value suivante est de 7e-109, soit un différentiel de 13 log avec le groupe des Flavobacteriia (bon, c'est encore assez proche...)
- Le groupe des protéobactéries est très peu représenté dans votre rapport taxonomique en terme de nb de séquences (seulement 17 ou 18 séq), contrairement au groupe des Flavobacteriia (1096).
- Et surtout, voir le point 3)
3) En réalité, dans votre rapport taxonomique, vous avez des e-values plus faibles que e-122 dans le groupe des Flavobacteriia, qui n'ont pas été identifiées par l'outil TaxList (je ne sais pas pourquoi, probablement un bug de l'outil). Regardez bien votre rapport taxonomique et modifiez votre table 5 en conséquence :
e-value la plus faible : Flavobacteriaceae bacterium 473 1e-164 121 hitsBacteria:Bacteroidetes:Flavobacteriia:Flavobacteriales
Mais aussi :
-Flavobacteriales bacterium.................... 419 3e-143
-Bacteroidetes bacterium......................... 421 3e-144 155 hitsBacteria:Bacteroidetes: ==> mais on ne sait pas de quelle classe de Bacteroidetes il s'agit.
==> par conséquent, le différentiel d'e-values entre le groupe des Flavobacteriia et les autres bactéroidetes est donc plus important que ce que vous aviez noté : quasiment 50 log ! Ce qui est énorme.
==> par conséquent, avez-vous le droit de vous focaliser sur le groupe des Flavobacteriia pour établir votre groupe d'étude ?
==> et quel serait alors votre groupe extérieur ? Pour rappel, le groupe extérieur doit être de même niveau taxonomique que le groupe d'étude, et l'échantillon analysé DOIT lui aussi être monophylétique.
==> D'après ce que je vois dans la ccl de votre paragraphe rapport taxonomique : groupes d'étude et externe sont justes !
==> D'après votre arbre, vous séparez bien groupe d'étude et externe, et votre ORF est bien inclus dans le groupe d'étude.
==> Dans le paragraphe rapport taxo, indiquez aussi si vous avez plusieurs sous-groupes dans les flavo- (voir rapport taxonomique : décalages vers la gauche, valeurs de score et d'e-value en gras qui augmentent à nouveau (par rapport aux valeurs précédentes), même si ces sous-groupes n'ont pas de nom (la taxonomie indiquée n'est pas complète, elle est tronquée). Est-ce que vous retrouvez ces sous-groupes sur votre arbre ? Votre ORF appartient-il à l'un de ces sous-groupes ?
Bon travail,
BW