Forum "Recherche d'homologues: BLAST"

Sujet de discussion: Rapport taxonomique du Blast

[ Retour aux forums ]
Rapport taxonomique du Blast
Yassine
16 Mar 2020 23:30
Contribution non évaluée

Bonsoir;

Je vous envoi ce message concernant cette question : 

  • calculez explicitement le différentiel de E-values entre les 2 groupes d'étude et extérieur!

Je n'arrive pas trop à comprendre cette question et comment calculer le différentiel des deux groupes ?

Merci d'avance

B_Wirth_20
17 Mar 2020 9:55
Maître de jeu

Bonjour,

comme expliqué en TP, ce différentiel de E-values est à mentionner effectivement de manière explicite entre groupe d'étude et extérieur, lorsque vous les avez définis, mais pas seulement. Calculez aussi ce différentiel de E-values entre les différents groupes taxonomiques de votre table 5, car c'est ce qui vous permettra de définir votre groupe d'étude.

Le calcul de ce différentiel se fait entre les e-values minimales de chaque groupe.

Ex de la table 5 donné dans les règles du jeu :

Bacteria
Proteobacteria
Betaproteobacteria
3E-71 à 8E-38
 400
  
  
Gammaproteobacteria
9E-64 à 7.8

Le différentiel d'e-values entre les beta- et les gamma- est donc de 7 log.

Ce qui est peu, le chevauchement de la gamme d'e-values est donc important, on ne peut pas se focaliser sur le groupe des beta- seulement pour former le groupe d'étude. Il faudra tenir compte des beta- + gamma-, mais attention, il faut que le groupe d'etude soit monophyletique. Est-ce que beta- + gamma- forme bien un groupe monophyletique ?

Bon travail,

BW

 

 

 

B_Wirth_20
17 Mar 2020 9:56
Maître de jeu

Répondu, voir message précédent.

Yassine
17 Mar 2020 11:15
Contribution non évaluée

Bonjour,

Je vous remercie pour votre réponse, j'ai pu donc calculer le différentiel des groupes et en effet je suis dans le même cas que l'exemple donné dans les règles du jeux

J'ai 3 groupe que je suppose que sont mon groupe d'étude : Flavobacteriia, Cytophagia, Bacteroidia avec des E-value min = 4E-122, 2E-115 et 5E-86. le différentiel entre Flavobacteriia et Cytophagia est de 7log mais le différentiel entre Flavobacteriia et Bacteroidia est de 36 log, j'ai pu donc en déduire que je dois prendre en compte  Flavobacteriia et Cytophagia pour former mon groupe d'étude et que ces deux dernier forme un groupe monophylétique. Or qu'en regardant sur l'arbre de la vie je trouve que les 3 espèces forment un groupe monophylétique car ils ont un ancêtre commun unique

  • Est-ce que je dois prendre les 3 espèces comme groupe d'étude ? Ou plutôt prendre que Flavobacteriia et Cytophagia ? Si c'est le deuxième cas, est-ce possible de se focaliser plus sur Flavobacteriia comme groupe d'étude pour la suite des annalyses ? car ce dernier présente un nombre imortant des alignements (1096) plus que les autres groupes, de plus, tous mes résultats obtenus sont en fonction de celui-ci ...

Cordialement

B_Wirth_20
17 Mar 2020 17:00
Maître de jeu

Re-Bonjour,

Réponse en plusieurs points :

1) Concernant la phylogénie du groupe des Bactéroidètes, elle a un peu changé par rapport à la phylogénie simplifiée présentée dans les FAQ et dans le document Phylogénie déposé sur AMETICE. Comme vous le voyez bien dans votre rapport taxonomique, et dans votre table 5 : le phylum (ou groupe monophylétique) des Bactéroidètes est composé de plusieurs classes (Flavobacteriia, Cytophagia, Bacteroidia, Chitinophagia, Sphingobacteriia et Saprospiria). Chacune de ces classes formant aussi un groupe monophylétique.

De plus, votre groupe d'étude choisi DOIT être monophylétique.

Par conséquent, si vous choisissez comme groupe d'étude, les 3 groupes (Flavobacteriia, Cytophagia, Bacteroidia) : ce groupe d'étude est-il bien monophylétique d'après vous ? Ou est-ce un groupe paraphylétique ? Ce groupe d'étude est-il donc bien valide ?

2) D'après votre table 5, vous avez effectivement 7 log d'écart entre le groupe des Flavobacteriia et celui des Cytophagia. Mais regardez bien le groupe taxonomique suivant : celui des protéobactéries => e-value minimale = 1E-116, soit seulement 6 log d'écart avec le groupe des Flavobacteriia.

Qu'est-ce que cela signifie ? Vous avez une ou des séquences très similaires (quasiment aussi similaire que dans le groupe des Flavobacteriia) dans le groupe des protéobactéries. Il faudrait alors aussi tenir compte du groupe des protéobactéries pour établir votre groupe d'étude monophylétique...

Dans votre cas, vous ne tiendrez pas compte du groupe des protéobactéries pour 3 raisons :

- Une seule séquence de protéobactérie a une e-value aussi faible (E-116). L'e-value suivante est de 7e-109, soit un différentiel de 13 log avec le groupe des  Flavobacteriia (bon, c'est encore assez proche...)

- Le groupe des protéobactéries est très peu représenté dans votre rapport taxonomique en terme de nb de séquences (seulement 17 ou 18 séq), contrairement au groupe des Flavobacteriia (1096).

- Et surtout, voir le point 3)

3) En réalité, dans votre rapport taxonomique, vous avez des e-values plus faibles que e-122 dans le groupe des Flavobacteriia, qui n'ont pas été identifiées par l'outil TaxList (je ne sais pas pourquoi, probablement un bug de l'outil). Regardez bien votre rapport taxonomique et modifiez votre table 5 en conséquence :

e-value la plus faible : Flavobacteriaceae bacterium 473  1e-164 121 hitsBacteria:Bacteroidetes:Flavobacteriia:Flavobacteriales

Mais aussi :

-Flavobacteriales bacterium.................... 419  3e-143

-Bacteroidetes bacterium......................... 421 3e-144 155 hitsBacteria:Bacteroidetes:  ==> mais on ne sait pas de quelle classe de Bacteroidetes il s'agit.

==> par conséquent, le différentiel d'e-values entre le groupe des Flavobacteriia et les autres bactéroidetes est donc plus important que ce que vous aviez noté : quasiment 50 log ! Ce qui est énorme.

==> par conséquent, avez-vous le droit de vous focaliser sur le groupe des Flavobacteriia pour établir votre groupe d'étude ?

==> et quel serait alors votre groupe extérieur ? Pour rappel, le groupe extérieur doit être de même niveau taxonomique que le groupe d'étude, et l'échantillon analysé DOIT lui aussi être monophylétique.

==> D'après ce que je vois dans la ccl de votre paragraphe rapport taxonomique : groupes d'étude et externe sont justes !

==> D'après votre arbre, vous séparez bien groupe d'étude et externe, et votre ORF est bien inclus dans le groupe d'étude.

==> Dans le paragraphe rapport taxo, indiquez aussi si vous avez plusieurs sous-groupes dans les flavo- (voir rapport taxonomique : décalages vers la gauche, valeurs de score et d'e-value en gras qui augmentent à nouveau (par rapport aux valeurs précédentes), même si ces sous-groupes n'ont pas de nom (la taxonomie indiquée n'est pas complète, elle est tronquée). Est-ce que vous retrouvez ces sous-groupes sur votre arbre ? Votre ORF appartient-il à l'un de ces sous-groupes ?

Bon travail,

BW