Forum "Analyse phylogénétique"

Sujet de discussion: Choix difficile du groupe d'étude-ordre incertain avec e-value égale au groupe d'étude

[ Retour aux forums ]
Choix difficile du groupe d'étude-ordre incertain avec e-value égale au groupe d'étude
Krystel
9 Mar 2019 0:03
Contribution non évaluée

Bonsoir,

Je me retrouve un peu coincée avec mon fragment concernant le choix du groupe d'étude et du groupe extérieur, à cause de certains hits dont l'ordre est incertain :

J'ai notifié 2 hypothèses provisoirement sur mon travail, le problème est que dans les 2 cas, l'E-value du groupe extérieur peut être égale à celle du groupe d'étude (0.0) ... du coup je ne peux pas estimer de degrès de différence entre eux. Puis-je continuer ainsi ou je risque d'être bloquée ? Peut-être dois-je trouver une 3ème hypothèse ? 

Je ne sais pas si mon message est clair, en tout cas tout est noté sur mon travail dans la partie "rapport taxonomique" 

Merci beaucoup pour votre aide,

cordialement, 

Christelle 

Meglecz18CTES
11 Mar 2019 17:32
Maître de jeu

Bonjour Christelle,


Le plus simple sera d’ignorer dans un premier temps des lignées incomplètes avec des E-valeurs très faibles :

  • Bacteria:Proteobacteria:Alphaproteobacteria
  • Bacteria:Proteobacteria
  • Bacteria

Si vous continuez avec l’hypothèse 1, vous pouvez/devez aussi poser une hypothèse secondaire : Les meilleurs hits dans les lignes ignorées sont les Bacteria:Proteobacteria:Alphaproteobacteria:Rickettsiales. Pour le moment rien n’invalide cette hypothèse.
Calculez la différence d’ordre de grandeur entre groupes d’étude est groupe extérieur selon cette hypothèse.


Si vous choisissez l’Hypothèse 2, votre hypothèse secondaire sera que les meilleurs hits dans les lignes ignorés sont les Bacteria:Proteobacteria:Alphaproteobacteria.

Un complément par rapport à la précision d’E-valeur :
Nous avons vu dans un post précédent sur ce forum, qu’une E-valeur 0, est un arrondi. En réalité, elle n’est pas 0 mais très une valeur très petite. Je ne suis pas absolument certaine  de l'ordre de grandeur  à partir de quel on arrondit l’evaleur à 0, mais en regardant la liste de hits on voit que la plus petita e-valeur affichée comme non-zero est 4e-171. Ceci me suggère qu’un E-valeur affiché comme 0 c'est < 1e172.
 
Bonne continuation,
Emese Meglecz

 

P.S. Votre message est clair, mais vos notes dans la section 'Rapport Taxonomique' sont encore mieux ! Merci !

 

Krystel
14 Mar 2019 12:37
Contribution non évaluée

Bonjour,

Merci beaucoup pour votre message, mais je ne suis pas sûr d'avoir bien compris : Quand vous dîtes qu'il faudrait ignorer les lignes inomplètes, vous voulez dire que je conserve les hypothèses en faisant le travail sans prendre en compte les lignes incomplètes ? 

Par exemple pour l'hypothèse 1 :

prendre comme groupe d'étude : Bacteria:Proteobacteria:Alphaproteobacteria:Rickettsiales

Prendre comme groupe extérieur :  Bacteria:Proteobacteria:Alphaproteobacteria: non-Rickettsiales ( en excluant la ligne  "Bacteria:Proteobacteria:Alphaproteobacteria" pouvant comprendre des Rickettsiales et des non-Rickettsiales) 

En réfléchissant de mon côté, j'avais sinon envisagé de conserver l'hypothèse 1 mentionnée sur le rapport en faisant 2 sous-hypothèses : 1 optimiste (la ligne incomplète comprend des Rickettsiales) VS 1 pessimiste (la ligne incomplète comprend des non Rickettsiales)

Désolé, je ne sais pas si je suis clair, j'ai du mal à exprimer le problème ! 

Christelle

 

Krystel
14 Mar 2019 14:11
Contribution non évaluée

Bonjour,

Merci beaucoup pour votre message, mais je ne suis pas sûr d'avoir bien compris : Quand vous dîtes qu'il faudrait ignorer les lignes inomplètes, vous voulez dire que je conserve les hypothèses en faisant le travail sans prendre en compte les lignes incomplètes ? 

Par exemple pour l'hypothèse 1 :

prendre comme groupe d'étude : Bacteria:Proteobacteria:Alphaproteobacteria:Rickettsiales

Prendre comme groupe extérieur :  Bacteria:Proteobacteria:Alphaproteobacteria: non-Rickettsiales ( en excluant la ligne  "Bacteria:Proteobacteria:Alphaproteobacteria" pouvant comprendre des Rickettsiales et des non-Rickettsiales) 

En réfléchissant de mon côté, j'avais sinon envisagé de conserver l'hypothèse 1 mentionnée sur le rapport en faisant 2 sous-hypothèses : 1 optimiste (la ligne incomplète comprend des Rickettsiales) VS 1 pessimiste (la ligne incomplète comprend des non Rickettsiales)

Désolé, je ne sais pas si je suis clair, j'ai du mal à exprimer le problème ! 

Christelle

 

Meglecz18CTES
14 Mar 2019 14:29
Maître de jeu

Bonjour Christelle,

 ‘Quand vous dîtes qu'il faudrait ignorer les lignes inomplètes, vous voulez dire que je conserve les hypothèses en faisant le travail sans prendre en compte les lignes incomplètes ? ‘

Oui, c’est une manière à procéder. Dans un premier temps, vous pouvez ignorer les lignées incomplètes pour poser votre hypothèse. Ensuite, vous tenez compte de la présence des lignées incomplètes avec des Evaleurs très faible. Ceci impose une sous-hypothèse optimiste : les meilleurs hits de la ligne incomplète sont des Rickettsiales. Dans le cas de sous-hypotèse pessimiste (les meilleurs hits de la ligne incomplète comprennent des non Rickettsiales) vous avez de très faible Evaleurs pour les non Rickettsiales, donc vous ne pouvez pas choisir les Rickettsiales comme groupe d’études. Ceci invalide votre hypothèse de base.

Je pense qu’on s’exprime de manière diffèrent, mais vous êtes sur la bonne voie.

Attention pour la partie concernant des arrondis d'Evaleur à 0. 0 peut être en réalité 1e-172.

Bon travail,
Emese Meglecz