Forum "Analyse phylogénétique"

Thread subject: Choix groupe d'étude et groupe extérieur

[ Return to forums ]
Choix groupe d'étude et groupe extérieur
lea
29 Mar 2019 2:19
Non evaluated contribution

Bonjour madame,

Mon ORF que j'étudie a un e value min à 2E-92 et une homologie de séquence max à 63%.

J'ai donc décidé de l'étudier.

Lorsque j'arrive à l'étude du rapport taxonomique avec le choix entre le groupe d'étude et le groupe extérieur je me trouve face à un problème.

Immaginons comme première hypothèse que je prenne comme groupe d'étude les gammaprotéobactéries et comme groupe extérieur les autres protéobacter (autre que gammaprotéobactérie): c'est très risqué car il y a une différence de evalue min seulement de 3. En effet Gammaproteobacteria:Vibrionales a un evalue min de 2e-92 et Alphaproteobacteria possède un evalue min de 3e-89. Donc je ne prend pas cette hypothèse.

2ème hypothèse: Je prend comme groupe d'étude les protéobacter et comme groupe extérieur les Bactéries (autre que proteobacter); c'est toujours risqué car il y a une différence de evalue min de seulement 10. En effet Proteobacter a un evalue min de 2e-92 et Actinobacteria a un e value min de 3e-82. J'aurai pris cette hypothèse mais je me retrouve face à un plus gros problème. En effet le groupe extérieur est censé se rapprocher au plus proche du groupe d'étude et dans cette hypothèse les Eucaryotes (complètement différent des bactérie) ont un evalue min de 2e-82 pratiquement le meme que le evalue min de mon groupe d'étude.

Je suis un petit peu perdue.

Dois je changer de séquence d'étude?

Je vous remercie d'avance pour votre réponse

Meglecz18CTES
29 Mar 2019 11:22
Game master

Bonjour Léa,

Merci pour votre question bien décrite.

En effet, la première hypothèse n’est pas impossible, mais elle est risquée et vous avez raison, la deuxième hypothèse est plus raisonnable.
Je comprends que l’Evaleur très faible des Eucaryotes vous perturbe, mais il n’y a que 3 hits d'Eukaryotes, dont seulement un a une E-valeur très faible (Bosea lupini 2e-82). Cela me suggère des erreurs dans le BDD.  
Une explication simple et plausible de ce type d’erreur sera la contamination de l’échantillon des Eucaryotes par des bactéries. Par exemple, la drosophile d'où vient l’ADN s’est promenée dans les endroits pas très propres avant qu’on les attrape à passe à ‘extraction :)

Dans le cas de Bosea lupini il y un autre type d’erreur. Je vous laisse le découvrir en cherchant ce nom de genre et espèce.

Une petite correction de vocabulaire :

« une homologie de séquence max à 63% ». Cette expression n’a pas de sens. Vous pouvez dire que la plus proche homologue à 63% identité avec l'ORF. Deux séquences sont soit homologues (elles dérivent un ancêtre commun) soit elles ne le sont pas. On ne peut pas parler de pourcentage d’homologie.

Bon travail,
Emese Meglecz

 

lea
31 Mar 2019 16:24
Non evaluated contribution

Bonjour Madame,

Je vous remercie pour votre réponse. Je vais essayer de trouver quel autre type d'erreur pourrait apparaitre avec Bosea Lupini.

J'aurai une autre question: En faisant l'arbre j'ai pu remarquer que l'ORF fait très probablement partie des protéobactéries, mais puis je aussi en conclure sur les gammaprotéobactéries?

 En effet j'ai remarqué que mon arbre présentait une différence franche entre le groupe extérieur et le groupe d'étude mais plus nuancée au sein meme du groupe d'étude pour en conclure sur la classe.

Je vous remercie d'avance pour votre réponse.

 

Meglecz18CTES
1 Apr 2019 16:38
Game master

Bonjour Léa,

Est-ce que les gammaprotéobactéries forment un clade (une branche qui inclut tous les gamma protéobactéries et rien d’autre). Si la réponse est non, dire que votre ORF est une gammaprotéobactérie sera une surinterprétation.

Bon travail,
Emese Meglecz