Forum "Analyse phylogénétique"

Sujet de discussion: Groupe extérieur

[ Retour aux forums ]
Groupe extérieur
Ampen-sarah
7 Apr 2021 15:32
Contribution non évaluée

Bonjour,

 

J'ai pris en groupe d'étude:

 

Bacteria:Calditrichaeota:Calditrichae:Calditrichales

1

2

1E-180

1E-180

 

et en groupe extérieur :

Bacteria:Chloroflexi:Anaerolineae:Anaerolineales

12

106

1E-150

1E-117

 

je voudrais savoir si c'est bien le bon choix en sachant pour le groupe Bacteria:Calditrichaeota:Calditrichae:Calditrichales, dans mon tableau s'y figure ceci:

Bacteria:Calditrichaeota

1

4

2E-97

2E-97

 

 

Dois-je le prendre comme groupe extérieur ou ne dois-je pas y tenir compte ?

 

Merci cordialement

Ampen-sarah
7 Apr 2021 15:46
Contribution non évaluée

Je viens de voir ce qu'Anais a mis sur le forum, les valeurs 0.0 sont plus petites que e-180.

 

Donc je pense prendre comme groupe d'étude

 

Bacteria:Proteobacteria

1

8

0.0

0

 

et comme groupe extérieur

 

Bacteria:Calditrichaeota:Calditrichae:Calditrichales

1

2

1E-180

1E-180

 

 

par contre comment doi-je calculer l'ordre de grandeur ?

 

Merci cordialement

AnaisE
7 Apr 2021 16:36
Contribution non évaluée

Salut Sarah,

 

Je me souviens que la prof avait proposé dans un autre poste différentes options pour gérer les E-valeurs de 0 : raccourcir la longueur de ta séquence requête dans BLAST (afin que les scores d'alignement soit légèrement inférieur), ou faire une recherche dans refseq_protein au lieu de nr pour voir si les résultats sont plus simples à gérer.

 

Personnellement, j'avais le même cas de figure et recalculé l'E-valeur de 0 grâce au score d'alignement qui est donné en parallèle des E-valeurs (qui lui, n'est pas limité). C'est peut-être moins précis, mais j'ai trouvé ça pratique.

 

(Attention à groupe extérieur, car les Protéobactéria sont dans un noeud non-résolu à la racine de l'arbre. Il faut donc choisir toutes les non-Protéobactéria, et pas seulement le groupe avec la seconde meilleure E-valeur.)

Ampen-sarah
7 Apr 2021 18:28
Contribution non évaluée

Re-bonjour,

 

Merci beaucoup Anais pour tes réponses.

Meglecz20CTES
8 Apr 2021 16:25
Maître de jeu

Bonjour Sarah et Anaïs,


Très bonne remarque sur le groupe extérieur si on choisit les proteobacteria comme groupe d’étude.

 

Il y a deux questions à poser :
 - Peut-on faire confiance à l’annotation des séquences Calditrichaceae ?
- Peut-on supposer que la linge Bacteria:Proteobacteria (Evaleur 0.0) correspond au deltaproteobacteria ?


Si la réponse à la première question est non, et pour la deuxième est oui, alors il est possible de choisir un groupe d’étude plus petit que le proteobacteria, même si c’est une hypothèse un peu risquée.

Bon travail,
Emese Meglecz

 

Ampen-sarah
8 Apr 2021 17:34
Contribution non évaluée

Bonjour,

 

J'ai réfléchis à ce que vous avez écrit, je pense prendre les delta proteobacteria comme groupe d'étude et par contre est-il possible pour moi de prendre les gamma proteobacteria comme groupe extérieur (meilleur e-valeur : 8E-149) ? ou je dois abstraction de cette valeur et prendre le groupe "frère" le plus proche donc ici les alpha proteobacteria (e-valeur : 7E-132)

 

Merci cordialement 

Meglecz20CTES
9 Apr 2021 10:56
Maître de jeu

Bonjour Sarah,


Si vous prenez le delta protéobacteria comme groupe d’étude TOUS les delta devraient être votre groupe d’études peu importe de quels ordres il appartient.
Une fois vous avez choisi le groupe d’étude, le choix de groupe extérieur ne dépend pas des Evaleurs, mais la phylogénie (http://annotathon.org/Metagenes/index.php/Annotathon:_foire_aux_questions#L.27arbre_de_la_vie.2C_vu_par_les_microbes ), ou la taxonomie.
Le groupe frère des deltabacteria n’est pas le alphabateria.


Bon courage,
Emese Meglecz

Meglecz20CTES
9 Apr 2021 11:12
Maître de jeu

En complément, lisez le poste http://annotathon.org/?seeThread=2966 aussi.

 

Ampen-sarah
12 Apr 2021 16:07
Contribution non évaluée

Bonjour,

 

Je vous remercie de votre aide. 

Le complément que vous avez envoyé m'a beaucoup aidé.
Si j'ai bien compris, je dois prendre les delta protéobacteria comme groupe d'étude et les non delta protéobacteria en groupe extérieur (cad tous les groupes comme par exemple les alpha, beta, gamma proteo bacteria)

 

Merci cordialement

Meglecz20CTES
12 Apr 2021 18:02
Maître de jeu

C'est une possibilité.

Ampen-sarah
14 Apr 2021 17:35
Contribution non évaluée

Bonjour,

 

Au vue de mon petit problème avec les groupes extérieur et d'étude, j'ai décidé de faire un bastp contre refseq_proteine.

Voici les résultats que j'ai obtenu:

 

Table 3: Catalogue des fonctions des protéines alignées par BLASTp contre refseq_proteine

 

Definitions nb lines min E-value max E-value
cysteine desulfurase-like protein 100 7e-150 8e-119

 

Je retrouve la fonction que j'avais trouvé avec Nr donc pour le moment ça va, mais ensuite j'obtiens ceci:

 

 

Table 4 : Synthèse des classifications taxonomiques des protéines alignées par BLASTp contre refseq_proteine

 

Classification nb lines nb hits min E-value max E-value
Bacteria:Cyanobacteria:Nostocales:Calotrichaceae 1 1 7e-150 7e-150
Bacteria:Proteobacteria:Gammaproteobacteria:Chromatiales 1 2 3e-147 3e-147
Bacteria:Proteobacteria:Alphaproteobacteria:Hyphomicrobiales 62 113 1e-138 8e-119
Bacteria:Proteobacteria:Alphaproteobacteria:Rhodospirillales 2 4 2e-125 6e-125
Bacteria:Proteobacteria:Betaproteobacteria:Burkholderiales 1 2 4e-121 4e-121
Bacteria:Proteobacteria:Alphaproteobacteria:Sphingomonadales 1 2 3e-120 3e-120
Bacteria:Proteobacteria:Alphaproteobacteria:Kordiimonadales 1 1 5e-120 5e-120
Bacteria:Planctomycetes:Planctomycetia:Pirellulales 1 2 3e-143 3e-143
Bacteria:Chloroflexi:Anaerolineae:Anaerolineales 6 14 8e-137 7e-128
Bacteria:Chloroflexi:Ktedonobacteria:Ktedonobacterales 8 15 4e-130 1e-119
Bacteria:Chloroflexi:Chloroflexia:Kallotenuales 1 1 3e-123 3e-123
Bacteria:Chloroflexi:Caldilineae:Caldilineales 1 1 4e-120 4e-120

 

Mon tableau est beaucoup plus petit, j'ai beaucoup moins de valeurs qu'avec Nr mais surtout, en regardant les e-valeur, mon groupe d'étude ici serait Bacteria:Cyanobacteria:Nostocales:Calotrichaceae avec une e-valeur de 7e-150 alors qu'avec Nr, les Cyanobacteria ont comme plus grande e-valeur 4E-109. 

Je suis perdue, je ne sais pas quel tableau utilisé puisque les classifications taxonomiques changent.

Devrais-je prendre le tableau de blastp contre refseq et dans ce cas je change mon groupe d'étude (Bacteria:Cyanobacteria) et mon groupe extérieur  (Bacteria:Proteobacteria)

ou dois-je garder mon ancien tableau ?

 

Merci cordialement

 

 

Meglecz20CTES
14 Apr 2021 19:06
Maître de jeu

Bonjour Sarah,


Vous avez fait une erreur quelque part. J’ai refait le BLAST contre refseq_protein et j’ai 5000 eu hits.

 

Bon courage,
Emese Meglecz

 

Ampen-sarah
15 Apr 2021 14:42
Contribution non évaluée

Bonjour,

 

J'ai refais le test, en effet j'ai dû faire une erreur.Par contre, j'ai une petite question, puis-je prendre les résultats avec refseq_protein ou dois-je absolument garder mes résultats avec Nr. J'ai trouvé ces résultats:

 

Classification nb lines nb hits min E-value max E-value
Bacteria:Cyanobacteria:Nostocales:Calotrichaceae 10 13 7e-150 1e-99
Bacteria:Cyanobacteria:Nostocales:Hapalosiphonaceae 19 31 8e-115 6e-108
Bacteria:Cyanobacteria:Nostocales:Fortieaceae 4 6 6e-113 2e-104
Bacteria:Cyanobacteria:Nostocales:Nostocaceae 69 106 2e-112 7e-57
Bacteria:Cyanobacteria:Nostocales:Aphanizomenonaceae 26 40 3e-111 2e-58
Bacteria:Cyanobacteria:Nostocales:Chlorogloeopsidaceae 1 1 6e-111 6e-111
Bacteria:Cyanobacteria:Nostocales:Scytonemataceae 7 14 4e-109 7e-104
Bacteria:Cyanobacteria:Nostocales:Tolypothrichaceae 5 7 6e-109 5e-104
Bacteria:Cyanobacteria:Nostocales:Symphyonemataceae 1 1 1e-105 1e-105
Bacteria:Cyanobacteria:Synechococcales:Leptolyngbyaceae 15 26 5e-118 6e-58
Bacteria:Cyanobacteria:Synechococcales:Oculatellaceae 2 4 9e-115 3e-109
Bacteria:Cyanobacteria:Synechococcales:Chamaesiphonaceae 2 2 2e-114 9e-113
Bacteria:Cyanobacteria:Synechococcales:Trichocoleusaceae 3 6 8e-106 3e-104
Bacteria:Cyanobacteria:Synechococcales:Merismopediaceae 1 1 8e-97 8e-97
Bacteria:Cyanobacteria:Synechococcales:Prochlorotrichaceae 7 11 1e-61 8e-57
Bacteria:Cyanobacteria:Chroococcales:Aphanothecaceae 1 1 1e-114 1e-114
Bacteria:Cyanobacteria:Oscillatoriales:Oscillatoriaceae 3 5 1e-110 1e-57
Bacteria:Cyanobacteria:Oscillatoriales:Microcoleaceae 2 3 1e-62 7e-60
Bacteria:Cyanobacteria:Pleurocapsales:Hydrococcaceae 1 1 2e-110 2e-110
Bacteria:Cyanobacteria:Pleurocapsales:Hyellaceae 2 2 5e-110 1e-109
Bacteria:Cyanobacteria:Pleurocapsales:Dermocarpellaceae 2 3 8e-105 8e-104
Bacteria:Cyanobacteria:Pleurocapsales:Xenococcaceae 1 1 1e-103 1e-103
Bacteria:Cyanobacteria 1 2 6e-108 6e-108
Bacteria:Cyanobacteria:Gloeobacteria:Gloeobacterales 2 2 2e-62 3e-59
Bacteria:Proteobacteria:Gammaproteobacteria:Chromatiales 2 4 3e-147 5e-78
Bacteria:Proteobacteria:Gammaproteobacteria:Pseudomonadales 61 170 2e-114 4e-57
Bacteria:Proteobacteria:Gammaproteobacteria:Methylococcales 10 15 1e-113 2e-96
Bacteria:Proteobacteria:Gammaproteobacteria:Alteromonadales 224 528 6e-101 5e-61
Bacteria:Proteobacteria:Gammaproteobacteria:Vibrionales 365 1753 2e-100 6e-57
Bacteria:Proteobacteria:Gammaproteobacteria 4 5 1e-98 4e-84
Bacteria:Proteobacteria:Gammaproteobacteria:Enterobacterales 51 305 4e-92 1e-80
Bacteria:Proteobacteria:Gammaproteobacteria:Thiotrichales 8 41 1e-90 1e-75
Bacteria:Proteobacteria:Gammaproteobacteria:Aeromonadales 20 101 3e-89 7e-74
Bacteria:Proteobacteria:Gammaproteobacteria:Oceanospirillales 10 13 4e-87 4e-59
Bacteria:Proteobacteria:Gammaproteobacteria:Nevskiales 1 1 1e-71 1e-71
Bacteria:Proteobacteria:Gammaproteobacteria:Xanthomonadales 1 1 3e-65 3e-65
Bacteria:Proteobacteria:Alphaproteobacteria:Hyphomicrobiales 554 1590 1e-138 1e-57
Bacteria:Proteobacteria:Alphaproteobacteria:Rhodospirillales 32 64 2e-125 2e-58
Bacteria:Proteobacteria:Betaproteobacteria:Burkholderiales 9 18 4e-121 2e-59
Bacteria:Proteobacteria:Alphaproteobacteria:Sphingomonadales 28 42 3e-120 9e-57
Bacteria:Proteobacteria:Alphaproteobacteria:Kordiimonadales 1 1 5e-120 5e-120
Bacteria:Proteobacteria:Alphaproteobacteria:Rhodobacterales 25 42 4e-117 6e-57
Bacteria:Proteobacteria:Alphaproteobacteria:Kiloniellales 3 6 1e-109 1e-108
Bacteria:Proteobacteria:Alphaproteobacteria:Caulobacterales 1 1 1e-64 1e-64
Bacteria:Proteobacteria:Alphaproteobacteria:Rickettsiales 1 2 5e-64 5e-64
Bacteria:Proteobacteria:Deltaproteobacteria:Desulfovibrionales 1 2 4e-63 4e-63
Bacteria:Proteobacteria:Betaproteobacteria:Neisseriales 3 6 1e-62 2e-61
Bacteria:Proteobacteria:Deltaproteobacteria:Myxococcales 1 3 5e-58 5e-58
Bacteria:Planctomycetes:Planctomycetia:Pirellulales 9 19 3e-143 1e-74
Bacteria:Planctomycetes:Planctomycetia:Planctomycetales 6 10 4e-104 8e-96
Bacteria:Planctomycetes:Planctomycetia:Gemmatales 1 1 3e-91 3e-91
Bacteria:Planctomycetes:Planctomycetia:Isosphaerales 3 5 1e-79 2e-74
Bacteria:Chloroflexi:Anaerolineae:Anaerolineales 7 17 8e-137 7e-118
Bacteria:Chloroflexi:Anaerolineae:Aggregatilineales 1 1 8e-108 8e-108
Bacteria:Chloroflexi:Ktedonobacteria:Ktedonobacterales 9 16 4e-130 7e-74
Bacteria:Chloroflexi:Chloroflexia:Kallotenuales 1 1 3e-123 3e-123
Bacteria:Chloroflexi:Caldilineae:Caldilineales 2 4 4e-120 4e-108
Bacteria:Chloroflexi:Ktedonobacteria:Thermogemmatisporales 4 6 3e-118 1e-117
Bacteria:Chloroflexi:Thermoflexia:Thermoflexales 1 1 2e-115 2e-115
Bacteria:Chloroflexi:Chloroflexia:Chloroflexales 12 16 8e-113 5e-102
Bacteria:Chloroflexi:Chloroflexia:Herpetosiphonales 3 5 6e-111 2e-109
Bacteria:Chloroflexi:Ardenticatenia:Ardenticatenales 1 2 1e-110 1e-110
Bacteria:Chloroflexi 1 1 4e-103 4e-103
Bacteria:Acidobacteria:Acidobacteriia:Acidobacteriales 4 5 2e-105 6e-71
Bacteria:Acidobacteria:Vicinamibacteria:Vicinamibacteraceae 1 1 8e-70 8e-70
Bacteria:Gemmatimonadetes:Longimicrobia:Longimicrobiales 1 4 1e-103 1e-103
Bacteria:Gemmatimonadetes:Gemmatimonadetes:Gemmatimonadales 4 8 7e-77 2e-73
Bacteria:Firmicutes:Clostridia:Clostridiales 5 9 2e-83 3e-60
Bacteria:Firmicutes:Clostridia:Natranaerobiales 1 2 1e-81 1e-81
Bacteria:Firmicutes:Bacilli:Bacillales 101 208 3e-87 6e-57
Bacteria:Firmicutes:Bacilli:Lactobacillales 8 27 3e-76 1e-68
Bacteria:Bacteroidetes:Cytophagia:Cytophagales 33 58 5e-85 4e-68
Bacteria:Bacteroidetes:Saprospiria:Saprospirales 1 1 3e-82 3e-82
Bacteria:Bacteroidetes:Sphingobacteriia:Sphingobacteriales 1 2 3e-79 3e-79
Bacteria:Bacteroidetes:Flavobacteriia:Flavobacteriales 26 49 3e-78 3e-57
Bacteria:Armatimonadetes:Armatimonadia:Armatimonadales 1 2 4e-84 4e-84
Bacteria:Actinobacteria:Actinobacteria:Pseudonocardiales 147 271 2e-83 6e-57
Bacteria:Actinobacteria:Rubrobacteria:Rubrobacterales 2 5 2e-82 4e-66
Bacteria:Actinobacteria:Actinobacteria:Streptomycetales 436 894 2e-78 7e-57
Bacteria:Actinobacteria:Actinobacteria:Geodermatophilales 57 174 1e-75 3e-57
Bacteria:Actinobacteria:Actinobacteria:Micrococcales 128 225 2e-75 7e-57
Bacteria:Actinobacteria:Actinobacteria:Corynebacteriales 17 29 1e-74 6e-57
Bacteria:Actinobacteria:Actinobacteria:Streptosporangiales 76 146 3e-73 2e-58
Bacteria:Actinobacteria:Rubrobacteria:Gaiellales 1 2 4e-72 4e-72
Bacteria:Actinobacteria:Actinobacteria:Kineosporiales 1 2 1e-71 1e-71
Bacteria:Actinobacteria:Actinobacteria:Propionibacteriales 78 138 1e-71 5e-57
Bacteria:Actinobacteria:Nitriliruptoria:Egicoccales 1 3 6e-71 6e-71
Bacteria:Actinobacteria:Actinobacteria 1 2 3e-69 3e-69
Bacteria:Actinobacteria:Actinobacteria:Micromonosporales 127 292 4e-67 9e-57
Bacteria:Actinobacteria:Actinobacteria:Catenulisporales 2 3 2e-64 2e-61
Bacteria:Actinobacteria:Actinobacteria:Motilibacterales 1 2 2e-64 2e-64
Bacteria:Actinobacteria:Actinobacteria:Frankiales 4 7 2e-63 3e-58
Bacteria:Actinobacteria:Nitriliruptoria:Euzebyales 1 1 1e-63 1e-63
Bacteria:Actinobacteria:Actinobacteria:Nakamurellales 3 5 3e-61 2e-57
Bacteria:Actinobacteria:Thermoleophilia:Solirubrobacterales 2 3 1e-60 4e-60
Bacteria:Actinobacteria:Acidimicrobiia:Acidimicrobiales 1 1 1e-57 1e-57
Bacteria:Synergistetes:Synergistia:Synergistales 4 7 5e-83 8e-75
Bacteria: 1 2 7e-59 7e-59
Eukaryota::Cryptophyceae:Pyrenomonadales 1 2 7e-73 7e-73

 

 

Mon groupe d'étude et mon groupe extérieur changent par rapport à ces résultats.

 

Merci cordialement

 

Meglecz20CTES
15 Apr 2021 18:23
Maître de jeu

Bonjour Sarah,


Vous pouvez utiliser les résultats de RefSeq. C’est votre choix.


Bon travail,
Emese Meglecz