Forum "Alignement multiple: CLUSTALW"

Thread subject: Choix de groupe d'étude

[ Return to forums ]
Choix de groupe d'étude
AMIRA
3 Mar 2023 22:27
Non evaluated contribution

Bonjour 

 

J'ai du mal a choisir mon groupe d'etude ,les homologues appartenant au meme groupe taxonomique sont pas alignés.est ce que ce possible de choisir bacteria proteobacteria et ces classes alpha,gamma,delta).cmt choisir mon groupe d'etude ?est ce que je peux continuer sur cette séquence ou dois je l'abandonner?j'ai pas de chance sur la recherche des sequences .je n'ai pas de doute quant à la fonction de la protéine nombre de hits (5000) obtenus par le Blastp.j'ai testé cet ORF rapide sans rediger nos analyses.

 

merci

 

Taxonomy synthesis table

Classification nb lines nb hits min E-value max E-value max Score min Score
LUCA:Bacteria:Kiritimatiellaeota:Kiritimatiellae 2 4 7e-154 8e-149 469 456
LUCA:Bacteria:Chlamydiae:Chlamydiia 39 117 2e-153 3e-88 468 296
LUCA:Bacteria:Lentisphaerae:Lentisphaeria 1 1 2e-144 2e-144 445 445
LUCA:Bacteria:Spirochaetes:Spirochaetia 84 289 1e-141 1e-91 439 306
LUCA:Bacteria:Proteobacteria:Oligoflexia 14 36 3e-136 2e-107 424 348
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria 27 55 8e-121 2e-91 384 305
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria 78 139 1e-102 3e-85 336 290
LUCA:Bacteria:Proteobacteria:Deltaproteobacteria 6 8 8e-102 1e-88 333 298
LUCA:Bacteria:Fibrobacteres:Fibrobacteria 17 36 4e-135 2e-129 421 406
LUCA:Bacteria:Fibrobacteres:Chitinivibrionia 1 1 4e-122 4e-122 388 388
LUCA:Bacteria:Candidatus Absconditabacteria:Candidatus Absconditabacterales 1 2 1e-110 1e-110 357 357
LUCA:Bacteria:Calditrichaeota:Calditrichae 2 4 2e-106 2e-106 346 346
LUCA:Bacteria:Ignavibacteriae:Ignavibacteria 1 1 3e-105 3e-105 342 342
LUCA:Bacteria:Candidatus Kryptonia:Candidatus Kryptobacter 1 2 2e-101 2e-101 332 332
LUCA:Bacteria:Candidatus Kryptonia:Candidatus Thermokryptus 1 2 2e-100 2e-100 330 330
LUCA:Bacteria:Candidatus Kryptonia:Candidatus Kryptonium 1 8 5e-99 5e-99 326 326
LUCA:Bacteria:Balneolaeota:Balneolia 9 16 2e-101 1e-93 332 311
LUCA:Bacteria:Bacillota:Clostridia 493 1556 2e-101 3e-85 332 289
LUCA:Bacteria:Bacillota:Negativicutes 41 80 1e-95 1e-86 317 293
LUCA:Bacteria:Bacillota:Capillibacterium 1 1 6e-92 6e-92 307 307
LUCA:Bacteria:Bacillota:Tissierellia 23 59 3e-91 9e-86 305 290
LUCA:Bacteria:Bacillota:Bacilli 20 55 4e-90 3e-85 301 289
LUCA:Bacteria:Chloroflexi:Chloroflexia 8 10 2e-100 4e-94 330 313
LUCA:Bacteria:Chloroflexi:Anaerolineae 5 10 4e-97 6e-93 321 310
LUCA:Bacteria:Chloroflexi:Ardenticatenia 1 3 9e-96 9e-96 317 317
LUCA:Bacteria:Chloroflexi:Dehalococcoidia 6 21 2e-93 3e-91 310 305
LUCA:Bacteria:Chloroflexi:Thermoflexia 1 2 1e-90 1e-90 304 304
LUCA:Bacteria:Chloroflexi:Caldilineae 2 3 1e-89 8e-88 301 296
LUCA:Bacteria:Actinobacteria:Actinobacteria 1138 3157 7e-100 3e-85 328 289
LUCA:Bacteria:Actinobacteria:Acidimicrobiia 3 6 6e-97 1e-93 320 311
LUCA:Bacteria:Actinobacteria:Rubrobacteria 2 3 7e-95 5e-93 315 310
LUCA:Bacteria:Actinobacteria:Nitriliruptoria 1 1 1e-89 1e-89 301 301
LUCA:Bacteria:Actinobacteria:Thermoleophilia 2 3 6e-88 1e-85 296 290
LUCA:Bacteria:Candidatus Saccharibacteria:Candidatus Nanosyncoccalia 2 4 3e-98 3e-92 322 307
LUCA:Bacteria:Candidatus Saccharibacteria:Candidatus Saccharimonadia 2 4 3e-95 4e-93 319 308
LUCA:Bacteria:Rhodothermaeota:Rhodothermia 6 11 2e-96 4e-86 320 292
LUCA:Bacteria:Chlorobi:Chlorobia 14 31 2e-96 3e-90 320 303
LUCA:Bacteria:Bacteroidetes:Rhodothermaceae 9 51 1e-95 2e-92 317 308
LUCA:Bacteria:Bacteroidetes:Saprospiria 9 16 6e-94 2e-88 313 298
LUCA:Bacteria:Bacteroidetes:Cytophagia 63 104 7e-93 3e-85 310 290
LUCA:Bacteria:Bacteroidetes:Flavobacteriia 281 657 2e-92 3e-85 310 290
LUCA:Bacteria:Bacteroidetes:Sphingobacteriia 33 60 3e-91 2e-85 306 291
LUCA:Bacteria:Bacteroidetes:Bacteroidia 48 134 8e-91 3e-85 305 290
LUCA:Bacteria:Bacteroidetes:Chitinophagia 6 11 1e-90 3e-85 305 290
LUCA:Bacteria:Bacteroidetes:Candidatus Sulfidibacteriales 1 2 4e-86 4e-86 292 292
LUCA:Bacteria:Dictyoglomi:Dictyoglomia 1 3 5e-95 5e-95 314 314
LUCA:Bacteria:Deinococcota:Deinococci 9 15 3e-92 1e-85 308 290
LUCA:Bacteria:Thermotogae:Thermotogae 5 8 3e-92 8e-91 308 304
LUCA:Bacteria:Candidatus Cloacimonetes:Candidatus Syntrophosphaera 1 2 1e-91 1e-91 306 306
LUCA:Bacteria:bacterium TM473 1 1 5e-90 5e-90 302 302
LUCA:Bacteria:Cyanobacteria:Cyanophyceae 5 6 3e-87 3e-85 295 290
LUCA:Bacteria:Cyanobacteria:Adonisia 1 1 4e-87 4e-87 286 286
LUCA:Bacteria:Planctomycetes:Planctomycetia 2 3 1e-86 1e-86 294 293
LUCA:Bacteria:Fusobacteria:Fusobacteriia 2 4 1e-86 6e-86 293 291
LUCA:Eukaryota:Amoebozoa:Evosea 5 10 2e-113 4e-92 364 308
LUCA:Eukaryota:Amoebozoa:Discosea 1 2 9e-107 9e-107 342 342
LUCA:Eukaryota:Metazoa:Chordata 230 447 4e-109 2e-86 357 294
LUCA:Eukaryota:Metazoa:Spiralia 16 37 3e-108 1e-93 354 313
LUCA:Eukaryota:Metazoa:Ecdysozoa 91 129 2e-106 7e-86 350 293
LUCA:Eukaryota:Fungi:Dikarya 24 52 5e-102 5e-87 341 297
LUCA:Eukaryota:Viridiplantae:Streptophyta 61 119 1e-100 2e-89 333 302
LUCA:Eukaryota:Metazoa:Cnidaria 2 2 3e-100 1e-98 332 327
LUCA:Eukaryota:Sar:Stramenopiles 2 4 6e-100 7e-87 330 295
LUCA:Eukaryota:Fungi:Fungi incertae sedis 1 2 4e-93 4e-93 312 312
LUCA:Eukaryota:Sar:Alveolata 4 8 3e-93 5e-88 311 298
LUCA:Eukaryota:Haptista:Haptophyta 1 2 2e-92 2e-92 310 310
LUCA:Eukaryota:Choanoflagellata:Craspedida 1 2 2e-85 2e-85 291 291
LUCA:other sequences:artificial sequences 1 2 1e-102 1e-102 339 339
LUCA:Archaea:Euryarchaeota:Stenosarchaea group 1 2 1e-91 1e-91 305 305
Meglecz23CTES
5 Mar 2023 11:25
Game master

Bonjour,


C’est un cas difficile. En effet les meilleurs E-valeurs de plusieurs phyla bactériennes sont assez proches ce qui ne vous permettre pas à délimiter un groupe d’étude facilement.
Il y a trois solutions (chacune est peu satisfaisante) :

 

1. Si vous faites une recherche dans NCBI taxonomy (https://www.ncbi.nlm.nih.gov/Taxonomy), vous pouvez trouver que les premiers phyla dans le tableau font partie de PVC group (superphylum). Regardez si ce superphylum peut être le groupe d’étude. Comme le différentiel des meilleurs E-valeurs reste quand même faible, ce n’est probablement pais la meilleure solution, mais vous pouvez la tenter quand même.

 

2. Vous pouvez tenter élargir le groupe d’étude aux bactéries. Ceci peut être compliqué, car vous devez aligner des séquences phylogénétiquement éloignées, mais vous pouvez tenter.

 

3. Vous pouvez abandonner cette séquence. Évidemment c’est frustrant :(

 

 

Bon courage,
Emese Meglecz

noapardo
31 Mar 2023 2:36
Non evaluated contribution

 

Bonjour,

 

Au vue de mes résultats, est ce judicieux de choisir comme groupe d'étude les Blastocatellia, en supposant que la première ligne est inclue en fait dans la classe Blastocatellia puisque le e-val min est très proche (e-93 et e-96) ?

 

En vous remerciant par avance pour votre aide,

Bien cordialement,

 

 

 

Classification nb lines nb hits min E-value max E-value max Score min Score
LUCA:Bacteria:Acidobacteria 2 111 3,00E-96 2,00E-72 295 235
LUCA:Bacteria:Acidobacteria:Blastocatellia 4 19 9,00E-93 2,00E-77 286 247
LUCA:Bacteria:Acidobacteria:Acidobacteriia 27 97 8,00E-91 4,00E-68 281 224
LUCA:Bacteria:Acidobacteria:Vicinamibacteria 1 1 3,00E-81 3,00E-81 257 257
LUCA:Bacteria:Proteobacteria 2 31 1,00E-90 2,00E-62 281 208
LUCA:Bacteria:Proteobacteria:Gammaproteobacteria 73 150 3,00E-88 4,00E-57 275 195
LUCA:Bacteria:Proteobacteria:Alphaproteobacteria 1521 5161 1,00E-87 1,00E-56 273 194
LUCA:Bacteria:Proteobacteria:Betaproteobacteria 186 479 5,00E-84 1,00E-57 264 196
LUCA:Bacteria:Proteobacteria:Candidatus Lambdaproteobacteria 1 2 2,00E-78 2,00E-78 249 249
LUCA:Bacteria:Deinococcota:Deinococci 7 12 3,00E-90 1,00E-56 280 194
LUCA:Bacteria:Planctomycetes:Planctomycetia 43 187 9,00E-90 2,00E-68 278 224
LUCA:Bacteria:Planctomycetes 1 26 1,00E-86 1,00E-86 271 271
LUCA:Bacteria:Planctomycetes:Phycisphaerae 4 8 1,00E-79 3,00E-78 252 249
LUCA:Bacteria:Planctomycetes:Planctomycetes bacterium Pan216 1 1 4,00E-73 4,00E-73 236 236
LUCA:Bacteria:Chloroflexi:Anaerolineae 5 37 1,00E-87 5,00E-60 273 202
LUCA:Bacteria:Chloroflexi 4 50 4,00E-87 4,00E-69 272 226
LUCA:Bacteria:Chloroflexi:Caldilineae 2 4 5,00E-82 2,00E-80 259 255
LUCA:Bacteria:Chloroflexi:Chloroflexia 5 6 6,00E-81 2,00E-76 256 244
LUCA:Bacteria:Chloroflexi:Ktedonobacteria 1 1 3,00E-78 3,00E-78 249 249
LUCA:Bacteria:Chloroflexi:Dehalococcoidia 1 1 2,00E-77 2,00E-77 247 247
LUCA:Bacteria:Chloroflexi:Thermoflexia 1 1 3,00E-73 3,00E-73 236 236
LUCA:Bacteria:Spirochaetes:Spirochaetia 24 94 3,00E-87 1,00E-56 272 194
LUCA:Bacteria:Spirochaetes 5 15 8,00E-80 4,00E-60 253 203
LUCA:Bacteria:candidate division KSB1 1 17 5,00E-87 5,00E-87 271 271
LUCA:Bacteria:Deferribacteres:Deferribacteres 1 2 8,00E-87 8,00E-87 271 271
LUCA:Bacteria:Candidatus Vecturithrix 1 1 1,00E-85 1,00E-85 268 268
LUCA:Bacteria:Bacteroidetes:Cytophagia 33 53 3,00E-85 1,00E-58 267 199
LUCA:Bacteria:Bacteroidetes 1 17 2,00E-84 2,00E-84 265 265
LUCA:Bacteria:Bacteroidetes:Chitinophagia 16 36 1,00E-83 2,00E-65 263 217
LUCA:Bacteria:Bacteroidetes:Saprospiria 2 12 3,00E-82 7,00E-64 259 212
LUCA:Bacteria:Bacteroidetes:Sphingobacteriia 23 38 4,00E-82 1,00E-66 259 219
LUCA:Bacteria:Bacteroidetes:Bacteroidia 30 72 1,00E-80 2,00E-57 255 196
LUCA:Bacteria:Bacteroidetes:Flavobacteriia 37 68 7,00E-80 2,00E-57 253 196
LUCA:Bacteria:Bacteroidetes:Rhodothermaceae 2 17 2,00E-78 2,00E-65 249 216
LUCA:Bacteria:Bacteroidetes:Bacteroidetes Order II. Incertae sedis 1 1 4,00E-65 4,00E-65 216 216
LUCA:Bacteria:Atribacterota: TPA 1 9 8,00E-85 8,00E-85 266 266
LUCA:Bacteria:Atribacterota 2 2 7,00E-78 7,00E-67 246 215
LUCA:Bacteria 4 31 9,00E-85 6,00E-60 266 202
LUCA:Bacteria:Thermodesulfobacteria:Desulfobacteria 3 4 2,00E-84 2,00E-73 265 237
LUCA:Bacteria:Thermodesulfobacteria:Desulfobulbia 7 14 5,00E-82 8,00E-70 259 228
LUCA:Bacteria:Thermodesulfobacteria:Desulfovibrionia 19 33 8,00E-80 5,00E-64 253 213
LUCA:Bacteria:Balneolaeota:Balneolia 23 53 3,00E-84 1,00E-63 264 212
LUCA:Bacteria:Actinobacteria:Actinobacteria 9 29 4,00E-84 3,00E-69 264 226
LUCA:Bacteria:Actinobacteria:Actinobacteria bacterium 1 2 7,00E-76 7,00E-76 241 241
LUCA:Bacteria:Actinobacteria:Acidimicrobiia 3 25 6,00E-77 3,00E-71 246 231
LUCA:Bacteria:Actinobacteria:Nitriliruptoria 4 6 2,00E-74 2,00E-60 239 203
LUCA:Bacteria:Deltaproteobacteria 2 36 4,00E-84 6,00E-81 264 256
LUCA:Bacteria:Deltaproteobacteria:SAR324 cluster 1 13 9,00E-84 9,00E-84 263 263
LUCA:Bacteria:Verrucomicrobia 1 24 9,00E-84 9,00E-84 263 263
LUCA:Bacteria:Verrucomicrobia:Opitutae 5 7 7,00E-82 7,00E-68 258 223
LUCA:Bacteria:Verrucomicrobia:Verrucomicrobiae 3 5 2,00E-77 4,00E-72 245 233
LUCA:Bacteria:Verrucomicrobia:Spartobacteria 1 2 4,00E-70 4,00E-70 229 229
LUCA:Bacteria:bacterium M00.F.Ca.ET.230.01.1.1 1 1 2,00E-80 2,00E-80 255 255
LUCA:Bacteria:Calditrichaeota 1 5 6,00E-80 6,00E-80 253 253
LUCA:Bacteria:Calditrichaeota:Calditrichae 1 1 2,00E-59 2,00E-59 201 201
LUCA:Bacteria:Ignavibacteriae:Ignavibacteria 2 5 7,00E-80 6,00E-68 253 223
LUCA:Bacteria:Ignavibacteriae 1 5 1,00E-70 1,00E-70 229 229
LUCA:Bacteria:Myxococcota:Polyangia 5 23 1,00E-79 3,00E-77 253 247
LUCA:Bacteria:Myxococcota:Myxococcia 1 2 2,00E-75 2,00E-75 242 242
LUCA:Bacteria:candidate division KSB3 1 3 1,00E-79 1,00E-79 253 253
LUCA:Bacteria:Candidatus Marinimicrobia 1 6 3,00E-79 3,00E-79 251 251
LUCA:Bacteria:Gemmatimonadetes: TPA 1 6 4,00E-79 4,00E-79 251 251
LUCA:Bacteria:Gemmatimonadetes:Gemmatimonadetes bacterium T265 1 1 4,00E-75 4,00E-75 241 241
LUCA:Bacteria:Gemmatimonadetes:Gemmatimonadetes 4 5 5,00E-75 9,00E-67 241 220
LUCA:Bacteria:bacterium M00.F.Ca.ET.141.01.1.1 1 1 1,00E-77 1,00E-77 247 247
LUCA:Bacteria:Candidatus Latescibacteria 1 1 8,00E-76 8,00E-76 243 243
LUCA:Bacteria:bacterium M00.F.Ca.ET.194.01.1.1 1 2 5,00E-74 5,00E-74 239 239
LUCA:Bacteria:Rhodothermaeota:Rhodothermia 1 1 1,00E-73 1,00E-73 238 238
LUCA:Bacteria:Chlorobi 2 3 7,00E-72 1,00E-71 233 232
LUCA:Bacteria:Bacillota:Bacilli 392 927 9,00E-70 1,00E-56 228 194
LUCA:Bacteria:Bacillota:Clostridia 9 15 4,00E-69 1,00E-58 226 199
LUCA:Bacteria:Bacillota 4 6 5,00E-66 9,00E-62 218 207
LUCA:Bacteria:Bacillota:Hydrogenispora 1 2 1,00E-59 1,00E-59 201 201
LUCA:Bacteria:Thermotogae:Thermotogae 3 3 2,00E-63 5,00E-60 211 202
LUCA:Bacteria:Candidatus Aminicenantes 1 3 2,00E-61 2,00E-61 206 206
LUCA:Bacteria:Candidatus Aminicenantes:Candidatus Saccharicenans 2 7 1,00E-59 2,00E-59 201 201
LUCA:Bacteria:Candidatus Melainabacteria:Candidatus Obscuribacterales 1 2 2,00E-59 2,00E-59 201 201
LUCA:Bacteria:Chlamydiae:Chlamydiia 1 1 2,00E-58 2,00E-58 199 199
LUCA:Bacteria:Thermomicrobiota:Thermomicrobia 1 1 3,00E-57 3,00E-57 194 194
LUCA:Eukaryota:Metazoa:Ecdysozoa 1 7 4,00E-84 4,00E-84 264 264
LUCA:Eukaryota:Sar:Alveolata 1 1 9,00E-67 9,00E-67 234 234
LUCA:Eukaryota:Viridiplantae:Streptophyta 1 1 3,00E-65 3,00E-65 216 216
LUCA:Eukaryota:Fungi:Dikarya 1 1 2,00E-59 2,00E-59 201 201
Meglecz23CTES
31 Mar 2023 17:57
Game master

Bonjour,


On n’a aucune indication que les séquences de première lige soient des Blastocatellia, donc votre choix ne me semble pas justifié. De plus. Même si on était sûrs que ces séquences soient le Blastocatellia, le différentiel de l’ordre de grandeur entre 3,00E-96 et 8,00E-91 n’est que 5. C’est assez faible.


Je vous conseille d’élargir le groupe d’étude.


Bon travail,
Emese Meglecz