|
Alignement multiple erreur |
NAOMIE 11 Apr 2021 17:15 Non evaluated contribution |
Bonjour,
J'ai transformé mes séquences en format FASTA, ajouté la séquence de l'ORF étudié, et l'alignement multiple ne se fait pas, un message d'erreur m'est constamment renvoyé. Je ne comprends pas pourquoi.
Cordialement
|
AnaisE 12 Apr 2021 11:08 Non evaluated contribution |
Possible que ce soit dû au fait que tes séquences sont un peu trop longues ("Error: MUSCLE input: sequences too long (in average)"). Je vois que ton ORF, par contre, est partiel, donc gBlock va sans doute de toute façon couper les autres séquences. Peut-être que tu peux essayer de les tronquer toi-même à 2000 AA (vu que c'est le max) et refaire l'alignement avec ça, en faisant en sorte que les bouts restants soient bien ceux qui s'alignent à ton ORF. Mais attend de voir ce que la prof te recommande.
Bonne chance !
(P.S: attention car tu as des E-valeurs de 0 hors de ton groupe d'étude)
|
Meglecz20CTES 12 Apr 2021 17:55 Game master |
Bonjour Naomi et Anaïs,
Anaïs avait de très bonnes remarques.
Vous pouvez aussi réduire le nombre des séquences.
Bon courage,
Emese Meglecz
|
NAOMIE 12 Apr 2021 18:31 Non evaluated contribution |
Bonjour,
merci beaucoup pour vos réponses !
|
Belmont 19 Apr 2021 22:01 Non evaluated contribution |
Bonjour,
Lors du choix des sequences je prends pour choix d'étude les Bacteria Proteobacteria gammaprotobacteria, et celle inscrit en gras avec la meilleur e value dont celle ci
. . .Gammaproteobacteria bacterium TMED183........ 300 1e-94 1 hit Bacteria:Proteobacteria:Gammaproteobacteria: sulfoacetaldehyde dehydrogenase [SAR116 cluster bac...
qui devient une fois le format fasta pret comme ceci ci :
>BPAS1 [Bacteria Proteobacteria Alphaproteobacteria SAR116 cluster ] E-value=1e-94 Bacteria;Proteobacteria;Alphaproteobacteria;SAR116 cluster; MAI00912.1 sulfoacetaldehyde dehydrogenase [SAR116 cluster bacterium]
MPADPRSDEMETRLVDDLVARARKAQKAYEHGATQDRYDKSALAAAWALMEPGRNQELAGMAVETTGLGNVADKIRKNHR
KTLGVLRDIKNSRTHGVISDDPATGITEIARPVGVVGAVVPSTNPVATPTNNVVNALKCGNAIILSPSPAGVTVCEKLLG
YMHAEFDKIGLDHDLVQMIPAPVSKVKAQRLMESVDILVVTGSQNNVHRAYSSGTPAIGVGAGNVTVIVDETADLADAAG
KITXSKTFDNATSCSSENVIIVVDEIRDAFLGELHAAGARLLDAPNSARLKQALFQPGGLNRNMIARDVDRVIEVAGVDI
PDPGNARFLLIEGEGIGSDHPESGEKLSLVATLYRASDFDDAKRIAAAVLSHQGAGHSVGIHTAIDARALVLGEEIPACR
VIVNQAHCFATGGSFDNGMPFSLSMGCGTWGGNSIDDNFNHXHLLNITKVVRTIPSNEPSLEEIFGGYWKQAGK
Ci je ne la selectionne pas ceci n'a aucune incidence sur mon alignement, j'ai le même nombre de positions, avec les même positions conserve et apres Gblocks le meme nombre de position également
|
Belmont 19 Apr 2021 22:09 Non evaluated contribution |
Bonjour,
Lors du choix des sequences je prends pour choix d'étude les Bacteria Proteobacteria gammaprotobacteria, et celle inscrit en gras avec la meilleur e value dont celle ci
. . .Gammaproteobacteria bacterium TMED183........ 300 1e-94 1 hit Bacteria:Proteobacteria:Gammaproteobacteria: sulfoacetaldehyde dehydrogenase [SAR116 cluster bac...
qui devient une fois le format fasta pret comme ceci ci :
>BPAS1 [Bacteria Proteobacteria Alphaproteobacteria SAR116 cluster ] E-value=1e-94 Bacteria;Proteobacteria;Alphaproteobacteria;SAR116 cluster; MAI00912.1 sulfoacetaldehyde dehydrogenase [SAR116 cluster bacterium]
MPADPRSDEMETRLVDDLVARARKAQKAYEHGATQDRYDKSALAAAWALMEPGRNQELAGMAVETTGLGNVADKIRKNHR
KTLGVLRDIKNSRTHGVISDDPATGITEIARPVGVVGAVVPSTNPVATPTNNVVNALKCGNAIILSPSPAGVTVCEKLLG
YMHAEFDKIGLDHDLVQMIPAPVSKVKAQRLMESVDILVVTGSQNNVHRAYSSGTPAIGVGAGNVTVIVDETADLADAAG
KITXSKTFDNATSCSSENVIIVVDEIRDAFLGELHAAGARLLDAPNSARLKQALFQPGGLNRNMIARDVDRVIEVAGVDI
PDPGNARFLLIEGEGIGSDHPESGEKLSLVATLYRASDFDDAKRIAAAVLSHQGAGHSVGIHTAIDARALVLGEEIPACR
VIVNQAHCFATGGSFDNGMPFSLSMGCGTWGGNSIDDNFNHXHLLNITKVVRTIPSNEPSLEEIFGGYWKQAGK
Ci je ne la selectionne pas ceci n'a aucune incidence sur mon alignement, j'ai le même nombre de positions, avec les même positions conserve et apres Gblocks le meme nombre de position également
|