Forum "Analyse phylogénétique"

Sujet de discussion: arbre phylogenetique

[ Retour aux forums ]
arbre phylogenetique
samiahafsoi
17 Feb 2011 16:02
Contribution: Incompréhensible
Bonjour,
en fait on voulait faire l'arbre phylogénétique, et on a sélectioné les séquences ci dessous dans cluster W
et s'est marqué erreur, du coup on est bloqué et on arrive pas àvoir l'erreur.
voici ce qu'on a collé.

>ORF LFRFYHFYMKNTPKLISYTIVDFPSETHMELGTRFFEEKASEFFNKAEKKGLLRWRMNRVWNKQGSFTLSQVYEYKDEKAFKNCQIIVDEFYDKYKKDFSLINAKIVSSRAITLLDYISEDY
>gi|126031525|pdb|2OD6|A Chain A, Crystal Structure Of A Dimeric Ferredoxin-Like Protein (Jcvi_pep_1096682647733) From An Environmental Metagenome (Unidentified Marine Microbe), Sorcerer Ii Global Ocean Sampling Experiment At 1.85 A Resolution
GXAEPKFTSFTTADFINDVDXELFIDAVEKTAPVWVKEXKSRGLLKFSXNRVWNKGEVFRVVXTYEYKDR
ASFEANIAYLEDTFGKNPVFLQLVTTAKFTTSRCLVVXEV
>gi|114770226|ref|ZP_01447764.1| hypothetical protein OM2255_11335 [alpha proteobacterium HTCC2255]
MSDTIISFTTIEYPNQEIMDKSYEIFEKEMALLADKLRPQGMIRFHSSRLFLPEKKLMMGNWLEYKDMAA
YENCNKIWEKNGEEFFEKYGEIMAEVKITAYRGQVTLDWS
>gi|126031733|pdb|2OP5|A Chain A, Crystal Structure Of A Dimeric Ferredoxin-Like Protein (Jcvi_pep_1096672785533) From Uncultured Marine Organism At 2.20 A Resolution
GXKDTDETAFLNSLFXDFTSENELELFLKSLDEVWSEDLYSRLSAAGLIRHVISKVWNKEQHRISXVFEY
DSKEGYQKCQEIIDKEFGITLKEKLKKFVFKIHNNRGVVVSEFIRST
>gi|126031525|pdb|2OD6|A Chain A, Crystal Structure Of A Dimeric Ferredoxin-Like Protein (Jcvi_pep_1096682647733) From An Environmental Metagenome (Unidentified Marine Microbe), Sorcerer Ii Global Ocean Sampling Experiment At 1.85 A Resolution
GXAEPKFTSFTTADFINDVDXELFIDAVEKTAPVWVKEXKSRGLLKFSXNRVWNKGEVFRVVXTYEYKDR
ASFEANIAYLEDTFGKNPVFLQLVTTAKFTTSRCLVVXEV
>gi|114770226|ref|ZP_01447764.1| hypothetical protein OM2255_11335 [alpha proteobacterium HTCC2255]
MSDTIISFTTIEYPNQEIMDKSYEIFEKEMALLADKLRPQGMIRFHSSRLFLPEKKLMMGNWLEYKDMAA
YENCNKIWEKNGEEFFEKYGEIMAEVKITAYRGQVTLDWS
>gi|126031733|pdb|2OP5|A Chain A, Crystal Structure Of A Dimeric Ferredoxin-Like Protein (Jcvi_pep_1096672785533) From Uncultured Marine Organism At 2.20 A Resolution
GXKDTDETAFLNSLFXDFTSENELELFLKSLDEVWSEDLYSRLSAAGLIRHVISKVWNKEQHRISXVFEY
DSKEGYQKCQEIIDKEFGITLKEKLKKFVFKIHNNRGVVVSEFIRST
>gi|136033387|gb|EBL46121.1| hypothetical protein GOS_8567974 [marine metagenome]
MLFNIYNHLFRFYHFYMKSTPKLISYTIVDFPSETHMELGTRFFDEKASEFFNKAEKKGLLRWRMNRVWN
KQGSFTLSQVYEYKDEKAFKNCQIIVDEFYDKYKKDFSLINAKIVSSRAITLLDYVSEDY
>gi|136302563|gb|EBN24988.1| hypothetical protein GOS_8277466 [marine metagenome]
MSKKLMEEQKNSIPSAKLISHVLIDFSSEAEMELFINYVEKTGANFYENMKKIGLMRFRLNQVWNKEGGF
ALSTLFEYEDENAYVKGQKVIEKHFKENENFFKKITIKRLTTRTLNLLDFNY
>gi|137813747|gb|EBW14648.1| hypothetical protein GOS_6793120 [marine metagenome]
MINQTVFSGVIMKDSKLINYSTQDFSTESDMLITLHNWQDKKEKFLPKLKSKGLLRHAIMRVWNRDGSFR
LGHIFEYKDENAYKNCQPIWQEIEKQHKSKVPIKIFANRGIVLEDNILV
>gi|143405390|gb|EDE77944.1| hypothetical protein GOS_1071409 [marine metagenome]
MIKFGDQIMDDSSLMTYNTFTFKTEPEMLLHSRFWEDYGQKFFQKLKKHGCTRFCYNRIWNKQGMFKTSA
LFEYKNTNAFKKCQEVFQSERDTMIKDLGSINVIVEASRNIVLQDFT
>gi|140677273|gb|ECM75361.1| hypothetical protein GOS_5153802 [marine metagenome]
MGKSNLMSYNTFTFKTEAQMLLHIRLWEDKGKLLFEKLKEKGCTRYCYNQIWNKKGTYKTSTLFEYESPQ
AYKDCQTAIDTFRQSLMKELGAISAVIESSRNIILEDLR
>gi|135879917|gb|EBK43340.1| hypothetical protein GOS_8733649 [marine metagenome]
MTTSKLINYTTREFVSENELELYAAKQDEIFTPEVIEEFKKAGMLRRVLTRIWNKEGVARVGILFEYKDE
KAFVACQTLLDKFHAPKVKTFVNKVVGSRGIVLHEFTAEDFK
>gi|141983311|gb|ECU61596.1| hypothetical protein GOS_3660968 [marine metagenome]
MLKSSQLSEHLLIKQYECFNYVWEVNLENDTKLTSYNSFTFKSEAEMLLHIKYWDEEGEKVFKLLKSKGC
TRFCYSRIWNKKGLFKTSTLLEYKNAKAFNDCQIEIGKMTKKLKSDLKSINVVIDASRNIVLKDLT
>gi|143725082|gb|EDG46505.1| hypothetical protein GOS_777250 [marine metagenome]
MTETNLMSYNTFTFKTEAQMLLHIRLWEEKGKLLFAKLKQKGCTRFCYNQIWNKKGTYKTSTLFEYNSPQ
AYKDCQKAIDNFRQNIMKELEAISPVIESSRNVILQDLY
>gi|134635583|gb|EBC52224.1| hypothetical protein GOS_56596 [marine metagenome]
MTETNLMSYNTFTFKTEAQMLLHIRLWEEKGKLLFAKLKQKGCTRFCYNQIWNKKGTYKTSTLFEYNSPQ
AYKDCQKAIDNFRQSIMKELEAISPVIESSRNVILQDLY
>gi|144106329|gb|EDI90997.1| hypothetical protein GOS_1787658 [marine metagenome]
MTTSKLINYTTREFVSENELELYAAKQDEIFTPEVIEEFKKAGMLRRVLTRIWNKEGVARVGILFEYKDE
KAFVACQTLLDKYHAPKVKTFVNKVVGSRGIVLHEFTAEDFK
>gi|139708957|gb|ECG92792.1| hypothetical protein GOS_3802488 [marine metagenome]
RSIVVVSMKVWVDHMKETDTPLSTFNMLTFKSEAHLMLWVSFWEEYGEAFFSDLSKQGCKRVTFNRVWNK
EGQYKASSLFEYKKAEAFKACQKVIEAWSKRPEWQELRKSESILEATRNIVLQDHRAD
>gi|140314333|gb|ECK91892.1| hypothetical protein GOS_5440068 [marine metagenome]
IIGGFKLSDVTLINYTTRDFISKAELELYISKQDNIFTENVISEFKKAGMVRRVVTRIWNREGAFRVGIL
FEYMGEKAYKDCQKLLEKHYLHHLKDFNTKVVGSRGIVVHEF
>gi|137360703|gb|EBT66413.1| hypothetical protein GOS_7236465 [marine metagenome]
MSNVSLINYSTREFTTKGEMDSYIRKQDEIFTEEVTKIFIEAGMLRRVVTQIWNKKETFRVGIIFEYKDQ
TAYKNCQSLLEKHYLPFLKDYNTKVIGSRGIVVHEFVSKDFT
>gi|134326872|gb|EBA66290.1| hypothetical protein GOS_363919 [marine metagenome]
MVRERAVSKKSALMSYNIFTFPSEAQMLLHIKIWETRFPEMFEKLTEAGCTAYSYNQVWNSPGTFKTSVM
FEYESPEAFKACQEVMKEFTAPFLDELQSTGAVIEASRNVIRHAARIG
>gi|135772015|gb|EBJ74532.1| hypothetical protein GOS_8846827 [marine metagenome]
MKNYSMKVFKMSDSKLISYITSDFQTRSDMKVGEVEWEKIMNKNFDRFKKAGAVRQTVTQIWNKEGTLRL
GHLWEYKDEKAFVECQKIFRDAELEFKNKTGIVWKVFSNRGIVLYDVNYQ
>gi|134467305|gb|EBB51890.1| hypothetical protein GOS_219901 [marine metagenome]
MKLSDITLINYTTRDFISKTELELYISKQDNIFTENVITEFKNAGMVRRVVTRIWNREGAFRVGILFEYT
GEKAYKDCQKLLEKHYLHHLKDFNTKVVGSRGIVVHEF
>gi|139616727|gb|ECG29525.1| hypothetical protein GOS_6345724 [marine metagenome]
MDVEAKLISYNQLDFQSKAHIESMIRDIEDQVRQFSEQMAAAGLVSFTLTQVWNKQGKFRLGSYFAYRDE
KAFVDCQKILNGIPQDEENPAIQNADLGVVLLNFEAGK
>gi|141486116|gb|ECS03742.1| hypothetical protein GOS_6307636 [marine metagenome]
LLDTKANLMTYNTFTFKTEAQMLLFIKIWEDNGTKLFDKLKTKGCTRFCLNQIWNVKGTFKASVLFEYDG
PNAFKQCQVELENFTKNIMKELQAADPVIEASRNIVLQDLRV
>gi|138628360|gb|ECA91521.1| hypothetical protein GOS_6460768 [marine metagenome]
VFKKRGAAMTPKLMSYNQNDFQSKAHMEMSIAEIEKNVAAIGDQMREAGLLSFTVTQVWNKQGKFRTGTY
WAYRDEKAFIDCQKILNGIPEEKTT
>gi|140028599|gb|ECJ10752.1| hypothetical protein GOS_5630758 [marine metagenome]
MFADWEFMLDTKANLMTYNTFTFKTEAQMLLFRRIWEDNGTALFDKLKKKGCTRFCLNQIWNMKGTFKIS
ILFEYESPTSFKQSQNELENFTKNIMKELQAADPVIEASRNIVLQDLRV
>gi|137421336|gb|EBU00656.1| hypothetical protein GOS_7181258 [marine metagenome]
VWNKQGSFTLSQVYEYKDEKAFKNCQIIVDEFYDKYKKDFSLINAKIVSSRAITLLDYVSEDY
>gi|143701142|gb|EDG35289.1| hypothetical protein GOS_796420 [marine metagenome]
IKMVEIISAKLISYVKVDFSTEAEMELYINMFEKEGENFYNELKKVGLLRWRFNRVWNKTGGYEISQMFE
YKDEKAYTKGQEVLGKMIAGNKSFFDKINLKRTASRSINLMDFYG
>gi|135879917|gb|EBK43340.1| hypothetical protein GOS_8733649 [marine metagenome]
MTTSKLINYTTREFVSENELELYAAKQDEIFTPEVIEEFKKAGMLRRVLTRIWNKEGVARVGILFEYKDE
KAFVACQTLLDKFHAPKVKTFVNKVVGSRGIVLHEFTAEDFK
>gi|140989040|gb|ECO87950.1| hypothetical protein GOS_3707378 [marine metagenome]
LENDAKLTSYNTFTFKSEAEMLLHIKYWDDEGEKVFKLLKSKGCTRFCYSRIWNKKGLFKTSTLLEYKNA
KAFNDCQIEIGKMTEKLKTDLKSINVVIDASRNIVLKDLT
>gi|138108927|gb|EBX79229.1| hypothetical protein GOS_6532206 [marine metagenome]
KVELEHWVTTFEDRVWTDDVMKDLSKAGLVRRTVAQVWNKQNHRLTSTFEYENEDAYRACQKIIDEKVMP
KALANYTVKARNNRGIIIYDYRS

C_Brochier_11
17 Feb 2011 16:21
Maître de jeu
Bonjour,

Votre message est incompréhensible. Veuillez décrire mieux les opérations que vous vouliez faire et le point qui a posé problème.
Veillez aussi à votre expression écrite (c\'est quoi cluster W?) et à votre orthographe.

Céline Brochier
samiahafsoi
17 Feb 2011 16:41
Contribution non évaluée
bonjour,
Voici ce que j'ai tappé.
Dans phylogeny.fr, phylogénie analysis, à la carte.
J'ai juste changé le paramètre step by step, creat workflow.
Ensuite, j'ai collé les séquences (celles que je vous ai envoyé précédemment) et là lorsque je clique sur submit, il y a écrit en haut de page: Error: Muscle input: Invalid FASTA sequence block format.
Et donc le problème et que je ne peut pas avancer car je n'arrive pas à avoir l'arbre.
Ainsi pouvez me dire si les opérations effectuées sont justes??

samiahafsoi
C_Brochier_11
17 Feb 2011 16:52
Maître de jeu
Bonjour,

L'erreur est simple. MUSCLE vous dit que les séquences fournies ne sont pas au format fasta et il a raison.
Apparemment vous avez un espace au lieu d'un retour à la ligne entre votre identifiant et le début de votre séquence. Vous auriez pu vous en rendre compte en tentant d'aligner les séquences issues des banques de données (sans votre ORF) et voir que cela marchait. Ceci vous aurait indiqué que c'est votre séquence qui posait problème.

Céline Brochier