GOS 715020

From Metagenes
Warning: this metagenomic sequence has been carefully annotated by students during bioinformatics assignments. These quality annotations are therefore the result of a teaching exercise that you are most welcome to amend and extend if necessary!


Sequence
CAMERA AccNum : AACY01160537.1
Annotathon code: GOS_715020
Sample :
  • GPS :31°10'30n; 64°19'27.6w
  • Sargasso Sea: Sargasso Sea, Stations 3-11 - Bermuda (UK)
  • Open Ocean (-5m, 20°C, 0.1-0.8 microns)
Authors
Team : BioCell2008
Username : Dj-neiluj
Annotated on : 2009-02-13 16:34:58
  • Del Vecchio Alexandre
  • belaid amine
  • porte julien

Synopsis

Genomic Sequence

>AACY01160537.1 GOS_715020 genomic DNA
CTTCATAACAGGCGGCACCGGGTCCGGCCTAGGCCACGGGTCAGGTGGACCGGGTTGTGGCCAGGGCCACGGCGGGCGCGGCCACGGTTTGGGCCACGGC
GGGAGCGGCCACGGCGTGGGGAACGGCGCCGGCCACGGCACGGGCGTGTAACCGTTTATCAGACCGTCCCCGAGCATCTCAACAGGGGAGTAGTTTAAAG
TATTGCCTGGGGTCTGCGTCTGATTCACCACCAAATCCCCCCGAAGCAGGCCGCCATAAGCCACAACCGCGTCAATACTCGCAGCCGGCAACCACGGCGT
CATCGTGTCCGACGGGTAGTACGTTCTCTGAACGTAATGCTCCTGTATCCTGCTGCAGGCTTCTCTGGCGGTCGGGATATAATCATCCCAACTGTAATTA
CCGTTTAAATTGTTGCTATTCAGATTAACTTTCTGGAACTCGGGATACAATTGCGGTTGCCAGAGATTATATGCTTGGTCCGTCGTTGTCGCCTGCAGCT
GAATGTCCCGCATGCACTGACAGGAGAATAGTTCTTTGATTTGATAAGGCTGCTTTCCAGTAGGCCCCGTTGTGTTTGTCCACCCGAATCGCAGTTCCGG
ATCCTTTTCCAAGTCGGAATCATCATACGTCCTCTGATATCCGGGGGTGTACAGGGCTCTTGGACCCTGCTCTTTCGCATTTAGGATAGCAGCGTCCGTG
CTTAGCGACTGGAAGAACGAATCTTCGGGCTGGAAGAAGTCGGGGCGCCATCCCCCCATATTCTCCACCAAAGCCTTGTGGACGAAGCACTCTTTCAGGT
ACTGTTCCCCATCGAAGCTGTTTCCTCCTCCGTTGGAGTTTGCGGCGTTAGCCTCTCTTGATACGTACTCCGGATCCGTCGTCTCACAGCTCGCTCCGAA
GCTCTGGTTAGCGTATGACCCAGCAAAGTCATTGCTTACG

Translation

[2 - 940/940]   indirect strand
>GOS_715020 Translation [2-940   indirect strand]
VSNDFAGSYANQSFGASCETTDPEYVSREANAANSNGGGNSFDGEQYLKECFVHKALVENMGGWRPDFFQPEDSFFQSLSTDAAILNAKEQGPRALYTPG
YQRTYDDSDLEKDPELRFGWTNTTGPTGKQPYQIKELFSCQCMRDIQLQATTTDQAYNLWQPQLYPEFQKVNLNSNNLNGNYSWDDYIPTAREACSRIQE
HYVQRTYYPSDTMTPWLPAASIDAVVAYGGLLRGDLVVNQTQTPGNTLNYSPVEMLGDGLINGYTPVPWPAPFPTPWPLPPWPKPWPRPPWPWPQPGPPD
PWPRPDPVPPVMK

[ Warning ] 5' incomplete: does not start with a Methionine
[ Warning ] 3' incomplete: following codon is not a STOP

Phylogeny

PROTOCOLE:

---------------------------------------------------------------------------------------------------
ANALYSE DES RÉSULTATS:

---------------------------------------------------------------------------------------------------
RÉSULTATS BRUTS:

---------------------------------------------------------------------------------------------------

Annotator commentaries

Nous étudions la séquence d'ADN génomique (Sargasso Sea: Sargasso Sea, Station 11 (Bermuda (UK))) portant le nom de GOS_715020. Cette séquence possède 940 pb.


Notre ORF semble codant car la séquence traduite de l'ORF possède plus de 313 acides aminés : elle n'est pas complète (elle ne débute pas par une méthionine et ne finit pas par un codon stop).


Suite aux différents BLAST, qui sont restés sans résultat significatif, nous pouvons en déduire que notre séquence est une séquence orpheline (ORFan).


Nous ne pouvons donc pas annoter d'avantage notre séquence. Il nous est donc impossible de conclure sur la fonction protéique et la classification taxonomique de notre séquence.

Multiple Alignement

PROTOCOLE:

---------------------------------------------------------------------------------------------------
ANALYSE DES RÉSULTATS:

---------------------------------------------------------------------------------------------------
RÉSULTATS BRUTS:

---------------------------------------------------------------------------------------------------

BLAST

PROTOCOLE:

a) BLASTp contre SwissProt, paramètres par défaut au NCBI, sur ORF
b) BLASTp contre NR, paramètres par défaut au NCBI, sur ORF
c) BLASTp contre env_nr, paramètres par défaut au NCBI, sur ORF
d) BLASTx contre NR, paramètres par défaut au NCBI, sur séquence nucléotidique complète
e) BLASTx contre env_nr, paramètres par défaut au NCBI, sur séquence nucléotidique complète
f) tBLASTn contre env_nt, paramètres par défaut au NCBI, sur ORF

---------------------------------------------------------------------------------------------------
ANALYSE DES RÉSULTATS:

a) Pour commencer, nous avons fait un BLASTp contre Swissprot avec l'ORF traduit en protéine.
Nous ne trouvons qu'un seul résultat qui n'est pas concluant : score (32) et E-value (3.8)

b) Nous effectuons donc un BLASTp contre NR où il ne figure aucun résultat alors que l'on devrait trouver au moins la séquence trouvée avec Swissprot.
Cela peut s'expliquer car les E-values des résultats de Swissprot augmentent dans NR et donc n'apparaissent pas à cause du seuil par défaut.

c) Nous avons donc fait un BLASTp contre la banque environnementale (env_nr), qui ne possède que des séquences métagénomiques.
Nous n'observons aucun résultat. Nous pouvons donc craindre un faux positif.

d) Nous avons ensuite effectué un BLASTx contre NR de la séquence nucélotidique complète de notre fragment de  séquence.
Le BLASTx permet de traduire notre séquence nucléotidique complète dans les 6 cadres de lecture contre une banque protéique.
Ce qui nous permettra de ne plus avoir de doute sur le cadre de lecture de notre ORF.
Nous constatons qu'il n'y a que 6 résultats pour ce BLASTx et aucun d'entre eux ne présentent un bon score ou une bonne E-value.
Les scores sont compris entre 37.7 et 35 et les E-values entre 1.4 et 8.8

e) Nous effectuons donc un BLASTx contre la banque environnementale (env_nr)
Nous n'observons qu'un seul résultat qui n'est toujours pas concluant : score de 36.6 et E-value de 0.91
Notre hypothèse concernant le faux positif est écartée.

f) Pour finir, nous effectuons un tBLASTn contre la banque environnementale (env_nt) afin de retrouver notre propre séquence.
La séquence obtenue est bien la notre car elle possède 100% d'identité et 0% de gaps.
Nous constatons qu'elle possède un très bon score (641) et une très bonne E-value (0.0)

---------------------------------------------------------------------------------------------------
RÉSULTATS BRUTS:


a) BLASTp contre SwissProt, paramètres par défaut au NCBI, sur ORF


Sequences producing significant alignments:                       (Bits)  Value

sp|A4X4N7.1|IF2_SALTO  RecName: Full=Translation initiation fa...  32.3    3.8   Gene info


***************Alignements****************


>sp|A4X4N7.1|IF2_SALTO Gene info RecName: Full=Translation initiation factor IF-2
Length=999

 GENE ID: 5057823 Strop_1370 | translation initiation factor IF-2
[Salinispora tropica CNB-440]

 Score = 32.3 bits (72),  Expect = 3.8, Method: Composition-based stats.
 Identities = 12/28 (42%), Positives = 14/28 (50%), Gaps = 0/28 (0%)

Query  271  APFPTPWPLPPWPKPWPRPPWPWPQPGP  298
             P P+P  +PP P P   PP P P   P
Sbjct  242  GPRPSPASMPPRPSPASMPPRPSPASMP  269




---------------------------------------------------------------------------------------------------


b) BLASTp contre NR, paramètres par défaut au NCBI, sur ORF

No significant similarity found.


---------------------------------------------------------------------------------------------------


c) BLASTp contre env_nr, paramètres par défaut au NCBI, sur ORF

No significant similarity found. 


---------------------------------------------------------------------------------------------------


d) BLASTx contre NR, paramètres par défaut au NCBI, sur séquence nucléotidique complète

Sequences producing significant alignments:                       (Bits)  Value

ref|YP_707905.1|  hypothetical protein RHA1_ro08703 [Rhodococc...  37.7    1.4   
ref|XP_804145.1|  hypothetical protein [Trypanosoma cruzi stra...  36.2    4.0   
gb|EEB03773.1|  hypothetical protein TGME49_016030 [Toxoplasma...  35.8    5.2  
ref|XP_001666358.1|  hypothetical protein CBG21184 [Caenorhabd...  35.4    6.8   
ref|NP_496423.1|  Ligand-Gated ion Channel family member (lgc-...  35.4    6.8   
emb|CAG13038.1|  unnamed protein product [Tetraodon nigroviridis]  35.0    8.8 


***************Alignements****************


>ref|YP_707905.1| Gene info hypothetical protein RHA1_ro08703 [Rhodococcus sp. RHA1]
 gb|ABG99747.1| Gene info conserved hypothetical protein [Rhodococcus sp. RHA1]
Length=383

 GENE ID: 4225608 RHA1_ro08703 | hypothetical protein [Rhodococcus sp. RHA1]
(10 or fewer PubMed links)

 Score = 37.7 bits (86),  Expect = 1.4
 Identities = 18/45 (40%), Positives = 26/45 (57%), Gaps = 0/45 (0%)
 Frame = -1

Query  766  GEYGGMAPRLLPARRFVLPVAKHGRCYPKCERAGSKSPVHPRISE  632
            G+ GG +PR+L + R + PVA+H    P CER  +K    P + E
Sbjct  157  GDRGGRSPRILISGREITPVAEHTLSSPICERLAAKGVSTPTLYE  201


>ref|XP_804145.1| Gene info hypothetical protein [Trypanosoma cruzi strain CL Brener]
 gb|EAN82294.1| Gene info hypothetical protein, conserved [Trypanosoma cruzi]
Length=423

 GENE ID: 3533499 Tc00.1047053408437.10 | hypothetical protein
[Trypanosoma cruzi strain CL Brener] (10 or fewer PubMed links)

 Score = 36.2 bits (82),  Expect = 4.0
 Identities = 38/121 (31%), Positives = 47/121 (38%), Gaps = 12/121 (9%)
 Frame = +3

Query  471  MLGPSLSPAAECPACTDRRIVL*FDKAAFQ*APLCLSTRIAVPDPFPSRNHHTSSDIRGC  650
            ML  S    A   A T RR++     AA Q  P  L     V  P  S    TSS     
Sbjct  271  MLTASFPSTAAASAATSRRLISFVPAAARQNTPHGLGGEAGVGAPSTSSASTTSS-----  325

Query  651  TGLLDPALSHLG*QRPCL---ATGRTNLRAGRSRGA--IPPYSPPKPCGRSTLSGTVPHR  815
              +L  A  H       +    T R  LR+   RG   +PP  PP P   S+LS T+  R
Sbjct  326  --MLPFANIHSAASNDAVRAYVTERVRLRSLPPRGVDGVPPPPPPAPFSSSSLSATITKR  383

Query  816  S  818
            +
Sbjct  384  A  384


>gb|EEB03773.1|  hypothetical protein TGME49_016030 [Toxoplasma gondii ME49]
Length=1319

 Score = 35.8 bits (81),  Expect = 5.2
 Identities = 17/53 (32%), Positives = 30/53 (56%), Gaps = 0/53 (0%)
 Frame = +3

Query  192  SLKYCLGSASDSPPNPPEAGRHKPQPRQYSQPATTASSCPTGSTFSERNAPVS  350
            S+K+ + +A +SP   P     +P P   S  + ++SS P+ S+FS  ++P S
Sbjct  278  SMKFMVKNAEESPAFDPSLRIRRPAPHPPSSSSFSSSSSPSSSSFSSSSSPSS  330


>ref|XP_001666358.1| Gene info hypothetical protein CBG21184 [Caenorhabditis briggsae AF16]
 emb|CAP38035.1|  Hypothetical protein CBG21184 [Caenorhabditis briggsae]
Length=952

 GENE ID: 5643876 CBG21184 | hypothetical protein [Caenorhabditis briggsae AF16]

 Score = 35.4 bits (80),  Expect = 6.8
 Identities = 18/40 (45%), Positives = 23/40 (57%), Gaps = 2/40 (5%)
 Frame = +3

Query  228  PPNPPEAGRHKPQPRQY--SQPATTASSCPTGSTFSERNA  341
            PP PP AG  K   R     QP+T+++S  T ST S+R A
Sbjct  893  PPRPPSAGNRKAPKRASGGQQPSTSSASAATSSTVSKRRA  932


>ref|NP_496423.1| UniGene infoGene info Ligand-Gated ion Channel family member (lgc-20) [Caenorhabditis 
elegans]
 emb|CAA90086.1| Gene info C. elegans protein B0491.4, partially confirmed by transcript 
evidence [Caenorhabditis elegans]
Length=454

 GENE ID: 174733 lgc-20 | Ligand-Gated ion Channel [Caenorhabditis elegans]
(10 or fewer PubMed links)

 Score = 35.4 bits (80),  Expect = 6.8
 Identities = 15/45 (33%), Positives = 23/45 (51%), Gaps = 5/45 (11%)
 Frame = +2

Query  671  SFAFRIAASVLSDWKNESSGWKKSG-----RHPPIFSTKALWTKH  790
            S+ F +   +  +WK+E   W K G      H  IF++ A+WT H
Sbjct  87   SYQFNVFGDIYLNWKDERMKWDKKGEFENYEHLYIFNSSAIWTPH  131


>emb|CAG13038.1|  unnamed protein product [Tetraodon nigroviridis]
Length=764

 Score = 35.0 bits (79),  Expect = 8.8
 Identities = 22/57 (38%), Positives = 27/57 (47%), Gaps = 6/57 (10%)
 Frame = +3

Query  198  KYCLGSASDSPPNPPEAGRHKP----QPRQYSQPATTASSCPTGSTFSERNAPVSCC  356
            K CL   S + P PP +G  +P     P  Y+    T S CP GS FS+   P S C
Sbjct  128  KICLEGVSGAEPLPP-SGEREPCPPCNPGFYNNDTPTCSPCPAGS-FSDGTKPCSQC  182




---------------------------------------------------------------------------------------------------



e) BLASTx contre env_nr, paramètres par défaut au NCBI, sur séquence nucléotidique complète

gb|EDJ38152.1|  hypothetical protein GOS_1705494 [marine metag...  36.6    0.91 


***************Alignements****************


>gb|EDJ38152.1|  hypothetical protein GOS_1705494 [marine metagenome]
Length=525

 Score = 36.6 bits (83),  Expect = 0.91
 Identities = 21/60 (35%), Positives = 26/60 (43%), Gaps = 0/60 (0%)
 Frame = +3

Query  213  SASDSPPNPPEAGRHKPQPRQYSQPATTASSCPTGSTFSERNAPVSCCRLLWRSGYNHPN  392
            SA   P  P  +  +  +P   + P TTASS P G+T        SC R   R G   PN
Sbjct  43   SAPAYPSAPTRSAPNSSRPSSTTTPTTTASSPPAGTTAFSSTCRASCSRGCARPGSPRPN  102




---------------------------------------------------------------------------------------------------



f) tBLASTn contre env_nt, paramètres par défaut au NCBI, sur ORF

                                                                   Score     E
Sequences producing significant alignments:                       (Bits)  Value

gb|AACY024086556.1|  Marine metagenome 1096626586378, whole ge...   641    0.0  


***************Alignements****************


>gb|AACY024086556.1|  Marine metagenome 1096626586378, whole genome shotgun sequence
Length=940

 Score =  641 bits (1653),  Expect = 0.0, Method: Compositional matrix adjust.
 Identities = 313/313 (100%), Positives = 313/313 (100%), Gaps = 0/313 (0%)
 Frame = -2

Query  1    VSNDFAGSYANQSFGASCETTDPEYVSREANAANSNGGGNSFDGEQYLKECFVHKALVEN  60
            VSNDFAGSYANQSFGASCETTDPEYVSREANAANSNGGGNSFDGEQYLKECFVHKALVEN
Sbjct  939  VSNDFAGSYANQSFGASCETTDPEYVSREANAANSNGGGNSFDGEQYLKECFVHKALVEN  760

Query  61   MGGWRPDFFQPEDSFFQSLSTDAAILNAKEQGPRALYTPGYQRTYDDSDLEKDPELRFGW  120
            MGGWRPDFFQPEDSFFQSLSTDAAILNAKEQGPRALYTPGYQRTYDDSDLEKDPELRFGW
Sbjct  759  MGGWRPDFFQPEDSFFQSLSTDAAILNAKEQGPRALYTPGYQRTYDDSDLEKDPELRFGW  580

Query  121  TNTTGPTGKQPYQIKELFSCQCMRDIQLQATTTDQAYNLWQPQLYPEFQKVNLNSNNLNG  180
            TNTTGPTGKQPYQIKELFSCQCMRDIQLQATTTDQAYNLWQPQLYPEFQKVNLNSNNLNG
Sbjct  579  TNTTGPTGKQPYQIKELFSCQCMRDIQLQATTTDQAYNLWQPQLYPEFQKVNLNSNNLNG  400

Query  181  NYSWDDYIPTAREACSRIQEHYVQRTYYPSDTMTPWLPAASIDAVVAYGGLLRGDLVVNQ  240
            NYSWDDYIPTAREACSRIQEHYVQRTYYPSDTMTPWLPAASIDAVVAYGGLLRGDLVVNQ
Sbjct  399  NYSWDDYIPTAREACSRIQEHYVQRTYYPSDTMTPWLPAASIDAVVAYGGLLRGDLVVNQ  220

Query  241  TQTPGNTLNYSPVEMLGDGLINGYTPVPWPAPFPTPWPLPPWPKPWPRPPWPWPQPGPPD  300
            TQTPGNTLNYSPVEMLGDGLINGYTPVPWPAPFPTPWPLPPWPKPWPRPPWPWPQPGPPD
Sbjct  219  TQTPGNTLNYSPVEMLGDGLINGYTPVPWPAPFPTPWPLPPWPKPWPRPPWPWPQPGPPD  40

Query  301  PWPRPDPVPPVMK  313
            PWPRPDPVPPVMK
Sbjct  39   PWPRPDPVPPVMK  1

---------------------------------------------------------------------------------------------------

ORF finding

PROTOCOLE:

a) SMS ORFinder / sens direct   / cadres 1, 2 & 3 / min 60 AA / initiation 'any codon' / code génétique 'universel'
b) SMS ORFinder / sens indirect / cadres 1, 2 & 3 / min 60 AA / initiation 'any codon' / code génétique 'universel'

---------------------------------------------------------------------------------------------------
ANALYSE DES RÉSULTATS:

Nous avons utilisé l'outils ORF Finder sur le site SMS dans le but de trouver les cadres ouverts de lecture.
Nous avons effectué deux recherches. Une sur un brin dans le sens direct où nous avons 4 ORF différents et l'autre 
dans le sens indirect où nous avons 3 ORF différents. Nous observons que l'ORF le plus long se situe sur le brin dans 
le sens indirect (2-940 soit 939 nucléotides). 
En raison de la grandeur de cet ORF, nous pouvons en conclure qu'il s'agit d'une séquence codante.
Nous constatons également que la séquence traduite de l'ORF est incomplète en 5' et en 3'.
Elle ne commence pas par une méthionine et ne se termine pas par un codon stop.
Les prochaines recherches, et en particulier l'alignement multiple, nous permettrons d'établir si le codon initiateur se trouve en amont ou dans l'ORF.
Nous pourrons également voir combien de nucléotides il manque en 3' de l'ORF jusqu'au codon stop par comparaison avec ses homologues.

---------------------------------------------------------------------------------------------------
RÉSULTATS BRUTS:


a) SMS ORFinder / sens direct   / cadres 1, 2 & 3 / min 60 AA / initiation 'any codon' / code génétique 'universel'

>ORF number 1 in reading frame 1 on the direct strand extends from base 1 to base 198.
CTTCATAACAGGCGGCACCGGGTCCGGCCTAGGCCACGGGTCAGGTGGACCGGGTTGTGG
CCAGGGCCACGGCGGGCGCGGCCACGGTTTGGGCCACGGCGGGAGCGGCCACGGCGTGGG
GAACGGCGCCGGCCACGGCACGGGCGTGTAACCGTTTATCAGACCGTCCCCGAGCATCTC
AACAGGGGAGTAGTTTAA

>Translation of ORF number 1 in reading frame 1 on the direct strand.
LHNRRHRVRPRPRVRWTGLWPGPRRARPRFGPRRERPRRGERRRPRHGRVTVYQTVPEHL
NRGVV*

>ORF number 2 in reading frame 1 on the direct strand extends from base 199 to base 408.
AGTATTGCCTGGGGTCTGCGTCTGATTCACCACCAAATCCCCCCGAAGCAGGCCGCCATA
AGCCACAACCGCGTCAATACTCGCAGCCGGCAACCACGGCGTCATCGTGTCCGACGGGTA
GTACGTTCTCTGAACGTAATGCTCCTGTATCCTGCTGCAGGCTTCTCTGGCGGTCGGGAT
ATAATCATCCCAACTGTAATTACCGTTTAA

>Translation of ORF number 2 in reading frame 1 on the direct strand.
SIAWGLRLIHHQIPPKQAAISHNRVNTRSRQPRRHRVRRVVRSLNVMLLYPAAGFSGGRD
IIIPTVITV*

>ORF number 1 in reading frame 2 on the direct strand extends from base 638 to base 940.
TATCCGGGGGTGTACAGGGCTCTTGGACCCTGCTCTTTCGCATTTAGGATAGCAGCGTCC
GTGCTTAGCGACTGGAAGAACGAATCTTCGGGCTGGAAGAAGTCGGGGCGCCATCCCCCC
ATATTCTCCACCAAAGCCTTGTGGACGAAGCACTCTTTCAGGTACTGTTCCCCATCGAAG
CTGTTTCCTCCTCCGTTGGAGTTTGCGGCGTTAGCCTCTCTTGATACGTACTCCGGATCC
GTCGTCTCACAGCTCGCTCCGAAGCTCTGGTTAGCGTATGACCCAGCAAAGTCATTGCTT
ACG

>Translation of ORF number 1 in reading frame 2 on the direct strand.
YPGVYRALGPCSFAFRIAASVLSDWKNESSGWKKSGRHPPIFSTKALWTKHSFRYCSPSK
LFPPPLEFAALASLDTYSGSVVSQLAPKLWLAYDPAKSLLT

>ORF number 1 in reading frame 3 on the direct strand extends from base 33 to base 428.
GCCACGGGTCAGGTGGACCGGGTTGTGGCCAGGGCCACGGCGGGCGCGGCCACGGTTTGG
GCCACGGCGGGAGCGGCCACGGCGTGGGGAACGGCGCCGGCCACGGCACGGGCGTGTAAC
CGTTTATCAGACCGTCCCCGAGCATCTCAACAGGGGAGTAGTTTAAAGTATTGCCTGGGG
TCTGCGTCTGATTCACCACCAAATCCCCCCGAAGCAGGCCGCCATAAGCCACAACCGCGT
CAATACTCGCAGCCGGCAACCACGGCGTCATCGTGTCCGACGGGTAGTACGTTCTCTGAA
CGTAATGCTCCTGTATCCTGCTGCAGGCTTCTCTGGCGGTCGGGATATAATCATCCCAAC
TGTAATTACCGTTTAAATTGTTGCTATTCAGATTAA

>Translation of ORF number 1 in reading frame 3 on the direct strand.
ATGQVDRVVARATAGAATVWATAGAATAWGTAPATARACNRLSDRPRASQQGSSLKYCLG
SASDSPPNPPEAGRHKPQPRQYSQPATTASSCPTGSTFSERNAPVSCCRLLWRSGYNHPN
CNYRLNCCYSD*



b) SMS ORFinder / sens indirect   / cadres 1, 2 & 3 / min 60 AA / initiation 'any codon' / code génétique 'universel'

>ORF number 1 in reading frame 1 on the reverse strand extends from base 94 to base 318.
CGCCGCAAACTCCAACGGAGGAGGAAACAGCTTCGATGGGGAACAGTACCTGAAAGAGTG
CTTCGTCCACAAGGCTTTGGTGGAGAATATGGGGGGATGGCGCCCCGACTTCTTCCAGCC
CGAAGATTCGTTCTTCCAGTCGCTAAGCACGGACGCTGCTATCCTAAATGCGAAAGAGCA
GGGTCCAAGAGCCCTGTACACCCCCGGATATCAGAGGACGTATGA

>Translation of ORF number 1 in reading frame 1 on the reverse strand.
RRKLQRRRKQLRWGTVPERVLRPQGFGGEYGGMAPRLLPARRFVLPVAKHGRCYPKCERA
GSKSPVHPRISEDV*

>ORF number 1 in reading frame 2 on the reverse strand extends from base 2 to base 940.
GTAAGCAATGACTTTGCTGGGTCATACGCTAACCAGAGCTTCGGAGCGAGCTGTGAGACG
ACGGATCCGGAGTACGTATCAAGAGAGGCTAACGCCGCAAACTCCAACGGAGGAGGAAAC
AGCTTCGATGGGGAACAGTACCTGAAAGAGTGCTTCGTCCACAAGGCTTTGGTGGAGAAT
ATGGGGGGATGGCGCCCCGACTTCTTCCAGCCCGAAGATTCGTTCTTCCAGTCGCTAAGC
ACGGACGCTGCTATCCTAAATGCGAAAGAGCAGGGTCCAAGAGCCCTGTACACCCCCGGA
TATCAGAGGACGTATGATGATTCCGACTTGGAAAAGGATCCGGAACTGCGATTCGGGTGG
ACAAACACAACGGGGCCTACTGGAAAGCAGCCTTATCAAATCAAAGAACTATTCTCCTGT
CAGTGCATGCGGGACATTCAGCTGCAGGCGACAACGACGGACCAAGCATATAATCTCTGG
CAACCGCAATTGTATCCCGAGTTCCAGAAAGTTAATCTGAATAGCAACAATTTAAACGGT
AATTACAGTTGGGATGATTATATCCCGACCGCCAGAGAAGCCTGCAGCAGGATACAGGAG
CATTACGTTCAGAGAACGTACTACCCGTCGGACACGATGACGCCGTGGTTGCCGGCTGCG
AGTATTGACGCGGTTGTGGCTTATGGCGGCCTGCTTCGGGGGGATTTGGTGGTGAATCAG
ACGCAGACCCCAGGCAATACTTTAAACTACTCCCCTGTTGAGATGCTCGGGGACGGTCTG
ATAAACGGTTACACGCCCGTGCCGTGGCCGGCGCCGTTCCCCACGCCGTGGCCGCTCCCG
CCGTGGCCCAAACCGTGGCCGCGCCCGCCGTGGCCCTGGCCACAACCCGGTCCACCTGAC
CCGTGGCCTAGGCCGGACCCGGTGCCGCCTGTTATGAAG

>Translation of ORF number 1 in reading frame 2 on the reverse strand.
VSNDFAGSYANQSFGASCETTDPEYVSREANAANSNGGGNSFDGEQYLKECFVHKALVEN
MGGWRPDFFQPEDSFFQSLSTDAAILNAKEQGPRALYTPGYQRTYDDSDLEKDPELRFGW
TNTTGPTGKQPYQIKELFSCQCMRDIQLQATTTDQAYNLWQPQLYPEFQKVNLNSNNLNG
NYSWDDYIPTAREACSRIQEHYVQRTYYPSDTMTPWLPAASIDAVVAYGGLLRGDLVVNQ
TQTPGNTLNYSPVEMLGDGLINGYTPVPWPAPFPTPWPLPPWPKPWPRPPWPWPQPGPPD
PWPRPDPVPPVMK

>ORF number 1 in reading frame 3 on the reverse strand extends from base 261 to base 521.
ATGCGAAAGAGCAGGGTCCAAGAGCCCTGTACACCCCCGGATATCAGAGGACGTATGATG
ATTCCGACTTGGAAAAGGATCCGGAACTGCGATTCGGGTGGACAAACACAACGGGGCCTA
CTGGAAAGCAGCCTTATCAAATCAAAGAACTATTCTCCTGTCAGTGCATGCGGGACATTC
AGCTGCAGGCGACAACGACGGACCAAGCATATAATCTCTGGCAACCGCAATTGTATCCCG
AGTTCCAGAAAGTTAATCTGA

>Translation of ORF number 1 in reading frame 3 on the reverse strand.
MRKSRVQEPCTPPDIRGRMMIPTWKRIRNCDSGGQTQRGLLESSLIKSKNYSPVSACGTF
SCRRQRRTKHIISGNRNCIPSSRKLI*

---------------------------------------------------------------------------------------------------