GOS 1103010

From Metagenes
Warning: this metagenomic sequence has been carefully annotated by students during bioinformatics assignments. These quality annotations are therefore the result of a teaching exercise that you are most welcome to amend and extend if necessary!


Sequence
CAMERA AccNum : JCVI_READ_1091138050591
Annotathon code: GOS_1103010
Sample :
  • GPS :20°31'21n; 85°24'49w
  • Caribbean Sea: Yucatan Channel - Mexico
  • Open Ocean (-2m, 27°C, 0.1-0.8 microns)
Authors
Team : BioCell2009
Username : sonia2hayiri
Annotated on : 2010-01-24 10:40:53
  • Ghilas Sonia
  • Maaroufou Hayiri

Synopsis

  • Taxonomy: Prochlorales (NCBI info)
    Rank: order - Genetic Code: Bacterial and Plant Plastid - NCBI Identifier: 1212
    Kingdom: Bacteria - Phylum: Cyanobacteria - Class: - Order: Prochlorales
    Bacteria; Cyanobacteria; Prochlorales;

Genomic Sequence

>JCVI_READ_1091138050591 GOS_1103010 Genomic DNA
AAAGACTCATTAGTTGATATTCAAAATTTATGGAGACCAGCGATATTAATAACTTTTACTTTAGTTATTACTGGATTAGCAATTGGTTTATGGACAAGTA
GATTACTTAAAATAGATATTATTACAACAATTCTAGGAGCTGCCCCAGGAGGAATTAGTGGAATGAGTCTTGTAGGTTCAGAATACGGAGTTGGGCCTGC
CGTAGCAACTTTACATGCTGTCAGATTGATCACTGTACTCTTAATTCTTCCTTTAGTTGTGAAATGCTTGAATATATTTGGAGTGATTAAATCTTAAATT
TCTATAGACATATTCACAATAAAAGATATTTTTAAATAGAAGGTAAAAGCTCAATGCAAAGATTAACGAAGAAAAAACTAATACCATTAGCGTTTGTAAT
TTTCGCTCCTCTAACCCTTACTTCGCCAAGAGTAAATGCAAGTGCATTTGGAGCGGAAATTTTTTGTACTATGAGAGACGGCGGAAATGATCATGAAAGT
AGTTGGGATGCAGCTTATACGTACATAAAAAAACAAAAGGGAGGATTATTTAAAGTTTCACCTAAAAATGCAGCAGCGCAAATTACTGAAACAGTTATAA
GGGAAAGAGAAAAATTTAGTTATTGCGTTGAATATTTAGATAATCTTCATCCAAATAGAAAACTAATACGAGATTTAGAAAAAGAAAAAAAAAGAAAAGA
AAAAGAAGCAATAGATAGAGAAAACAAAAGAAAAAGATTAAAAAAAGAATTAGAAGAAGCTAATGAAGAAATTTCTGAAGAATTTACTGATGAAACCCTT
GATAGATATAGTTATTAATCAAGGTTTTCAAAAGATAATAAT

Translation

[354 - 815/842]   direct strand
>GOS_1103010 Translation [354-815   direct strand]
MQRLTKKKLIPLAFVIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKKQKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHP
NRKLIRDLEKEKKRKEKEAIDRENKRKRLKKELEEANEEISEEFTDETLDRYSY

Annotator commentaries

-La séquence étudiée contient un ORF complet et codant. La protéine codée par notre ORF ne débute qu'au 7eme acide aminé de notre séquence protéique.

-Notre recherche de domaines protéiques conservés n'a rien donné, cependant il semblerait que notre séquence contienne une région transmembranaire. Celle-ci pourrait être associée à des fonctions de transport à travers la membrane. Les homologues trouvés(par le blast contre nr) sont impliqués dans des activités de sécrétion. On peut donc supposer que notre séquence peut elle aussi avoir un rôle dans la sécrétion.

-Les résultats de l'arbre construits à partir du rapport taxonomique semble nous montrer que l'organisme qui porte le fragment d'ADN étudié appartient au règne des bactéries, à la division des cyanobactéries et plus précisément à l'ordre des Prochlorales.

ORF finding

PROTOCOLE:


a) SMS ORFinder / sens direct / cadres 1, 2 & 3 / min 60 AA / initiation 'any codon' / code génétique 'universel'

b) SMS ORFinder / sens indirect / cadres 1, 2 & 3 / min 60 AA / initiation 'any codon' / code génétique 'universel'



ANALYSE DES RÉSULTATS:

Notre séquence contient trois ORFs : deux dans le sens direct et un dans le sens indirect. Etant donné que ces trois ORFs ont une longueur différente, on considère donc le plus long des trois c'est-à-dire l'ORF numéro 1 dans le cadre de lecture numéro 3 obtenu dans le sens direct.

L'ORF trouvé semble être incomplet en 5' d'après la recherche d'ORFs car notre séquence protéique ne commence pas par une méthionine. Cependant il semble être complet en 3'. Après avoir effectuée une analyse plus poussée de notre ORF, nous avons remarquer que la région codante ne commence qu'au 21eme nucléotide de l'ORF trouvée (voir (a) correction). En effet on peut observer la présence d'un codon start à cette même position codant pour une méthionine. Ce n'est qu'après cette analyse(essentiellement grâce au blast) que nous avons pu affirmer que nous étions en présence d'une unité de transcription complète. Ceci explique le résultat (b) qui est la traduction de la région codante incluse dans notre ORF.

Lors de la recherche d'ORFs par le logiciel SMS ORF finder, ce dernier lit la séquence entrée dans les six cadres de lecture possible et fragmente celle-ci à chaque fois qu'il rencontre un codon STOP( paramètre any codon).Les fragments générés seront forcément complets en 3'(étant donné qu'il reconnait les codons STOP).Cependant ils ne débutent pas toujours par une méthionine.


RÉSULTATS BRUTS:

a)sens direct

>ORF number 1 in reading frame 1 on the direct strand extends from base 1 to base 297.
AAAGACTCATTAGTTGATATTCAAAATTTATGGAGACCAGCGATATTAATAACTTTTACT
TTAGTTATTACTGGATTAGCAATTGGTTTATGGACAAGTAGATTACTTAAAATAGATATT
ATTACAACAATTCTAGGAGCTGCCCCAGGAGGAATTAGTGGAATGAGTCTTGTAGGTTCA
GAATACGGAGTTGGGCCTGCCGTAGCAACTTTACATGCTGTCAGATTGATCACTGTACTC
TTAATTCTTCCTTTAGTTGTGAAATGCTTGAATATATTTGGAGTGATTAAATCTTAA

>Translation of ORF number 1 in reading frame 1 on the direct strand.
KDSLVDIQNLWRPAILITFTLVITGLAIGLWTSRLLKIDIITTILGAAPGGISGMSLVGS
EYGVGPAVATLHAVRLITVLLILPLVVKCLNIFGVIKS*



No ORFs were found in reading frame 2.



>ORF number 1 in reading frame 3 on the direct strand extends from base 336 to base 818.
ATAGAAGGTAAAAGCTCAATGCAAAGATTAACGAAGAAAAAACTAATACCATTAGCGTTT
GTAATTTTCGCTCCTCTAACCCTTACTTCGCCAAGAGTAAATGCAAGTGCATTTGGAGCG
GAAATTTTTTGTACTATGAGAGACGGCGGAAATGATCATGAAAGTAGTTGGGATGCAGCT
TATACGTACATAAAAAAACAAAAGGGAGGATTATTTAAAGTTTCACCTAAAAATGCAGCA
GCGCAAATTACTGAAACAGTTATAAGGGAAAGAGAAAAATTTAGTTATTGCGTTGAATAT
TTAGATAATCTTCATCCAAATAGAAAACTAATACGAGATTTAGAAAAAGAAAAAAAAAGA
AAAGAAAAAGAAGCAATAGATAGAGAAAACAAAAGAAAAAGATTAAAAAAAGAATTAGAA
GAAGCTAATGAAGAAATTTCTGAAGAATTTACTGATGAAACCCTTGATAGATATAGTTAT
TAA

>Translation of ORF number 1 in reading frame 3 on the direct strand.
IEGKSSMQRLTKKKLIPLAFVIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAA
YTYIKKQKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKR
KEKEAIDRENKRKRLKKELEEANEEISEEFTDETLDRYSY*


---------------------------------------------------------------------------------------------------


b)sens indirect

>ORF number 1 in reading frame 1 on the reverse strand extends from base 550 to base 822.
GATTTAATCACTCCAAATATATTCAAGCATTTCACAACTAAAGGAAGAATTAAGAGTACA
GTGATCAATCTGACAGCATGTAAAGTTGCTACGGCAGGCCCAACTCCGTATTCTGAACCT
ACAAGACTCATTCCACTAATTCCTCCTGGGGCAGCTCCTAGAATTGTTGTAATAATATCT
ATTTTAAGTAATCTACTTGTCCATAAACCAATTGCTAATCCAGTAATAACTAAAGTAAAA
GTTATTAATATCGCTGGTCTCCATAAATTTTGA

>Translation of ORF number 1 in reading frame 1 on the reverse strand.
DLITPNIFKHFTTKGRIKSTVINLTACKVATAGPTPYSEPTRLIPLIPPGAAPRIVVIIS
ILSNLLVHKPIANPVITKVKVINIAGLHKF*



No ORFs were found in reading frame 2.



No ORFs were found in reading frame 3.




Multiple Alignement

PROTOCOLE:

EBI / Programme Clustalw2 / Parametres par defaut/ Sortie format clustal.



ANALYSE DES RÉSULTATS:

L'alignement multiple montre que notre séquence(GOS)


L'alignement multiple montre plusieurs faits importants:

-le début de notre séquence de départ ne présente pas de similarités avec les homologues.Il ne peut donc être aligné avec les séquences homologues.En effet la sequence protéique de base ne s'aligne avec les autres homologues seulement à partir de la premiere méthionine.

-la présence de régions composées de résidus très conservés par les homologues(du 45eme acide aminé au 99eme acide aminé).

-la présence du premier acide aminé de notre protéine en 7eme position de notre séquence de base,ce qui confirme les résultats obtenus lors du BLAST.Notre ORF contient une région codante qui débute bien au niveau du 354eme nucléotide de notre séquence de départ.On peut dire que notre ORF est trop long en 5'.

-l'émergence de notre séquence au sein du groupe d'étude choisi.


La région conservée mise en evidence grâce à notre alignement multiple pourrait être une région fonctionnelle de la protéine.Comme notre séquence ne possédait pas de domaines protéiques conservés mais seulement une région transmembranaire,on peut penser que cette région fortement conservée est la région transmembranaire.


RÉSULTATS BRUTS:

CLUSTAL 2.0.12 multiple sequence alignment


Prochlo11        -MNRNRNRVALSLTLLGLVGISLSATAAQSATTDAASKGAQIYCFMRSNGNNHEVSWTAS 59
Prochlo12        -MNRNRNRVALSLTLLGLVGISLSATAAQSATTDAASKGAQIYCFMRSNGNNHEVSWTAS 59
chrooco4         -MARNRTRSLLTLSLAGLCLSSLLPLNARAADP-TPNKGAQVYCFMRSNGNNHNVSWEAS 58
chrooco2         -MASLPMRLALLLPMAGMLWS---AAPARAAANGPAGKGAQVYCYMRSNGNNHNVSWEAS 56
chrooco1         -MG---------------------GTQPVQAGQQSEDKGAKIYCFMRSSGNDHSVSWNAA 38
chrooco6         -MGP--IRSSLVLSAAALIGAFSSVTPALQAAEPTEDKGAKIYCYLRSSGNNHKVSWNAA 57
chrooco5         -MLR--STAQRILCSAGVIVGLLCGSSTAWAGTDTEEKGAQVYCFMRSSGNAHDVSWNAA 57
chrooco3         -MP---ALLLLASPLPLLSQPTRLAQVSQPDPSDPGNKGAEVYCFMRKAGNDHEVSWTAA 56
Prochlo9         -----MSLGIKRNLLPISIICLACGSTLGLRINAAVTNGADIYCFMRNGGNTHEPSWQAA 55
Prochlo10        -----MSFGIKRNLLPISIICLVCGSTLGLRINAAVTNGADIYCFMRNGGNTHEPSWEAA 55
Prochlo13        ---------------------------------------------MRNGGNDHASSWLAA 15
Prochlo8         -MLKKDNFMTIPVSIGFLTAVNLITAPIG---LAGAGIGVDIYCVMRQGGNDHEASWRAA 56
Prochlo1         ------MQSLKNKKLILISFGVFTPLIIINAKVNASSFGAEIFCTMRDGGNDHESSWDAA 54
Prochlo2         ------MQRFKEKKLILLALGVFTPLILTNTKVNASSFGAEIFCTMREGGNDHESSWDAA 54
GOS_1103010      IEGKSSMQRLTKKKLIPLAFVIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAA 60
Prochlo3         ------MQRLKQKK-IVLTLGLLTPLVLTASKVNAGSFGAEIFCTMRDGGNDHESSWDAA 53
Prochlo4         ------MKRLKQKK-IVLTLGLLTPLVLTTSKINAGSFGAEIFCTMREGGNDHESSWDAA 53
Prochlo6         ------MKRFKQKKQIFLILSILMPLALSTFKVHAGSFAAEIFCTMRDGGNDHESSWEAA 54
Prochlo5         ------MKRCIKVKLLLPIVAIFVPTLLFIPKASAGSFGAEIFCTMRDGGNDHESSWQSA 54
Prochlo7         ------MKGHKKIRFIFPLVAMYVPLLLLAPKAIAGSFGAEIFCTMRDGGNDHESSWQAA 54
                                                              :*. ** *  ** ::

Prochlo11        YALIKRQGNSLFKTSPKHAAVLITEAVVNEPSNYPNCGQYLGDLYGGN-KGSSSGADQVS 118
Prochlo12        YALIKRQGNSLFKTSPNHAAVLITEAVVNEPSSYPNCGQYLGDLFGNS-KNSLSVADQES 118
chrooco4         YALIKRQKSGMFKTSPEHAAVMITEAVVNDPGSYPECGRYLGDLFAPK-KSSASSSTQSS 117
chrooco2         YALIKRQGSGLFKTSPEHAAVMITEAVVEDPGSFPDCGQYLGDLFGGSGRASASTNTTSS 116
chrooco1         YAVIKRQGGQLFKTSPEHASVMITEAVVQDPGNFPDCGRFLGDLFGGSPNKASITSLGTS 98
chrooco6         YAVIKRQGRSMFKTSPEHASVMITEAVVNDPGNFPDCGQFLGDLFGGNTQPATAATLGKS 117
chrooco5         YALIKRQSRGLFKTSPEHASVMITEAVVKDPGTFPDCGQFLGDLFGGATT-ATAASLGST 116
chrooco3         YALIKRQSASLFKTSPEHAAVMITEAVVKSPDAFPDCGRFIGALYGSEKPAPLRTDIPAS 116
Prochlo9         YQFIKNKKQGLFKTSPKQAASLIVEEVVQNPTKYEDCINYLGDLYTGESSSIGVNNEKDL 115
Prochlo10        YQFIKNKKQGLFKTSPKQAASLIVEEVVQNPTKYEDCINYLGDLYTGESSSIGGNNDKDL 115
Prochlo13        YQSLKNERGGLFKISPRQAATIIVQQVVGSPDTYKDCIQHLGDLYP--------KNEEDL 67
Prochlo8         YESIKNQKPGLFKTSPKQAAAMIVEAVVREPERFDGCISYLGDLYPKPLKAENNNISIGE 116
Prochlo1         YTYIKKQKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEEKR 114
Prochlo2         YSYIKKQKGGFFKVSPKNAAAQITETVIREKEQFTYCVEYLDNLHPNRKLIRDLEKEEKR 114
GOS_1103010      YTYIKKQKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKR 120
Prochlo3         YTYIKKQKGGFFKVSPKQAAAQITESVIRDRETFSYCVEYLDNLHPNRKLIRDLKKEEER 113
Prochlo4         YTYIKKQKGGFFKVSPKQAAAQITESVIRDRETFSYCVEYLDNLHPNRKLIRDLKKEEER 113
Prochlo6         YTYIKKQKGGIFKVSPKQAASQITESVIRDKETFSYCVEYLDKLHPNRKLLRELEKEEER 114
Prochlo5         YSYIKKQKGGLFKTSPKQAAGQIIETVVRERDKFSYCVEYLDQLHPDRKLQMENNRKEKR 114
Prochlo7         YSYIKKQKGGIFKTSPKQAAGQIIETVVRERDKFSYCVEFLDQLHPDRKLQLENDRKEKR 114
                 *  :*.:   :** **.:*:  * : *: .   :  *  .:. *.               

Prochlo11        GDETVIDSYSSGNTNTTTPSSTDHE----------QHYSY 148
Prochlo12        GDETVIDSYSSGNTNTTTPSSTDHE----------QHYSY 148
chrooco4         ----------------TSTSPSYGE----------QRYSY 131
chrooco2         ------------SSDSSEIPNWDAD----------DRYSY 134
chrooco1         ------------TTDTTNSESNSVD---------DERYSY 117
chrooco6         ------------STISESTIESTDD---------TTRYSY 136
chrooco5         ------------STPTQTNTSFSSDGYA---ASEAERYSY 141
chrooco3         G-----------STGPVPIPSGGGTTR-------NDRYSY 138
Prochlo9         ------------TSEVTSPSDSAEKTPK---GKYVDRYSY 140
Prochlo10        ------------TSEVTSSSHSAEKTPK---GKYVDRYSY 140
Prochlo13        ------------EGNVE-----EKKVNK---GYVEDRYSY 87
Prochlo8         ------------EENNNTSKENYAK----------DRYSY 134
Prochlo1         KEKEARDIENKRIKLEKELEETNKAISDEFTDETLDRYSY 154
Prochlo2         KEKEAQDRENKRMKLEKELEETNKEIS----DETLDRYSY 150
GOS_1103010      KEKEAIDRENKRKRLKKELEEANEEISEEFTDETLDRYSY 160
Prochlo3         KEKEAQEKEKKRRKLEKELEEANEDFS----EESIDRYSY 149
Prochlo4         KEKEAQEKEKKRKKLEKELEEANEDFS----EESIDRYSY 149
Prochlo6         KEK--------------ELEETNEDFS----EETIERYSY 136
Prochlo5         KKQE-----------ERLREKENINYS----EESFDRYSY 139
Prochlo7         RKKE-----------ELLQDKENEDYS----KETFDRYSY 139
                                                     :***

Protein Domains

PROTOCOLE:


a)recherche de domaines protéiques conservés sur le site interproscan avec les paramètres par défaut

b)recherche de domaines protéiques conservés sur le site prosite avec les paramètres par défaut

c)recherche de domaines protéiques conservés sur le site pFam avec les paramètres par défaut




ANALYSE DES RÉSULTATS:


a,b et c)Notre séquence ne semble pas présenter de domaines protéiques conservés chez d'autres protéines, donc à cette étape de l'annotation de notre séquence on ne peut déterminer de fonction associée à notre protéine. Cependant notre recherche dans Interpro nous renseigne sur des domaines structuraux de notre protéine. Celle-ci présente des régions transmembranaires. Ceci nous laisse suggérer que cette protéine se situe au niveau d'une membrane.

RÉSULTATS BRUTS:

a)Sequence_1	F4B0A50C0A1C2D4A	160	TMHMM	tmhmm	transmembrane_regions	15	35	NA	?	23-Oct-2009	NULL	NULL
Sequence_1	F4B0A50C0A1C2D4A	160	SignalPHMM	SignalP	signal-peptide	1	35	NA	?	23-Oct-2009	NULL	NULL

b)Hits for all PROSITE (release 20.55) motifs on sequence USERSEQ1 : 


no hit!

c)Pfam HMM search results, glocal+local alignments merged (Pfam_ls+Pfam_fs) 
[Go here for an explanation of the format of the results] 


[No hits in Pfam]

Phylogeny

PROTOCOLE:

a) Phylogeny.fr / méthode BioNJ / groupe extérieur: Chroococcales

b) Phylogeny.fr / méthode PhyML / pas de bootstrap / default substitution model / groupe extérieur: Chroococcales


ANALYSE DES RÉSULTATS:

a et b)-On distingue bien une séparation entre notre groupe d'étude et notre groupe extérieur.

-On peut par ailleurs remarquer que notre séquence émerge au sein de notre groupe d'étude donc le groupe d'étude choisi semble une nouvelle fois cohérent. On peut donc conclure que notre séquence provient d'une cyanobactérie,et plus précisément d'une Prochlorolales.

En outre, on constate la présence de deux séquences prochlorales au sein du sous-groupe des Chroococcales qui constituent notre groupe extérieur. On peut penser que ces deux séquences présentent des régions acquises par transfert latéral. Ce fait était déja observable grâce au résultat du Blast p contre nr dans lequel ces mêmes séquences émergeaient au sein du groupe extérieur. En effet elles présentaient des E-values comparables aux séquences du groupe extérieur,plus faibles que celles du groupe d'étude.

-L'arbre obtenu par la méthode des distances est cohérent avec l'arbre produit par la méthode de maximun de vraissemblance.En effet on observe les mêmes faits.La seule différence entre ces deux arbres est que pour le premier on trouve un ancêtre commun de notre séquence et la séquence prochlo1 seulement alors que dans le second on trouve un ancêtre commun de notre séquence et des séquences prochlo1 et 2.


RÉSULTATS BRUTS:
a) 


            +----------------Prochlo8_gi_159902574_ref_YP_001549918.1_type_II_secretion_syste
            |
      +-----+                                +--Prochlo9_gi_124024744_ref_YP_001013860.1_type_II_secretion_syste
      |     |         +----------------------+
      |     |         |                      +-Prochlo10_gi_72383196_ref_YP_292551.1_hypothetical_protein_PMN2A
      |     +---------+
      |               +---------------------------------Prochlo13_gi_33239485_ref_NP_874427.1_hypothetical_protein_Pro00
      |
      |
      |                                        +-Prochlo3_gi_254525422_ref_ZP_05137474.1_conserved_hypothetical_p
      |                                      +-+
 +----+                                 +----+ +--Prochlo4_gi_157412369_ref_YP_001483235.1_type_II_secretion_syste
 |    |                                 |    |
 |    |                                 |    +--------Prochlo6_gi_78778417_ref_YP_396529.1_type_II_secretion_system_pr
 |    |                                 |
 |    |                         +-------+   +GOS_1103010_Traduction_354-815_sens_direct
 |    |                         |       |+--+
 |    |                         |       ||  +Prochlo1_gi_123967568_ref_YP_001008426.1_type_II_secretion_syste
 |    |                         |       ++
 |    +-------------------------+        +----------Prochlo2_gi_126695369_ref_YP_001090255.1_type_II_secretion_syste
 |                              |
 |                              |
 |                              |        +---Prochlo5_gi_123965266_ref_YP_001010347.1_type_II_secretion_syste
 |                              +--------+
 |                                       +---Prochlo7_gi_33860592_ref_NP_892153.1_type_II_secretion_system_pr
 |
 |                            +------------------chrooco3_gi_87301589_ref_ZP_01084429.1_hypothetical_protein_WH57
 |                            |
 |                          +-+       +------chrooco5_gi_33864576_ref_NP_896135.1_hypothetical_protein_SYNW00
 |                          | |       |
 |                          | +-------+     +-----chrooco1_gi_78183619_ref_YP_376053.1_hypothetical_protein_Syncc9
 |                          |         +-----+
 |                          |               +-----------chrooco6_gi_78211595_ref_YP_380374.1_hypothetical_protein_Syncc9
 +--------------------------+
                            |
                            |                 +-Prochlo11_gi_33862311_ref_NP_893871.1_penicillin_amidase_Prochlo
                            |    +------------+
                            |    |            +---Prochlo12_gi_124021753_ref_YP_001016060.1_penicillin_amidase_Pro
                            +----+
                                 |       +--------chrooco4_gi_116074315_ref_ZP_01471577.1_hypothetical_protein_RS9
                                 +-------+
                                         +----chrooco2_gi_148238377_ref_YP_001223764.1_hypothetical_protein_Sy



b)


   
                                    +-Prochlo5_gi_123965266_ref_YP_001010347.1_type_II_secretion_syste
                                 +--+
                                 |  +--Prochlo7_gi_33860592_ref_NP_892153.1_type_II_secretion_system_pr
                                 |
                                 |          +Prochlo3_gi_254525422_ref_ZP_05137474.1_conserved_hypothetical_p
                                 |          |
            +--------------------+          |--Prochlo4_gi_157412369_ref_YP_001483235.1_type_II_secretion_syste
            |                    |      +---+
            |                    |      |   |
            |                    |      |   +------Prochlo6_gi_78778417_ref_YP_396529.1_type_II_secretion_system_pr
            |                    +------+
            |                           |+GOS_1103010_Traduction_354-815_sens_direct
            |                           ||
            |                           ++Prochlo1_gi_123967568_ref_YP_001008426.1_type_II_secretion_syste
 +----------+                            |
 |          |                            +-------Prochlo2_gi_126695369_ref_YP_001090255.1_type_II_secretion_syste
 |          |
 |          |                         +Prochlo9_gi_124024744_ref_YP_001013860.1_type_II_secretion_syste
 |          |            +------------+
 |          |            |            +-Prochlo10_gi_72383196_ref_YP_292551.1_hypothetical_protein_PMN2A
 |          |   +--------+
 |          |   |        |
 |          +---+        +------------------------------Prochlo13_gi_33239485_ref_NP_874427.1_hypothetical_protein_Pro00
 |              |
 |              +-----------Prochlo8_gi_159902574_ref_YP_001549918.1_type_II_secretion_syste
 |
 |                      +---------------chrooco3_gi_87301589_ref_ZP_01084429.1_hypothetical_protein_WH57
 |                      |
 |                      |       +--chrooco5_gi_33864576_ref_NP_896135.1_hypothetical_protein_SYNW00
 +----------------------+       |
                        |   +---+    +------chrooco1_gi_78183619_ref_YP_376053.1_hypothetical_protein_Syncc9
                        |   |   +----+
                        |   |        +-----chrooco6_gi_78211595_ref_YP_380374.1_hypothetical_protein_Syncc9
                        +---+
                            |
                            |          +chrooco2_gi_148238377_ref_YP_001223764.1_hypothetical_protein_Sy
                            +----------+
                                       | +-----chrooco4_gi_116074315_ref_ZP_01471577.1_hypothetical_protein_RS9
                                       +-+
                                         |           +--Prochlo11_gi_33862311_ref_NP_893871.1_penicillin_amidase_Prochlo
                                         +-----------+
                                                     +-Prochlo12_gi_124021753_ref_YP_001016060.1_penicillin_amidase_Pro

Taxonomy report

PROTOCOLE:

Rapport taxonomique trouvé grâce au Blast p contre nr sur NCBI



ANALYSE DES RÉSULTATS:

On peut voir d'après notre rapport taxonomique que notre proteine semblerait appartenir au groupe taxonomique des Cyanobactéries. En effet, lors de notre première étude sur le Blast p contre NR sur NCBI, nous avions déterminé un seuil d'E-Value de 8e-10 associé à un seuil de score de 66.6. Nous nous sommes servies de ce seuil de score pour établir le groupe taxonomique. Ce dernier comprend tous les homologues dont la valeur de score est supèrieure à 66.6. Ces homologues appartiennent tous au groupe des Cyanobactéries, on peut affirmer que notre proteine appartient à ce même groupe.

Cependant, à ce rang taxonomique, notre groupe extérieur est aussi inclus dans le groupe des Cyanobactéries, étant donné que les séquences sélectionnées dans les groupes d'étude et extérieur sont des homologues, c'est à dire au dessus du score seuil déterminé précedemment. Nous devons donc affiner les limites de notre groupe d'étude. Nous avons pour cela consulté la fiche de chaque homologue, ainsi nous avons pu distinguer plusieurs sous-groupes à l'intérieur du groupe taxonomique des Cyanobactéries.

Nous avons défini notre groupe d'étude comme étant le groupe des Prochlorales. Il contient les 13 premières séquences de notre rapport taxonomique représentant les homologues appartenant au même groupe taxonomique que notre ORF.


On définit alors notre groupe extérieur par les homologues les plus proches n'appartenant pas au groupe d'étude, c'est à dire comme étant le groupe des Chroococcales.



Groupe d'étude: Prochlorales


ref|YP_001008426.1| 6e-65 Prochlorococcus marinus str. AS9601 [Prochlorales]


ref|YP_001090255.1| 1e-61 Prochlorococcus marinus str. MIT 9301 [Prochlorales]


ref|ZP_05137474.1| 1e-49 Prochlorococcus marinus str. MIT 9202 [Prochlorales]


ref|YP_001483235.1| 1e-47 Prochlorococcus marinus str. MIT 9215 [Prochlorales]


ref|YP_001010347.1| 2e-42 Prochlorococcus marinus str. MIT 9515 [Prochlorales]


ref|YP_396529.1| 4e-39 Prochlorococcus marinus str. MIT 9312 [Prochlorales]


ref|NP_892153.1| 1e-38 Prochlorococcus marinus subsp. pastoris str. CCMP1986 [Prochlorales]


ref|YP_001549918.1| 5e-21 Prochlorococcus marinus str. MIT 9211 [Prochlorales]


ref|YP_001013860.1| 1e-19 Prochlorococcus marinus str. NATL1A [Prochlorales]


ref|YP_292551.1| 3e-19 Prochlorococcus marinus str. NATL2A [Prochlorales]


ref|NP_893871.1| 2e-15 Prochlorococcus marinus str. MIT 9313 [Prochlorales]


ref|YP_001016060.1| 3e-15 Prochlorococcus marinus str. MIT 9303 [Prochlorales]


ref|NP_874427.1| 8e-12 Prochlorococcus marinus subsp. marinus str. CCMP1375 [Prochlorales]




Groupe extérieur : Chroococcales



ref|YP_376053.1| 2e-14 Synechococcus sp. CC9902 [Chroococcales]


ref|YP_001223764.1| 5e-14 Synechococcus sp. WH 7803 [Chroococcales]


ref|ZP_01084429.1| 1e-13 Synechococcus sp. WH 5701 [Chroococcales]


ref|ZP_01471577.1| 2e-13 Synechococcus sp. RS9916 [Chroococcales]


ref|NP_896135.1| 3e-13 Synechococcus sp. WH 8102 [Chroococcales]


ref|YP_380374.1| 2e-11 Synechococcus sp. CC9605 [Chroococcales]




RÉSULTATS BRUTS:

Lineage Report

cellular organisms
. Bacteria                [bacteria]
. . Cyanobacteria           [cyanobacteria]
. . . Prochlorococcus marinus [cyanobacteria]
. . . . Prochlorococcus marinus str. AS9601 -------------------  249 2 hits [cyanobacteria]     type II secretion system protein-like [Prochlorococcus mari
. . . . Prochlorococcus marinus str. MIT 9301 .................  238 2 hits [cyanobacteria]     type II secretion system protein-like protein [Prochlorococ
. . . . Prochlorococcus marinus str. MIT 9202 .................  199 2 hits [cyanobacteria]     conserved hypothetical protein [Prochlorococcus marinus str
. . . . Prochlorococcus marinus str. MIT 9215 .................  192 2 hits [cyanobacteria]     type II secretion system protein-like protein [Prochlorococ
. . . . Prochlorococcus marinus str. MIT 9515 .................  174 2 hits [cyanobacteria]     type II secretion system protein-like protein [Prochlorococ
. . . . Prochlorococcus marinus str. MIT 9312 .................  163 2 hits [cyanobacteria]     type II secretion system protein-like [Prochlorococcus mari
. . . . Prochlorococcus marinus subsp. pastoris str. CCMP1986 .  162 2 hits [cyanobacteria]     type II secretion system pr [Prochlorococcus marinus subsp.
. . . . Prochlorococcus marinus str. MIT 9211 .................  103 2 hits [cyanobacteria]     type II secretion system protein-like prrotein [Prochloroco
. . . . Prochlorococcus marinus str. NATL1A ...................   98 2 hits [cyanobacteria]     type II secretion system protein-like protein [Prochlorococ
. . . . Prochlorococcus marinus str. NATL2A ...................   97 2 hits [cyanobacteria]     hypothetical protein PMN2A_1359 [Prochlorococcus marinus st
. . . . Prochlorococcus marinus str. MIT 9313 .................   85 2 hits [cyanobacteria]     penicillin amidase [Prochlorococcus marinus str. MIT 9313] 
. . . . Prochlorococcus marinus str. MIT 9303 .................   84 2 hits [cyanobacteria]     penicillin amidase [Prochlorococcus marinus str. MIT 9303] 
. . . . Prochlorococcus marinus subsp. marinus str. CCMP1375 ..   73 2 hits [cyanobacteria]     hypothetical protein Pro0033 [Prochlorococcus marinus subsp
. . . Synechococcus sp. WH 7805 -------------------------------   85 2 hits [cyanobacteria]     hypothetical protein WH7805_09234 [Synechococcus sp. WH 780
. . . Synechococcus sp. WH 8109 ...............................   83 2 hits [cyanobacteria]     conserved hypothetical protein [Synechococcus sp. WH 8109] 
. . . Synechococcus sp. CC9902 ................................   82 2 hits [cyanobacteria]     hypothetical protein Syncc9902_0035 [Synechococcus sp. CC99
. . . Synechococcus sp. RCC307 ................................   80 2 hits [cyanobacteria]     hypothetical protein SynRCC307_0040 [Synechococcus sp. RCC3
. . . Synechococcus sp. WH 7803 ...............................   80 2 hits [cyanobacteria]     hypothetical protein SynWH7803_0041 [Synechococcus sp. WH 7
. . . Synechococcus sp. BL107 .................................   79 2 hits [cyanobacteria]     hypothetical protein BL107_06469 [Synechococcus sp. BL107] 
. . . Synechococcus sp. WH 5701 ...............................   79 2 hits [cyanobacteria]     hypothetical protein WH5701_02904 [Synechococcus sp. WH 570
. . . Synechococcus sp. RS9916 ................................   78 2 hits [cyanobacteria]     hypothetical protein RS9916_37732 [Synechococcus sp. RS9916
. . . Synechococcus sp. CC9311 ................................   78 4 hits [cyanobacteria]     penicillin amidase [Synechococcus sp. CC9311] >gi|113880804
. . . Synechococcus sp. WH 8102 ...............................   78 2 hits [cyanobacteria]     hypothetical protein SYNW0040 [Synechococcus sp. WH 8102] >
. . . Cyanobium sp. PCC 7001 ..................................   77 2 hits [cyanobacteria]     conserved hypothetical protein [Cyanobium sp. PCC 7001] >gi
. . . Synechococcus sp. RS9917 ................................   72 2 hits [cyanobacteria]     possible Penicillin amidase [Synechococcus sp. RS9917] >gi|
. . . Synechococcus sp. CC9605 ................................   71 2 hits [cyanobacteria]     hypothetical protein Syncc9605_0040 [Synechococcus sp. CC96
. . Corynebacterium glucuronolyticum ATCC 51867 ---------------   36 2 hits [high GC Gram+]     conserved hypothetical protein [Corynebacterium glucuronoly
. . Corynebacterium genitalium ATCC 33030 .....................   36 2 hits [high GC Gram+]     ribosome-binding factor A [Corynebacterium genitalium ATCC 
. . Beggiatoa sp. PS ..........................................   35 2 hits [g-proteobacteria]  cation transport ATPase [Beggiatoa sp. PS] >gi|152073642|gb
. . Corynebacterium accolens ATCC 49725 .......................   33 2 hits [high GC Gram+]     ribosome-binding factor A [Corynebacterium accolens ATCC 49
. . Corynebacterium amycolatum SK46 ...........................   33 2 hits [high GC Gram+]     ribosome-binding factor A [Corynebacterium amycolatum SK46]
. . Alkaliphilus metalliredigens QYMF .........................   33 2 hits [firmicutes]        signal transduction histidine kinase regulating citrate/mal
. Penicillium marneffei ATCC 18224 ----------------------------   38 2 hits [ascomycetes]       cytochrome P450, putative [Penicillium marneffei ATCC 18224
. Vitis vinifera (wine grape) .................................   36 2 hits [eudicots]          hypothetical protein [Vitis vinifera]
. Toxoplasma gondii ME49 ......................................   35 2 hits [apicomplexans]     hypothetical protein TGME49_023460 [Toxoplasma gondii ME49]
. Macaca mulatta (rhesus macaque) .............................   33 1 hit  [primates]          PREDICTED: v-ski sarcoma viral oncogene homolog [Macaca mul
. Talaromyces stipitatus ATCC 10500 ...........................   33 2 hits [ascomycetes]       5-oxo-L-prolinase, putative [Talaromyces stipitatus ATCC 10
. Trichomonas vaginalis G3 ....................................   33 2 hits [trichomonads]      hypothetical protein [Trichomonas vaginalis G3] >gi|1219042
. Phaeosphaeria nodorum SN15 ..................................   33 2 hits [ascomycetes]       hypothetical protein SNOG_03246 [Phaeosphaeria nodorum SN15

BLAST

PROTOCOLE:


a)Blast p de l'ORF considérée(de 154 acides aminés) contre nr sur le site NCBI avec une valeur de Max targets_1000

b)Blast p de l'ORF considérée(de 154 acides aminés) contre swissprot sur le site NCBI avec une valeur de Max targets_1000




ANALYSE DES RÉSULTATS:


a)La recherche de protéines homologues par BLAST contre nr nous montre que la séquence d'ORF considéree est homologue à de très nombreuses protéines provenant d'origines diverses. Cette recherche met aussi en évidence le fait que le premier acide aminé de notre séquence n'est pas le premier acide aminé de notre protéine étant donné que la comparaison de notre séquence avec les vrais positifs(E-value<10e-10) montre un alignement qui débute au septième acide aminé de notre séquence.On peut donc donner la position du premier nucléotide de notre ORF:(336+(7*3)-1_354).

On considère les vrais positifs comme étant ceux qui possèdent une E-value inférieure à 8e-10 car on observe un saut d'E-value important(de 8e-10 à 0.28)

Cependant cette recherche met en évidence une fonction possible de notre protéine étant donné qu'elle possède de fortes similarités avec un grand nombre de protéines impliquées dans le transport,la sécrétion. Nous avons pu déterminer cette fonction grâce à la consultation des fiches de banques des vrais positifs.


b)La recherche de protéines homologues par BLAST contre swissprot ne nous donne pas de protéines homologues vrais positifs. En effet les homologues trouvés ont une E-value trop élevée(supérieure ou égale à 0.86) pour les considérer comme des homologues vrais positifs.




RÉSULTATS BRUTS:

a)Blast p de l'ORF considérée(de 161aa) contre nr sur le site NCBI avec une valeur de Max targets=1000


 *résumé des similarités détectées
                                                                   Score     E
Sequences producing significant alignments:                       (Bits)  Value

ref|YP_001008426.1|  type II secretion system protein-like [Pr...   249    6e-65 Gene info
ref|YP_001090255.1|  type II secretion system protein-like pro...   238    1e-61 Gene info
ref|ZP_05137474.1|  conserved hypothetical protein [Prochloroc...   199    1e-49
ref|YP_001483235.1|  type II secretion system protein-like pro...   192    1e-47 Gene info
ref|YP_001010347.1|  type II secretion system protein-like pro...   174    2e-42 Gene info
ref|YP_396529.1|  type II secretion system protein-like [Proch...   163    4e-39 Gene info
ref|NP_892153.1|  type II secretion system pr [Prochlorococcus...   162    1e-38 Gene info
ref|YP_001549918.1|  type II secretion system protein-like prr...   103    5e-21 Gene info
ref|YP_001013860.1|  type II secretion system protein-like pro...  99.0    1e-19 Gene info
ref|YP_292551.1|  hypothetical protein PMN2A_1359 [Prochloroco...  97.8    3e-19 Gene info
ref|ZP_01124831.1|  hypothetical protein WH7805_09234 [Synecho...  85.1    2e-15
ref|NP_893871.1|  penicillin amidase [Prochlorococcus marinus ...  85.1    2e-15 Gene info
ref|YP_001016060.1|  penicillin amidase [Prochlorococcus marin...  84.3    3e-15 Gene info
ref|ZP_05789458.1|  conserved hypothetical protein [Synechococ...  84.0    4e-15
ref|YP_376053.1|  hypothetical protein Syncc9902_0035 [Synecho...  82.0    2e-14 Gene info
ref|YP_001226296.1|  hypothetical protein SynRCC307_0040 [Syne...  80.9    4e-14 Gene info
ref|YP_001223764.1|  hypothetical protein SynWH7803_0041 [Syne...  80.5    5e-14 Gene info
ref|ZP_01469040.1|  hypothetical protein BL107_06469 [Synechoc...  79.7    9e-14
ref|ZP_01084429.1|  hypothetical protein WH5701_02904 [Synecho...  79.3    1e-13
ref|ZP_01471577.1|  hypothetical protein RS9916_37732 [Synecho...  78.2    2e-13
ref|YP_729278.1|  penicillin amidase [Synechococcus sp. CC9311...  78.2    3e-13 Gene info
ref|NP_896135.1|  hypothetical protein SYNW0040 [Synechococcus...  78.2    3e-13 Gene info
ref|ZP_05044922.1|  conserved hypothetical protein [Cyanobium ...  77.0    5e-13
ref|NP_874427.1|  hypothetical protein Pro0033 [Prochlorococcu...  73.2    8e-12 Gene info
ref|ZP_01079161.1|  possible Penicillin amidase [Synechococcus...  72.8    1e-11
ref|YP_380374.1|  hypothetical protein Syncc9605_0040 [Synecho...  71.6    2e-11 Gene info
ref|YP_729929.1|  hypothetical protein sync_0711 [Synechococcu...  66.6    8e-10 Gene info
ref|XP_002152914.1|  cytochrome P450, putative [Penicillium ma...  38.1    0.28  Gene info
emb|CAN82959.1|  hypothetical protein [Vitis vinifera]             36.2    0.98 
ref|ZP_03919382.1|  conserved hypothetical protein [Corynebact...  36.2    0.98 
ref|ZP_05706995.1|  ribosome-binding factor A [Corynebacterium...  36.2    0.99 
ref|XP_002366032.1|  hypothetical protein TGME49_023460 [Toxop...  35.8    1.4   Gene info
ref|ZP_01999402.1|  cation transport ATPase [Beggiatoa sp. PS]...  35.0    2.3  
ref|XP_002274755.1|  PREDICTED: hypothetical protein [Vitis vi...  34.3    4.5   UniGene infoGene info
ref|XP_001086434.1|  PREDICTED: v-ski sarcoma viral oncogene h...  33.9    5.0   UniGene infoGene info
ref|XP_002478734.1|  5-oxo-L-prolinase, putative [Talaromyces ...  33.9    5.4   Gene info
ref|ZP_03933460.1|  ribosome-binding factor A [Corynebacterium...  33.5    6.6  
ref|XP_001321450.1|  hypothetical protein [Trichomonas vaginal...  33.1    8.4   Gene info
ref|XP_001793816.1|  hypothetical protein SNOG_03246 [Phaeosph...  33.1    8.8   Gene info
ref|ZP_03392878.1|  ribosome-binding factor A [Corynebacterium...  33.1    9.1  
ref|YP_001318504.1|  signal transduction histidine kinase regu...  33.1    9.8   Gene info

---------------------------------------------------------------------------------------------------

* les 10 premiers alignements 2 à 2 



>ref|YP_001008426.1| Gene info type II secretion system protein-like [Prochlorococcus marinus 
str. AS9601]
 gb|ABM69319.1| Gene info type II secretion system protein-like [Prochlorococcus marinus 
str. AS9601]
Length=154

 GENE ID: 4716713 A9601_00311 | type II secretion system protein-like
[Prochlorococcus marinus str. AS9601] (10 or fewer PubMed links)

 Score =  249 bits (636),  Expect = 6e-65, Method: Compositional matrix adjust.
 Identities = 128/154 (83%), Positives = 140/154 (90%), Gaps = 0/154 (0%)

Query  7    MQRLTKKKLIPLAFVIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKK  66
            MQ L  KKLI ++F +F PL + + +VNAS+FGAEIFCTMRDGGNDHESSWDAAYTYIKKcodon start 
Sbjct  1    MQSLKNKKLILISFGVFTPLIIINAKVNASSFGAEIFCTMRDGGNDHESSWDAAYTYIKK  60

Query  67   QKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEAI  126
            QKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKE+KRKEKEA 
Sbjct  61   QKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEEKRKEKEAR  120

Query  127  DRENKRKRLKKELEEANEEISEEFTDETLDRYSY  160
            D ENKR +L+KELEE N+ IS+EFTDETLDRYSY
Sbjct  121  DIENKRIKLEKELEETNKAISDEFTDETLDRYSY  154


>ref|YP_001090255.1| Gene info type II secretion system protein-like protein [Prochlorococcus 
marinus str. MIT 9301]
 gb|ABO16654.1| Gene info type II secretion system protein-like protein [Prochlorococcus 
marinus str. MIT 9301]
Length=150

 GENE ID: 4912266 P9301_00311 | type II secretion system protein-like protein
[Prochlorococcus marinus str. MIT 9301] (10 or fewer PubMed links)

 Score =  238 bits (608),  Expect = 1e-61, Method: Compositional matrix adjust.
 Identities = 124/154 (80%), Positives = 138/154 (89%), Gaps = 4/154 (2%)

Query  7    MQRLTKKKLIPLAFVIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKK  66
            MQR  +KKLI LA  +F PL LT+ +VNAS+FGAEIFCTMR+GGNDHESSWDAAY+YIKK
Sbjct  1    MQRFKEKKLILLALGVFTPLILTNTKVNASSFGAEIFCTMREGGNDHESSWDAAYSYIKK  60

Query  67   QKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEAI  126
            QKGG FKVSPKNAAAQITETVIRE+E+F+YCVEYLDNLHPNRKLIRDLEKE+KRKEKEA 
Sbjct  61   QKGGFFKVSPKNAAAQITETVIREKEQFTYCVEYLDNLHPNRKLIRDLEKEEKRKEKEAQ  120

Query  127  DRENKRKRLKKELEEANEEISEEFTDETLDRYSY  160
            DRENKR +L+KELEE N+EIS    DETLDRYSY
Sbjct  121  DRENKRMKLEKELEETNKEIS----DETLDRYSY  150


>ref|ZP_05137474.1|  conserved hypothetical protein [Prochlorococcus marinus str. 
MIT 9202]
 gb|EEE39299.1|  conserved hypothetical protein [Prochlorococcus marinus str. 
MIT 9202]
Length=149

 Score =  199 bits (505),  Expect = 1e-49, Method: Compositional matrix adjust.
 Identities = 114/154 (74%), Positives = 134/154 (87%), Gaps = 5/154 (3%)

Query  7    MQRLTKKKLIPLAFVIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKK  66
            MQRL +KK++ L   +  PL LT+ +VNA +FGAEIFCTMRDGGNDHESSWDAAYTYIKK
Sbjct  1    MQRLKQKKIV-LTLGLLTPLVLTASKVNAGSFGAEIFCTMRDGGNDHESSWDAAYTYIKK  59

Query  67   QKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEAI  126
            QKGG FKVSPK AAAQITE+VIR+RE FSYCVEYLDNLHPNRKLIRDL+KE++RKEKEA 
Sbjct  60   QKGGFFKVSPKQAAAQITESVIRDRETFSYCVEYLDNLHPNRKLIRDLKKEEERKEKEAQ  119

Query  127  DRENKRKRLKKELEEANEEISEEFTDETLDRYSY  160
            ++E KR++L+KELEEANE+ SE    E++DRYSY
Sbjct  120  EKEKKRRKLEKELEEANEDFSE----ESIDRYSY  149


>ref|YP_001483235.1| Gene info type II secretion system protein-like protein [Prochlorococcus 
marinus str. MIT 9215]
 gb|ABV49649.1| Gene info type II secretion system protein-like protein [Prochlorococcus 
marinus str. MIT 9215]
Length=149

 GENE ID: 5615414 P9215_00301 | type II secretion system protein-like protein
[Prochlorococcus marinus str. MIT 9215] (10 or fewer PubMed links)

 Score =  192 bits (487),  Expect = 1e-47, Method: Compositional matrix adjust.
 Identities = 111/154 (72%), Positives = 135/154 (87%), Gaps = 5/154 (3%)

Query  7    MQRLTKKKLIPLAFVIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKK  66
            M+RL +KK++ L   +  PL LT+ ++NA +FGAEIFCTMR+GGNDHESSWDAAYTYIKK
Sbjct  1    MKRLKQKKIV-LTLGLLTPLVLTTSKINAGSFGAEIFCTMREGGNDHESSWDAAYTYIKK  59

sp|Q4U2R1.2|HERC2_MOUSE  RecName: Full=Probable E3 ubiquitin-p...  29.3    9.4   Gene info


* les 10 premiers alignements 2 à 2

>sp|Q5R7W8.1|BT2A2_PONAB Gene info RecName: Full=Butyrophilin subfamily 2 member A2; Flags: Precursor Length=528 GENE ID: 100173224 BTN2A1 | butyrophilin, subfamily 2, member A1 [Pongo abelii] Score = 32.7 bits (73), Expect = 0.86, Method: Composition-based stats. Identities = 17/58 (29%), Positives = 37/58 (63%), Gaps = 2/58 (3%) Query 94 FSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEAIDRENKRKRLKKELE-EANEEISEEF 150 F+ C+ +++ L +K++ EKE +R+ +E +E +++R++KE E + E++ EE Sbjct 263 FAVCMYWINKLQKEKKILSG-EKEFERETREIAVKELEKERVQKEEELQVKEKLQEEL 319 >sp|P03186.1|DUB_EBVB9 RecName: Full=Ubiquitin thiolesterase BPLF1; AltName: Full=Large tegument protein; Short=LTP Length=3149 Score = 32.3 bits (72), Expect = 1.3, Method: Composition-based stats. Identities = 17/45 (37%), Positives = 25/45 (55%), Gaps = 6/45 (13%) Query 106 PNRKLIRDLEK------EKKRKEKEAIDRENKRKRLKKELEEANE 144 PN++L R EK E RKEKE + + ++R ++ EANE Sbjct 1393 PNKELKRQYEKKLRQLMETGRKEKEKLREQEDKERQERRAREANE 1437 >sp|Q5KDK3.1|ROK1_CRYNE RecName: Full=ATP-dependent RNA helicase ROK1 Length=620 Score = 31.6 bits (70), Expect = 2.1, Method: Composition-based stats. Identities = 13/38 (34%), Positives = 26/38 (68%), Gaps = 0/38 (0%) Query 112 RDLEKEKKRKEKEAIDRENKRKRLKKELEEANEEISEE 149 RDL +E +K+K+ ++ KRK L+++ + NEE +++ Sbjct 581 RDLNREAGKKKKQMVEASKKRKMLERKGKGGNEEKNDD 618 >sp|O73946.1|HELS_PYRFU RecName: Full=Putative ski2-type helicase Length=720 Score = 30.8 bits (68), Expect = 2.8, Method: Compositional matrix adjust. Identities = 16/43 (37%), Positives = 23/43 (53%), Gaps = 1/43 (2%) Query 43 FCTMRDGGNDHESSW-DAAYTYIKKQKGGLFKVSPKNAAAQIT 84 F T DG D SSW + Y I+K+KG L V+ + A ++ Sbjct 212 FVTWEDGSIDRFSSWEELVYDAIRKKKGALIFVNMRRKAERVA 254 >sp|Q7KYR7.3|BT2A1_HUMAN Gene info RecName: Full=Butyrophilin subfamily 2 member A1; Flags: Precursor Length=527 GENE ID: 11120 BTN2A1 | butyrophilin, subfamily 2, member A1 [Homo sapiens] (10 or fewer PubMed links)  Score = 30.8 bits (68), Expect = 3.0, Method: Composition-based stats. Identities = 16/55 (29%), Positives = 35/55 (63%), Gaps = 2/55 (3%) Query 97 CVEYLDNLHPNRKLIRDLEKEKKRKEKEAIDRENKRKRLKKELE-EANEEISEEF 150 C+ +++ L +K++ EKE +R+ +E +E +++R++KE E + E++ EE Sbjct 265 CIYWINKLQKEKKILSG-EKEFERETREIALKELEKERVQKEEELQVKEKLQEEL 318 >sp|Q75A17.1|TRM10_ASHGO RecName: Full=tRNA (guanine-N(1)-)-methyltransferase; AltName: Full=tRNA methyltransferase 10 Length=296 Score = 30.8 bits (68), Expect = 3.1, Method: Compositional matrix adjust. Identities = 18/33 (54%), Positives = 22/33 (66%), Gaps = 0/33 (0%) Query 118 KKRKEKEAIDRENKRKRLKKELEEANEEISEEF 150 K RKEK+ RE +R+RL+K LEE EI EE Sbjct 50 KIRKEKKQKAREQRRERLQKALEENGGEIPEEL 82 >sp|Q92F65.1|LDH1_LISIN RecName: Full=L-lactate dehydrogenase 1; Short=L-LDH 1 Length=313 Score = 30.0 bits (66), Expect = 5.5, Method: Compositional matrix adjust. Identities = 29/102 (28%), Positives = 46/102 (45%), Gaps = 17/102 (16%) Query 58 DAAYTYIKKQKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHP----------- 106 DAAY I K+ + V+ A A+IT+ ++ YLD + Sbjct 215 DAAYEIINKKGATFYGVAA--ALARITKAILNNENAILPLSVYLDGHYGMNDIYIGAPAV 272 Query 107 -NRKLIRDL-EKEKKRKEKEAIDRENKRKRLKKELEEANEEI 146 NR+ +R + E KEKE + +N LKK L++A ++I Sbjct 273 VNRQGVRHIVEMNLNDKEKEQM--KNSADTLKKVLDDAMKQI 312 >sp|P33380.2|LDH1_LISMO RecName: Full=L-lactate dehydrogenase 1; Short=L-LDH 1 sp|Q724K3.1|LDH1_LISMF Gene info RecName: Full=L-lactate dehydrogenase 1; Short=L-LDH 1 Length=313 Score = 30.0 bits (66), Expect = 6.1, Method: Compositional matrix adjust. Identities = 29/102 (28%), Positives = 46/102 (45%), Gaps = 17/102 (16%) Query 58 DAAYTYIKKQKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHP----------- 106 DAAY I K+ + V+ A A+IT+ ++ YLD + Sbjct 215 DAAYEIINKKGATFYGVAA--ALARITKAILNNENAILPLSVYLDGHYGMNDIYIGAPAV 272 Query 107 -NRKLIRDL-EKEKKRKEKEAIDRENKRKRLKKELEEANEEI 146 NR+ +R + E KEKE + +N LKK L++A ++I Sbjct 273 VNRQGVRHIVEMNLNDKEKEQM--KNSADTLKKVLDDAMKQI 312 >sp|C3PH18.1|RBFA_CORA7 RecName: Full=Ribosome-binding factor A Length=147 Score = 29.6 bits (65), Expect = 7.2, Method: Compositional matrix adjust. Identities = 19/79 (24%), Positives = 34/79 (43%), Gaps = 0/79 (0%) Query 26 LTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKKQKGGLFKVSPKNAAAQITE 85 +T+T RV A +F T+R E +D A + + KG L K+ + + T Sbjct 34 VTITDARVTGDLHDATVFYTVRGTDIGTEPDYDQAAEALTRAKGQLRKIVGDELSVRFTP 93 Query 86 TVIREREKFSYCVEYLDNL 104 T+ E + +++ L Sbjct 94 TLSFELDTVPEASAHMEEL 112 >sp|Q6NGN3.1|RBFA_CORDI RecName: Full=Ribosome-binding factor A Length=147 Score = 29.3 bits (64), Expect = 8.5, Method: Compositional matrix adjust. Identities = 22/90 (24%), Positives = 41/90 (45%), Gaps = 1/90 (1%) Query 26 LTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKKQKGGLFKVSPKNAAAQITE 85 +T+T RV A ++ T+R D + AA +++ +G L K+ + + T Sbjct 34 VTVTDTRVTGDLHDATVYYTVRGRTIDDQPDLKAAAEALQRARGQLRKIVGDQLSVRFTP 93 Query 86 TVIREREKFSYCVEYLDNLHPNRKLIRDLE 115 T+ E + ++++L R RDLE Sbjct 94 TLSFELDTVPETSAHMEDLLA-RARARDLE 122 >sp|B9KCH0.1|DNAK_CAMLR Gene info RecName: Full=Chaperone protein dnaK; AltName: Full=Heat shock protein 70; AltName: Full=Heat shock 70 kDa protein; AltName: Full=HSP70 Length=622 GENE ID: 7410515 dnaK | chaperone and heat shock protein 70 [Campylobacter lari RM2100] (10 or fewer PubMed links)  Score = 29.3 bits (64), Expect = 8.5, Method: Compositional matrix adjust. Identities = 16/46 (34%), Positives = 29/46 (63%), Gaps = 2/46 (4%) Query 110 LIRD--LEKEKKRKEKEAIDRENKRKRLKKELEEANEEISEEFTDE 153 +++D L KE+ RK KEA++ N L ++E++ E+ E+ +DE Sbjct 509 MVKDAELHKEEDRKRKEAVEARNSADSLVHQVEKSLSELGEKVSDE 554 >sp|A5DP36.2|PAN1_PICGU RecName: Full=Actin cytoskeleton-regulatory complex protein PAN1 Length=1440 Score = 29.3 bits (64), Expect = 9.3, Method: Composition-based stats. Identities = 14/34 (41%), Positives = 25/34 (73%), Gaps = 3/34 (8%) Query 112 RDLEKEKKRKEKEAIDRENKRKRLKKELEEANEE 145 +++E+ + RK+KE +E + RLK+E+EE N+E Sbjct 1040 QEMEERRLRKKKE---KEERLARLKREMEEMNKE 1070 >sp|Q4U2R1.2|HERC2_MOUSE Gene info RecName: Full=Probable E3 ubiquitin-protein ligase HERC2; AltName: Full=HECT domain and RCC1-like domain-containing protein 2 Length=4836 GENE ID: 15204 Herc2 | hect (homologous to the E6-AP (UBE3A) carboxyl terminus) domain and RCC1 (CHC1)-like domain (RLD) 2 [Mus musculus] (Over 10 PubMed links)  Score = 29.3 bits (64), Expect = 9.4, Method: Composition-based stats. Identities = 14/35 (40%), Positives = 23/35 (65%), Gaps = 0/35 (0%) Query 108 RKLIRDLEKEKKRKEKEAIDRENKRKRLKKELEEA 142 +K+IR+ K++ K+ E+ID E K + +LEEA Sbjct 1549 QKIIRERRKKRVPKKPESIDSEEKIGNEESDLEEA 1583 
Query  67   QKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEAI  126
            QKGG FKVSPK AAAQITE+VIR+RE FSYCVEYLDNLHPNRKLIRDL+KE++RKEKEA 
Sbjct  60   QKGGFFKVSPKQAAAQITESVIRDRETFSYCVEYLDNLHPNRKLIRDLKKEEERKEKEAQ  119

Query  127  DRENKRKRLKKELEEANEEISEEFTDETLDRYSY  160
            ++E KRK+L+KELEEAN    E+F++E++DRYSY
Sbjct  120  EKEKKRKKLEKELEEAN----EDFSEESIDRYSY  149


>ref|YP_001010347.1| Gene info type II secretion system protein-like protein [Prochlorococcus 
marinus str. MIT 9515]
 gb|ABM71240.1| Gene info type II secretion system protein-like protein [Prochlorococcus 
marinus str. MIT 9515]
Length=139

 GENE ID: 4719862 P9515_00311 | type II secretion system protein-like protein
[Prochlorococcus marinus str. MIT 9515] (10 or fewer PubMed links)

 Score =  174 bits (441),  Expect = 2e-42, Method: Compositional matrix adjust.
 Identities = 90/154 (58%), Positives = 109/154 (70%), Gaps = 15/154 (9%)

Query  7    MQRLTKKKLIPLAFVIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKK  66
            M+R  K KL+     IF P  L  P+ +A +FGAEIFCTMRDGGNDHESSW +AY+YIKK
Sbjct  1    MKRCIKVKLLLPIVAIFVPTLLFIPKASAGSFGAEIFCTMRDGGNDHESSWQSAYSYIKK  60

Query  67   QKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEAI  126
            QKGGLFK SPK AA QI ETV+RER+KFSYCVEYLD LHP+RK    L+ E  RKEK   
Sbjct  61   QKGGLFKTSPKQAAGQIIETVVRERDKFSYCVEYLDQLHPDRK----LQMENNRKEK---  113

Query  127  DRENKRKRLKKELEEANEEISEEFTDETLDRYSY  160
             R+ + +RL +E E  N      +++E+ DRYSY
Sbjct  114  -RKKQEERL-REKENIN------YSEESFDRYSY  139


>ref|YP_396529.1| Gene info type II secretion system protein-like [Prochlorococcus marinus 
str. MIT 9312]
 gb|ABB49093.1| Gene info type II secretion system protein-like protein [Prochlorococcus 
marinus str. MIT 9312]
Length=136

 GENE ID: 3764813 PMT9312_0032 | type II secretion system protein-like
[Prochlorococcus marinus str. MIT 9312]

 Score =  163 bits (413),  Expect = 4e-39, Method: Compositional matrix adjust.
 Identities = 85/154 (55%), Positives = 110/154 (71%), Gaps = 18/154 (11%)

Query  7    MQRLTKKKLIPLAFVIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKK  66
            M+R  +KK I L   I  PL L++ +V+A +F AEIFCTMRDGGNDHESSW+AAYTYIKK
Sbjct  1    MKRFKQKKQIFLILSILMPLALSTFKVHAGSFAAEIFCTMRDGGNDHESSWEAAYTYIKK  60

Query  67   QKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEAI  126
            QKGG+FKVSPK AA+QITE+VIR++E FSYCVEYLD LHPNRK                 
Sbjct  61   QKGGIFKVSPKQAASQITESVIRDKETFSYCVEYLDKLHPNRK-----------------  103

Query  127  DRENKRKRLKKELEEANEEISEEFTDETLDRYSY  160
                + ++ ++  E+  EE +E+F++ET++RYSY
Sbjct  104  -LLRELEKEEERKEKELEETNEDFSEETIERYSY  136


>ref|NP_892153.1| Gene info type II secretion system pr [Prochlorococcus marinus subsp. pastoris 
str. CCMP1986]
 emb|CAE18491.1| Gene info possible Bacterial type II secretion system pr [Prochlorococcus 
marinus subsp. pastoris str. CCMP1986]
Length=139

 GENE ID: 1725752 PMM0032 | type II secretion system pr
[Prochlorococcus marinus subsp. pastoris str. CCMP1986]
(10 or fewer PubMed links)

 Score =  162 bits (410),  Expect = 1e-38, Method: Compositional matrix adjust.
 Identities = 83/148 (56%), Positives = 107/148 (72%), Gaps = 20/148 (13%)

Query  15   LIPLAFVIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKKQKGGLFKV  74
            + PL   ++ PL L +P+  A +FGAEIFCTMRDGGNDHESSW AAY+YIKKQKGG+FK 
Sbjct  10   IFPLV-AMYVPLLLLAPKAIAGSFGAEIFCTMRDGGNDHESSWQAAYSYIKKQKGGIFKT  68

Query  75   SPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEAI--DRENKR  132
            SPK AA QI ETV+RER+KFSYCVE+LD LHP+RKL  + ++++KR++KE +  D+EN  
Sbjct  69   SPKQAAGQIIETVVRERDKFSYCVEFLDQLHPDRKLQLENDRKEKRRKKEELLQDKEN--  126

Query  133  KRLKKELEEANEEISEEFTDETLDRYSY  160
                           E+++ ET DRYSY
Sbjct  127  ---------------EDYSKETFDRYSY  139


>ref|YP_001549918.1| Gene info type II secretion system protein-like prrotein [Prochlorococcus 
marinus str. MIT 9211]
 gb|ABX07964.1| Gene info type II secretion system protein-like prrotein [Prochlorococcus 
marinus str. MIT 9211]
Length=134

 GENE ID: 5731727 P9211_00331 | type II secretion system protein-like prrotein
[Prochlorococcus marinus str. MIT 9211] (10 or fewer PubMed links)

 Score =  103 bits (258),  Expect = 5e-21, Method: Compositional matrix adjust.
 Identities = 54/115 (46%), Positives = 66/115 (57%), Gaps = 12/115 (10%)

Query  21   VIFAPLTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKKQKGGLFKVSPKNAA  80
            +I AP+ L       +  G +I+C MR GGNDHE+SW AAY  IK QK GLFK SPK AA
Sbjct  22   LITAPIGLA-----GAGIGVDIYCVMRQGGNDHEASWRAAYESIKNQKPGLFKTSPKQAA  76

Query  81   AQITETVIREREKFSYCVEYLDNLHP-------NRKLIRDLEKEKKRKEKEAIDR  128
            A I E V+RE E+F  C+ YL +L+P       N   I + E     KE  A DR
Sbjct  77   AMIVEAVVREPERFDGCISYLGDLYPKPLKAENNNISIGEEENNNTSKENYAKDR  131


>ref|YP_001013860.1| Gene info type II secretion system protein-like protein [Prochlorococcus 
marinus str. NATL1A]
 gb|ABM74595.1| Gene info type II secretion system protein-like protein [Prochlorococcus 
marinus str. NATL1A]
Length=140

 GENE ID: 4780429 NATL1_00311 | type II secretion system protein-like protein
[Prochlorococcus marinus str. NATL1A] (10 or fewer PubMed links)

 Score = 99.0 bits (245),  Expect = 1e-19, Method: Compositional matrix adjust.
 Identities = 55/155 (35%), Positives = 83/155 (53%), Gaps = 16/155 (10%)

Query  7    MQRLTKKKLIPLAFVIFAPLTLTSPRVNASAF-GAEIFCTMRDGGNDHESSWDAAYTYIK  65
            M    K+ L+P++ +  A  +    R+NA+   GA+I+C MR+GGN HE SW AAY +IK
Sbjct  1    MSLGIKRNLLPISIICLACGSTLGLRINAAVTNGADIYCFMRNGGNTHEPSWQAAYQFIK  60

Query  66   KQKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEA  125
             +K GLFK SPK AA+ I E V++   K+  C+ YL +L+                E  +
Sbjct  61   NKKQGLFKTSPKQAASLIVEEVVQNPTKYEDCINYLGDLY--------------TGESSS  106

Query  126  IDRENKRKRLKKELEEANEEISEEFTDETLDRYSY  160
            I   N+ K L  E+   ++   +    + +DRYSY
Sbjct  107  IGVNNE-KDLTSEVTSPSDSAEKTPKGKYVDRYSY  140


>ref|YP_292551.1| Gene info hypothetical protein PMN2A_1359 [Prochlorococcus marinus str. 
NATL2A]
 gb|AAZ58848.1| Gene info conserved hypothetical protein [Prochlorococcus marinus str. 
NATL2A]
Length=140

 GENE ID: 3606754 PMN2A_1359 | hypothetical protein
[Prochlorococcus marinus str. NATL2A] (10 or fewer PubMed links)

 Score = 97.8 bits (242),  Expect = 3e-19, Method: Compositional matrix adjust.
 Identities = 54/155 (34%), Positives = 82/155 (52%), Gaps = 16/155 (10%)

Query  7    MQRLTKKKLIPLAFVIFAPLTLTSPRVNASAF-GAEIFCTMRDGGNDHESSWDAAYTYIK  65
            M    K+ L+P++ +     +    R+NA+   GA+I+C MR+GGN HE SW+AAY +IK
Sbjct  1    MSFGIKRNLLPISIICLVCGSTLGLRINAAVTNGADIYCFMRNGGNTHEPSWEAAYQFIK  60

Query  66   KQKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEA  125
             +K GLFK SPK AA+ I E V++   K+  C+ YL +L+                E  +
Sbjct  61   NKKQGLFKTSPKQAASLIVEEVVQNPTKYEDCINYLGDLY--------------TGESSS  106

Query  126  IDRENKRKRLKKELEEANEEISEEFTDETLDRYSY  160
            I   N  K L  E+  ++    +    + +DRYSY
Sbjct  107  IGGNND-KDLTSEVTSSSHSAEKTPKGKYVDRYSY  140

---------------------------------------------------------------------------------------------------


b)Blast p de l'ORF considérée(de 161aa) contre swissprot sur le site NCBI avec une valeur de Max targets=1000


 *résumé des similarités détectées
                                                                   Score     E
Sequences producing significant alignments:                       (Bits)  Value

sp|Q5R7W8.1|BT2A2_PONAB  RecName: Full=Butyrophilin subfamily ...  32.7    0.86  Gene info
sp|P03186.1|DUB_EBVB9  RecName: Full=Ubiquitin thiolesterase B...  32.3    1.3  
sp|Q5KDK3.1|ROK1_CRYNE  RecName: Full=ATP-dependent RNA helica...  31.6    2.1  
sp|O73946.1|HELS_PYRFU  RecName: Full=Putative ski2-type helicase  30.8    2.8  
sp|Q7KYR7.3|BT2A1_HUMAN  RecName: Full=Butyrophilin subfamily ...  30.8    3.0   Gene info
sp|Q75A17.1|TRM10_ASHGO  RecName: Full=tRNA (guanine-N(1)-)-me...  30.8    3.1  
sp|Q92F65.1|LDH1_LISIN  RecName: Full=L-lactate dehydrogenase ...  30.0    5.5  
sp|P33380.2|LDH1_LISMO  RecName: Full=L-lactate dehydrogenase ...  30.0    6.1  
sp|C3PH18.1|RBFA_CORA7  RecName: Full=Ribosome-binding factor A    29.6    7.2  
sp|Q6NGN3.1|RBFA_CORDI  RecName: Full=Ribosome-binding factor A    29.3    8.5  
sp|B9KCH0.1|DNAK_CAMLR  RecName: Full=Chaperone protein dnaK; ...  29.3    8.5   Gene info
sp|A5DP36.2|PAN1_PICGU  RecName: Full=Actin cytoskeleton-regul...  29.3    9.3  


* les 10 premiers alignements 2 à 2 


>sp|Q5R7W8.1|BT2A2_PONAB Gene info RecName: Full=Butyrophilin subfamily 2 member A2; Flags: Precursor
Length=528

 GENE ID: 100173224 BTN2A1 | butyrophilin, subfamily 2, member A1 [Pongo abelii]

 Score = 32.7 bits (73),  Expect = 0.86, Method: Composition-based stats.
 Identities = 17/58 (29%), Positives = 37/58 (63%), Gaps = 2/58 (3%)

Query  94   FSYCVEYLDNLHPNRKLIRDLEKEKKRKEKEAIDRENKRKRLKKELE-EANEEISEEF  150
            F+ C+ +++ L   +K++   EKE +R+ +E   +E +++R++KE E +  E++ EE 
Sbjct  263  FAVCMYWINKLQKEKKILSG-EKEFERETREIAVKELEKERVQKEEELQVKEKLQEEL  319


>sp|P03186.1|DUB_EBVB9  RecName: Full=Ubiquitin thiolesterase BPLF1; AltName: Full=Large 
tegument protein; Short=LTP
Length=3149

 Score = 32.3 bits (72),  Expect = 1.3, Method: Composition-based stats.
 Identities = 17/45 (37%), Positives = 25/45 (55%), Gaps = 6/45 (13%)

Query  106   PNRKLIRDLEK------EKKRKEKEAIDRENKRKRLKKELEEANE  144
             PN++L R  EK      E  RKEKE +  +  ++R ++   EANE
Sbjct  1393  PNKELKRQYEKKLRQLMETGRKEKEKLREQEDKERQERRAREANE  1437


>sp|Q5KDK3.1|ROK1_CRYNE  RecName: Full=ATP-dependent RNA helicase ROK1
Length=620

 Score = 31.6 bits (70),  Expect = 2.1, Method: Composition-based stats.
 Identities = 13/38 (34%), Positives = 26/38 (68%), Gaps = 0/38 (0%)

Query  112  RDLEKEKKRKEKEAIDRENKRKRLKKELEEANEEISEE  149
            RDL +E  +K+K+ ++   KRK L+++ +  NEE +++
Sbjct  581  RDLNREAGKKKKQMVEASKKRKMLERKGKGGNEEKNDD  618


>sp|O73946.1|HELS_PYRFU  RecName: Full=Putative ski2-type helicase
Length=720

 Score = 30.8 bits (68),  Expect = 2.8, Method: Compositional matrix adjust.
 Identities = 16/43 (37%), Positives = 23/43 (53%), Gaps = 1/43 (2%)

Query  43   FCTMRDGGNDHESSW-DAAYTYIKKQKGGLFKVSPKNAAAQIT  84
            F T  DG  D  SSW +  Y  I+K+KG L  V+ +  A ++ 
Sbjct  212  FVTWEDGSIDRFSSWEELVYDAIRKKKGALIFVNMRRKAERVA  254


>sp|Q7KYR7.3|BT2A1_HUMAN Gene info RecName: Full=Butyrophilin subfamily 2 member A1; Flags: Precursor
Length=527

 GENE ID: 11120 BTN2A1 | butyrophilin, subfamily 2, member A1 [Homo sapiens]
(10 or fewer PubMed links)

 Score = 30.8 bits (68),  Expect = 3.0, Method: Composition-based stats.
 Identities = 16/55 (29%), Positives = 35/55 (63%), Gaps = 2/55 (3%)

Query  97   CVEYLDNLHPNRKLIRDLEKEKKRKEKEAIDRENKRKRLKKELE-EANEEISEEF  150
            C+ +++ L   +K++   EKE +R+ +E   +E +++R++KE E +  E++ EE 
Sbjct  265  CIYWINKLQKEKKILSG-EKEFERETREIALKELEKERVQKEEELQVKEKLQEEL  318


>sp|Q75A17.1|TRM10_ASHGO  RecName: Full=tRNA (guanine-N(1)-)-methyltransferase; AltName: 
Full=tRNA methyltransferase 10
Length=296

 Score = 30.8 bits (68),  Expect = 3.1, Method: Compositional matrix adjust.
 Identities = 18/33 (54%), Positives = 22/33 (66%), Gaps = 0/33 (0%)

Query  118  KKRKEKEAIDRENKRKRLKKELEEANEEISEEF  150
            K RKEK+   RE +R+RL+K LEE   EI EE 
Sbjct  50   KIRKEKKQKAREQRRERLQKALEENGGEIPEEL  82


>sp|Q92F65.1|LDH1_LISIN  RecName: Full=L-lactate dehydrogenase 1; Short=L-LDH 1
Length=313

 Score = 30.0 bits (66),  Expect = 5.5, Method: Compositional matrix adjust.
 Identities = 29/102 (28%), Positives = 46/102 (45%), Gaps = 17/102 (16%)

Query  58   DAAYTYIKKQKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHP-----------  106
            DAAY  I K+    + V+   A A+IT+ ++           YLD  +            
Sbjct  215  DAAYEIINKKGATFYGVAA--ALARITKAILNNENAILPLSVYLDGHYGMNDIYIGAPAV  272

Query  107  -NRKLIRDL-EKEKKRKEKEAIDRENKRKRLKKELEEANEEI  146
             NR+ +R + E     KEKE +  +N    LKK L++A ++I
Sbjct  273  VNRQGVRHIVEMNLNDKEKEQM--KNSADTLKKVLDDAMKQI  312


>sp|P33380.2|LDH1_LISMO  RecName: Full=L-lactate dehydrogenase 1; Short=L-LDH 1
 sp|Q724K3.1|LDH1_LISMF Gene info RecName: Full=L-lactate dehydrogenase 1; Short=L-LDH 1
Length=313

 Score = 30.0 bits (66),  Expect = 6.1, Method: Compositional matrix adjust.
 Identities = 29/102 (28%), Positives = 46/102 (45%), Gaps = 17/102 (16%)

Query  58   DAAYTYIKKQKGGLFKVSPKNAAAQITETVIREREKFSYCVEYLDNLHP-----------  106
            DAAY  I K+    + V+   A A+IT+ ++           YLD  +            
Sbjct  215  DAAYEIINKKGATFYGVAA--ALARITKAILNNENAILPLSVYLDGHYGMNDIYIGAPAV  272

Query  107  -NRKLIRDL-EKEKKRKEKEAIDRENKRKRLKKELEEANEEI  146
             NR+ +R + E     KEKE +  +N    LKK L++A ++I
Sbjct  273  VNRQGVRHIVEMNLNDKEKEQM--KNSADTLKKVLDDAMKQI  312


>sp|C3PH18.1|RBFA_CORA7  RecName: Full=Ribosome-binding factor A
Length=147

 Score = 29.6 bits (65),  Expect = 7.2, Method: Compositional matrix adjust.
 Identities = 19/79 (24%), Positives = 34/79 (43%), Gaps = 0/79 (0%)

Query  26   LTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKKQKGGLFKVSPKNAAAQITE  85
            +T+T  RV      A +F T+R      E  +D A   + + KG L K+     + + T 
Sbjct  34   VTITDARVTGDLHDATVFYTVRGTDIGTEPDYDQAAEALTRAKGQLRKIVGDELSVRFTP  93

Query  86   TVIREREKFSYCVEYLDNL  104
            T+  E +       +++ L
Sbjct  94   TLSFELDTVPEASAHMEEL  112


>sp|Q6NGN3.1|RBFA_CORDI  RecName: Full=Ribosome-binding factor A
Length=147

 Score = 29.3 bits (64),  Expect = 8.5, Method: Compositional matrix adjust.
 Identities = 22/90 (24%), Positives = 41/90 (45%), Gaps = 1/90 (1%)

Query  26   LTLTSPRVNASAFGAEIFCTMRDGGNDHESSWDAAYTYIKKQKGGLFKVSPKNAAAQITE  85
            +T+T  RV      A ++ T+R    D +    AA   +++ +G L K+     + + T 
Sbjct  34   VTVTDTRVTGDLHDATVYYTVRGRTIDDQPDLKAAAEALQRARGQLRKIVGDQLSVRFTP  93

Query  86   TVIREREKFSYCVEYLDNLHPNRKLIRDLE  115
            T+  E +       ++++L   R   RDLE
Sbjct  94   TLSFELDTVPETSAHMEDLLA-RARARDLE  122


>sp|B9KCH0.1|DNAK_CAMLR Gene info RecName: Full=Chaperone protein dnaK; AltName: Full=Heat shock 
protein 70; AltName: Full=Heat shock 70 kDa protein; AltName: 
Full=HSP70
Length=622

 GENE ID: 7410515 dnaK | chaperone and heat shock protein 70
[Campylobacter lari RM2100] (10 or fewer PubMed links)

 Score = 29.3 bits (64),  Expect = 8.5, Method: Compositional matrix adjust.
 Identities = 16/46 (34%), Positives = 29/46 (63%), Gaps = 2/46 (4%)

Query  110  LIRD--LEKEKKRKEKEAIDRENKRKRLKKELEEANEEISEEFTDE  153
            +++D  L KE+ RK KEA++  N    L  ++E++  E+ E+ +DE
Sbjct  509  MVKDAELHKEEDRKRKEAVEARNSADSLVHQVEKSLSELGEKVSDE  554


>sp|A5DP36.2|PAN1_PICGU  RecName: Full=Actin cytoskeleton-regulatory complex protein PAN1
Length=1440

 Score = 29.3 bits (64),  Expect = 9.3, Method: Composition-based stats.
 Identities = 14/34 (41%), Positives = 25/34 (73%), Gaps = 3/34 (8%)

Query  112   RDLEKEKKRKEKEAIDRENKRKRLKKELEEANEE  145
             +++E+ + RK+KE   +E +  RLK+E+EE N+E
Sbjct  1040  QEMEERRLRKKKE---KEERLARLKREMEEMNKE  1070


>sp|Q4U2R1.2|HERC2_MOUSE Gene info RecName: Full=Probable E3 ubiquitin-protein ligase HERC2; AltName: 
Full=HECT domain and RCC1-like domain-containing protein 
2
Length=4836

 GENE ID: 15204 Herc2 | hect (homologous to the E6-AP (UBE3A) carboxyl terminus)
domain and RCC1 (CHC1)-like domain (RLD) 2 [Mus musculus] (Over 10 PubMed links)

 Score = 29.3 bits (64),  Expect = 9.4, Method: Composition-based stats.
 Identities = 14/35 (40%), Positives = 23/35 (65%), Gaps = 0/35 (0%)

Query  108   RKLIRDLEKEKKRKEKEAIDRENKRKRLKKELEEA  142
             +K+IR+  K++  K+ E+ID E K    + +LEEA
Sbjct  1549  QKIIRERRKKRVPKKPESIDSEEKIGNEESDLEEA  1583