ORF AH22480

From Metagenes
Warning: this metagenomic sequence has been carefully annotated by students during bioinformatics assignments. These quality annotations are therefore the result of a teaching exercise that you are most welcome to amend and extend if necessary!


Sequence
CAMERA AccNum : JCVI_READ_1092351624732
Annotathon code: ORF_AH22480
Sample :
  • GPS :1°23'21n; 91°49'1w
  • Galapagos Islands: Wolf Island - Ecuador
  • Coastal (-1.7m, 21.8°C, 0.1-0.8 microns)
Authors
Team : BioCell 2007
Username : delcha
Annotated on : 2008-03-19 18:52:37
  • CHAVE DELPHINE
  • GUILLOT CHARLENE

Synopsis

  • Taxonomy: Alphaproteobacteria (NCBI info)
    Rank: class - Genetic Code: Bacterial and Plant Plastid - NCBI Identifier: 28211
    Kingdom: Bacteria - Phylum: Proteobacteria - Class: Alphaproteobacteria - Order:
    Bacteria; Proteobacteria; Alphaproteobacteria;

Genomic Sequence

>JCVI_READ_1092351624732 ORF_AH22480 genomic DNA
ATATCCACTTGAGGTTAATTGGGATCATTGGGAAAATAAGATTAACGAAAGATTTATAATTTTTGATACAGAAAATGATCAGGGCATAAGAATGAATAAT
GCCATATTATCAGAAGATTCTATACTTCAAAACCTATCAAGTGAAAATCTATCTATTGAACAAAAATGTATTATTTTTGATGATCTATTTGATCGTACAA
CACTCTCCAAAATAGTAGTTTCGTCACTTTATGATAATTTTTTACATGGCAAATGTATTTAAATAATTTCATCTATGAAGAAGCAAAATTTACCAACTAA
AACTTGTGTTACCTGTAAAAAAGAATTCTCATGGAGAAAGAAATGGGAATTAAATTGGGACAATGTAAAGTATTGTTCAAAACGTTGCTCGCCCAGAAAC
AAATGAAACTCTATATTCTTTGAGTTGTATTAAGTATTTAATCAATTAGATTTAATAAATGCAATCAAAGCATCTTATTTTAGTTCTAATCATAATGGTT
TTGTATGGAAGCTCTTATCCAGTTGGAAAACTTGGGTTAGATACTATCCCCCCATTATTGTTTACCGCACTAAGACTTGGATTAATTTTTTTAGCTTTCC
TGCCTTTCTTTAGGTTTAGGCTACCTGAAAAACATTTATTAAAGCCTTTGCTTGGGTTTTCTCTTGCTATGGGAATTGGAACCTATGTGACAATGTACTA
TGCTTTAGAGCATTTATCTATTGTTGCGCCAATTATCATTGGAGCACAATTATCAATTCCATTTGGTTTGATGCTTAGTTTAGTCTTCTTGAGAGAGAAT
ATTTCCTTAAAACGTTGGATTCTTATATTTTTATCTTTTGTTGGGATAGTTATTATTGCTTATGACCCTAGAATTATTAATGACAAGTTTGGATTGTTGT
TAGTTATAGTAATGGCATTTTTCTATGCTCTATCAAATCTTATGGCAGAGTATTAAAAGAAGTGACACTGCACTCTTATGGTTGGCATGGTGTTATTGCA
TTTATACCTGTTGCAGTGTTAACG

Translation

[459 - 953/1024]   direct strand
>ORF_AH22480 Translation [459-953   direct strand]
MQSKHLILVLIIMVLYGSSYPVGKLGLDTIPPLLFTALRLGLIFLAFLPFFRFRLPEKHLLKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSI
PFGLMLSLVFLRENISLKRWILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAFFYALSNLMAEY

Phylogeny

------------------------------------------------------------------------
Arbre neighbour-joining UPGMA (avec 24 espèces)
Groupe extérieur : Gramm +
ARBRE 1
------------------------------------------------------------------------





Neighbor-Joining/UPGMA method version 3.6a2.1


 Neighbor-joining method

 Negative branch lengths allowed


  +-----------Streptomyces                                                            [gramm +]
  ! 
  !                    +----Arthrobacter FB24                                         [gramm+]
  !      +-------------3 
  !      !             +----Arthrobacter aurescens TC1                                [gramm+]
  !      ! 
  !      !          +-----------------Pseudomonas                                     [g-protéobactéria]
  !    +-8 +--------4 
  !    ! ! !        +---------------------Marinomona sp. MED121                       [g-protéobactéria]
  !    ! ! ! 
  !    ! ! !         +----------------Magnetospirillum                                [a-protéobactéria]
  !    ! +-9      +-10  
  !    !   !      !  +-----------------------Caulobactere crescentus CB15             [a-protéobactéria]
  !    !   !      !  
  !    !   !      !                                            +Candidatus HTCC1062   [a-protéobactéria]
  !    !   +-----11                         +------------------1 
  !    !          !  +----------------------2                  +Candidatus HTCC1002   [a-protéobactéria]
  !    !          !  !                      ! 
  !    !          !  !                      +----------ORF_AH2248
  6----7          !  !  
  !    !          +-12      +-------------------Hahella                               [g-protéobactéria]
  !    !             !   +-13  
  !    !             !   !  +-----------------Parvibaculum                            [a-protéobactéria]
  !    !             +--14  
  !    !                 !       +---------------Hyphomonas                           [a-protéobactéria]
  !    !                 !    +-15  
  !    !                 +---16  +---------------Maricaulis                           [a-protéobactéria]
  !    !                      !  
  !    !                      +------------------Caulobacter sp. K31                  [a-protéobactéria]
  !    ! 
  !    !    +---------------Aeromonas                                                 [g-protéobactéria]
  !    +----5 
  !         +---------------Marinomonas sp. MWYL1                                     [g-protéobactéria]
  ! 
  +-------------Rhodococcus                                                           [gramm+]






------------------------------------------------------------------------
Arbre par parcimonie (avec 24 espèces)
Groupe extérieur : Gramm +
ARBRE 2
------------------------------------------------------------------------



Protein parsimony algorithm, version 3.6a2.1



One most parsimonious tree found:




  +--------------------------------------------------Rhodococcus                         [gramm +]
  !  
  !  +-----------------------------------------------Streptomyces                        [gramm +]
  !  !  
  !  !                 +-----------------------------Marinomonas sp. MWYL1               [g-protéobactéria]
  !  !                 !  
  2  !           +----10  +--------------------------Caulobactere crescentus CB15        [a-protéobactéria]
  !  !           !     !  !  
  !  !           !     !  !  +-----------------------Magnetospirillum                    [a-protéobactéria]
  !  !           !     +-12  !  
  !  !           !        !  !                    +--Maricaulis                          [a-protéobactéria]
  !  !           !        !  !              +----16  
  +--3           !        +-11              !     +--Hyphomonas                          [a-protéobactéria]
     !           !           !  +----------15  
     !           !           !  !           !     +--Caulobacter sp. K31                 [a-protéobactéria]
     !           !           !  !           +----17  
     !  +--------6           +-13                 +--Hahella                             [g-protéobactéria]
     !  !        !              !  
     !  !        !              !           +--------Parvibaculum                        [a-protéobactéria]
     !  !        !              +----------14  
     !  !        !                          !  +-----ORF_AH2248
     !  !        !                          +--8  
     !  !        !                             !  +--Candidatus HTCC1002                 [a-protéobactéria]
     +--4        !                             +--7  
        !        !                                +--Candidatus HTCC1062                 [a-protéobactéria]
        !        !  
        !        !                                +--Arthrobacter aurescens TC1          [gramm +]
        !        +--------------------------------5  
        !                                         +--Arthrobacter FB24                   [gramm +]
        !  
        !                                      +-----Marinomona                          [g-protéobactéria]
        +--------------------------------------1  
                                               !  +--Pseudomonas                         [g-protéobactéria]
                                               +--9  
                                                  +--Aeromonas                           [g-protéobactéria]






------------------------------------------------------------------------
Arbre neighbour-joining UPGMA (avec 12 espèces)
Groupe extérieur : bactéries Gramm +
ARBRE 3
------------------------------------------------------------------------



  +--------------------------------Rhodococcus [gamm+]
  !  
  7                             +--Arthrobacter aurescens TC1 [gramm+]
  !  +--------------------------3  
  !  !                          +--Arthrobacter FB24 [gramm+]
  +--2  
     !     +-----------------------Pseudomonas [g-protéobactéria]
     !     !  
     +----11  +--------------------Magnetospirillum [a-protéobactéria]
           !  !  
           +-10  +-----------------Hahella [g-protéobactéria]
              !  !  
              !  !        +--------Parvibaculum [a-protéobactéria]
              +--9  +-----8  
                 !  !     !  +-----ORF_AH2248
                 !  !     +--6  
                 !  !        !  +--Candidatus HTCC1062   [a-protéobactéria]
                 +--4        +--5  
                    !           +--Candidatus HTCC1002   [a-protéobactéria]
                    !  
                    !           +--Hyphomonas [a-protéobactéria]
                    +-----------1  
                                +--Maricaulis [a-protéobactéria]




------------------------------------------------------------------------
Arbre par parcimonie (avec 12 espèces)
Groupe extérieur : Gramm +
ARBRE 4
------------------------------------------------------------------------




     +--------------------------Pseudomonas [g-protéobactéria]
     ! 
  +--5      +----------------Magnetospirillum [a-protéobactéria]
  !  !      ! 
  !  !      !                                          +Candidatus HTCC1062   [a-protéobactéria]
  !  +------7                     +--------------------1 
  !         !   +-----------------3                    +Candidatus HTCC1002   [a-protéobactéria]
  !         !   !                 ! 
  !         !   !                 +--------ORF_AH2248
  !         +---8 
  !             !     +-----------------Parvibaculum [a-protéobactéria]
  !             !  +-10  
  !             !  !  +------------------Hahella [g-protéobactéria]
  !             +--9 
  !                !    +--------------Maricaulis [a-protéobactéria]
  !                +----6 
  !                     +----------------Hyphomonas [a-protéobactéria]
  ! 
  !             +----Arthrobacter aurescens TC1 [gramm+]
  4-------------2 
  !             +-----Arthrobacter FB24 [gramm+]
  ! 
  +------------------Rhodococcus [gamm+]





Annotator commentaries


Galapagos Islands: Wolf Island (Ecuador) GPS: 1°23'21n; 91°49'1w Prélèvement le 03/01/04 à 04:44:00 Filtré à: 0.1-0.8 microns Habitat: Coastal Profondeur: 1.7m (fond: 71m) Température: 21.8°C



ETUDE DES RESULTATS DE ORF FINDER ET DU BLASTp.


Dans un premier temps nous avons étudié si notre séquence génomique était codante ou non codante.

Pour cela, nous avons recherché si la séquence possédait un ORF. Nous avons fait une analyse avec SMS ORF Finder/avec les options : Any codon / standard code / Frame 1,2 et 3/60 codons minimum/ direct strand (puis indirect strand) . Nous avons travaillé avec ces options pour avoir une première étude la plus globale possible de notre séquence.

L'ORF le plus grand c'est à dire celui qui est le plus susceptible de coder pour une protéine se trouve dans le troisième cadre de lecture dans le sens direct du nucléotide 459 à 953. De plus les nucléotides 950-953 codent bien pour un codon STOP (TAA : ochre) et on en trouve aucun autre (TAA,TAG,TGA) dans l'ORF. En ce qui concerne l'extrémité 5' elle est complète car le premier codon de l'ORF code bien pour une méthionine (ATG).


Hypothèse 1 : Notre ORF a une taille suffisante et pourrait coder pour une protéine et pourrait peut être avoir des protéines homologues.

[Nous avons traduit notre ORF afin de pouvoir l'analyser.]


Le fait que notre ORF code pour 165 acides aminés, qu'elle possède une méthionine, et qu’elle contienne un codon stop laisse penser que la protéine est codante.

Pour vérifier l’hypothèse, nous avons fait un BLASTp d'abord contre la banque NR puis contre la banque Swiss prot.

Le BLAST p contre la banque nr (banque qui contient toutes les protéines connues de façon non redondante), nous a fait constater que la protéine codée par notre ORF possédait des protéines homologues. La séquence la plus homologue trouvée a 44% d'identité avec notre séquence protéique. L'alignement de cette séquence avec notre protéine possède un E-Value faible (e-23) ; or plus le e-value est faible, plus l'alignement est bon, notre E-value étant faible, notre alignement peut être considéré comme bon. De plus, nous avons du comparer les pourcentages d’identité et de similarité pour trouver les protéines les plus homologues et pour continuer notre étude car beaucoup d’e-value n’étaient pas assez faible (e-6, e-5) pour conclure que les protéines étaient homologues. Cependant, notre Blast donne quand même quelques bons alignements (avec un E-value faible : e-25, e-12e-10) donc l'existence de quelques protéines homologues (ce qui renforce le fait que notre ORF est codant).

Le BLASTp nous fait constater que les zones d'homologies coïncident avec le début de notre ORF. De plus, on sait qu'une protéine commence par une méthionine, nous avons alors pas eu besoin de refaire une analyse ORF Finder en changeant les critères d’analyse (changer « any codon»  en « ATG»).

Lors du Blast, on constate que l’alignement de notre séquences avec les protéines homologues commence au premier nucléotide (ATG). On peut donc conclure que cet ATG est le codon initiateur de la traduction, et qu’il est le même pour les protéines homologues.

Nous pouvons alors dire que notre séquence code sûrement pour une protéine qui se trouve du nucléotide 459 jusqu'au nucléotide 953.

Nous avons fait un BLASTp contre la banque Swiss prot ( banque contenant des protéines annotées), qui n'a trouvé aucune protéine homologue déjà référencée.




ANALYSE DU VOLET TAXONOMY REPORT


La BLASTp nous a donné une liste taxonomique avec des espèces très proches (que des protéobactéries), c'est pourquoi il a été difficile de choisir des groupes extérieurs et de délimiter notre groupe d'étude (nous constatons après analyse qu'il y a une majorité de a-protéobactéries. Mais, celles ci sont au nombre de 25. Or, il y a 100 génomes d’a-protéobactérie séquencés. On peut donc dire que ce gène n'est pas représentatif de l'espèce.) Nous avons alors considéré que notre groupe d'étude était les a-protéobactéries et g-protéobactéries, et notre groupe extérieur les gramm+. Comme ces séquences avaient un hit assez bas (entre 30 et 40), après avoir comparé les pourcentages de similarité et d’identité ainsi que l’étude des alignements 2 à 2, nous avons vérifié si ces séquences étaient homologues en faisant un alignement multiple avec Infobiogen sans notre ORF. On constate qu'il y a des résidus conservés donc on peut considérer que nos séquences sont homologues.


Nous avons fait deux alignements multiples. Dans le premier (1 dans la case), nous n’avions pas pris assez d’espèces représentants la diversité de notre taxonomie report ce qui nous a conduis à des arbres non représentatifs (ARBRES 3 et 4). Nous avons donc refait un alignement (2 dans la case)avec plus de séquences de chaque groupe taxonomique.

Lors de ce deuxième alignement multiple avec CLUSTAL W nous avons constaté:

-L’ORF s’intègre bien dans la famille des orthologues qu’on pensait. -Les séquences n’ont pas un domaine très conservé. -Il y a deux résidus parfaitement conservés (*): E et G  : position 125 et 140 environ (peut-être des résidus essentiels)  ; ces résidus seraient importants pour la fonction de la protéine, car il y a eu une grande conservation. -Il y a également quelques substitutions conservatives ou semi conservatives( . et : ).

Puis nous avons refait l'alignement au format Phylip, qui nous a permis de faire les 2 arbres phylogénétiques (ARBRE 1 et 2 dans la zone prévue à cet effet).


Nous n’avons pas étudié les arbres 3 et 4 car ils ne sont pas représentatifs de la diversité de notre taxonomy report.


ANALYSE ARBRE 1


Les arbres 1 et 2 sont les deux arbres que nous avons étudiés. Ces deux arbres sont très congruents ; en effet, notre ORF a le même ancêtre commun que deux a-protéobactéries, les candidatus dans les deux arbres. C'est pourquoi nous allons seulement étudier l'arbre 1.

On constate que la protéine codée par notre ORF possède un ancêtre commun (nœud 2) avec deux a-protéobactéries (les deux candidatus). Ces deux a-protéobactéries sont les deux homologues les plus proches de notre ORF.

Au niveau du noeud 7, il y a eu spéciation entre les bactéries gramm+, les g-protéobactéries et les a-protéobactéries. C 'est au niveau du noeud 8, qu'il y a séparation des gramm +. Au noeud 9, il y a spéciation entre les g-protéobactéries et le a-protéobactéries. Le fait que les gramm+ et les g-protéobactéries ne soient pas regroupées entre elles, pourrait s'expliquer par le fait que les noeuds 8 et 9 ne sont pas très robustes (petite longueur).


La présence d'une g-protéobactéries (hahella) au milieu des a-protéobactéries, peut s'expliquer par l’hypothèse : - il s'agit d’un transfert horizontal (conjugaison, transformation) de ce gène des a-protéobactéries vers cette g-protéobactérie.

Nous pouvons dire que notre ORF et les deux candidatus sont orthologues, elles ont le même ancêtre commun et il y a eu un événement de spéciation au niveau du noeud 2.


En ce qui concerne la taxonomie, on constate dans l’arbre que notre ORF est entouré de a-protobactéries et bien ancré dans celles-ci (arbre 1). On peut donc penser que notre ORF est une séquence qui provient d‘une a-protéobactérie (ce qui est cohérent avec notre taxonomy report).



FONCTION ET PROCESSUS BIOLOGIQUE

D’après l’analyse dans INTERPRO, on a pu identifier 3domaines : Nous n'avons rien indiqué dans le champ de domaine protéique car deux d'entre eux ne nous renseignent pas sur la fonction (ils renseignent sur la structure et la localisation): -1 domaine transmembranaire (qui sert à la protéine à s’ancrer dans la membrane) -1 peptide signal (qui sert à la l’export de la protéine)

Et le dernier, est un domaine inconnu, il ne nous renseigne pas sur la fonction: -1 domaine inconnu : Protein of unknown function DUF6, transmembrane(peut-être un domaine qui sert à l’entrée ou la résistance de certaines substances ? (perméase ?)) On ne peut cependant pas vérifier si ce domaine est conservé chez les protéines homologues car il est inconnu.



En regardant les fiches interpro de la première protéine (44% de similarité) nous avons constaté qu‘elle possédait aucun domaine connu (comme notre ORF). Par ailleurs, d’autres protéines homologues sont des protéines transmembranaires (comme notre ORF). De plus, quelques protéines homologues sont des protéines de transport (des perméases aux drogues et à certains métabolites) L’hypothèse 2 : notre protéine pourrait être une perméase. ( cette hypothèse ne pourra pas être vérifié dans cet étude).


POIDS MOLECULAIRE


En ce qui concerne le poids moléculaire de la protéine, nous l’avons trouvé grâce au logiciel Protein Molecular Weight du site SMS. Ce résultat (18,66) semble très correct étant donné que la masse moyenne d’un acide aminé est de 110KDa. Notre protéine étant composée de 165 acides aminés : 280 x 0,110 KDa _

18,2 Kda.





Multiple Alignement

------------------------------------------------------------------------------------------------
Alignemennt multiple (1) de notre ORF avec 12 séquences homologues au format clustal W  avec Rhodococus et les deux 
Arthrobacter comme groupe extérieur (gramm +).
Rhodococus : 8ème ligne
Arthrobacter : lignes 3 et 4 
------------------------------------------------------------------------------------------------



CLUSTAL W (1.82) multiple sequence alignment


Maricau|114570639|ref|YP_75731      -------------------------MRLKDFLLLVAVCVVWGFNFVVAKF
Hypho|114798186|ref|YP_759211.      -------------------------MAIRDFILLCAVCLVWGLNLVVTRW
Arthroba|119961334|ref|YP_9466      MKQIYAVPCRIQRWCFNQKKARVLLVNLRHSALAVLVAVLWGINFVAIDL
Arthrobact|116669227|ref|YP_83      -------------------------MNLRHSALAVLVAVLWGANFVAIDL
CandHTCC1062|71084032|ref|YP_2      -------------------------MTVRHYFLVLFIMFLFGS-SYPINK
Candi|91762900|ref|ZP_01264865      -------------------------------------MFLFGS-SYPINK
ORF_AH22480                         -------------------------MQSKHLILVLIIMVLYGS-SYPVGK
Rhodoco|111021196|ref|YP_70416      -------------------------MTSRDRLLGLTVVVLWGLNFLAIRA
Parviba|154252851|ref|YP_00141      -------------------------MTPLHLGFMVLINLIWGFALIAAKV
Hahell|83644648|ref|YP_433083.      -------------------------MSLLDLLLGLLANLAWGFNFIAGKE
Magnetos|144899236|emb|CAM7610      -------------------------MPLKDWLLAISVVTLWGLNFIAVKV
Pseudo|70734290|ref|YP_257930.      -MASRSDSAALSRDVPGAAFCGSRDMQKKHLFLALLVTALWGLNFPITKL
                                                                            :*        

Maricau|114570639|ref|YP_75731      AVTGAPGWMPGFDGVPPIFFAFLRFALLYAFLAPWLRPRPAD---MKTMI
Hypho|114798186|ref|YP_759211.      AVADMA--------IPPIFFAALRFLGVAVCLVPFLFPRPPN---LRTLF
Arthroba|119961334|ref|YP_9466      GLHTNG------REVPPLLFVAMRFLLVVFPFILFIRKPDVG---WKAIL
Arthrobact|116669227|ref|YP_83      GLHANG------TEVPPLLFVAMRFVLVVFPWIFFIRRPDVS---WRAIV
CandHTCC1062|71084032|ref|YP_2      LALNTS--------LTPVLAASLRMFILFVCLVPFCKFKIPNKKYYLPLA
Candi|91762900|ref|ZP_01264865      LALNTS--------LTPVLAASLRMFILFVCLVPFCKFKIPNKKYYLPLA
ORF_AH22480                         LGLDT---------IPPLLFTALRLGLIFLAFLPFFRFRLPEKHLLKPLL
Rhodoco|111021196|ref|YP_70416      GLDHFP----------PFFFAALRFFVIAIPVILFVPRPQVP---LKWLL
Parviba|154252851|ref|YP_00141      SLDHFP----------PLLFAALRFTLIVLVLFPFLKIHRGR---MKEVI
Hahell|83644648|ref|YP_433083.      GAQHFQ----------PLLFTALRFAILLALTAPWLKPAKGY---MKPLL
Magnetos|144899236|emb|CAM7610      AVQTIP----------PFLLTAIRFALVAAVLAPLFRPARPQ---WKGII
Pseudo|70734290|ref|YP_257930.      GLASID----------PLLLTALRFTLAALPWVFLVPRPPVA---FAWLA
                                                    *.: . :*:                       : 

Maricau|114570639|ref|YP_75731      GVALCMGALQYALMFLGMRWATPS-GMAIAVQMGVPFATILSVIFLKERV
Hypho|114798186|ref|YP_759211.      FVSIMIGSVHFSLLFIGLQHADAS-AAAVTGQLGVPFSTLMSMLFLGEVI
Arthroba|119961334|ref|YP_9466      GVGLFMSAGQFGLLYLGMALGMPAGLASLVLQAQVLFTILLAAKFLGERP
Arthrobact|116669227|ref|YP_83      GVGLFMSAGQFGLLYLAMALGMPAGLASLVLQAQVLLTVLLAAGILGERP
CandHTCC1062|71084032|ref|YP_2      GFSFSMGFGVFIFLNLSLQKATMVAPIIIGAQLAIPFAILASSLFLGEKV
Candi|91762900|ref|ZP_01264865      GFSLSMGFGVFIFLNLSLQKATMVAPIIIGAQLAIPFAVLASSLFLGEKV
ORF_AH22480                         GFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENI
Rhodoco|111021196|ref|YP_70416      VYGLGFGVGQFAFLFWAMHVGMPTGLASLVLQSSAPFTVVLGAVLLRERL
Parviba|154252851|ref|YP_00141      IIALCAGPVGFGFFFVGLALSNAS-VVAVTSQLGVPFATIMSIFFLKEQV
Hahell|83644648|ref|YP_433083.      SVAFVLGVLHFSMMFLGLNAGGNIASVAIATQLYVPFSAILAAAILKESI
Magnetos|144899236|emb|CAM7610      GISLVLGVGHFGLMFVGVSGMDAA-SAAIITQLGVPFSALVAWVAFGEKL
Pseudo|70734290|ref|YP_257930.      AYGLIFGVAMWALINLGIDHGVAPGTAALLIQFSAFFSLGWGVLLFGERL
                                      .:  .   :  :  .:          :  *    :    .   : *  

Maricau|114570639|ref|YP_75731      GLPRIAGMMLAFGGVMLVILNPAAMDMSIGMLLGVGAAFVAALGMILVKR
Hypho|114798186|ref|YP_759211.      RWRRAIGITLAFLGVIIIALDPANFSVSFGLLYIIASAFIGSAGGIVMKR
Arthroba|119961334|ref|YP_9466      SRRQLAGVALGIAGLAVVAWGRSAVAPVLPLMIVLAAALSWAIGNVVARH
Arthrobact|116669227|ref|YP_83      SVRQFAGVVLGVAGLAVVAVGRSMVAPVLPLLIVLAAALSWAAGNIVARQ
CandHTCC1062|71084032|ref|YP_2      TPKMWVLIFISFFGIFLIGYDPNLKSEIFAIFLCAISAFFYGVANVFSRY
Candi|91762900|ref|ZP_01264865      TPKMWVLIFISFFGIFLIGYDPNLKSEIFAIFLCAISAFFYGLANVFSRY
ORF_AH22480                         SLKRWILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAFFYALSNLMAEY
Rhodoco|111021196|ref|YP_70416      RPAQVCGLLVAMAGMALIGWDRAQHAALLPVALTLLAGLSWAVGNIGNRK
Parviba|154252851|ref|YP_00141      HWRRWLGISLSFLGVMIISFDPAVFTYIDGLLFVVASALVGSVSTIFQRQ
Hahell|83644648|ref|YP_433083.      GWIKGGAIVLALAGVFIIGFDPVVFNHLDALAWVVGAAASMAVATILMKQ
Magnetos|144899236|emb|CAM7610      GLGRTIGLILAFSGVALLAGEPSLP-SLLPVLILVVAMIAWAVSNVQVKR
Pseudo|70734290|ref|YP_257930.      RLQQVLATAIALWGLLRIIGDSPGHATSLGYALLLVSAFSWSVGNVIIKR
                                             :.. *:  :                       . . :  . 

Maricau|114570639|ref|YP_75731      LPMDS-IRMQAWIGLLSWPPLLLLSLTFE------QGQLASVVSGGWAFG
Hypho|114798186|ref|YP_759211.      MPQISGLRMQAWVGLFSFAPLFALSFAIE------ENQLATYIDGGWMVW
Arthroba|119961334|ref|YP_9466      TKAASGLGLVVWSGAVVPVPLAGLSLLVDGP----GAVWSTIIDLQPATI
Arthrobact|116669227|ref|YP_83      AKASSGLGLVVWSGAVVPLPLIGLSLLIDGP----AAVGGSLAGLQVVTI
CandHTCC1062|71084032|ref|YP_2      IKDIDVKLTNTVMGFTGFILLFLFSIFFEG------NTVYQLLNIDFYTW
Candi|91762900|ref|ZP_01264865      IKDIDVKLTNTVMGFTGFILLFLFSIFFEG------NTVYQLLNIDFYTW
ORF_AH22480                         --------------------------------------------------
Rhodoco|111021196|ref|YP_70416      AASDQPMRLMLWMCVIPPLPMLALSFGVEGPSAGWNSLTSSLEGTGPLAL
Parviba|154252851|ref|YP_00141      LKNVGVFELQAWIAIAAAPLMLGASAIFER------DLLGLVLTADLLDW
Hahell|83644648|ref|YP_433083.      CPTLGVMRLQAWIALVATPSLLALSYIFED------GQWSLLVQSEWSDY
Magnetos|144899236|emb|CAM7610      LGDINPLALNGWMAVFAAPMLLALSLTLESG----HTELPARLLADWKPL
Pseudo|70734290|ref|YP_257930.      CGVREVFAFVVWASLFAPLPLLALTWISHG----AAPFLQLAGQVSAGAA
                                                                                      

Maricau|114570639|ref|YP_75731      AALLITVVLVNIFGHGVFYNLLQRYDATLIAPITLLAPLVGVVSGILLMG
Hypho|114798186|ref|YP_759211.      AASAFAILGVSVFGHSAFYTLLKKYDVSLLSPLTLMTPIWGVIFGIALLN
Arthroba|119961334|ref|YP_9466      LSAIYTAVFASLIGYGIWNRLLSLYPSSDVVPFTLLVPVVGMTAAWLVLN
Arthrobact|116669227|ref|YP_83      LSAIYTAVLGSLVGYGIWNWLLGIYPSSAVVPFTLLVPVVGMMTAWLVLG
CandHTCC1062|71084032|ref|YP_2      LLLLHNGVMVSVIAHTSLFYLYKFYSVNKIMPFYSLFPVFGLILTFFIFG
Candi|91762900|ref|ZP_01264865      LLLLHNGVMVSVIAHTSLFYLYKFYSVNKIMPFYSLFPVFGLILTFFIFG
ORF_AH22480                         --------------------------------------------------
Rhodoco|111021196|ref|YP_70416      AGLAYIVILGTVAGSGLWTALLSRYPAGMVAPFSLLVPIVGIGASWLVLH
Parviba|154252851|ref|YP_00141      AGVFYVAFASSLVGHAGIYYLLQRYEVTQTAPLTLLSPVFTVFFAVMLLG
Hahell|83644648|ref|YP_433083.      WAPLYSAVAASIIGHGIVYRLLGRYSVSLVTPMMLLAPIFAMVFGVVWFG
Magnetos|144899236|emb|CAM7610      AGLAYTVIASSLVAYTLWYGLLARHPMNRVVPVTLLGPVVAVAGGVLVLG
Pseudo|70734290|ref|YP_257930.      LSLMFQVYAATLFCYWGWNLLLREYPVSRVAPLSLLIPVFGMAGSVLILG
                                                                                      

Maricau|114570639|ref|YP_75731      DPMGWRLFVGGGLTLAGVGIIALRQNQKLPAAALAREKTL----------
Hypho|114798186|ref|YP_759211.      EPLTPRLILGAIVSLSGVLVIALRPNEKMPEAALGKKAGAGDS-------
Arthroba|119961334|ref|YP_9466      EIPTLTEILGGLILLLGVATAVLGAGRKIRPETPVVRPALRL--------
Arthrobact|116669227|ref|YP_83      EVPSPAEVAGGLLLLGGVAIAVLLPGRQGATPGQRRWHAQRRDVAFAGDV
CandHTCC1062|71084032|ref|YP_2      EIPTLLSAIGGLIIIFSVYRLQKIR-------------------------
Candi|91762900|ref|ZP_01264865      EIPTLLSAIGGLIIIFSVYRLQKIK-------------------------
ORF_AH22480                         --------------------------------------------------
Rhodoco|111021196|ref|YP_70416      EEPSMLSLMGGVVVIAGAAATQVSGRVRPSTLSHSPAPARVGV-------
Parviba|154252851|ref|YP_00141      EVLTSRMLVGALVALTGVLIVSIRQKRIVATGP-----------------
Hahell|83644648|ref|YP_433083.      DVLTWKLSLGGALTLLGVVIINIPREQLRRVMHLLAGKRGASV-------
Magnetos|144899236|emb|CAM7610      ETLTWQKLVGGAITILGVAVVQFVGGIRRPPAEPEPGT------------
Pseudo|70734290|ref|YP_257930.      QRLGAEEGISMGLILLALAVGQFDWRRLITLGRRSL--------------
                                                                                      

Maricau|114570639|ref|YP_75731      --------------------------------------------------
Hypho|114798186|ref|YP_759211.      --------------------------------------------------
Arthroba|119961334|ref|YP_9466      --------------------------------------------------
Arthrobact|116669227|ref|YP_83      GDGLAAGLGTDLGAADLGAGRAARGTADLAEGDAGRLAAGVRTAPDRDAG
CandHTCC1062|71084032|ref|YP_2      --------------------------------------------------
Candi|91762900|ref|ZP_01264865      --------------------------------------------------
ORF_AH22480                         --------------------------------------------------
Rhodoco|111021196|ref|YP_70416      --------------------------------------------------
Parviba|154252851|ref|YP_00141      --------------------------------------------------
Hahell|83644648|ref|YP_433083.      --------------------------------------------------
Magnetos|144899236|emb|CAM7610      --------------------------------------------------
Pseudo|70734290|ref|YP_257930.      --------------------------------------------------
                                                                                      

Maricau|114570639|ref|YP_75731      ---
Hypho|114798186|ref|YP_759211.      ---
Arthroba|119961334|ref|YP_9466      ---
Arthrobact|116669227|ref|YP_83      TRP
CandHTCC1062|71084032|ref|YP_2      ---
Candi|91762900|ref|ZP_01264865      ---
ORF_AH22480                         ---
Rhodoco|111021196|ref|YP_70416      ---
Parviba|154252851|ref|YP_00141      ---
Hahell|83644648|ref|YP_433083.      ---
Magnetos|144899236|emb|CAM7610      ---
Pseudo|70734290|ref|YP_257930.      ---
                                       



-----------------------------------------------------------------------------------------------
Alignemennt multiple (2) de notre ORF avec 18 séquences homologues au format Clustal avec comme
groupe extérieur Rhodococus, les deux Arthrobacter et Streptomyces qui sont toutes des Gramm +. 
Rhodococus : ligne 3
Arthrobacter : lignes 5 et 6
Streptomyces : ligne 4 
-----------------------------------------------------------------------------------------------


CLUSTAL W (1.82) multiple sequence alignment


Aeromona|117621088|ref|YP_8573      MPCPPPCGPPWPHAASQCTASPPESHLAPRCPVAPPPGGLTAPTEAGVCS
Marinomonas                         --------------------------------------------------
Rhodoco|111021196|ref|YP_70416      --------------------------------------------------
Streptomyce|21552247|gb|AAK564      --------------------------------------------------
Arthroba|119961334|ref|YP_9466      -----------------------------------------MKQIYAVPC
Arthrobact|116669227|ref|YP_83      --------------------------------------------------
CandHTCC1062|71084032|ref|YP_2      --------------------------------------------------
Candi|91762900|ref|ZP_01264865      --------------------------------------------------
ORF_AH22480                         --------------------------------------------------
Pseudo|70734290|ref|YP_257930.      ------------------------------------------MASRSDSA
Marinomonas|87118525|ref|ZP_01      --------------------------------------------------
Magnetos|144899236|emb|CAM7610      --------------------------------------------------
Caulobacter                         --------------------------------------------------
Hahell|83644648|ref|YP_433083.      --------------------------------------------------
Parviba|154252851|ref|YP_00141      --------------------------------------------------
Hypho|114798186|ref|YP_759211.      --------------------------------------------------
Maricau|114570639|ref|YP_75731      --------------------------------------------------
Cauloba|16126806|ref|NP_421370      --------------------------------------------------
                                                                                      

Aeromona|117621088|ref|YP_8573      SSFGLSCQRPQTEGRRMHTKDKFLAALVILCWGLNFVAIKWGLEG-----
Marinomonas                         -----MLLSNLMMVSVMTFKDCILALVIIFAWGLNFVVISFGLSE-----
Rhodoco|111021196|ref|YP_70416      ----------------MTSRDRLLGLTVVVLWGLNFLAIRAGLDH-----
Streptomyce|21552247|gb|AAK564      ----------------MSVRDRLLACFVAVLWGLNFLAVRIGLDY-----
Arthroba|119961334|ref|YP_9466      RIQRWCFNQKKARVLLVNLRHSALAVLVAVLWGINFVAIDLGLHTNG---
Arthrobact|116669227|ref|YP_83      ----------------MNLRHSALAVLVAVLWGANFVAIDLGLHANG---
CandHTCC1062|71084032|ref|YP_2      ----------------MTVRHYFLVLFIMFLFGSSYPINKLALNTSL---
Candi|91762900|ref|ZP_01264865      ----------------------------MFLFGSSYPINKLALNTSL---
ORF_AH22480                         ----------------MQSKHLILVLIIMVLYGSSYPVGKLGLDT-I---
Pseudo|70734290|ref|YP_257930.      ALSRDVPGAAFCGSRDMQKKHLFLALLVTALWGLNFPITKLGLAS-----
Marinomonas|87118525|ref|ZP_01      ----------------MKKLDLCLLTALMALWGFNFSVIKLGVNN-----
Magnetos|144899236|emb|CAM7610      ----------------MPLKDWLLAISVVTLWGLNFIAVKVAVQT-----
Caulobacter                         ----------------MSRTQLACAVLVPLLWGLQFVVIKVGLTA-----
Hahell|83644648|ref|YP_433083.      ----------------MSLLDLLLGLLANLAWGFNFIAGKEGAQH-----
Parviba|154252851|ref|YP_00141      ----------------MTPLHLGFMVLINLIWGFALIAAKVSLDH-----
Hypho|114798186|ref|YP_759211.      ----------------MAIRDFILLCAVCLVWGLNLVVTRWAVAD-----
Maricau|114570639|ref|YP_75731      ----------------MRLKDFLLLVAVCVVWGFNFVVAKFAVTGAPGWM
Cauloba|16126806|ref|NP_421370      ----------------MSLRDFGLLVLICLIWAGSNIISKLVVAHWG---
                                                                   :.                 

Aeromona|117621088|ref|YP_8573      -----IPPLLLGALRFVGVVFPAILLVPRPAM-PWRWLLAYGGAISLGQF
Marinomonas                         -----VPPLLLGGLRFLAVAAIGCLLVKRPNI-PLKWLCIYALPMGFMQF
Rhodoco|111021196|ref|YP_70416      -----FPPFFFAALRFFVIAIPVILFVPRPQV-PLKWLLVYGLGFGVGQF
Streptomyce|21552247|gb|AAK564      -----YPPVFLSAMRFVVVAVPVILFVPRPKV-PLRWLLVYGLGFGVIQF
Arthroba|119961334|ref|YP_9466      ---REVPPLLFVAMRFLLVVFPFILFIRKPDV-GWKAILGVGLFMSAGQF
Arthrobact|116669227|ref|YP_83      ---TEVPPLLFVAMRFVLVVFPWIFFIRRPDV-SWRAIVGVGLFMSAGQF
CandHTCC1062|71084032|ref|YP_2      ---TPVLAASLRMFILFVCLVPFCKFKIPNKK-YYLPLAGFSFSMGFGVF
Candi|91762900|ref|ZP_01264865      ---TPVLAASLRMFILFVCLVPFCKFKIPNKK-YYLPLAGFSLSMGFGVF
ORF_AH22480                         ---PPLLFTALRLGLIFLAFLPFFRFRLPEKH-LLKPLLGFSLAMGIGTY
Pseudo|70734290|ref|YP_257930.      -----IDPLLLTALRFTLAALPWVFLVPRPPV-AFAWLAAYGLIFGVAMW
Marinomonas|87118525|ref|ZP_01      -----IEPLVLTAMRFTFAVFPLIFFIKKPDV-KWRYLISYGLTFGIGVW
Magnetos|144899236|emb|CAM7610      -----IPPFLLTAIRFALVAAVLAPLFRPARP-QWKGIIGISLVLGVGHF
Caulobacter                         -----FPPLFFVGLRLAAVAVILLPFAGRPKRREIGPMIAISVFFGGLNF
Hahell|83644648|ref|YP_433083.      -----FQPLLFTALRFAILLALTAPWLKPAKG-YMKPLLSVAFVLGVLHF
Parviba|154252851|ref|YP_00141      -----FPPLLFAALRFTLIVLVLFPFLKIHRG-RMKEVIIIALCAGPVGF
Hypho|114798186|ref|YP_759211.      ---MAIPPIFFAALRFLGVAVCLVPFLFPRPP-NLRTLFFVSIMIGSVHF
Maricau|114570639|ref|YP_75731      PGFDGVPPIFFAFLRFALLYAFLAPWLRPRPA-DMKTMIGVALCMGALQY
Cauloba|16126806|ref|NP_421370      -----VPPLYYAAVRFALVAALTLPWLLPAPR-PTWRMVLVGLLMGGGNF
                                                   :                     :   .   .   :

Aeromona|117621088|ref|YP_8573      SFLFCAMKFGMPAGMASLVLQSQVVFTLLFAMIWLGERWQPHHWVALPLA
Marinomonas                         AFLFMAMANGMPAGLASLVLQSQALFTMVFALLFLQEGVRIHQVLAIVLA
Rhodoco|111021196|ref|YP_70416      AFLFWAMHVGMPTGLASLVLQSSAPFTVVLGAVLLRERLRPAQVCGLLVA
Streptomyce|21552247|gb|AAK564      GLLFLAIDIGMPSGQASVVVQAAAPFTMLLGLLLG-ERISRRQAGGIVLA
Arthroba|119961334|ref|YP_9466      GLLYLGMALGMPAGLASLVLQAQVLFTILLAAKFLGERPSRRQLAGVALG
Arthrobact|116669227|ref|YP_83      GLLYLAMALGMPAGLASLVLQAQVLLTVLLAAGILGERPSVRQFAGVVLG
CandHTCC1062|71084032|ref|YP_2      IFLNLSLQKATMVAPIIIGAQLAIPFAILASSLFLGEKVTPKMWVLIFIS
Candi|91762900|ref|ZP_01264865      IFLNLSLQKATMVAPIIIGAQLAIPFAVLASSLFLGEKVTPKMWVLIFIS
ORF_AH22480                         VTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKRWILIFLS
Pseudo|70734290|ref|YP_257930.      ALINLGIDHGVAPGTAALLIQFSAFFSLGWGVLLFGERLRLQQVLATAIA
Marinomonas|87118525|ref|ZP_01      GLTTLAIDAGTSSGMASLLLDMSVVSGLLIGYFFLNEKLTFNKLFGAALA
Magnetos|144899236|emb|CAM7610      GLMFVGVSG-MDAASAAIITQLGVPFSALVAWVAFGEKLGLGRTIGLILA
Caulobacter                         GLMFLGLGQGLAGVSAVAN-QLSTPFTVLLAWPFLGERPPKSVIIGVALA
Hahell|83644648|ref|YP_433083.      SMMFLGLNAGGNIASVAIATQLYVPFSAILAAAILKESIGWIKGGAIVLA
Parviba|154252851|ref|YP_00141      GFFFVGLALSNASVVAVTS-QLGVPFATIMSIFFLKEQVHWRRWLGISLS
Hypho|114798186|ref|YP_759211.      SLLFIGLQHADASAAAVTG-QLGVPFSTLMSMLFLGEVIRWRRAIGITLA
Maricau|114570639|ref|YP_75731      ALMFLGMRWATPSGMAIAV-QMGVPFATILSVIFLKERVGLPRIAGMMLA
Cauloba|16126806|ref|NP_421370      ALLFMGFQTASP-SAASVVIQVGVPFTTLLSVLILGEKIRWRRGLGIALT
                                         ..             :         .     *           : 

Aeromona|117621088|ref|YP_8573      GAGLYLIATHG-EGNLTLLGFVLTLCAAACWGLGNVINRQIGLRYQTTLP
Marinomonas                         GSGLLMIAVVSGIGDMTLFGFILTLFAAASWAMGNISARAMSQKGYSVNV
Rhodoco|111021196|ref|YP_70416      MAGMALIGWDR-AQHAALLPVALTLLAGLSWAVGNIGNRKAAS---DQPM
Streptomyce|21552247|gb|AAK564      VAGMSAIAVER-AQDAALLPLVLTLVAAFGWAMGNIASRQARP---DHPL
Arthroba|119961334|ref|YP_9466      IAGLAVVAWGR-SAVAPVLPLMIVLAAALSWAIGNVVARHTKA---ASGL
Arthrobact|116669227|ref|YP_83      VAGLAVVAVGR-SMVAPVLPLLIVLAAALSWAAGNIVARQAKA---SSGL
CandHTCC1062|71084032|ref|YP_2      FFGIFLIGYDP-NLKSEIFAIFLCAISAFFYGVANVFSRYIKD---IDVK
Candi|91762900|ref|ZP_01264865      FFGIFLIGYDP-NLKSEIFAIFLCAISAFFYGLANVFSRYIKD---IDVK
ORF_AH22480                         FVGIVIIAYDP-RIINDKFGLLLVIVMAFFYALSNLMAEY----------
Pseudo|70734290|ref|YP_257930.      LWGLLRIIGDS-PGHATSLGYALLLVSAFSWSVGNVIIKRCGVR---EVF
Marinomonas|87118525|ref|ZP_01      LIGLFIIMMEQ-GGSVTVKGLILVLAASLFWSINGLIVKRANT---KSIF
Magnetos|144899236|emb|CAM7610      FSGVALLAGEP--SLPSLLPVLILVVAMIAWAVSNVQVKRLGDIN---PL
Caulobacter                         FAGVALTAAEP-SASVKMLPTLEVIAAGLALAVGSVLAKRYGP---FEPM
Hahell|83644648|ref|YP_433083.      LAGVFIIGFDP-VVFNHLDALAWVVGAAASMAVATILMKQCPTLG---VM
Parviba|154252851|ref|YP_00141      FLGVMIISFDP-AVFTYIDGLLFVVASALVGSVSTIFQRQLKNVG---VF
Hypho|114798186|ref|YP_759211.      FLGVIIIALDP-ANFSVSFGLLYIIASAFIGSAGGIVMKRMPQIS---GL
Maricau|114570639|ref|YP_75731      FGGVMLVILNP-AAMDMSIGMLLGVGAAFVAALGMILVKRLPMDS----I
Cauloba|16126806|ref|NP_421370      LLGAVVVMWSP-KGIELSAGLWLIVAAAFTGSLGAVMMKQIEG---VKPL
                                      *                            .   :  .           

Aeromona|117621088|ref|YP_8573      SLIAWGGLVPILPFLALSWLFEGPELMA----SSLLNISWQGFLCVLYLS
Marinomonas                         NVVIWSAWVPPLPFFVCSWFMEGPELIY----SSLLHISWVSIGALVYLA
Rhodoco|111021196|ref|YP_70416      RLMLWMCVIPPLPMLALSFGVEGPSAGWNSLTSSLEGTGPLALAGLAYIV
Streptomyce|21552247|gb|AAK564      RFALWMCVLPPIPLLGLSAALEGPTAGWRALGDSLTSGDLTGPVALLYTA
Arthroba|119961334|ref|YP_9466      GLVVWSGAVVPVPLAGLSLLVDGPGAVW----STIIDLQPATILSAIYTA
Arthrobact|116669227|ref|YP_83      GLVVWSGAVVPLPLIGLSLLIDGPAAVG----GSLAGLQVVTILSAIYTA
CandHTCC1062|71084032|ref|YP_2      LTNTVMGFTGFILLFLFSIFFEGNTVYQ------LLNIDFYTWLLLLHNG
Candi|91762900|ref|ZP_01264865      LTNTVMGFTGFILLFLFSIFFEGNTVYQ------LLNIDFYTWLLLLHNG
ORF_AH22480                         --------------------------------------------------
Pseudo|70734290|ref|YP_257930.      AFVVWASLFAPLPLLALTWISHGAAPFLQ----LAGQVSAGAALSLMFQV
Marinomonas|87118525|ref|ZP_01      AFNIWAMLFAPIPLLLLAVISHGPEVIT----HLPQDINRSAIFSALFQA
Magnetos|144899236|emb|CAM7610      ALNGWMAVFAAPMLLALSLTLESGHTELP----ARLLADWKPLAGLAYTV
Caulobacter                         KLMAWMSAFTVPQVMIASFLTEHGQFAS------LHAASLKVWLAFGYTV
Hahell|83644648|ref|YP_433083.      RLQAWIALVATPSLLALSYIFEDGQWSL------LVQSEWSDYWAPLYSA
Parviba|154252851|ref|YP_00141      ELQAWIAIAAAPLMLGASAIFERDLLGL------VLTADLLDWAGVFYVA
Hypho|114798186|ref|YP_759211.      RMQAWVGLFSFAPLFALSFAIEENQLAT------YIDGGWMVWAASAFAI
Maricau|114570639|ref|YP_75731      RMQAWIGLLSWPPLLLLSLTFEQGQLAS------VVSGGWAFGAALLITV
Cauloba|16126806|ref|NP_421370      QFQAWVGFSSVWPLAAMSAFMEPGQVAAG------FAAGWPFVAAVVFSA
                                                                                      

Aeromona|117621088|ref|YP_8573      FVATWLGYGLWGRLLMRYPVAQVAPLSLLVPCVGMVAAALLLDEHPTPLQ
Marinomonas                         LVATILGYSLWGYLMSRYPASQVAPLTLGVPIVGLTFAAVILGESLLPLQ
Rhodoco|111021196|ref|YP_70416      ILGTVAGSGLWTALLSRYPAGMVAPFSLLVPIVGIGASWLVLHEEPSMLS
Streptomyce|21552247|gb|AAK564      LAGSVVGSGIWNTLMKRYEAGTVAPFSMLVPVVAVAVATIWLDERLTLWS
Arthroba|119961334|ref|YP_9466      VFASLIGYGIWNRLLSLYPSSDVVPFTLLVPVVGMTAAWLVLNEIPTLTE
Arthrobact|116669227|ref|YP_83      VLGSLVGYGIWNWLLGIYPSSAVVPFTLLVPVVGMMTAWLVLGEVPSPAE
CandHTCC1062|71084032|ref|YP_2      VMVSVIAHTSLFYLYKFYSVNKIMPFYSLFPVFGLILTFFIFGEIPTLLS
Candi|91762900|ref|ZP_01264865      VMVSVIAHTSLFYLYKFYSVNKIMPFYSLFPVFGLILTFFIFGEIPTLLS
ORF_AH22480                         --------------------------------------------------
Pseudo|70734290|ref|YP_257930.      YAATLFCYWGWNLLLREYPVSRVAPLSLLIPVFGMAGSVLILGQRLGAEE
Marinomonas|87118525|ref|ZP_01      YPTTLLGYWFWNKMIVKYELSSVAPMTLLVPVFAILGGYWFYQEAIVISQ
Magnetos|144899236|emb|CAM7610      IASSLVAYTLWYGLLARHPMNRVVPVTLLGPVVAVAGGVLVLGETLTWQK
Caulobacter                         LFGAVVGWGLWFWLIARCSMSRLAPFSLLQIVFAIIAGAVFLHEPLTWTL
Hahell|83644648|ref|YP_433083.      VAASIIGHGIVYRLLGRYSVSLVTPMMLLAPIFAMVFGVVWFGDVLTWKL
Parviba|154252851|ref|YP_00141      FASSLVGHAGIYYLLQRYEVTQTAPLTLLSPVFTVFFAVMLLGEVLTSRM
Hypho|114798186|ref|YP_759211.      LGVSVFGHSAFYTLLKKYDVSLLSPLTLMTPIWGVIFGIALLNEPLTPRL
Maricau|114570639|ref|YP_75731      VLVNIFGHGVFYNLLQRYDATLIAPITLLAPLVGVVSGILLMGDPMGWRL
Cauloba|16126806|ref|NP_421370      VVVSILAHTAYYGLIQRYEANLIAPLTLMTPLFTIGMGVVVTNDHFDLRM
                                                                                      

Aeromona|117621088|ref|YP_8573      WLGSALVLLGFVVHLLGGRLR-------WFKPQTAA--------------
Marinomonas                         WIGVCFVLTGLLVNTFGARLF-------GQFKTIFKEA------------
Rhodoco|111021196|ref|YP_70416      LMGGVVVIAGAAATQVSGRVR------PSTLSHSPAPARVGV--------
Streptomyce|21552247|gb|AAK564      AVSGAAVVLGVLVGTTRSRAAREAGPPPAAGRPPKAPAERGRMLRRRPPG
Arthroba|119961334|ref|YP_9466      ILGGLILLLGVATAVLGAGRK------IRPETPVVRPALRL---------
Arthrobact|116669227|ref|YP_83      VAGGLLLLGGVAIAVLLPGRQ------GATPGQRRWHAQRRDVAFAGDVG
CandHTCC1062|71084032|ref|YP_2      AIGGLIIIFSVYRLQKIR--------------------------------
Candi|91762900|ref|ZP_01264865      AIGGLIIIFSVYRLQKIK--------------------------------
ORF_AH22480                         --------------------------------------------------
Pseudo|70734290|ref|YP_257930.      GISMGLILLALAVGQFDWRRLITLGRRSL---------------------
Marinomonas|87118525|ref|ZP_01      ILAAFFILVGLFISHLAANLNPFLFQKAAKKVALEKIGNK----------
Magnetos|144899236|emb|CAM7610      LVGGAITILGVAVVQFVGGIRRPPAEPEPGT-------------------
Caulobacter                         VAGAAICIVGVATTQIRSVGRPGLPSVPCVSVGPIPTECP----------
Hahell|83644648|ref|YP_433083.      SLGGALTLLGVVIINIPREQLRRVMHLLAGKRGASV--------------
Parviba|154252851|ref|YP_00141      LVGALVALTGVLIVSIRQKRIVATGP------------------------
Hypho|114798186|ref|YP_759211.      ILGAIVSLSGVLVIALRPNEKMPEAALGKKAGAGDS--------------
Maricau|114570639|ref|YP_75731      FVGGGLTLAGVGIIALRQNQKLPAAALAREKTL-----------------
Cauloba|16126806|ref|NP_421370      GIGAALALLGVLIIALRRNQVMPLLTSLRSRLQ-----------------
                                                                                      

Aeromona|117621088|ref|YP_8573      --------------------------------------------------
Marinomonas                         --------------------------------------------------
Rhodoco|111021196|ref|YP_70416      --------------------------------------------------
Streptomyce|21552247|gb|AAK564      PGDTGPDQSDGPASAVQNTQRS----------------------------
Arthroba|119961334|ref|YP_9466      --------------------------------------------------
Arthrobact|116669227|ref|YP_83      DGLAAGLGTDLGAADLGAGRAARGTADLAEGDAGRLAAGVRTAPDRDAGT
CandHTCC1062|71084032|ref|YP_2      --------------------------------------------------
Candi|91762900|ref|ZP_01264865      --------------------------------------------------
ORF_AH22480                         --------------------------------------------------
Pseudo|70734290|ref|YP_257930.      --------------------------------------------------
Marinomonas|87118525|ref|ZP_01      --------------------------------------------------
Magnetos|144899236|emb|CAM7610      --------------------------------------------------
Caulobacter                         --------------------------------------------------
Hahell|83644648|ref|YP_433083.      --------------------------------------------------
Parviba|154252851|ref|YP_00141      --------------------------------------------------
Hypho|114798186|ref|YP_759211.      --------------------------------------------------
Maricau|114570639|ref|YP_75731      --------------------------------------------------
Cauloba|16126806|ref|NP_421370      --------------------------------------------------
                                                                                      

Aeromona|117621088|ref|YP_8573      --
Marinomonas                         --
Rhodoco|111021196|ref|YP_70416      --
Streptomyce|21552247|gb|AAK564      --
Arthroba|119961334|ref|YP_9466      --
Arthrobact|116669227|ref|YP_83      RP
CandHTCC1062|71084032|ref|YP_2      --
Candi|91762900|ref|ZP_01264865      --
ORF_AH22480                         --
Pseudo|70734290|ref|YP_257930.      --
Marinomonas|87118525|ref|ZP_01      --
Magnetos|144899236|emb|CAM7610      --
Caulobacter                         --
Hahell|83644648|ref|YP_433083.      --
Parviba|154252851|ref|YP_00141      --
Hypho|114798186|ref|YP_759211.      --
Maricau|114570639|ref|YP_75731      --
Cauloba|16126806|ref|NP_421370      --

BLAST

--------------------------------------------------------------------------
BLAST de la traduction de notre ORF contre la banque nr avec 100 séquences
--------------------------------------------------------------------------



BLASTP 2.2.17 (Aug-26-2007) 
Reference:
Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schäffer, 
Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman 
(1997), "Gapped BLAST and PSI-BLAST: a new generation of 
protein database search programs", Nucleic Acids Res. 25:3389-3402.

Reference:
Schäffer, Alejandro A., L. Aravind, Thomas L. Madden, Sergei 
Shavirin, John L. Spouge, Yuri I. Wolf, Eugene V. Koonin, and 
Stephen F. Altschul (2001), "Improving the accuracy of PSI-BLAST 
protein database searches with composition-based statistics 
and other refinements", Nucleic Acids Res. 29:2994-3005.

RID: M0GV6GMM013


Database: All non-redundant GenBank CDS
translations+PDB+SwissProt+PIR+PRF excluding environmental samples
from WGS projects
           5,647,417 sequences; 1,951,883,922 total letters
 If you have any problems or questions with the results of this search please refer to the BLAST FAQs
Taxonomy reports
Query=  ORF_AH22480 Traduction [459-953 sens direct]
Length=165

Distance tree of results  
                                                                   Score     E
Sequences producing significant alignments:                       (Bits)  Value

ref|YP_266752.1|  Protein of unknown function DUF6 [Candidatus...   122    1e-26 
ref|ZP_01264865.1|  hypothetical protein PU1002_06506 [Candida...   116    4e-25
ref|YP_001413675.1|  protein of unknown function DUF6 transmem...  73.6    4e-12 
emb|CAM76100.1|  integral membrane protein [Magnetospirillum g...  68.2    2e-10
ref|YP_757319.1|  protein of unknown function DUF6, transmembr...  67.4    3e-10 
ref|YP_759211.1|  hypothetical protein HNE_0481 [Hyphomonas ne...  65.9    8e-10 
ref|YP_433083.1|  Permease of the drug/metabolite transporter ...  65.1    1e-09 
ref|YP_257930.1|  hypothetical protein PFL_0793 [Pseudomonas f...  55.5    1e-06 
ref|ZP_01422670.1|  Protein of unknown function DUF6, transmem...  53.9    4e-06
ref|ZP_01422210.1|  Protein of unknown function DUF6, transmem...  53.1    5e-06
ref|ZP_01422142.1|  Protein of unknown function DUF6, transmem...  52.8    6e-06
ref|NP_421370.1|  integral membrane protein [Caulobacter cresc...  52.8    8e-06 
ref|YP_704168.1|  probable amino acid metabolite transport pro...  52.4    1e-05 
ref|ZP_00056084.1|  COG0697: Permeases of the drug/metabolite ...  52.4    1e-05
ref|YP_420223.1|  Permease of the drug/metabolite transporter ...  52.0    1e-05 
ref|YP_946607.1|  putative integral membrane DUF6 domain prote...  52.0    1e-05 
ref|YP_001261629.1|  protein of unknown function DUF6, transme...  52.0    1e-05 
ref|YP_001155138.1|  protein of unknown function DUF6, transme...  51.6    1e-05 
ref|ZP_00959155.1|  hypothetical protein ISM_04970 [Roseovariu...  51.2    2e-05
ref|YP_830160.1|  protein of unknown function DUF6, transmembr...  49.7    7e-05 
ref|ZP_01743486.1|  Permease of the drug/metabolite transporte...  49.3    9e-05
ref|NP_421884.1|  integral membrane protein [Caulobacter cresc...  48.9    1e-04 
ref|NP_880696.1|  putative integral membrane protein [Bordetel...  48.9    1e-04 
ref|NP_420389.1|  integral membrane protein [Caulobacter cresc...  48.5    2e-04 
ref|ZP_00381207.1|  COG0697: Permeases of the drug/metabolite ...  48.1    2e-04
ref|YP_522352.1|  protein of unknown function DUF6, transmembr...  48.1    2e-04 
ref|ZP_01074424.1|  membrane protein [Marinomonas sp. MED121] ...  47.8    2e-04
ref|YP_857362.1|  transporter, 10 TMS drug/metabolite exporter...  47.8    2e-04 
gb|AAK56491.1|  unknown [Streptomyces clavuligerus] >gb|AAP135...  47.8    3e-04
ref|ZP_01018481.1|  integral membrane protein [Parvularcula be...  47.4    3e-04
ref|NP_127125.1|  hypothetical protein PAB2381 [Pyrococcus aby...  46.6    5e-04 
ref|YP_458569.1|  integral membrane protein [Erythrobacter lit...  46.6    5e-04 
ref|YP_687430.1|  predicted transporter (DMT superfamily) [unc...  46.6    5e-04 
ref|ZP_01420347.1|  Protein of unknown function DUF6, transmem...  46.6    5e-04
ref|NP_888400.1|  putative integral membrane protein [Bordetel...  46.2    7e-04 
ref|NP_884641.1|  putative integral membrane protein [Bordetel...  46.2    7e-04 
gb|EDP64757.1|  Permease of the drug/metabolite transporter su...  45.8    8e-04
ref|ZP_01580713.1|  protein of unknown function DUF6, transmem...  45.8    0.001
ref|YP_001102539.1|  probable amino acid metabolite transport ...  45.4    0.001 
ref|YP_001371109.1|  protein of unknown function DUF6 transmem...  45.1    0.001 
ref|YP_116511.1|  hypothetical protein nfa3050 [Nocardia farci...  45.1    0.002 
ref|ZP_01447791.1|  Permease of the drug/metabolite transporte...  45.1    0.002
ref|YP_001527166.1|  permeases [Azorhizobium caulinodans ORS 5...  44.3    0.002 
ref|YP_052469.1|  probable amino acid metabolite efflux pump [...  43.9    0.003 
ref|ZP_00952448.1|  integral membrane protein [Oceanicaulis al...  42.7    0.007
ref|YP_585566.1|  protein of unknown function DUF6, transmembr...  42.7    0.008 
ref|YP_001352837.1|  transporter of the DMT superfamily [Janth...  42.7    0.008 
emb|CAJ50115.1|  probable amino acid metabolite efflux pump [B...  42.4    0.009
ref|YP_586691.1|  protein of unknown function DUF6, transmembr...  42.4    0.011 
ref|NP_578046.1|  hypothetical protein PF0317 [Pyrococcus furi...  42.0    0.012 
ref|YP_001339046.1|  protein of unknown function DUF6 transmem...  42.0    0.013 
ref|ZP_00827635.1|  COG0697: Permeases of the drug/metabolite ...  41.6    0.015
ref|YP_270066.1|  membrane protein [Colwellia psychrerythraea ...  41.6    0.016 
ref|ZP_01511041.1|  protein of unknown function DUF6, transmem...  41.6    0.019
ref|YP_001342995.1|  protein of unknown function DUF6 transmem...  40.4    0.034 
ref|NP_745016.1|  hypothetical protein PP_2872 [Pseudomonas pu...  40.4    0.034 
ref|YP_612924.1|  protein of unknown function DUF6, transmembr...  40.4    0.040 
ref|YP_001321518.1|  protein of unknown function DUF6, transme...  40.0    0.044 
ref|YP_574720.1|  protein of unknown function DUF6, transmembr...  40.0    0.044 
ref|ZP_01569827.1|  protein of unknown function DUF6, transmem...  40.0    0.049
ref|YP_001339777.1|  protein of unknown function DUF6 transmem...  40.0    0.052 
ref|YP_001338952.1|  protein of unknown function DUF6 transmem...  40.0    0.054 
ref|YP_985365.1|  protein of unknown function DUF6, transmembr...  39.7    0.056 
ref|YP_561322.1|  protein of unknown function DUF6, transmembr...  39.7    0.061 
ref|YP_001268133.1|  protein of unknown function DUF6, transme...  39.7    0.061 
ref|YP_001022867.1|  putative integral membrane protein [Methy...  39.7    0.065 
ref|YP_297463.1|  Protein of unknown function DUF6, transmembr...  39.7    0.065 
ref|ZP_01733859.1|  hypothetical protein FBBAL38_05875 [Flavob...  39.7    0.066
ref|ZP_00741095.1|  Transporter, drug/metabolite exporter fami...  39.7    0.067
ref|ZP_01712301.1|  protein of unknown function DUF6, transmem...  39.7    0.069
ref|YP_001477683.1|  protein of unknown function DUF6 transmem...  39.3    0.073 
ref|YP_037252.1|  permease, drug/metabolite exporter family [B...  39.3    0.074 
ref|YP_277273.1|  Permease of the drug/metabolite transporter ...  39.3    0.083 
ref|YP_084009.1|  transporter, drug/metabolite exporter family...  38.9    0.096 
ref|ZP_01880023.1|  hypothetical protein RTM1035_19956 [Roseov...  38.9    0.100
ref|NP_845031.1|  transporter, EamA family [Bacillus anthracis...  38.9    0.12  
ref|YP_608586.1|  hypothetical protein PSEEN3025 [Pseudomonas ...  38.1    0.16  
ref|NP_832436.1|  Transporter, Drug/Metabolite Exporter family...  38.1    0.17  
ref|ZP_01519429.1|  protein of unknown function DUF6, transmem...  38.1    0.18 
ref|ZP_01075491.1|  hypothetical protein MED121_06635 [Marinom...  38.1    0.19 
ref|ZP_00240543.1|  transporter, Drug/metabolite exporter fami...  38.1    0.19 
ref|ZP_01370636.1|  protein of unknown function DUF6, transmem...  38.1    0.19 
ref|ZP_01771532.1|  Hypothetical protein COLAER_00519 [Collins...  37.7    0.21 
ref|YP_370134.1|  protein of unknown function DUF6, transmembr...  37.7    0.23  
ref|ZP_01638703.1|  protein of unknown function DUF6, transmem...  37.7    0.24 
ref|NP_626987.1|  integral membrane protein [Streptomyces coel...  37.7    0.26  
ref|YP_078499.1|  conserved membrane protein YoaV [Bacillus li...  37.4    0.28  
ref|YP_893188.1|  permease, drug/metabolite transporter superf...  37.4    0.29  
ref|ZP_01691165.1|  integral membrane protein DUF6 [Microscill...  37.4    0.30 
ref|YP_895206.1|  permease, drug/metabolite transporter superf...  37.4    0.32  
ref|ZP_00208159.1|  COG0697: Permeases of the drug/metabolite ...  37.4    0.33 
ref|YP_034608.1|  permease, drug/metabolite transporter (DMT) ...  37.4    0.35  
ref|YP_081870.1|  probable permease of the drug/metabolite tra...  37.0    0.36  
ref|YP_766030.1|  putative transmembrane protein [Rhizobium le...  37.0    0.36  
ref|YP_001207814.1|  Putative transport protein; putative perm...  37.0    0.39  
ref|ZP_01187870.1|  Protein of unknown function DUF6, transmem...  37.0    0.45 
ref|NP_830160.1|  Transporter, Drug/Metabolite Exporter family...  36.6    0.50  
ref|YP_501530.1|  protein of unknown function DUF6, transmembr...  36.6    0.50  
ref|NP_832932.1|  Transporter, Drug/Metabolite Exporter family...  36.6    0.50  
ref|ZP_00980463.1|  COG0697: Permeases of the drug/metabolite ...  36.6    0.52 


---------------------------------------------------------------------------------------------
Ce qui suit est le copier/coller des 10 alignements les plus homologues en terme de séquence.
---------------------------------------------------------------------------------------------



Alignments
   
  
>ref|YP_266752.1|  Protein of unknown function DUF6 [Candidatus Pelagibacter ubique 
HTCC1062]
 gb|AAZ22148.1|  Protein of unknown function DUF6 [Candidatus Pelagibacter ubique 
HTCC1062]
Length=285

 GENE ID: 3517042 SAR11_1344 | Protein of unknown function DUF6
[Candidatus Pelagibacter ubique HTCC1062] (10 or fewer PubMed links)

 Score =  122 bits (305),  Expect = 1e-26, Method: Composition-based stats.
 Identities = 74/166 (44%), Positives = 115/166 (69%), Gaps = 1/166 (0%)

Query  1    MQSKHLILVLIIMVLYGSSYPVGKLGLDT-IPPLLFTALRLGLIFLAFLPFFRFRLPEKH  59
            M  +H  LVL IM L+GSSYP+ KL L+T + P+L  +LR+ ++F+  +PF +F++P K 
Sbjct  1    MTVRHYFLVLFIMFLFGSSYPINKLALNTSLTPVLAASLRMFILFVCLVPFCKFKIPNKK  60

Query  60   LLKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKR  119
               PL GFS +MG G ++ +  +L+  ++VAPIIIGAQL+IPF ++ S +FL E ++ K 
Sbjct  61   YYLPLAGFSFSMGFGVFIFLNLSLQKATMVAPIIIGAQLAIPFAILASSLFLGEKVTPKM  120

Query  120  WILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAFFYALSNLMAEY  165
            W+LIF+SF GI +I YDP + ++ F + L  + AFFY ++N+ + Y
Sbjct  121  WVLIFISFFGIFLIGYDPNLKSEIFAIFLCAISAFFYGVANVFSRY  166


>ref|ZP_01264865.1|  hypothetical protein PU1002_06506 [Candidatus Pelagibacter ubique 
HTCC1002]
 gb|EAS85352.1|  hypothetical protein PU1002_06506 [Candidatus Pelagibacter ubique 
HTCC1002]
Length=273

 Score =  116 bits (291),  Expect = 4e-25, Method: Composition-based stats.
 Identities = 70/154 (45%), Positives = 109/154 (70%), Gaps = 1/154 (0%)

Query  13   MVLYGSSYPVGKLGLDT-IPPLLFTALRLGLIFLAFLPFFRFRLPEKHLLKPLLGFSLAM  71
            M L+GSSYP+ KL L+T + P+L  +LR+ ++F+  +PF +F++P K    PL GFSL+M
Sbjct  1    MFLFGSSYPINKLALNTSLTPVLAASLRMFILFVCLVPFCKFKIPNKKYYLPLAGFSLSM  60

Query  72   GIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKRWILIFLSFVGIV  131
            G G ++ +  +L+  ++VAPIIIGAQL+IPF ++ S +FL E ++ K W+LIF+SF GI 
Sbjct  61   GFGVFIFLNLSLQKATMVAPIIIGAQLAIPFAVLASSLFLGEKVTPKMWVLIFISFFGIF  120

Query  132  IIAYDPRIINDKFGLLLVIVMAFFYALSNLMAEY  165
            +I YDP + ++ F + L  + AFFY L+N+ + Y
Sbjct  121  LIGYDPNLKSEIFAIFLCAISAFFYGLANVFSRY  154


>ref|YP_001413675.1|  protein of unknown function DUF6 transmembrane [Parvibaculum 
lavamentivorans DS-1]
 gb|ABS64018.1|  protein of unknown function DUF6 transmembrane [Parvibaculum 
lavamentivorans DS-1]
Length=288

 GENE ID: 5455044 Plav_2409 | protein of unknown function DUF6 transmembrane
[Parvibaculum lavamentivorans DS-1] (10 or fewer PubMed links)

 Score = 73.6 bits (179),  Expect = 4e-12, Method: Composition-based stats.
 Identities = 52/161 (32%), Positives = 90/161 (55%), Gaps = 4/161 (2%)

Query  1    MQSKHLILVLIIMVLYGSSYPVGKLGLDTIPPLLFTALRLGLIFLAFLPFFRFRLPEKHL  60
            M   HL  +++I +++G +    K+ LD  PPLLF ALR  LI L   PF +     +  
Sbjct  1    MTPLHLGFMVLINLIWGFALIAAKVSLDHFPPLLFAALRFTLIVLVLFPFLKI---HRGR  57

Query  61   LKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKRW  120
            +K ++  +L  G   +   +  L  LS  + + + +QL +PF  ++S+ FL+E +  +RW
Sbjct  58   MKEVIIIALCAGPVGFGFFFVGLA-LSNASVVAVTSQLGVPFATIMSIFFLKEQVHWRRW  116

Query  121  ILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAFFYALSNL  161
            + I LSF+G++II++DP +     GLL V+  A   ++S +
Sbjct  117  LGISLSFLGVMIISFDPAVFTYIDGLLFVVASALVGSVSTI  157


>emb|CAM76100.1|  integral membrane protein [Magnetospirillum gryphiswaldense MSR-1]
Length=294

 Score = 68.2 bits (165),  Expect = 2e-10, Method: Composition-based stats.
 Identities = 49/164 (29%), Positives = 89/164 (54%), Gaps = 5/164 (3%)

Query  1    MQSKHLILVLIIMVLYGSSYPVGKLGLDTIPPLLFTALRLGLIFLAFLPFFRFRLPEKHL  60
            M  K  +L + ++ L+G ++   K+ + TIPP L TA+R  L+     P FR   P +  
Sbjct  1    MPLKDWLLAISVVTLWGLNFIAVKVAVQTIPPFLLTAIRFALVAAVLAPLFR---PARPQ  57

Query  61   LKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKRW  120
             K ++G SL +G+G +  M+  +  +   +  II  QL +PF  +++ V   E + L R 
Sbjct  58   WKGIIGISLVLGVGHFGLMFVGVSGMDAASAAII-TQLGVPFSALVAWVAFGEKLGLGRT  116

Query  121  ILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAFFYALSNLMAE  164
            I + L+F G+ ++A +P + +    L+LV+ M   +A+SN+  +
Sbjct  117  IGLILAFSGVALLAGEPSLPSLLPVLILVVAM-IAWAVSNVQVK  159


>ref|YP_757319.1|  protein of unknown function DUF6, transmembrane [Maricaulis maris 
MCS10]
 gb|ABI66381.1|  protein of unknown function DUF6, transmembrane [Maricaulis maris 
MCS10]
Length=304

 GENE ID: 4284343 Mmar10_2089 | protein of unknown function DUF6, transmembrane
[Maricaulis maris MCS10]

 Score = 67.4 bits (163),  Expect = 3e-10, Method: Composition-based stats.
 Identities = 47/174 (27%), Positives = 91/174 (52%), Gaps = 14/174 (8%)

Query  1    MQSKHLILVLIIMVLYGSSYPVGKL----------GLDTIPPLLFTALRLGLIFLAFLPF  50
            M+ K  +L++ + V++G ++ V K           G D +PP+ F  LR  L++    P+
Sbjct  1    MRLKDFLLLVAVCVVWGFNFVVAKFAVTGAPGWMPGFDGVPPIFFAFLRFALLYAFLAPW  60

Query  51   FRFRLPEKHLLKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVF  110
             R   P    +K ++G +L MG   Y  M+  +   +  + + I  Q+ +PF  +LS++F
Sbjct  61   LR---PRPADMKTMIGVALCMGALQYALMFLGMR-WATPSGMAIAVQMGVPFATILSVIF  116

Query  111  LRENISLKRWILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAFFYALSNLMAE  164
            L+E + L R   + L+F G++++  +P  ++   G+LL +  AF  AL  ++ +
Sbjct  117  LKERVGLPRIAGMMLAFGGVMLVILNPAAMDMSIGMLLGVGAAFVAALGMILVK  170


>ref|YP_759211.1|  hypothetical protein HNE_0481 [Hyphomonas neptunium ATCC 15444]
 gb|ABI76485.1|  putative membrane protein [Hyphomonas neptunium ATCC 15444]
Length=300

 GENE ID: 4288004 HNE_0481 | hypothetical protein
[Hyphomonas neptunium ATCC 15444] (10 or fewer PubMed links)

 Score = 65.9 bits (159),  Expect = 8e-10, Method: Composition-based stats.
 Identities = 51/156 (32%), Positives = 84/156 (53%), Gaps = 6/156 (3%)

Query  1    MQSKHLILVLIIMVLYGSSYPVGKLGLD--TIPPLLFTALRLGLIFLAFLPFFRFRLPEK  58
            M  +  IL+  + +++G +  V +  +    IPP+ F ALR   + +  +PF   R P  
Sbjct  1    MAIRDFILLCAVCLVWGLNLVVTRWAVADMAIPPIFFAALRFLGVAVCLVPFLFPRPPN-  59

Query  59   HLLKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLK  118
              L+ L   S+ +G   +  ++  L+H    A  + G QL +PF  ++S++FL E I  +
Sbjct  60   --LRTLFFVSIMIGSVHFSLLFIGLQHADASAAAVTG-QLGVPFSTLMSMLFLGEVIRWR  116

Query  119  RWILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAF  154
            R I I L+F+G++IIA DP   +  FGLL +I  AF
Sbjct  117  RAIGITLAFLGVIIIALDPANFSVSFGLLYIIASAF  152


>ref|YP_433083.1|  Permease of the drug/metabolite transporter (DMT) superfamily 
[Hahella chejuensis KCTC 2396]
 gb|ABC28658.1|  Permease of the drug/metabolite transporter (DMT) superfamily 
[Hahella chejuensis KCTC 2396]
Length=299

 GENE ID: 3839564 HCH_01819 | Permease of the drug/metabolite transporter (DMT)
superfamily [Hahella chejuensis KCTC 2396] (10 or fewer PubMed links)

 Score = 65.1 bits (157),  Expect = 1e-09, Method: Composition-based stats.
 Identities = 44/147 (29%), Positives = 74/147 (50%), Gaps = 3/147 (2%)

Query  16   YGSSYPVGKLGLDTIPPLLFTALRLGLIFLAFLPFFRFRLPEKHLLKPLLGFSLAMGIGT  75
            +G ++  GK G     PLLFTALR  ++     P+ +   P K  +KPLL  +  +G+  
Sbjct  16   WGFNFIAGKEGAQHFQPLLFTALRFAILLALTAPWLK---PAKGYMKPLLSVAFVLGVLH  72

Query  76   YVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKRWILIFLSFVGIVIIAY  135
            +  M+  L     +A + I  QL +PF  +L+   L+E+I   +   I L+  G+ II +
Sbjct  73   FSMMFLGLNAGGNIASVAIATQLYVPFSAILAAAILKESIGWIKGGAIVLALAGVFIIGF  132

Query  136  DPRIINDKFGLLLVIVMAFFYALSNLM  162
            DP + N    L  V+  A   A++ ++
Sbjct  133  DPVVFNHLDALAWVVGAAASMAVATIL  159


>ref|YP_257930.1|  hypothetical protein PFL_0793 [Pseudomonas fluorescens Pf-5]
 gb|AAY96195.1|  membrane protein, putative [Pseudomonas fluorescens Pf-5]
Length=318

 GENE ID: 3481377 PFL_0793 | hypothetical protein [Pseudomonas fluorescens Pf-5]
(10 or fewer PubMed links)

 Score = 55.5 bits (132),  Expect = 1e-06, Method: Composition-based stats.
 Identities = 45/163 (27%), Positives = 80/163 (49%), Gaps = 5/163 (3%)

Query  1    MQSKHLILVLIIMVLYGSSYPVGKLGLDTIPPLLFTALRLGLIFLAFLPFFRFRLPEKHL  60
            MQ KHL L L++  L+G ++P+ KLGL +I PLL TALR  L  L ++    F +P   +
Sbjct  25   MQKKHLFLALLVTALWGLNFPITKLGLASIDPLLLTALRFTLAALPWV----FLVPRPPV  80

Query  61   -LKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKR  119
                L  + L  G+  +  +   ++H        +  Q S  F L   ++   E + L++
Sbjct  81   AFAWLAAYGLIFGVAMWALINLGIDHGVAPGTAALLIQFSAFFSLGWGVLLFGERLRLQQ  140

Query  120  WILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAFFYALSNLM  162
             +   ++  G++ I  D        G  L++V AF +++ N++
Sbjct  141  VLATAIALWGLLRIIGDSPGHATSLGYALLLVSAFSWSVGNVI  183


>ref|ZP_01422670.1|  Protein of unknown function DUF6, transmembrane [Caulobacter 
sp. K31]
 gb|EAU09918.1|  Protein of unknown function DUF6, transmembrane [Caulobacter 
sp. K31]
Length=303

 Score = 53.9 bits (128),  Expect = 4e-06, Method: Composition-based stats.
 Identities = 44/164 (26%), Positives = 76/164 (46%), Gaps = 3/164 (1%)

Query  1    MQSKHLILVLIIMVLYGSSYPVGKLGLDTIPPLLFTALRLGLIFLAFLPFFRFRLPEKHL  60
            M    L   +++ +L+G  + V K+GL   PPL F  LRL  + +  LPF     P++  
Sbjct  1    MSRTQLACAVLVPLLWGLQFVVIKVGLTAFPPLFFVGLRLAAVAVILLPF--AGRPKRRE  58

Query  61   LKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKRW  120
            + P++  S+  G   +  M+  L    +     +  QLS PF ++L+  FL E       
Sbjct  59   IGPMIAISVFFGGLNFGLMFLGLGQ-GLAGVSAVANQLSTPFTVLLAWPFLGERPPKSVI  117

Query  121  ILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAFFYALSNLMAE  164
            I + L+F G+ + A +P         L VI      A+ +++A+
Sbjct  118  IGVALAFAGVALTAAEPSASVKMLPTLEVIAAGLALAVGSVLAK  161


>ref|ZP_01422210.1|  Protein of unknown function DUF6, transmembrane [Caulobacter 
sp. K31]
 gb|EAU10418.1|  Protein of unknown function DUF6, transmembrane [Caulobacter 
sp. K31]
Length=336

 Score = 53.1 bits (126),  Expect = 5e-06, Method: Composition-based stats.
 Identities = 36/133 (27%), Positives = 66/133 (49%), Gaps = 4/133 (3%)

Query  30   IPPLLFTALRLGLIFLAFLPFFRFRLPEKHLLKPLLGFSLAMGIGTYVTMYYALEHLSIV  89
            +PPL + A+R  ++    LP+    LP       ++   L MG G +  ++   +  S  
Sbjct  71   VPPLFYAAVRFAIVAAVTLPWL---LPAPRPTWRIVTVGLLMGAGNFALLFMGFKTASPS  127

Query  90   APIIIGAQLSIPFGLMLSLVFLRENISLKRWILIFLSFVGIVIIAYDPRIINDKFGLLLV  149
            A  ++  QL +PF  +LS++ L E +  KR + I L+  G V++ ++P  +    GL  +
Sbjct  128  AAAVV-IQLGVPFTTILSMLMLGEQVRWKRGLGIALTLSGAVVVMWNPHGLQLSPGLWFI  186

Query  150  IVMAFFYALSNLM  162
            +  AF  +L  +M
Sbjct  187  VASAFTGSLGAVM  199





----------------------------------------------------------------------------------
BLAST de la traduction de notre ORF contre la banque Swiss Prot avec 100 séquences
----------------------------------------------------------------------------------


Job Title: ORF_AH22480 Traduction [459-953 sens direct]
Show Conserved Domains 
No putative conserved domains have been detected
 



   
  


BLASTP 2.2.17 (Aug-26-2007) 
Reference:
Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schäffer, 
Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman 
(1997), "Gapped BLAST and PSI-BLAST: a new generation of 
protein database search programs", Nucleic Acids Res. 25:3389-3402.

Reference:
Schäffer, Alejandro A., L. Aravind, Thomas L. Madden, Sergei 
Shavirin, John L. Spouge, Yuri I. Wolf, Eugene V. Koonin, and 
Stephen F. Altschul (2001), "Improving the accuracy of PSI-BLAST 
protein database searches with composition-based statistics 
and other refinements", Nucleic Acids Res. 29:2994-3005.

RID: MUFC6N7F013


Database: Non-redundant SwissProt sequences
           263,422 sequences; 100,341,196 total letters
 If you have any problems or questions with the results of this search please refer to the BLAST FAQs
Taxonomy reports
Query=  ORF_AH22480 Traduction [459-953 sens direct]
Length=165



                                                                   Score     E
Sequences producing significant alignments:                       (Bits)  Value

sp|O29470|Y788_ARCFU  Uncharacterized transporter AF_0788          35.4    0.093
sp|O34416|YOAV_BACSU  Uncharacterized transporter yoaV             35.4    0.095
sp|O32256|YVBV_BACSU  Uncharacterized transporter yvbV             33.9    0.28 
sp|P31125.2|EAMA_ECOLI  Probable amino-acid metabolite efflux pum  32.3    0.84  
sp|Q12333|FRE7_YEAST  Ferric reductase transmembrane component...  31.6    1.4  
sp|Q1RKL2|SAM_RICBR  S-adenosylmethionine uptake transporter       31.6    1.5  
sp|Q4UNE6|SAM_RICFE  S-adenosylmethionine uptake transporter       30.8    2.1  
sp|P96680|YDFC_BACSU  Uncharacterized transporter ydfC             30.4    2.8  
sp|Q92JG1|SAM_RICCN  S-adenosylmethionine uptake transporter       30.0    4.1  
sp|O51601|RPIA_BORBU  Ribose-5-phosphate isomerase A (Phosphoribo  29.6    4.9  
sp|Q5K915|HUT1_CRYNE  UDP-galactose transporter homolog 1          29.6    5.1  
sp|P0AA70.1|YEDA_ECOLI  Uncharacterized inner membrane transpo...  29.3    7.0   
sp|Q68XV0|SAM_RICTY  S-adenosylmethionine uptake transporter       29.3    7.7  
sp|Q8BY79|TMM20_MOUSE  Transmembrane protein 20                    28.9    7.9   
sp|P03879|MBI4_YEAST  Intron-encoded RNA maturase bI4 precurso...  28.9    8.3   
sp|Q92BW9|FTSK_LISIN  DNA translocase ftsK                         28.9    9.5  



---------------------------------------------------------------------------------------------
Ce qui suit est le copier/coller des 10 alignements les plus homologues en terme de séquence.
---------------------------------------------------------------------------------------------


>sp|O29470|Y788_ARCFU  Uncharacterized transporter AF_0788
Length=308

 Score = 35.4 bits (80),  Expect = 0.093, Method: Composition-based stats.
 Identities = 15/42 (35%), Positives = 28/42 (66%), Gaps = 0/42 (0%)

Query  11  IIMVLYGSSYPVGKLGLDTIPPLLFTALRLGLIFLAFLPFFR  52
           ++ +++GS++PV K+ LD++ P  F  +R  +  L FLPF +
Sbjct  49  LVALIWGSTFPVVKIALDSMSPFAFNTVRFFIACLFFLPFLK  90


>sp|O34416|YOAV_BACSU  Uncharacterized transporter yoaV
Length=292

 Score = 35.4 bits (80),  Expect = 0.095, Method: Composition-based stats.
 Identities = 42/171 (24%), Positives = 87/171 (50%), Gaps = 14/171 (8%)

Query  4    KHLILVLIIMVLYGSSYPVGKLGLDTIPPLLFTALRLGLIFLAFLPFF------RFRLP-  56
            K ++ ++ + +++G ++   K+G+  IPPLLF+ LRL   F+  +P F      R +L  
Sbjct  3    KVMLGIISVTLIWGYTWVAMKVGIHDIPPLLFSGLRL---FIGAVPLFLILFIQRKKLSI  59

Query  57   EKHLLKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENIS  116
            +K  LK  +  SL MG+G    + Y ++ +      ++   + I F  ++S   L E ++
Sbjct  60   QKEHLKSYIIMSLLMGLGYMGILTYGMQFVDSGKTSVLVYTMPI-FVTVISHFSLNEKMN  118

Query  117  LKRWILIFLSFVGIVIIAYDPRIINDK---FGLLLVIVMAFFYALSNLMAE  164
            + + + +     G++ I     +  D+   FG L V+V A  + ++N+ ++
Sbjct  119  VYKTMGLVCGLFGLLFIFGKEMLNIDQSALFGELCVLVAALSWGIANVFSK  169


>sp|O32256|YVBV_BACSU  Uncharacterized transporter yvbV
Length=305

 Score = 33.9 bits (76),  Expect = 0.28, Method: Composition-based stats.
 Identities = 35/144 (24%), Positives = 71/144 (49%), Gaps = 20/144 (13%)

Query  2    QSKHLILVLIIMVLYGSSYPVGKLGLDTIPPLLFTALR-----LGLIFLAFLPFFRFRLP  56
            +++  +L+  +++++G ++P+ K  L   PPLLF  +R     L L+ +A     + RL 
Sbjct  6    KTRTALLLAFLVIMWGVNWPLSKAALAYSPPLLFAGIRTLIGGLLLVIVALPRIHKLRLK  65

Query  57   EK---HLLKPLLGFSLAMGIGTYVTMYYALEHLSIVA---PIIIGAQLSIPFGLMLSLVF  110
            E    +L+  LL  +L  G+ T    Y      S +    P+++G         + S ++
Sbjct  66   ETWPIYLVSALLNITLFYGLQTIGLNYLPAGLFSAIVFFQPVLMG---------VFSWLW  116

Query  111  LRENISLKRWILIFLSFVGIVIIA  134
            L E++ + + I + L F G+ +I+
Sbjct  117  LGESMFVMKVIGLILGFAGVAVIS  140


>sp|P31125.2|EAMA_ECOLI  Probable amino-acid metabolite efflux pump
Length=299

 GENE ID: 946081 eamA | cysteine and O-acetyl-L-serine efflux system
[Escherichia coli K12] (Over 10 PubMed links)

 Score = 32.3 bits (72),  Expect = 0.84, Method: Composition-based stats.
 Identities = 44/165 (26%), Positives = 77/165 (46%), Gaps = 9/165 (5%)

Query  1    MQSKHLILVLIIMVLYGSSYPVGKLGLDTIPPLLFTALRLGLIFLAFLPFFRFRLPEKHL  60
            M  K  +L L+++V++G ++ V K+GL  +PPL+   LR  L+  AF   F    P K  
Sbjct  1    MSRKDGVLALLVVVVWGLNFVVIKVGLHNMPPLMLAGLRFMLV--AFPAIFFVARP-KVP  57

Query  61   LKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKRW  120
            L  LLG+ L +    +  ++ A+          +  Q    F +ML      E +  K+ 
Sbjct  58   LNLLLGYGLTISFAQFAFLFCAINFGMPAGLASLVLQAQAFFTIMLGAFTFGERLHGKQL  117

Query  121  ILIFLSFVGIVIIAYDPRIINDK----FGLLLVIVMAFFYALSNL  161
              I L+  G++++  D   +N +     G +L +  AF +A  N+
Sbjct  118  AGIALAIFGVLVLIEDS--LNGQHVAMLGFMLTLAAAFSWACGNI  160


>sp|Q12333|FRE7_YEAST  Ferric reductase transmembrane component 7 (Ferric-chelate reductase 
7)
Length=629

 Score = 31.6 bits (70),  Expect = 1.4, Method: Composition-based stats.
 Identities = 19/70 (27%), Positives = 37/70 (52%), Gaps = 14/70 (20%)

Query  30   IPPLLFTALRLGLIFLAFLPFFRFRLPEKHLLKPLLGFSLAMGIGTYVTMYYAL-----E  84
            +PP+LF    L L++L+ LP  R     +H  +  L     + +G Y++++Y +      
Sbjct  242  VPPILF----LNLLWLSSLPIAR-----RHFYEIFLQLHWILAVGFYISLFYHVYPELNS  292

Query  85   HLSIVAPIII  94
            H+ +VA I++
Sbjct  293  HMYLVATIVV  302


>sp|Q1RKL2|SAM_RICBR  S-adenosylmethionine uptake transporter
Length=291

 Score = 31.6 bits (70),  Expect = 1.5, Method: Composition-based stats.
 Identities = 18/36 (50%), Positives = 26/36 (72%), Gaps = 1/36 (2%)

Query  98   LSIP-FGLMLSLVFLRENISLKRWILIFLSFVGIVI  132
             SIP F L+L++ FL ENI  +RW++  + FVG+VI
Sbjct  104  FSIPLFTLILAVFFLNENIIWQRWVVTIVGFVGLVI  139


>sp|Q4UNE6|SAM_RICFE  S-adenosylmethionine uptake transporter
Length=294

 Score = 30.8 bits (68),  Expect = 2.1, Method: Composition-based stats.
 Identities = 18/47 (38%), Positives = 30/47 (63%), Gaps = 3/47 (6%)

Query  89   VAPIIIGA--QLSIP-FGLMLSLVFLRENISLKRWILIFLSFVGIVI  132
            +AP+        SIP F L+L++ FL ENI  +RW++  + F+G+V+
Sbjct  93   IAPVTTATVVSFSIPLFTLILAVFFLNENIIWQRWVVTVVGFIGLVV  139


>sp|P96680|YDFC_BACSU  Uncharacterized transporter ydfC
Length=306

 Score = 30.4 bits (67),  Expect = 2.8, Method: Composition-based stats.
 Identities = 40/156 (25%), Positives = 68/156 (43%), Gaps = 20/156 (12%)

Query  11   IIMVLYGSSYPVGKLGLDTIPP---LLFTALRLGLIFLAFLPFFRFRLPEKH-----LLK  62
            +++ L+ S++P  + GL+   P    LF  L   +  L F    + RLP+        L 
Sbjct  14   LMIGLWASAFPGIRAGLEGYTPEHLALFRLLIGSMALLLFAVLTQMRLPDLKDIPAIFLL  73

Query  63   PLLGFS---LAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKR  119
              LGF+   + + IG           L   API         F  MLS +F +E+    +
Sbjct  74   GFLGFAFYHILLNIGEKTVSAGVASLLVTTAPI---------FSAMLSRLFYKEHFGFTK  124

Query  120  WILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAFF  155
            W+   +S +G+++IA+           +LVI++A F
Sbjct  125  WLGSMISLLGVLLIAFGAGDFTYSMSGILVILLAAF  160


>sp|Q92JG1|SAM_RICCN  S-adenosylmethionine uptake transporter
Length=294

 Score = 30.0 bits (66),  Expect = 4.1, Method: Composition-based stats.
 Identities = 18/47 (38%), Positives = 29/47 (61%), Gaps = 3/47 (6%)

Query  89   VAPIIIGA--QLSIP-FGLMLSLVFLRENISLKRWILIFLSFVGIVI  132
            +AP+        SIP F L+L++ FL ENI   RW++  + F+G+V+
Sbjct  93   IAPVTTATVVSFSIPLFTLILAVFFLNENIIWPRWVVTVVGFIGLVV  139


>sp|O51601|RPIA_BORBU  Ribose-5-phosphate isomerase A (Phosphoriboisomerase A) (PRI)
Length=228

 Score = 29.6 bits (65),  Expect = 4.9, Method: Composition-based stats.
 Identities = 13/33 (39%), Positives = 22/33 (66%), Gaps = 0/33 (0%)

Query  55  LPEKHLLKPLLGFSLAMGIGTYVTMYYALEHLS  87
           L  KH +   +  ++ +GIGT  T+YYA+++LS
Sbjct  7   LVAKHAIDHYIKSNMNLGIGTGTTIYYAIKYLS  39




ORF finding

-------------------------------------------------------------------------
SMS ORF Finder/ Any codon / standard code / Frame 1,2 et 3/ direct strand avec minimum 60codons
-------------------------------------------------------------------------


ORF Finder results
Results for 1024 residue sequence "ORF_AH22480 ADN génomique (Galapagos Islands: Wolf Island)" starting "ATATCCACTT"
No ORFs were found in reading frame 1.

>ORF number 1 in reading frame 2 on the direct strand extends from base 2 to base 262.
TATCCACTTGAGGTTAATTGGGATCATTGGGAAAATAAGATTAACGAAAGATTTATAATT
TTTGATACAGAAAATGATCAGGGCATAAGAATGAATAATGCCATATTATCAGAAGATTCT
ATACTTCAAAACCTATCAAGTGAAAATCTATCTATTGAACAAAAATGTATTATTTTTGAT
GATCTATTTGATCGTACAACACTCTCCAAAATAGTAGTTTCGTCACTTTATGATAATTTT
TTACATGGCAAATGTATTTAA

>Translation of ORF number 1 in reading frame 2 on the direct strand.
YPLEVNWDHWENKINERFIIFDTENDQGIRMNNAILSEDSILQNLSSENLSIEQKCIIFD
DLFDRTTLSKIVVSSLYDNFLHGKCI*

>ORF number 2 in reading frame 2 on the direct strand extends from base 434 to base 613.
GTATTTAATCAATTAGATTTAATAAATGCAATCAAAGCATCTTATTTTAGTTCTAATCAT
AATGGTTTTGTATGGAAGCTCTTATCCAGTTGGAAAACTTGGGTTAGATACTATCCCCCC
ATTATTGTTTACCGCACTAAGACTTGGATTAATTTTTTTAGCTTTCCTGCCTTTCTTTAG


>Translation of ORF number 2 in reading frame 2 on the direct strand.
VFNQLDLINAIKASYFSSNHNGFVWKLLSSWKTWVRYYPPIIVYRTKTWINFFSFPAFL*


>ORF number 1 in reading frame 3 on the direct strand extends from base 459 to base 956.
ATGCAATCAAAGCATCTTATTTTAGTTCTAATCATAATGGTTTTGTATGGAAGCTCTTAT
CCAGTTGGAAAACTTGGGTTAGATACTATCCCCCCATTATTGTTTACCGCACTAAGACTT
GGATTAATTTTTTTAGCTTTCCTGCCTTTCTTTAGGTTTAGGCTACCTGAAAAACATTTA
TTAAAGCCTTTGCTTGGGTTTTCTCTTGCTATGGGAATTGGAACCTATGTGACAATGTAC
TATGCTTTAGAGCATTTATCTATTGTTGCGCCAATTATCATTGGAGCACAATTATCAATT
CCATTTGGTTTGATGCTTAGTTTAGTCTTCTTGAGAGAGAATATTTCCTTAAAACGTTGG
ATTCTTATATTTTTATCTTTTGTTGGGATAGTTATTATTGCTTATGACCCTAGAATTATT
AATGACAAGTTTGGATTGTTGTTAGTTATAGTAATGGCATTTTTCTATGCTCTATCAAAT
CTTATGGCAGAGTATTAA

>Translation of ORF number 1 in reading frame 3 on the direct strand.
MQSKHLILVLIIMVLYGSSYPVGKLGLDTIPPLLFTALRLGLIFLAFLPFFRFRLPEKHL
LKPLLGFSLAMGIGTYVTMYYALEHLSIVAPIIIGAQLSIPFGLMLSLVFLRENISLKRW
ILIFLSFVGIVIIAYDPRIINDKFGLLLVIVMAFFYALSNLMAEY*





---------------------------------------------------------------------------
SMS ORF Finder/ Any codon / standard code / Frame 1,2 et 3/ indirect strand avec au moins 60codons
---------------------------------------------------------------------------


ORF Finder results
Results for 1024 residue sequence "ORF_AH22480 ADN génomique (Galapagos Islands: Wolf Island)" starting "ATATCCACTT"
No ORFs were found in reading frame 1.

No ORFs were found in reading frame 2.

No ORFs were found in reading frame 3.