Forum "Recherche d'homologues: BLAST"

Thread subject: Détermination de la e-value seuil

[ Return to forums ]
Détermination de la e-value seuil
Carbon14
12 Aug 2023 23:33
Non evaluated contribution

Bonjour,
en essayant de déterminer les synonymes des fonctions comme dans la vidéo via QuickGO afin de déterminer la E-value Seuil je n'obtiens pas pareil. J'ai donc cherché un moment à travers les fiches de la colonne "Accession" et sur NCBI pour essayer de comprendre quelles fonctions étaient synonyme. J’ai compilé ce que j’ai trouvé et crois avoir compris dans un tableur que je vais essayer de joindre en fin de message.
Il me semble que les protéine dite « Bactériorhodopsine-like » et « bactériorhodopsine » ont des fonctions quasi similaires j’ai donc envie de les considérer comme « synonyme » et placer ma valeur seuil plus loin.
Dans un second temps « rhodopsin » « fami
ly A G protein-coupled receptor-like protein » « microbial rhodopsin family protein » semble être la même chose qui désignerais la fonction « sensory rhodopsin I », mais je n’en suis vraiment pas sûr vu le peu d’information disponible.
Ils seraient donc proche de « sensory rhodopsin II» et « sensory rhodopsin III ». Cependant ces désignations dans la liste concernent que peux de lignes et qui sont souvent annoté de manière pas très détaillée (issus du blastp contre RefSeq_protein).  Est-il pertinent de les prendre en compte, ou de les considéré comme les protéines hypothétique/ non caractérisé ?
En regroupant ce qui semble être la même chose sous des noms différent et en excluant les protéines hypothétique, non caractérisé ou non nommé une version simplifiée de ma table 3 serait :

 

Definitions

nb lignes

min E-value

max E-value

bacteriorhodopsin-like

843

7,00E-102

4.9

bacteriorhodopsin

648

3,00E-84

9.9

sensory rhodopsin I ?

7

5,00E-07

4.7

sensory rhodopsin II

26

3,00E-06

2.5

sensory rhodopsin III

5

0.037

0.21

TetR family transcriptional regulator

1

8.7

8.7


Dans ce cas, La E valeur seuil est elle 8.7 qui désigne l’alignement avec « TetR family transcriptional regulator » qui est clairement un non homologue ?
Dois-je retiré du tableau « sensory rhodopsin I » ? Ou au contraire y chercher ma valeur seuil vu que la E value de certaines lignes tend vers 1 voir le dépasse parfois ?

J’ai le même souci avec Le blastp conte Swissprot à la différence qu’il ne m’a retournée que 7 résultats.

Dans l’attente de votre réponse, cordialement.





Table annexe 1 mentionné au début du message

noms  Description GO Terme associés  Lien  conclusion 
bacteriorhodopsin-like bactériorhodopsine-like comme la xanthorhodopsine, une pompe à protons actionnée par la lumière avec un double chromophore, et les protéorhodopsines absorbant la lumière verte et bleue, qui agissent comme une pompe à protons actionnée par la lumière qui joue un rôle majeur dans la fourniture d'énergie lumineuse aux micro-organismes marins phototropes , par un mécanisme similaire à celui de la bactériorhodopsine   https://www.ncbi.nlm.nih.gov/Structure/sparcle/archview.html?archid=11607111#nmlbl Homologue de la séquence, protéine codé par ORF2 à la même fonction 
bacteriorhodopsin Les opsines bactériennes sont des protéines de liaison à la rétine qui assurent le transport des ions et les fonctions sensorielles dépendant de la lumière à une famille de bactéries halophiles [2,3]. Ce sont des protéines membranaires intégrales censées contenir sept domaines transmembranaires (TM), dont le dernier contient le point d'attache de la rétine (une lysine conservée). Cette famille comprend également des protéines apparentées à distance qui ne contiennent pas de lysine de liaison rétinienne et ne peuvent donc pas fonctionner comme des opsines. Quelques exemples sont : Swiss : O74870, Swiss : P25619, Swiss : P38079, Swiss : Q12117. (de Pfam) Biological process GO:0006811monoatomic ion transport, Cellular component GO:0016020 membrane https://www.ncbi.nlm.nih.gov/genome/annotation_prok/evidence/NF013223/ Fonction très proche, quasi similaire, je suppose homologue de la séquence
rhodopsin concerne 2 ligne semble être 2 annotation incomplètes      
sensory rhodopsin II (sop2) Photorécepteur photophobe responsable de la phototaxie négative. Active le transducteur sensoriel rhodopsine II (HTR-II) en réponse à la lumière bleue   Biological process: phototransduction (GO:0007602)Molecular function: photoreceptor activity (GO:0009881) https://www.ncbi.nlm.nih.gov/genome/annotation_prok/evidence/NBR014940/       https://www.ebi.ac.uk/QuickGO/annotations?geneProductId=P42197 Sensory rhodopsin I, II & III homologue entre eux fonction et GO proche homologie avec  bacteriorhodopsin-bacteriorhodopsin-like?
family A G protein-coupled receptor-like protein pas de définition concerne 2 séquence mal annotés  mal annoté     
sensory rhodopsin III (xop2) pas de définition Biological process: phototransduction (GO:0007602)Molecular function: photoreceptor activity (GO:0009881) https://www.ncbi.nlm.nih.gov/genome/annotation_prok/evidence/NBR014942/  
microbial rhodopsin family protein la protéine microbienne de la famille des rhodopsines, également connue sous le nom de rhodopsine de type 1, peut fonctionner comme une pompe ionique, un canal cationique ou un capteur dépendant de la lumière ; similaire à un importateur de chlorure de cyanobactérie guidé par la lumière, qui contient un domaine à sept transmembranes similaire à celui d'autres récepteurs couplés aux protéines G (GPCR), mais se distingue par un résidu de lysine qui est un site de liaison rétinienne dans la septième hélice   https://www.ncbi.nlm.nih.gov/Structure/sparcle/archview.html?archid=11606509 Semble pareil que "Family A G protein coupled receptor-like preotein" semble aussi être pareil que "rhodopsin"
TetR family transcriptional regulator   Molecular function: DNA binding (GO:0003677)   Non homologue fonction clairement différente 
ATP-dependent protease La (swissprot) ATP-dependent serine protease that mediates the selective degradation of mutant and abnormal proteins as well as certain short-lived regulatory proteins. Required for cellular homeostasis and for survival from DNA damage and developmental changes induced by stress. Degrades polypeptides processively to yield small peptide fragments that are 5 to 10 amino acids long. Binds to DNA in a double-stranded, site-specific manner.   https://www.ncbi.nlm.nih.gov/protein/B8F9K1.1?report=genbank&log$=prottop&blast_rank=7&RID=DF2ARZG8013 Non homologue fonction clairement différente
Meglecz23CTES
13 Aug 2023 9:33
Game master

Bonjour,


Tout d’abord, bravo pour votre analyse de fonctions !

 

Vos explications me semblent cohérentes, et le tableau simplifié et très bien. Vous avez raison d’écarter la fonction 'TetR family transcriptional regulator'.


En ce qui concerne les fonctions sensory rhodopsin I-III, vous avez raison aussi. Vu que les annotations sont peu détaillées, le faible nombre des séquences concernées, et surtout que les E-valeur sont relativement hautes, vous pouvez placer le seuil en dessous de meilleurs E-valeur de ces hits.  Notez quand même dans votre rapport, que c'est une décision pragmatique pour la suite de votre travail : Le but de trouver une E-valeur seuil entre homologues et non-homologues, c’est d’éviter de prendre des séquences non-homologues pour les analyses phylogénétiques. Pour les hits sensory rhodopsin I-III vous avez émis un doute légitime, il faut donc prendre une décision plutôt prudente, quitte à éliminer quelques homologues.

 

Bon travail,
Emesse Meglecz

 

Carbon14
14 Aug 2023 17:22
Non evaluated contribution

Merci pour votre réponse.
Je continu donc en les excluants. J'avais un peu peur d'avoir mal compris quelque chose et de faire fausse route.
Cordialement.