Forum "Domaines conservés: INTERPRO"

Sujet de discussion: domaines concervés

[ Retour aux forums ]
domaines concervés
magorne
14 Dec 2008 18:19
Contribution: Pertinent
La 2nd séquence de notre panier (binome magorne) comprend 8 domaines concervés selon les résultats
donnés par interpro scan ... l'analyse des différentes fiches nous montre que les domaines
se cheuvauchent entres eux et recouvrent à eux tous la quasi totalité de notre séquence et ceux si pour une meme fonction "peptidase".
comment choisir les domaines que l'on met dans le tableau .. je n'arrive pas vraiment à justifier un
choix plutot qu'un autre ... deplus, toutes les séquences ont un lien de "parenté" c'est à dire que les différents domaines se retrouvent cités dans chacunes des fiches ...
Comment dois mis prendre ?

GOS_673020        685CBECE5BF0AFD8        298        Gene3D        G3DSA:3.30.830.10        no description        52        240        1.6e-25        T        22-Nov-2008        IPR011237        Peptidase M16, core        Molecular Function: catalytic activity (GO:0003824), Molecular Functi
on: metal ion binding (GO:0046872)
GOS_673020        685CBECE5BF0AFD8        298        superfamily        SSF63411        LuxS/MPP-like metallohydrolase        34        241        5.2e-30        T        22-Nov-2008        IPR011249        Metalloenzyme, LuxS/M16 peptidase-like, metal-binding        Molecular Function: cat
alytic activity (GO:0003824), Molecular Function: metal ion binding (GO:0046872)
GOS_673020        685CBECE5BF0AFD8        298        HMMPfam        PF00675        Peptidase_M16        35        168        0.067        T        22-Nov-2008        IPR011765        Peptidase M16, N-terminal        Molecular Function: metalloendopeptidase activity (GO:0004222), Biological
Process: proteolysis (GO:0006508)
GOS_673020        685CBECE5BF0AFD8        298        HMMPfam        PF05193        Peptidase_M16_C        202        295        2.5e-11        T        22-Nov-2008        IPR007863        Peptidase M16, C-terminal        Molecular Function: metalloendopeptidase activity (GO:0004222), Biolog
ical Process: proteolysis (GO:0006508), Molecular Function: zinc ion binding (GO:0008270)
GOS_673020        685CBECE5BF0AFD8        298        HMMPanther        PTHR11851:SF68        METALLOPROTEASE 1-RELATED        45        140        6.3e-97        T        22-Nov-2008        NULL        NULL        
GOS_673020        685CBECE5BF0AFD8        298        HMMPanther        PTHR11851:SF68        METALLOPROTEASE 1-RELATED        158        294        6.3e-97        T        22-Nov-2008        NULL        NULL        
GOS_673020        685CBECE5BF0AFD8        298        HMMPanther        PTHR11851        METALLOPROTEASE        45        140        6.3e-97        T        22-Nov-2008        NULL        NULL        
GOS_673020        685CBECE5BF0AFD8        298        HMMPanther        PTHR11851        METALLOPROTEASE        158



Merci par avance
Macchi Magali
opale
14 Dec 2008 19:32
Contribution: Constructif
dans un premier temps regarde si un domaine est le parent des autres, si c'est le cas tu dois choisir ce domaine.
vérifie aussi que l'un de tes domaines ne contient pas les autres
si tu as plusieurs domaines ( sans parents, l'un ne contient pas l'autre) je pense que tu dois choisir celui qui a la meilleur e-value ( c'est ce que nous a dit un des professeur).
je sais pas si je suis clair dans mes explications, c'est difficile d'expliquer à l'écrit sans avoir sous les yeux les résultats d'interpro scan.
magorne
14 Dec 2008 20:24
Contribution: Pertinent
le probleme c'est que tous mes domaines sont parents !!
des que je lis les differentes fiches , elles sont toutes liées d'une maniere ou d'une autre  ... càd qu'un est parent de deux et ceux ci sont parents avec un autre .. qui est lui meme lié à la 1ere ... je ne sais plus ou donner de la tete !!
En plus elles s'accordent dans la meme fonction.
Je ne sais pas comment discriminer ces infos..
Merci quand meme , je pense que pour le theorique c'est vraie mais j'ai du mal a l'appliquer pour ma séquence ...
Si t'as une autre idee n'hesites pas mais je crois qu'il va falloir choisir de façon plus ou moins arbitraire et se justifier car pour le coup, je ne crois pas qu'il y a une solution simple et direct.
Merci encore et bon courage pour tes séquences
opale
14 Dec 2008 20:33
Contribution: Constructif
si tu as plusieurs fiches différentes d'interpro je sais pas trop comment t'aider, alors dans ce cas tu peut choisir celui qui a la meilleure e-value.
fais attention parce que une fiche interpro a différentes appelations
par exemple pour ma séquence j'ai 3 domaines avec des identifiants différents mais en fait ils font partis de la même famille de domaine (ils ont le même identifiant chez inter pro)
peut être que tu as une famille de domaine comme moi
regarde sous l'identifiant d'interpro s'il n'y a pas le mot family en dessous
opale
14 Dec 2008 20:52
Contribution: Constructif
je crois que j'ai compris
tu as le domaine IPR011249 qui est le parent de IPR011237 (donc celui là tu ne le prend pas)
ensuite tu peux voir que ce même domaine contient IPR011765 (qui contient IPR001431) et IPR007863
tu as donc le domaine IPR011249 qui contient tous les autres
c'est celui-là que tu dois choisir
voilà j'espère que tu y verras plus clair
bonne chance
Hingamp_BC08
15 Dec 2008 8:47
Maître de jeu
En jetant un oeil à vos annotations, c'est clair que tous les domaines sont liés. Pas mal de choses pertinentes ont été mentionnées par opale (rares et précieux sont ceux qui trouvent le temps d'écrire un mot pour tenter de dépanner les collègues) mais j'ajouterais qu'il semble y avoir deux sous domaines: un N-term et un C-term non-chevauchants (par ex les deux prédictions PFAM PF00675 et PF05193), qui ensemble définissent la protéine. S'il y avait un domaine clairement annoté qui couvrait ces deux parties, vous pourriez le choisir, mais en l'occurrence pourquoi ne pas sélectionner ces deux là (non-chevauchants et complémentaires)? Il est vrai que le E-value de la partie N-term est moins impressionnant (0.067), mais sa présence en amont du domaine C-term le rend du coup très crédible!
Comme vous le dites, dans tous les cas justifiez bien votre choix, pour que l'on comprenne bien la démarche.