Bonjour Monsieur,
J'ai 2 questions concernant la Table 2 "Liste des domaines protéiques conservés détectés par InterproScan, après nettoyage de la redondance" ;
- Premièrement, où pouvons-nous trouver l'intitulé de la banque d'origine, est-ce que c'est seulement à partir des données TSV ?
- Deuxièmement, est-ce qu'on doit seulement s'intéresser aux domaines protéiques pour l'analyse de nos résultats ou on doit aussi parler des Family, Homologous Superfamily, Unintegrated etc. ?
En vous remerciant par avance pour votre retour,
Thibault ANTOINE M2 Sciences de la Mer
Bonjour,
1- Oui, quand l'intitulé de la banque d'origine existe (par PFAM, ou PANTHER) il est spécifié dans le format CSV.
2- Vous pouvez utiliser toutes les types de classification d'INTERPRO : domaines à super-familles. Dans le cas général vous pouvez ignorer les "unintegrated", sauf s'il n'y a rien d'autre d'exploitable.
Bonne journée !