Forum "Recherche d'ORF"

Thread subject: <50% d'identité et hypothetic protein

[ Return to forums ]
<50% d'identité et hypothetic protein
Julien051
21 Mar 2021 14:49
Non evaluated contribution

Lorsque l'on trouve un ORF avec une bonne e-valeur et un % d'identité de 44% avec Blastp, peut-on considérer l'ORF comme codant (Je pense que oui s'il est suffisamment long). Mais dans ce cas s'agit-il d'un ORF Novel ou un ORFan ?

Je dirais ORFan puisque 44% d'identité ne me semble pas suffisant pour parler d'homologie ?

 

Meglecz20CTES
21 Mar 2021 16:05
Game master

Bonjour Julien,


Si l’Evaleur est faible, cela indique qu’il y a une cause biologique qui explique la similarité entre des séquences, et donc la similarité n’est pas due au hasard. Même si 44% identité vous semble faible, si l’alignement est assez long vous pouvez conclure l’homologie.
Par contre, même si les séquences sont homologues, vous risquez d’avoir d’un alignement multiple peu fiable, car les séquences sont trop divergentes. Cela compliquera vraiment votre tâche, et il est mieux de choisir une autre séquence.

 

Bon travail,
Emese Meglecz

 

AnaisE
21 Mar 2021 16:09
Non evaluated contribution

Je me demande si ce n'est pas plutôt le score d'alignement (donc l'E-valeur, par exemple < e-10) qui détermine s'il y a ou non homologie, car il me semble que le % d'identité témoigne surtout de la distance évolutive et que ça ne remet pas forcément en cause une origine commune. Par contre cela compliquerait peut-être ton analyse. Il y a d'autres facteurs à considérer en plus de ce % d'identité pour savoir s'il y a homologie ou non, comme le % de similarité, la longueur des alignements, la taille de la base de donnée, la similarité des fonctions trouvées, la répartition des domaines conservés, etc. Et une partie de ces critères sont reflétés dans le calcul de l'e-valeur dans Blast.

Meglecz20CTES
21 Mar 2021 17:20
Game master

Très bonne remarque d’Anaïs!


L’evaleur tient compte de la longueur de l’alignement, le niveau de la similarité, et la taille de la BDD. C’est donc le premier indice à examiner.