Forum "Recherche d'homologues: BLAST"

Thread subject: recherche du score seuil

[ Return to forums ]
recherche du score seuil
adecam
30 Apr 2010 20:21
Non evaluated contribution
Nous avons déjà poster un message dans le forum définition du score seuil où nous avons expliqué que nous hésitions entre 2 scores seuil, l'un caractérisé par un saut du score et l'autre par un saut du recouvrement.
Vous nous avez conseillé de regarder d'autres critères.

Nous avons donc regardé les alignements 2 à 2 et nous observons que les % d'Identities et de Positives sont  sensiblement les mêmes sur tous les alignements( en moyenne %identities: 40%, %Positives: 50%), il y a parfois des faibles variation de ces valeurs d'un alignement à l'autre mais elles sont tout de suite rectifiées lors de l'alignement suivant. D'autre part il n'y a pas de grandes variations des gaps (qui sont compris entre 0 et 9% sur l'ensemble des alignements).
Ensuite par rapport à la taille des séquences similaires, elles ont toutes une taille très proches (environs 300résidus), sauf deux exceptions.
On a également regardé l'appartenance phylogénique de ces séquences mais il n'y a pas de différence d'espèce pouvant  être corrélé aux alignements.
Nous pensons que tous ces éléments ne peuvent pas être utilisés pour déterminer le score seuil puisqu'il n'y a pas de saut au niveau de ces valeurs.

Puisque les seuls éléments qui nous permettent de déterminer le seuil est le saut de e-value ou celui des recouvrements, nous avons fait un choix entre ces deux hypothèses. Nous avons choisi celui des recouvrements pour avoir plus de séquences. Mais finalement nous avons toujours le même problème:  nous avons uniquement 5 séquences utilisables pour construire l'arbre phylogénétique (notre groupe d'étude est formé de 2séquences et le groupe extérieur de 3). Ceci n'est pas suffisant pour faire un arbre pertinent.

Faut-il encore essayer de trouver un autre score seuil mais à partir d’autres éléments ? Si oui lesquels ?  (Nous pensons avoir  fait toutes les recherches possibles à ce niveau. )
Pouvons nous tout de même réaliser l’arbre phylogénétique,  tout en gardant en tête qu’il ne sera pas très représentatif ?

Merci encore
adecam
1 May 2010 18:09
Non evaluated contribution
Nous avons continué nos recherches.
Nous avons remarqué que les séquences trouvées avec des trés bons scores et des trés bon e-value, ont des fonctions différentes de notre domaine protéique hypothétique (il y a tout de même quelques séquences avec cette même fonction).
Est-ce-que ceci peut nous faire penser que finalement ces séquences ne sont pas homologues à notre séquence d'intérêt puisque elles ont des fonctions trés différentes? Dans ce cas nous n'aurons pas d'homologue malgrés les trés bonnes valeurs au niveau des scores, des e-value, des gaps, des recouvrements...
Ou peut être que notre séquence d'intérêt peut être caractérisée par une fonction différente de celle décrite dans notre hypothèse de départ?
c_petitjean_10
2 May 2010 17:47
Game master
Bonjour,

Encore une fois, je vous répète qu'un seul critère n'est pas suffisant pour prendre une décision sur l'homologie de vos séquences.

D'autre part,
Êtes vous sur d'avoir trouvé touts les homologues avec les paramètres que vous avez utilisé pour votre blast?
Etes vous sur que la différence d'annotation que vous notez entre les séquences obtenues est vraiment significative?
N'oubliez pas que la plupart des annotations des séquences présentes dans la NR sont des annotation faites par méthodes bioinformatiques, et souvent automatique.

Je vous signale aussi que vous pouvez reconstruire un arbre à partir de 4 séquences, même s'il est vrai qu'il vous apportera peut d'information.

Pour répondre à votre question, oui il est possible, que votre séquence n'est pas la fonction que vous lui avait donné au début de votre analyse, mais je doit vous rappeler que dans tout les cas, vous ne pouvez faire qu'une hypothèse sur cette fonction, vous ne la tester pas de façon biologique.

Dans tout les cas, c'est la seule question que vous posez, il m'est un peu difficile de vous répondre, je vous invite donc à formuler une ou plusieurs questions claire pour que je puisse vous répondre au mieux.
Merci.



Bonne annotation.

C. Petitjean