Forum "Alignement multiple: CLUSTALW"

Thread subject: Nombre d'aa manquants aux extrémités : /Blast et /clustalW

[ Return to forums ]
Nombre d'aa manquants aux extrémités : /Blast et /clustalW
B_Wirth_22
28 Apr 2022 11:41
Game master

Question posée:

 

"Serait-il possible d'avoir un nombre d'aa manquants en C- Terminal, qui se différent dans le blast et l'alignement multiple ? Si oui quelle peut être les raisons ? je n'arrive pas à trouver."

 

Réponse :

Normalement, vous devriez trouver le même nb d'aa manquants aux extrémités, par les deux analyses, en tous cas, le même ordre de grandeur !

Car il peut, effectivement, y avoir une variation de qq aa, voire d'une dizaine d'aa, entre séq différentes, c'est pour cette raison que vous devez regarder les 10 1ers alignements du blast, et pas seulement le premier alignement, afin de dégager une tendance.

 

Dans l'alignement multiple, attention aux gaps, aux indels ! Chaque indel compte pour une position dans l'alignement multiple !

Si vous avez une différence en terme de nb d'aa manquants entre le résultat du blast et celui de l'alignement multiple, c'est peut-être dû aux gaps que vous avez comptabilisés dans les positions.

Pensez à retirer le nb de positions des indels dans votre estimation du nb d'aa manquants.

 

Question posée:

Je vous joins quelques détails juste en dessous:

 

Blast :

La taille de la séquence query est de 193AA, un codon start a été proposé qui se trouve à la position 171- 725 ce qui fait une taille de 184 AA. L'alignement commence à la position 10 on a donc 9 AA manquant en N-terminal

L'alignement se termine à la fin au 184 AA. Étant complet et la séquence query faisant une taille de 193 AA. Je dirai qu'on a 9 AA manquants également en C-terminal (sans le stop)

 

Alignement multiple :

L'alignement fait une taille de 259 AA positionnés. L'ORF lui fait une taille de 249 AA, le start est retrouvé en position 10 on a donc 9 acides aminés manquants en 5'.  Ensuite étant complet en 3' le codon stop se trouve certainement après la dernière position (249AA) avec environ 10 a. Aminés manquants en C-terminal. (Sans tenir compte du stop)

 

Réponse :

"La taille de la séquence query est de 193AA, un codon start a été proposé qui se trouve à la position 171- 725 ce qui fait une taille de 184 AA."

==> Si vous me proposez un codon start, c'est que votre ORF est complet en 5', est-ce bien cela ?

Si l'ORF est complet en 5', il ne peut pas y avoir d'aa manquants à cette extrémité...

Dans ce cas, les alignements (blast et multiple) doivent vous permettre de confirmer le start proposé ! Ou d'en proposer un autre / aux homologues.

Revoyez vos alignements, je pense que ce n'est pas compris.

 

"L'alignement commence à la position 10 on a donc 9 AA manquant en N-terminal"

==> à la position 10 de quelle séq ? query ? ou cible ?

==> et sur l'autre séq ???

 

"L'alignement se termine à la fin au 184 AA. Étant complet et la séquence query faisant une taille de 193 AA. Je dirai qu'on a 9 AA manquants également en C-terminal (sans le stop)"

==> Là aussi, si l'orf est effectivement complet en 3', vous ne pouvez pas (normalement) avoir d'aa manquants...

==> 184 aa correspond à la taille de la protéine obtenue à partir du start proposé... donc est-ce que 184 correspond au dernier aa de la séq query ?

==> Là, il faut aussi regarder la position de fin sur la séq cible, et voir s'il s'agit du dernier aa de la séq cible. Pour cela, vous avez donc aussi besoin de la taille de la séq cible.

==> Si ce n'est pas le dernier aa qui est aligné (ça arrive aussi), il faut regarder si le nb d'aa non alignés entre les deux séq est cohérent : peut-être que les derniers aa ne s'alignent pas, simplement parce que la similarité est trop faible... 

==> Par exemple, si les 9 derniers aa de la séq query ne s'alignent pas avec les 12-13 (valeurs prises au hasard) derniers aa de la séq cible, le nb d'aa aux extrémités de ces deux séq est tout de même cohérent, c'est le même ordre de grandeur ! Ca signifie que ces deux séq ont ENVIRON la même taille, ces deux séq sont bien complètes en Cter.

==> Par contre, si les 9 derniers aa de la séq query ne s'alignent pas, alors qu'au niveau de la séq cible vous avez une séq bien plus longue (par exemple 95 aa non alignés), là, l'ordre de grandeur n'est plus le même : la séq cible est alors plus longue en Cter, et il semblerait qu'il vous manque de la séq en Cter au niveau de la protéine étudiée, alors même que vous aviez un ORF visblement complet en 3'. Dans ce cas, c'est le codon stop détecté qu'il faut remettre en cause : ce stop ne devrait peut-être pas exister à ce niveau là, car les homologues sont plus long en Cter. Dans ce cas, il s'agit peut-être d'une mutation non sens ayant affecté le gène étudié, ou peut-être simplement une erreur de séquençage qui fait apparaître un stop prématuré qui en fait n'existe pas.

 

N'hésitez pas à demander plus de précisions si ce n'est pas clair.

Mais passez par le forum, pour que j'ai accès à votre séquence, et donc à vos résultats d'alignements.

 

Bon travail,

BW