Forum "Recherche d'homologues: BLAST"

Thread subject: Forte e-value max impact ? Pourcentage alignement pas terrible

[ Return to forums ]
Forte e-value max impact ? Pourcentage alignement pas terrible
Krystel
30 Mar 2019 9:21
Non evaluated contribution

Bonjour,

En relisant mon travail j'ai deux choses qui me font douter concernant mon choix de travailler avec cette séquence :

1) La forte max e-value de la meilleure fonction proposée par BLASTp "membrane protein insertase YidC" à 80 dans mon tableau 3. Aurais-je dû la prendre en compte malgré toutes les basses min e-value et la cohérence avec les autres fonctions du tableau ? 

2) L'alignement multiple n'est pas terrible, surtout après Gblocks il ne reste plus que 24% de positions conservées. Dans la vidéo en question vous disiez de garder la séquence si la valeur est au-dessus de 100, mais vous étiez dans un cas où les positions conservées de départ étaient moins élevées, et donc le pourcentage de conservation était nettement meilleure que le mien. 

J'ai malgré tout obtenu un arbre qui semble cohérent, mais peut être ai-je fais fausse route ? Il aurait peut être fallu élargir encore le groupe d'étude 

Merci,

bon week end 

Christelle

 

Meglecz18CTES
31 Mar 2019 14:30
Game master

Bonjour Christelle,

1.    La valeur de  max E-value dans le tableau 3 me semble clairement erronée. Dans les résultats bruts de BLAST contre nr, l’Evaleur max était 2e-60. Comme le tableau 3 est un extrait de résultats brut du BLAST, il y a surement une erreur (copier/coller ?).

2.    Gblock par défaut enlève toutes les positions de l’alignement, où au moins une des séquences a un gap. En plus, il garde que des suites des positions relativement longues. Par exemples, s’il y a 5-6 positions consécutives relativement bien conservées, mais entourées par des positions avec des gaps, ces positions ne seront pas gardées. Donc Gblock a enlevé beaucoup de positions de l’alignement original, car vous avez pas mal des gaps, et l’ORF et la séquence BPAMMM2 sont incomplètes à Nter. À mon sens, le pourcentage des positions gardées pas Gblock a relativement peu d’importance, si vous avez au moins une centaine des positions qui restent et l’arbre qui en sorte est relativement robuste.

3.    Votre arbre me semble raisonnable. Dans les doutes, éventuellement, vous pouvez enlever la séquence BPAMMM2, qui est partielle, est relâcher les conditions de Gblocks dans Phylogeny.fr pour voir si la robustesse de votre arbre augment.

Bon travail,

Emese Meglecz

Krystel
31 Mar 2019 21:06
Non evaluated contribution

Merci beaucoup pour votre réponse ! je vais essayer de reprendre tout ça 

Bonne soirée

Christelle

Krystel
31 Mar 2019 22:21
Non evaluated contribution

Re bonjour, je viens de refaire la definition list avec les résultats de BLASTp (cf. impression écran), je retrouve bien les mêmes max e-value

Je pense que je vais malgré tout garder cette séquence j'ai peur de ne plus avoir le temps de tout refaire. Je vais essayer ce que vous avez dit concernant BPAMMM2

Merci

bonne soirée

Christelle

Meglecz18CTES
1 Apr 2019 16:03
Game master

Bonjour Christelle,

Apparemment, c’est une erreur de l’outil qui produit la liste.
Vous pouvez garder cette séquence sans problème.

Bon travail,
Emese Meglecz

 

Krystel
1 Apr 2019 20:18
Non evaluated contribution

Bonsoir,

d'accord merci !

(en ce qui concerne la séquence BPAMMM2, j'ai essayer en la supprimant mais finalement cela diminue la robustesse du noeud des alphaprotéobacteria je vais donc rester comme ça )

Bonne soirée

Christelle