Forum "Alignement multiple: CLUSTALW"

Sujet de discussion: choisir des séquences

[ Retour aux forums ]
choisir des séquences
LEVY
28 Feb 2023 10:46
Contribution non évaluée

Bonjour, 

J'ai plusieurs questions concernant ma séquence à analyser.

 

Lorsque j'ai fait mon blast, il y avait 2 orfs sur ma séquence de 182 et 206 aa avec 87 et 88 % d'id. Mais quand j'ai cherché en détails, je ne trouve pas les mêmes orfs et le plus grand orf est 170 aa( celui que j'ai choisi). Est- ce normal ?

 

Pour l'alignement multiple, je ne sais pas quelles séquences choisir car pour mon groupe d'étude ( flavobacteria),il y a 62 groupes soulignés.

Comment savoir quelle est la valeur seuil ? Est ce  1e-84 ?

 

J'ai essayé de continuer en sélectionnant une vingtaine de séquences pour le groupe d'étude, mais j'obtiens 119 positions sur 336, soit seulement 35%;

 

Merci beaucoup 

 

Bonne journée

Meglecz23CTES
28 Feb 2023 14:40
Maître de jeu

Bonjour,

 
Lorsque j'ai fait mon blast, il y avait 2 orfs sur ma séquence de 182 et 206 aa avec 87 et 88 % d'id. Mais quand j'ai cherché en détails, je ne trouve pas les mêmes orfs et le plus grand orf est 170 aa( celui que j'ai choisi). Est- ce normal ?

 

Les ORF affichées dans la partie ORFinder sont correctes. Comment avez-vous obtenu les ORF par BLAST ? Comme l’ORF Finder a une approche « gourmand » ce n’est pas logique de trouver des ORF plus grandes que par ORF Finder.  Seule possibilité que je peux imaginer, c’est que la séquence contienne un codon STOP erroné, qui arrête l’ORFinder prématurément.


Pour l'alignement multiple, je ne sais pas quelles séquences choisir car pour mon groupe d'étude ( flavobacteria),il y a 62 groupes soulignés.


La taxonomie est hiérarchique. Donc chaque groupe taxonomique est composé des sous-groupes, et les sous-groupes eux aussi ont des sous-(sous) groupes, etc. Il faut tenter de bien représenter de la variabilité d’un groupe. Par exemple dans le cas de classe de Flavobacteriia, il faut représenter tous les ordres s’il y en a plusieurs (par exemple Flavobacteriales) et puis les différentes familles (Flavobacteriaceae, Weeksellaceae, Schleiferiaceae…) des chaque ordre.

 

Comment savoir quelle est la valeur seuil ? Est ce  1e-84 ?


L'E-valeur seuil sépare les homologues et les non-homologues. Si votre dernier E-valeur est encore très petite (par exemple < 1e-10), vous pouvez probablement conclure que tous les hits sont homologues et vous ne pouvez pas déterminer le seuil. Vous pouvez seulement dire que c’est plus grand que l’E-valeur la plus élevée que vous avez. Si l’E-valeur la plut haute est relativement grande, il faut regarder des fonctions des hits pour voir s’ils sont tous compatibles avec la fonction des meilleurs hits. Si oui, vous pouvez conclure que tous les hits sont homologues. Au cas contraire, il faudra établir la valeur seuil à la plus petite E-valeur qui a une fonction incompatible.
 
J'ai essayé de continuer en sélectionnant une vingtaine de séquences pour le groupe d'étude, mais j'obtiens 119 positions sur 336, soit seulement 35%;


Tant qu’il vous reste une bonne centaine de positions pour faire la phylogénie, et que les nœuds de l’arbre sont généralement robustes, ce n’est pas un problème.
Le pourcentage est bas dans votre cas, car il y a une dizaine de séquences qui sont nettement plus longues en Nter que les autres. Vérifiez, si la fonction de ces séquences est identique aux fonctions des autres et/ou si elles se regroupent dans le même groupe taxonomique. Ça sera intéressant à discuter.

 

Bon travail,

 

Emese Meglecz
 

LEVY
28 Feb 2023 20:40
Contribution non évaluée

Merci beaucoup pour vos réponses. 


Effectivement, il y a une erreur , j'ai mélangé les résultats de blast dans mon tableau. Ce n'était pas la séquence que je pensais analyser au départ. Je vais revoir tout ça !

 

Cordialement

 

LEVY
5 Mar 2023 11:59
Contribution non évaluée

Bonjour, 

J'ai essayé d'analyser d'autres séquences mais je reviens vers celle là,  elle me semble être un bon parti. Il y a juste l'orf qui n'est pas très long. 

Est ce que vous pensez que je peux tout de même continuer avec cette séquence ?

Merci pour votre aide !

Meglecz23CTES
6 Mar 2023 11:22
Maître de jeu

Bonjour,


Vous avez 119 positions retenues après Gblock (étape de curation de l’alignement). C’est acceptable surtout que les valeurs de robustesse de l’arbre sont souvent acceptables aussi. À voir si les nœuds profonds sont robustes, une fois l’arbre est correctement enraciné.

 

Bon travail,
Emese Meglecz

 

LEVY
6 Mar 2023 17:41
Contribution non évaluée

D'accord  merci beaucoup!