Forum "Recherche d'homologues: BLAST"

Thread subject: determination valeur seuil et groupes

[ Return to forums ]
determination valeur seuil et groupes
samiraophelie
12 Dec 2010 19:41
Non evaluated contribution
bonsoir,

j'ai quelques difficultés dans mon annotation.Tout d'abord la difficulté à justifier une valeur seuil d'e-value malgrès la prise en compte de nombreux paramètres:
le pourcentage de recouvrement est très élévé pour toutes les séquences( de l'ordre de 80 à 90% ),le pourcentage d'identité  est quasiment tout le temps supérieur à 30% à part quelques exceptions à partir de la valeur de 10¨-7,de même les pourcentage de gap sont relativement faible ( 4% max en moyenne) sauf là aussi quelques exceptions visible à partir d'une valeur 10^-6 /10^-5 ( 14,15% de gap).De plus la quasi totalité des séquences de notre alignement présente la même fonction de glycosyl transferase.Peut -on alors se baser sur le léger shift  à 10^-16 (score de 106 à 87,passage de couleur rose à vert sur l'alignement)bien que cela represente alors que très peu de séquences au dessus du seuil(une dizaine)?
(remarque: mon blastp contre swissprot ne donne que très peu de résultats)

concernant alors la determination de groupe d'etude et groupe exterieur:
en plus du problème de la valeur seuil,le lineage report montre un alignement sans difference de niveau taxonomique sur la gauche ( appartiennent tous à la catégorie " Root" qui est le niveau superieur regroupant les Archae,bacteires,eucaryotes,virus et autres).Sur le conseil d'un professeur,les choix de groupe auraient été dans un premier temps les euryarchae pour le groupe d'etude et les crénarchae pour le groupe exterieur mais il se trouve que ces 2 groupes se chevauchent pour des scores tous supérieurs à une valeur seuil prise par défaut de 10^-5 ( mon lineage repport du blastp contre nr à 250 alignement de séquences ne descend pas plus bas que cette valeur malgrès que normalement les valeur d'e-value vont jusqu'à 0.008 correspondant à un score de 43.5 or ici notre score minimal est de 52)

J'ai tenté cependant d'avancer dans mon analyse en sélectionnant dans un premier temps seulement des euryarchae ( groupe d'etude) et des crénarchae( groupe exterieur):l'alignement multiple montre 12 positions très conservées et les arbres sont congruent et montrenr un ORF émergeant au sein des euryarchae.
J'ai ensuite fait un analyse sans définir réellement de groupes et pris alors un échantillonage large de toutes les espèces issues du blast.(pour un score alors superieur à 52 correspondant à une e-value de 10^-5).L'alignement multiple montre cette fois 6 positions parfaitement conservées entre les especes et la reconstruction phylogénétique aboutit à la même conclusion que précedement ( ORF dans euryarchae).

Puis-je alors garder l'impossibilité d'établir de groupe d'étude et groupe exterieur du fait d'une valeur seuil difficile à établir?

Merci par avance de votre éclaircissement.
ETalla_10
12 Dec 2010 21:06
Game master
Bonsoir,

"Peut -on alors se baser sur le léger shift  à 10^-16 (score de 106 à 87,passage de couleur rose à vert sur l'alignement)" En theorie, oui si vous avez suffisamment de sequences homologues et une tres grande diversité taxonomique de vos homologues, ce qui vous donnerait plus de chance d'ancrer votre sequence au sein d'un groupe taxonomique. Dans votre cas, vous avez relativement peu d'homologues, une tres faible diversité taxonomique, et dans ce cas, il faut aller chercher des homologues tres distants (meme avec des EV de 0.001). Pour cela, regarder les alignements blast jusqu'à Ev 0.001 (par exemple). Si ce sont les memes regions qui s'alignent, ceux memes à 0.001 sont potentiellement aussi des homologues. Construisez alors votre jeu de donnees en echantillonnant aussi ces sequences de haut EV. Puis, vous confirmerez cette homologie entre tous homologues en analysant attentivement l'alignement multiple, CAD en regardant si des regions de sequences choisies restent conserves entre elles apres alignement multiples. Au besoin, alors eliminer certaines sequences si elles divergent trop par rapport aux autres sequences (et au besoin alors reconsider votre seuil).

"J'ai tenté cependant d'avancer dans mon analyse en sélectionnant dans un premier temps seulement des euryarchae ( groupe d'etude) et des crénarchae( groupe exterieur):l'alignement multiple montre 12 positions très conservées et les arbres sont congruent et montrenr un ORF émergeant au sein des euryarchae. " A la lecture de votre rapport taxonomique, d'accord avec vous pour une première hypothese taxonomique. mais au fait, 12 positions conservees? est ce après Gblocks? sinon, analysez la sortie de votre gblocks....

bon courage,

et