Forum "Alignement multiple: CLUSTALW"

Sujet de discussion: alignement multiple

[ Retour aux forums ]
alignement multiple
meline13
22 Feb 2012 13:25
Contribution: Relisez les Règles du Jeu / la FAQ
bonjour,
pouvez vous nous expliquer ce qu'il faut faire dans la partie alignement multiple.
merci

meline13
B_Wirth_12
22 Feb 2012 18:48
Maître de jeu
Bonjour,

Des explications ont été données durant le topo, et vous trouverez également des informations en ligne, dans l'onglet "règles du jeu" et dans les "FAQ", sous l'onglet "Aide".
Relisez d'abord ces différents éléments, puis précisez ce qui vous pose problème :
Sélection des séquences, logiciel à utiliser, résultats bruts, analyse des résultats ?

Bon travail,
Bénédicte Wirth
meline13
22 Feb 2012 18:57
Contribution non évaluée
Alors on a sélectionné les séquences dans le logiciel NCBI (15 pour le groupe d'études car on en avait pas plus et 20 pour le groupe externe) qu'on a copié dans résultats bruts c'est bien ça?
Après on ne sait pas quel logiciel utiliser ni comment analyser les résultats.
Merci pour votre aide

Meline13
B_Wirth_12
22 Feb 2012 20:29
Maître de jeu
Meline13,

1ère remarque : Les règles du jeu et les FAQ sont là pour vous guider et pour vous aider pas à pas. Elles récapitulent les consignes, et doivent donc être lues ABSOLUMENT !
Je vous conseille de vous y plonger sérieusement avant la soumission de votre séquence, car j'ai déjà vu de nombreuses erreurs dans votre formulaire d'annotation (ex: présentation des protocoles, présentation des Analyses de résultats), qui pourraient être évitées rien qu'en consultant cette aide.

- "Alors on a sélectionné les séquences dans le logiciel NCBI"
=> Le NCBI n'est pas un logiciel, c'est un site internet, une plateforme.
=> De quoi, exactement, vous êtes-vous servis pour sélectionner vos séquences ?

- "qu'on a copié dans résultats bruts c'est bien ça?"
=> Je n'ai pas vu les séquences dans la partie résultats bruts, je n'y ai vu que le "Lineage Report" du "Taxonomy Report", qui y est tout à fait à sa place.
=> "Les règles du jeu" vous indiquent où, et comment, sous quelle forme, copier vos séquences


B_Wirth_12
22 Feb 2012 21:06
Maître de jeu
(Suite)
Problème de sélection des séquences :
- [planctomycetes] scores de 245 à 144 => ce n'est pas tout à fait vrai, mais vous ne pouviez pas savoir, vous avez là un cas un peu particulier
Si vous regardez la 1ère ligne :
. . . . Planctomyces brasiliensis DSM 5305 ---------------  245  36 hits [planctomycetes]  
Vous avez 36 hits, cad 36 alignements différents entre votre query et des séq issues de l'espèce Planctomyces brasiliensis DSM 5305 (c'est plutôt rare, d'habitude il n'y a que 1 ou 2 hits par espèce)
=> Cliquez sur le lien "36 hits"
=> Vous arrivez plus bas dans le "Taxonomy Report", dans la section "Organism Report" qui présente les résultats du blast encore différemment : les hits obtenus par espèce
=> Là, quand vous avez des scores identiques, c'est que les séquences sont à 100% identiques et proviennent donc de Bq de données différentes (Par exemple :
- ref|YP_004270925.1| Iduronate-2-sulfatase [Planctomyces br...     245  1e-74
- gb|ADY60903.1| Iduronate-2-sulfatase [Planctomyces brasili...     245  1e-74
La 1ère vient de la Bq RefSeq, la 2ème de GenBank)
=> Mais quand les scores sont différents, c'est qu'il s'agit de séq différentes
=> Et donc ici, de séq différentes au sein de la même espèce : l'espèce Planctomyces brasiliensis DSM 5305 possède donc plusieurs gènes différents de sulfatase
=> Et on a la même chose, pour toutes les espèces de Planctomycètes, or dans la partie lineage report, on ne vous donne que le meilleur score pour une espèce donnée.

=> Mais, ce que l'on peut voir, c'est qu'au sein du groupe des Planctomyces, la score
B_Wirth_12
22 Feb 2012 21:28
Maître de jeu
(Suite2)
=> Mais, ce que l'on peut voir, c'est qu'au sein du groupe des Planctomyces, la gamme de scores varie entre 245 et 89.

Quand on a épuisé les hits contre le groupe des Planctomyces, on remonte d'un cran dans l'arbre phylogénétique des bactéries, et on trouve des verrucomicrobia, qui appartiennent au même sous-groupe taxonomique des PVC.
"Verrucomicrobium spinosum DSM 4136 -------------------  197  13 hits [verrucomicrobia]"
=> Là aussi, vous avez 13 et 14 hits contre la même espèce : si vous cliquez dessus comme tout à l'heure, vous verrez que vous avez plusieurs alignements pour une seule et même espèce, de score 197 à 98 et 185 à 98.
DE PLUS, ATTENTION, vous avez d'autres verrucomicrobia plus bas dans la liste, avec des scores plus faibles : 145, 144, 128, ...

Avez-vous trouvé des Chlamidiae, qui appartiennent au même groupe PVC ?

Si vous regardez les autres bactéries : g-protéo => 181, CFB => 174, le chevauchement n'est pas négligeable, de même niveau que pour les verrucomicrobia
=> Donc, on ne peut pas négliger ce signal
=> Donc votre groupe d'étude doit être "Toutes les bactéries" => 30 séq
et donc groupe externe : EuK + Archaea (10 séq)

Avez-vous vu des Archaea dans la liste ?
Si la réponse est non, il faut refaire un blastP contre nr, pour rechercher spécifiquement des séq Archaea
=> Pour cela, refaite un BlastP contre nr, en précisant "archaea" dans le champ "organism"
=> Récupérez quelques séq d'archaea pour rajouter aux séq EuK, pour constituer votre groupe externe.

Enfin, avec l'ensemble de ces séq : groupe d'étude + votre séq protéique + groupe externe
=> faites l'alignement multiple avec l'un des 3 logiciels mentionnés pendant le topo : ClustalW, Muscle ou T-Coffee.

Bon travail,

Bénédicte