Forum "Analyse phylogénétique"

Thread subject: les protéines universelles = la galère

[ Return to forums ]
les protéines universelles = la galère
eniyro
5 Dec 2008 13:00
Non evaluated contribution
Nous avons malheureusement piocher une séquence codant pour une protéine universelle (une topoisomérase). le problème avec ce genre de protéines c'est qu'elles ont des homologues dans tous les règnes du vivant. Nous avons d'abord commencer une analyse phylogénétique en prenant comme groupe d'étude l'ensemble du vivant et pas de groupe extérieur (les schtroumpfs n'étaient pas d'accord pour un prélèvement ADN). à la suite de cette analyse, nous obtenons un arbre où toutes les séquence sont biens rangées par taxons et la notre se ballade au milieu des virus, firmicutes B-proteo et Green sulfur (qui sont loin d'être les meilleurs scores du blast)pour l'arbre par parcimony et elle s'acoquine avec la séquence virale dans l'arbre neighbor... Je me suis dit "j'ai une séquence virale... on va refaire un alignement et un arbre avec les virus comme groupe d'étude..." mais mon problème maintenant c'est qu'en fait, toute les séquences virales donnés comme homologues par mon blast sont issus de plasmides chimériques traficotés... j'ai essayer de refaire mon arbre sans les séquences virales, j'obtient quasiment le même arbre sauf que ma séquence GOS se place au milieu de rien sur une branche à part entre les G-proteo et CFB et green sulfur
Un seul mot me vient: AU SECOURS  
Brochier_BC08
5 Dec 2008 17:03
Game master
Bonjour,

1) Votre protéine est universelle, c'est vrai, mais cela ne signifie pas que vous ne pouvez pas définir de groupe d'étude et de groupe extérieur. Au vu du taxonomy report un groupe extérieur est définissable.

2) Concernant le choix des séquences, vous avez inclus dans votre alignement multiple des séquences non homologues, ou des homologues trop divergents. L'inclusion de ces séquences dans votre analyse, à pour conséquence que vous avez un alignement avec très peu de résidus conservés et donc une reconstruction phylogénétique de faible qualité.
Une définition précise de votre groupe d'étude/groupe extérieur va faciliter votre choix des séquences.

3) Vous n'avez pas choisi vos séquences bactériennes de manière rationnelle (groupes bactériens sous représentés/sur-représentés).

En refaisant votre analyse en tenant compte de ces remarques, vous verrez que vous obtiendrez de bien meilleurs résultats.

Bon courage !

Céline Brochier

Hingamp_BC08
5 Dec 2008 17:04
Game master
C'est assez dur d'étudier l'arbre sans l'annotation des groupes taxonomiques; mais en regardant d'abord l'alignement multiple, j'ai l'impression que les deux archae en haut de l'aln sont peut-être trop distantes, et compliquent bcp la tâche pour Clustal. Après avoir retiré ces deux là, je surveillerai aussi de près les deux ou trois dernières de l'alignement, qui sont aussi assez distantes et perturbent peut-être trop l'aln multiple? Enfin, avec un aln un peu "épuré", vous pouvez tester la méthode PhyML (mon message précédent) qui pourrait mieux s'en sortir?
eniyro
7 Dec 2008 14:15
Non evaluated contribution
Après avoir retiré les deux archaé et les séquence avec une Evalue superieure à e-40 j'obtient un arbre semblable. ou ma séquence GOS est toujours aussi mal placé... je vois pas ce que je peux prendre comme groupe d'étude ou groupe extérieur.



  +-----CYANO2    
  !
  !  +------ACTCL1    
  !  !  
  !  !  +----------EUKA1    
  9-10  !  
  !  !  !  +----------D-1    
  !  !  !  !  [color=red]
  !  !  !  !         +------------------CFB1    
  !  +-11  !         !  
  !     !  !         !   +---------GOS    
  !     !  !      +-13   !
  !     !  !      !  !   !                          +G-3    
  !     !  !      !  !   !                        +-1
  !     !  !      !  !   !                    +---2 +G-4    
  !     +-12      !  +---8                    !   !
  !        !      !      !                  +-3   +--G-5    
  !        !   +-14      !                  ! !
  !        !   !  !      !        +---------4 +------G-1    
  !        !   !  !      !        !         !
  !        !   !  !      +--------5         +------G-2    
  !        !   !  !               !
  !        !   !  !               +---------------GRSF1    
  !        !   !  !  [/color]
  !        !   !  +----------------A-1    
  !        +--15  
  !            !               +ACTIBAC2    
  !            !           +---6
  !            !   +-------7   +ACTIBAC4    
  !            !   !       !
  !            !   !       +---ACTIMY4    
  !            !   !  
  !            !   !     +------ACTIMY2    
  !            +--20  +-21  
  !                !  !  +--------ACTIBAC1    
  !                !  !  
  !                !  !                +COLOR1    
  !                !  !             +-17  
  !                +-22          +-18  +STREPTO2    
  !                   !          !  !  
  !                   !     +---19  +STREPTO1    
  !                   !     !    !  
  !                   !  +-23    +-STREPTO4    
  !                   !  !  !  
  !                   +-24  +-------ACTIMY3    
  !                      !  
  !                      !  +----ACTIMY1    
  !                      +-16  
  !                         +----ACTIBAC3    
  !
  +-----CYANO1    
ci_co
12 Dec 2008 10:37
Non evaluated contribution
test