Forum "Analyse phylogénétique"

Thread subject: problémes concernant l'analyse des arbres

[ Return to forums ]
problémes concernant l'analyse des arbres
giraudaguerre
12 Apr 2007 11:03
Non evaluated contribution
Bonjour,
Après correction nous avons enracinné tous nos arbres du NJ. Néanmoins deux séquences nous posent
problème. Ce sont :
>ArchEurMJ gi|15669230|ref|NP_248035.1| DNA-directed RNA polymerase, subunit B' (rpoB1) [Methanocaldococcus jannaschii DSM 2661]
>ArchEurMT gi|133460|sp|P09845|RPOB1_METTW DNA-directed RNA polymerase subunit B'
Elles sont plus courtes que les autres mais ne nous semblent pas partielles car elles commencent par une méthionine.
Doit-on les enlever où bien s'agit-il d'un transfert ?(voir arbres 1)

De plus, dans la correction il nous a été conseillé d'analyser les arbres 1 une fois bien enracinnés.
L'arbre 1 ayant comme groupe d'étude les Crenarchae et les Euryarchae comme groupe externe.
Néanmoins, il nous semblait plus approprié de travailler avec les arbres 5 avec pour groupe d'étude les Archae et comme groupe externe les Eucaryotes.
En effet, n'est-il pas mieux de travailler avec un groupe d'etude plus large à savoir les Archae et non pas les Crenarchae ?

Enfin dernière question concernant les paralogues et orthologues. Il nous a été dit que cette détermination était mauvaise sur le dernier arbre (arbre 5 avec deux séquences en moins).
Néanmoins, on ne comprends pourquoi car nous n'avons jamais deux fois la même souche.

Nous avons déjà procédé à quelques corrections donc la conclusion n'est pas toujours en accord avec les résultats présentés (certains arbres ont été retirés depuis). Au cas où nous les avons laissé dans le bloc note.

Merci d'avance de votre attention.

Le binome giraudaguerre

Brochier_B07
12 Apr 2007 12:53
Game master
Bonjour,

Chez certaines euryarchaea, le sous-unité B de l'arn polymerase est codée par deux gènes distincts (chez les autres archaea, elle est codée par un seul gène). C'est pour cela que les séquences vous apparaissent plus courtes.
Si au niveau de l'alignement multiple, vous vous rendez compte ces séquences ne sont pas plus corute que votre séquence d'étude, alors vous pouvez les inclure dans l'analyse phylogénétique. Sinon il faut les retirer.

Concernant la taille du groupe d'étude, votre question est de préciser la position de la séquence par rapport à des séquences connues dans les banques. Etant donné que vous incluez ~ 10/15 séquences pour votre groupe d'étude, au plus celui-ci sera délimité de manière fine, au plus vous pourrez préciser la position de votre séquence au sein du groupe.
Vous êtes donc beaucoup plus précis si vous travaillez avec comme groupe d'étude les crenarchaea (vous allez pouvoir travailler finement au sein des crenarchaea) que si vous travailler au sein des archaea. Si ce n'était pas le cas on ne s'embêterait pas et on vous ferait travailler à l'échelle du vivant.

Concernant le problème orthologue/paralogue, je maintiens que vous avez une erreur. Si vous vous contentez de regarder si les noms des séquences sont différents alors vous êtes sur de vous tromper dans 50% des cas (regardez les noms de groupes)...

Cordialement,
Céline Brochier