Bonjour,
Avez-vous bien compris pourquoi vous ne pouviez pas vous focaliser sur le groupe des alpha- dans un 1er temps ? cf les gammes d'-evalues très proches entre tous les groupes bactériens. Le différentiel d'e-value est très faible entre les divers groupes bactériens. Voire même chez les euK que vous avez dans le rapport taxo ! Ce qui s'explique car il existe un lien entre seq euK et seq d'alpha- : quel est ce lien ?
Auquel cas, il faudrait même une 1ere phylogénie GE = ensemble du vivant : bacteries + euK + archae, qui serait alors non racinée.
Si on prend un GE = toutes les bactéries, quel sera le groupe externe dans ce cas ?
Rappel cf doc Phylogénie section TP sur Ametice :
1/ Définir le groupe d’étude de telle sorte qu’il représente une lignée taxonomique réelle. Ce doit être un groupe monophylétique. ⇒ Choisir les séquences parmi l’ensemble de ces lignées de telle sorte que l’ensemble des lignées soit représentées.
2/ Définir un groupe extérieur constitué de l’ensemble des lignées de même niveau taxonomique que le groupe d’étude. ⇒ Choisir les séquences parmi l’ensemble de ces lignées de telle sorte que l’ensemble des lignées soit représentées.
==> quelles sont LES lignées de même niveau taxo que toutes les bactéries ?
==> d'où l'indication sur les blast à refaire pour définir le groupe externe dans ce cas : Pour la sélection des séq du groupe externe, il vous faudra absolument refaire un blastP vs NR en spécifiant dans le champ "Organism" (sous le champ "Database") => "Archaea", afin d'identifier des séq homologues chez les archae (décrivez et expliquez le résultat obtenu, c'est intéressant), et vous pouvez faire la même chose en précisant "Eukaryota", afin d'identifier toutes les séq homologues chez les euK (décrivez et expliquez le résultat obtenu, c'est intéressant également).
==> Il faut absolument faire cette phylogénie large dans un 1er temps. Si sur cette phylogénie, votre protéine se rapproche des alpha- (vous pourrez donc sur-représenter les alpha- sur cette 1ere phylo), alors elle justifiera une 2eme phylogenie plus restreinte sur le groupe des alpha- (la phylogenie que vous avez faite, qu'il faudra un peu modifier concernant le choix des seq et le choix du groupe externe).
==> vous pouvez sur-représenter les alpha- sur cette 1ere phylo, voire les proteo-, mais attention, il faut représenter l'ensemble des groupes taxo bacteriens. Sur-représenter les Bacteroidetes n'est pas nécessaire !
==> que les séq euK se mélangent dans l'arbre avec les alpha- (surtout celles de votre rapport taxo avec les e-values les plus faibles) est logique, car il existe un lien entre alpha- et euK : quel est ce lien ???