Bonjour,
Démontrer la duplication est assez compliqué.
Si vous trouvez deux types de fonctions parmi des hits, c’est une piste à creuser, car il est possible qu’après la duplication les fonctions des deux copies se soient différenciées. Ceci dit, il est aussi possible que les deux copies gardent leurs fonctions, donc la présence des deux fonctions n’est pas essentielle pour l’hypothèse de duplication. La manip à faire (si vous avez du courage) est décrite dans le vidéo.
Attention, votre tableau 3 est basé sur swissport. Comme dans Swissprot la description (« titres ») des séquences est assez détaillée, il y a peu de titres identiques et le tableau est difficilement lisible. Faites ce tableau, sur la base de Refseq_protein.
La démonstration de transfert horizontal est encore plus compliquée. Ça dépasse les limites de notre cours.
Les logiciels que vous utilisez sont assez bien testés. Si on obtient des résultats incohérents, c’est parce que leur algorithme n’est pas bien adapté aux jeux de donnée. Sur les nœuds profonds (près de la racine), les valeurs de robustesse sont assez bonnes. Que vous suggère ceci ?
Bon travail,
Emese Meglecz