Bonsoir,
Vous ne mentionnez pas quel groupe d'étude vous avez en tête, mais je suppose "bacteria"... Dans ce cas en effet il faudrait en théorie chercher un groupe extérieur hors des bactéries, hors il n'y a que quelques homologues éparses chez les eukaryotes (fortes probabilités de HGT), et il reste donc les archaes... Or chez les archaea aussi on ne trouve que des homologues chez les Archaea:Euryarchaeota:Halobacteria:Halobacteriales, ce qui est difficile à reconciler avec l'idée que ce gène était présent chez l'ancêtre commun de bactéries et des archées, mais aurait été "perdu" chez toutes les archaea hormi un unique taxon: les Halobacteriales? Pas très convainquant comme scénario...
Le soucis pourrait venir du fait que les hits blast ont été tronqués très tôt dans l'immense univers des homologues de votre ORF (ça semble être un gène très ancien...), et donc qu'il manque à votre listing de 5000 hits des homologues plus distants, y compris peut être chez d'autres archaea? Quelques fois dans ce cas on se reporte sur les homologues dans SWISSPROT, mais il y en que très peu (attention je l'ai refait et je en trouve que 3 hits, différent de vos résultats bruts???). Dans ce cas il faudrait tenter plus que 5000 hits, mais ça pose souvent des soucis dans les différents traitements qui s'en suivent.
Et de plus faire un arbre bactéries + archaea c'est très très ambitieux! Une solution serait de tenter un groupe d'étude plus restreint (appuyez vous sur les scores plutôt que sur le E-values, car le min des E-value est arrondi à zéro dans ce cas précis), par exemple un phylum bactérien, avec les autres phylums bactériens comme groupe extérieur. Si l'arbre montre l'ORF dans la branche du groupe d'étude, ça peut régler votre soucis...
P.