Bonjour,
Il semble en effet que cet homologue de cyanobactérie soit totalement atypique (peut-être un HGT, ou une erreur d'annotation effectivement). Donc je comprends que vous ne fondiez pas votre choix de groupe d'étude sur cet homologue de cyanobactérie, par contre, étant malgré tout le meilleur hit BLAST, je pense qu'il est pertinent de l'ajouter à votre sélection de séquences homologues (même si vos groupes d'étude et extérieurs ne comprennent pas les cyanobactéries) afin de pouvoir "tracer" l'origine de cette étrange séquence...
Concernant la décision de restreindre ou élargir le groupe d'étude, je pense que dans le cas général il est préférable de se limiter au groupe d'étude le plus précis (donc restreint) possible. Par exemple, dans la mesure du possible préférez comme groupe d'étude les ricketsies et en groupe extérieur les autres alphabactéries, plutôt que les protéobactéries comme groupe d'étude et les autres bactéries comme groupe extérieur. En effet, à trop élargir ce groupe d'étude, vous prenez le risque d'inclure progressivement des homologues de plus en plus distants, ce qui risque de réduire la qualité de l'alignement multiple (et donc de réduire le nombre de positions conservées ce qui risque de compliquer l'inférence phylogénétique). Quelque fois, parce que les similitudes sont trop proches entre taxa, ou parce que vos premiers arbres avec des groupes trop restreints ne sont pas concluants (par exemple l'ORF émerge hors du groupe d'étude), vous n'aurez pas d'autre choix que d'élargir progressivement le groupe d'étude.