Bonjour,
Une bonne première approche sera d’inclure dans le groupe d’étude tous les groupes taxonomiques avec un faible E-valeur minimum. Dans votre cas c’est des alpha- et gammaproteobacteria. Attention, le groupe d’étude devrait être un groupe monophylétique (un groupe qui contient tous les descendants d’un ancêtre commun, mais rien d’autre), donc vérifiez bien la monophylie du groupe d’étude et le cas échéant complétez-le (http://annotathon.org/Metagenes/Annotathon_FAQ_fr.html#L.27arbre_de_la_vie.2C_vu_par_les_microbes ).
Alternativement, vous pouvez faire un BLAST avec seulement la moitié ou 2/3 de l’ORF. En effet, comme l’ORF est très long les E-valeurs sont très basses et souvent affichées comme 0.0 (ceci veut dire < 1e-182). Si vous faites le BLAST avec l’ORF raccourci, les E-valeurs seront plus hautes, et avec un peu de chance vous allez pouvoir choisir un groupe d’étude plus restreint.
Il sera aussi une bonne idée d’ajouter un niveau taxonomique dans tableau récapitulative des groupes taxonomiques, pour voir les différents ordres des proteobacteria, et pas seulement les classes.
C’est le moment d’expérimenter avec les différentes analyses.
Bon travail,
Emese Meglecz