Bonjour Léa,
Merci pour votre question bien décrite.
En effet, la première hypothèse n’est pas impossible, mais elle est risquée et vous avez raison, la deuxième hypothèse est plus raisonnable.
Je comprends que l’Evaleur très faible des Eucaryotes vous perturbe, mais il n’y a que 3 hits d'Eukaryotes, dont seulement un a une E-valeur très faible (Bosea lupini 2e-82). Cela me suggère des erreurs dans le BDD.
Une explication simple et plausible de ce type d’erreur sera la contamination de l’échantillon des Eucaryotes par des bactéries. Par exemple, la drosophile d'où vient l’ADN s’est promenée dans les endroits pas très propres avant qu’on les attrape à passe à ‘extraction :)
Dans le cas de Bosea lupini il y un autre type d’erreur. Je vous laisse le découvrir en cherchant ce nom de genre et espèce.
Une petite correction de vocabulaire :
« une homologie de séquence max à 63% ». Cette expression n’a pas de sens. Vous pouvez dire que la plus proche homologue à 63% identité avec l'ORF. Deux séquences sont soit homologues (elles dérivent un ancêtre commun) soit elles ne le sont pas. On ne peut pas parler de pourcentage d’homologie.
Bon travail,
Emese Meglecz