Bonsoir,
Concernant la structure globale du génome de CoV que vous analysez, comparez seulement à la structure génomique du type de CoV le plus proche (si votre CoV est proche structurellement de OC43, ne comparez qu'avec OC43 pour les ORF présents/absents).
Le différentiel de E-value correspond au rapport entre le meilleur E-value dans le groupe d'étude et le meilleur E-value du groupe extérieur, exprimé en nombre de logs. Par ex si c'est 1E-122 dans le gr d'étude et 1E-95 dans le groupe extérieur, ce différentiel est de 27 logs. Ce différentiel doit être suffisamment important (au moins 10 logs, si possible plus) pour argumenter que votre séquence Spike requête appartient très vraissemblablement au groupe d'étude (plutôt qu'au groupe extérieur).
Dans le cas où certains E-values sont arrondis à zéro (car < 1E-180), alors utilisez la soustraction entre les scores max au lieu des E-value min pour évaluer ce différentiel de qualité entre les alignements. Dans ce cas, le différentiel doit être > 100 pour être convainquant. Par ex si le score max du groupe d'étude est 1456 bits et le score max du groupe extérieur est 965, le différentiel est de 491.
Bonne soirée !