Forum "Recherche d'homologues: BLAST"

Thread subject: Rapport taxonomique et Table 5

[ Return to forums ]
Rapport taxonomique et Table 5
B_Wirth_25
6 Dec 2025 15:18
Game master

Bonjour Madame,

J'aurais une question sur le rapport taxonomique.

Dans mon cas, les résultats Blast reports me permettent de choisir un groupe d'étude et un groupe externe au niveau de l'espèce (niveau 8).

De ce fait la table 4 demandé qui synthétise les résulats taxonomiques a déjà une taille conséquente, vous avez signifié dans la correction de ma première séquence qu'il fallait ajouté une colonne au niveau taxonomique supérieur pour pouvoir justifier de la précision, qui dans ce cas serait la souche (niveau 9). À ce niveau, le Blast reports donne une nomination plus précise que l'espèce qu'à très peu de séquences et leur nombre est insuffisant pour constituer des groupes.

D'après mes souvenir, vous nous avez dis que de ne pas dépassé le niveau 8 (espèce). 

Dans ce cas, est-que je rajoute quand même une colonne souche pour justifier que je ne pouvais pas être plus précis ? Ou alors expliquer plus dans le détails ce que j'ai dis plus haut concernant le niveau 9 (souche) suffit à justifier que je ne pouvais pas être plus précis.

Merci de l'attention que vous accordez à ma demande.

Cordialement.

Amine Bendjama.

B_Wirth_25
6 Dec 2025 15:31
Game master

Bonjour,

 

Dans mon cas, les résultats Blast reports me permettent de choisir un groupe d'étude et un groupe externe au niveau de l'espèce (niveau 8).

 

==> Cela m’étonne… En général, vous ne pouvez pas aller jusqu’au rang de l’espèce… Combien de séquences avez-vous alors à ce rang "espèce" pour constituer votre GE ??? Sachant qu'il faut une trentaine de séquences pour constituer votre GE.

 

==> Pour les séquences que vous récupérez dans la BDD (lorsque vous cliquez sur le bouton « Get selected sequences au format FASTA »), certaines séquences indiquent EFFECTIVEMENT une classification jusqu’au rang de l’espèce, voire de la souche. Ceci signifie que ces séquences proviennent de telle espèce, voire de telle souche. MAIS cette information n’est pas disponible pour TOUTES les séquences récupérées. Et même si vous avez cette information pour certaines séquences, je ne pense pas que vous ayez plus de 30 séquences correspondant à une espèce donnée, pour pouvoir constituer un GE au rang de l'espèce...

 

==> D’après ce que je vois, vous avez choisi, pour l’arbre :

- GE : la famille Rhizobiaceae au sein de l’ordre des Rhizobiales,

- et externe : famille des Stappiaceae au sein de l’ordre des Rhizobiales.

 

==> Ce choix est cohérent, ce sont 2 familles différentes au même niveau taxonomique, puisqu’elles appartiennent toutes les 2 à l’ordre des Rhizobiales.

Sur l’arbre, l’ORF s’intègre dans le groupe d’étude en bleu. MAIS il n’y est pas ancré profondément, juste par une seule séq, la séq BPARRRPP2.

Il faudra vérifier que le 2e arbre, avec la 2eme méthode, permette aussi d’intégrer l’ORF dans le GE !

Donc, d’après cet arbre, la ccl serait : la séq étudiée est issue d’une bactérie qui appartient à la famille des Rhizobiaceae.

 

Dans la famille des Rhizobiaceae, Rhizobium/Agrobacterium group est un groupe qui contient visiblement les genres Rhizobium, Agrobacterium, Allorhizobium et Pararhizobium.
Le nom de l’espèce vient après : par exemple, Pararhizobium mangrovi ou Pararhizobium sp. IMCC21322 ou Agrobacterium sp. MA01 ou Rhizobium cremeum.
 
Dans votre séléction de séq de la famille des Rhizobiaceae, vous représentez seulement des séq du genre Rhizobium/Agrobacterium group, et vous ne représentez pas les AUTRES genres disponibles dans cette famille. 
=> Votre GE n’est donc pas monophylétique, mais paraphylétique !
Si le groupe d'étude est bien la famille des Rhizobiaceae, alors ce groupe DOIT être monophylétique, et devrait contenir des séq de tous les genres au sein de cette famille.
Ou alors, cela signifie que votre GE est au niveau du genre Rhizobium/Agrobacterium group, mais alors le choix du groupe externe n’est pas judicieux, vous auriez pu prendre les autres genres au sein de la famille des Rhizobiaceae comme groupe externe…
=> Le groupe externe DOIT être de même niveau taxo que le GE.
=> On remonte d'un cran ds la taxo de réf si pas de séq disponibles au même rang...
MAIS vous avez 15 seq de genres différents pour constituer un groupe externe.
 
==> Il faut donc d’abord être sûr de vos GE et externe.
 
Ensuite, concernant votre table 5 :

De ce fait la table 4 demandé qui synthétise les résulats taxonomiques a déjà une taille conséquente, vous avez signifié dans la correction de ma première séquence qu'il fallait ajouté une colonne au niveau taxonomique supérieur pour pouvoir justifier de la précision, qui dans ce cas serait la souche (niveau 9). À ce niveau, le Blast reports donne une nomination plus précise que l'espèce qu'à très peu de séquences et leur nombre est insuffisant pour constituer des groupes.

 

==> Non, votre table est trop détaillée ! Revérifiez les consignes dans les règles du jeu et le document TP 3 à 5 disponible sur AMETICE pour la constitution de cette table !

Cf notez que ce tableau de synthèse doit être précis pour les taxa les plus proches, et peut devenir moins précis avec par exemple juste une ligne par Phylum ou même Règne pour les taxa les plus éloignés)

 

Donc, si votre GE est bien la famille des Rhizobiaceae, ALORS votre table DOIT être précise pour ce groupe-là, et DEVRA indiquer les différents GENRES (avec leurs gammes de e-values et le nb de séq pour chaque genre) au sein de cette famille.
Puis vous indiquez les AUTRES familles de même rang, au sein du même ordre, mais vous n’avez pas besoin de présenter les différents genres au sein de ces familles. DONC, une ligne par famille.
Puis vous remontez d’un cran dans la taxo de réf, et vous présentez les autres ordres au sein des alpha- => une seule ligne par ordre.
Puis vous remontez d’un cran dans la taxo de réf, et vous présentez les autres classes au sein des protéo- => une seule ligne par classe.
Puis vous remontez d’un cran dans la taxo de réf, et vous présentez les autres phyla bactériens => une seule ligne par phylum.
Et si vous avez un autre règne (archaea ou euK, ce qui n’est pas votre cas) => une seule ligne par autre domaine.
 

D'après mes souvenir, vous nous avez dis que de ne pas dépassé le niveau 8 (espèce). 

Dans ce cas, est-que je rajoute quand même une colonne souche pour justifier que je ne pouvais pas être plus précis ? Ou alors expliquer plus dans le détails ce que j'ai dis plus haut concernant le niveau 9 (souche) suffit à justifier que je ne pouvais pas être plus précis.

 
==> Ce n’est pas la peine de présenter une colonne espèce, puisque dans ce cas, vous auriez 1 seule espèce par ligne. Et parfois, l’espèce n’est pas mentionnée, pas connue.

N'hésitez pas si vous avez d'autres questions,
Bon travail,
BW
B_Wirth_25
6 Dec 2025 15:39
Game master

Par ailleurs, j'ai parcouru votre formulaire :

- vous n'avez pas besoin de 2c tables différentes dans le paragraphe domaine => cf règles du jeu :

Veuillez résumer ces résultats bruts, assez indigeste, par un tableau N°2 de synthèse, en ignorant les domaines prédits non intégrés à INTERPRO (no IPR).

Toutes les entrées dans INTERPRO (donc tous les N° IPRxxxx de vos résultats bruts) doivent apparaître dans ce tableau, en indiquant une seule ligne par N° IPR.

Pour les N° IPR pour lesquels il y aurait des prédictions redondantes dans plusieurs bases de données d'origine, ne conservez qu'un seul domaine représentatif (par exemple ne reportez que le domaine Gene3D qui a la meilleure e-value dans le résultat ci-dessus qui présente 3 domaines redondants).

 

- votre "table 4", peut encore être simplifiée : cf

 

Table 5 : catalogues des fonctions des protéines alignées par BlastP contre NR => contre Refseq

MULTISPECIES: precorrin-2 C(20)-methyltransferase... Alphaproteob... a-proteobact...

 

=> MULTISPECIES: et Alphaproteob... a-proteobact est en rapport avec l'origine taxonomique et non pas avec la fonction

La fonction est donc precorrin-2 C(20)-methyltransferase.

=> vous pouvez donc encore regrouper des lignes.

 

Par ailleurs, une table DOIT avoir des bordures.

 

Bon travail,

BW