Forum "Annotathon: généralités, fonctionnement & bugs"

Thread subject: Problème avec notre ORF au niveau des arbres et des alignements

[ Return to forums ]
Problème avec notre ORF au niveau des arbres et des alignements
manal
14 Dec 2025 13:27
Non evaluated contribution

Bonjour, 

 

Nous avons plusieurs problèmes et on aimerait savoir si ces problèmes peuvent être arranger ou faut-il changer d'ORF, ce que nous vous avions proposés il y a 2 semaines.

 

Au niveau de l'arbre, nous avons du faire plusieurs choix de groupes d'études et groupe externe. Vous nous aviez demandé de le refaire avec cette fois ci 5000 séquences et une e-value de 0,05. Suite à cela nous avons eu plusieurs choix:

  • groupe étude: LUCA;Bacteria;Proteobacteria;Gammaproteobacteria
  • groupe externe: 

    LUCA;Bacteria;Proteobacteria;Alphaproteobacteria

  •  

    groupe étude :

    LUCA;Bacteria;Bacteroidetes; Flavobacteriia 

  • groupe externe : 

    LUCA;Bacteria;Bacteroidetes; Cytophagia

  • groupe étude : 

    LUCA;Bacteria;Cyanobacteria;Cyanophyceae

  • groupe externe : 

    LUCA;Bacteria;Cyanobacteria;Adonisia

Malgré tout ces choix nous avions toujours le même problème au niveau des arbres: un mélange entre groupe externe et groupe étude.

Je vous montre ceci sur un seul arbre: 

Ce qui nous empêche donc de faire un enracinement correcte. Et dans le premier annotathon, j'ai pu comprendre qu'on ne pouvait pas prendre deux groupes d'études avec 2 différences comme par exemple: LUCA;Bacteria;Spirochaetes; Spirochaetia et LUCA;Bacteria;Proteobacteria;Gammaproteobacteria. Et qu'il fallait plutôt prendre 2 groupes étude et externe avec une seule difference( le dernier ordre). Est ce exact? 

 

On a tout de même essayer avec deux groupes ayant 2 ordre différent : LUCA; Bacteria;Spirochaetes:Spirochaetia et LUCA:Bacteria:Cyanobacteria:Cyanophyceae 

Nous avons eu cet arbre qui est beaucoup plus correct puisqu'il y a une bonne séparation entre groupe étude et groupe externe et une bonne intégration de l'ORF. 

 

Le problème maintenant c'est l'alignement au format ClustalW ( disponible sur notre partie alignement; résultats bruts), en le comparant un peu avec celui de notre ancien ORF je trouve que l'alignement n'est pas de bonne qualité et les zones annotés d'un signe de conservation sont minimes et très éparpillés. 

 

Pourriez vous s'il vous plait nous indiquer si notre choix de groupes est correct? si l'alignement est analysable? ou sinon faut-il qu'on change d'ORF? 

 

Merci par avance!

AIT EL MOUMEN Manal

SMATA Anfel

B_Wirth_25
16 Dec 2025 11:42
Game master

Bonjour,

 

tous les choix de groupes d'étude et externe que vous mentionnez ci-dessus sont tous cohérents, car vous prenez bien un groupe de même rang taxonomique que le groupe d'étude pour faire votre groupe externe.

- Classe des gamma- vs classe de alpha-, au sein du phylum des proteo-

- Classe des flavo- vs cytophagia au sein du phylum des bacteroidetes

- 2 classes différentes au sein du phylum des Cyanobacytéries

 

Et qu'il fallait plutôt prendre 2 groupes étude et externe avec une seule difference( le dernier ordre). Est ce exact? 

=> Le groupe externe se choisit en fonction du groupe d'étude, il doit être de même rang taxonomique.

=> Si vous n'avez pas suffisamment de séq au même rang pour faire un groupe externe, et uniquement dans ce cas là, alors vous pouvez remonter d'un cran dans la taxo de réf. pour faire un groupe externe.

 

Malgré tout ces choix nous avions toujours le même problème au niveau des arbres: un mélange entre groupe externe et groupe étude.

=> Je pense que l'orf n'était pas non plus intégré dans les groupes d'études choisis ?

 

On a tout de même essayer avec deux groupes ayant 2 ordre différent : LUCA; Bacteria;Spirochaetes:Spirochaetia et LUCA:Bacteria:Cyanobacteria:Cyanophyceae 

=> Non, là vous considérer les groupes d'étude et externe au niveau du phylum bactérien : Spirochaetes vs Cyanobacteria.

 

Vous nous aviez demandé de le refaire avec cette fois ci 5000 séquences 

=> Oui, car l'e-value la plus faible, e-51, et donc la séq la plus proche de votre séq étudiée, est dans le groupe des spirochaetes, qui pouvait donc être le groupe d'appartenance. Cependant, vous n'aviez que 17 séq avec le blast avec 1000 seq cibles. L'idée était donc de voir si vous pouviez obtenir plus de seq dans ce groupe taxonomique en augmentant le nombre de cibles demandées.

 

Ce qui semble être le cas, puisque dans le dernier arbre que vous me présentez, le groupe d'étude est le groupe des spirochaetes, il y a plus que les 17 seq de départ, et votre ORF émerge bien dans ce groupe : il s'agit donc bien du bon groupe d'appartenance.

 

Si votre GE est le phylum des spirochaetes, alors le groupe externe, est un autre phylum bactérien, cyanobactérie par exemple, oui : le résultat présenté est juste.

 

Par contre, avec le résultat de blast avec 5000 séq cibles, ne pouviez-vous pas être plus précis dans le choix du groupe d'étude et groupe externe ? (Le but est de trouver le groupe d'appartenance le plus précis possible).

Avez-vous peut-être plusieurs classes, ou plusieurs ordres, ou plusieurs familles différent(e)s dans le phylum des spirochaetes ? Ce qui vous permettraient de choisir un GE plus précis ?

Là, pour en juger, il me faut la "Taxonomy Summury Table" du blast vs 5000 seq.

Celle que vous présentez ici, est celle du blast vs 1000 seq.

 

Le problème maintenant c'est l'alignement au format ClustalW ( disponible sur notre partie alignement; résultats bruts),

=> Il faut d'abord voir si vous pouvez être plus précis dans votre choix du groupe d'étude et du groupe externe. cf "Taxonomy Summury Table" du blast vs 5000 seq.

Dans ce cas, vous auriez effectivement des séq plus proches incluses dans l'alignement multiple.

 

Bon travail,

BW