Forum "Annotathon: généralités, fonctionnement & bugs"

Sujet de discussion: Grille d’évaluation, rédaction de rapport

[ Retour aux forums ]
Grille d’évaluation, rédaction de rapport
Meglecz20CTES
31 Mar 2021 10:43
Maître de jeu

Bonjour,

 

À la fin de règles du jeu d’Annotathon, vous pouvez trouver une grille d’évaluation. Cette grille a été conçue il a quelques années quand nous avons eu une UE de 6 crédits pour l’Annotathon, et par conséquence, nous avons demandé des travaux approfondis de la part des étudiants.
Certains de ces points n’appliquent pas à vous. Par exemple, j’ai désactivé les champs concernant le poids moléculaire, domaines (interpro), processus biologiques, symbole de gène. En conséquence, beaucoup des points sur cette liste ne sont pas appliqués sur vos travaux. Néanmoins, si vous voulez aller plus loin, vous pouvez y trouver l’inspiration.


Dans la version actuelle de l’UE je vous demande une rédaction restreinte dans les champs analyse :

Les tableaux et les figures demandés résument essentiel des informations. Je vous demande de faire sortir que des informations clés dans la rédaction des analyses, et expliquer d’éventuelles analyses supplémentaires que vous avez faites. Attention, soyez précis dans vos rédactions, chiffrez vos observations (par exemple 565 homologues à la place de beaucoup d’homologues), utilisez des liens vers vos sources extérieures quand c’est opportun.


Dans la partie conclusion, vous avez 4000 caractères pour synthétiser vos interprétations et hypothèses bâties sur la base des observations faites dans les rubriques précédentes. Croisez les résultats des différentes analyses pour répondre aux 4 questions suivantes :
1.    La séquence est-elle codante ? Utilisez les résultats d’ORFinder et BLAST
2.    Est-ce on ORF complet à chacun de ces extrémités ? Discutez de la position de départ de l'ORF, et estimez le nombre des aa/nt marquants de chaque extrémité incomplète. Utilisez les résultats d’ORFinder, Alignement multiple et éventuellement BLAST.
3.    Quelle est la fonction de la protéine ? Utilisez pour les prédictions de fonction les annotations disponibles pour les homologues de votre ORF dont la fonction est connue, par exemple dans les fiches SWISSPROT, les BDD de NCBI éventuellement Uniprot, QuickGO, interpro…
4.    À quel groupe taxonomique appartient cette séquence ? Utilisez essentiellement les analyses phylogénétiques.

 

 

Anaïs a listé une série des questions concernant la grille d’évaluation. Je réponds point par point ci-dessous.


Bon travail,
Emese Meglecz

 

 

ORF:
1. Faut-il calculer le poids moléculaire de la protéine choisie ?
    NON.
2. Faut-il indiquer également les résultats d'une recherche d'ORF débutant par un codon d'initiation ?
    Non pas obligatoire, mais possible, si vous le jugez important.

3. Faut-il faire une « analyse des biais de fréquences de nucléotides » (SMS->DNA Stats) ?
    Non pas obligatoire, mais possible, si vous le jugez important.

 

Alignements BLAST :

4. Faut-il décrire qualitativement et quantitativement les meilleurs alignements 2 à 2 ?
    NON.
5. Faut-il inclure les BLAST des autres ORFs (hors celui étudié) ?
    NON.

 

Fonction et domaines de la protéine :
6. Faut-il employer interpro ?
    Non pas obligatoire, mais possible, si vous le jugez important.

7. Faut-il parler des domaines ou sous-domaines potentiels de notre protéine (notamment en se basant sur interpro et/ou sur les fiches SWISSPROT/RefSeq/NR des homologues) ?
    Non pas obligatoire, mais possible, si vous le jugez important.

8. Faut-il mentionner QuickGo, si l’on n’y trouve pas les descriptions de notre ORF ?
    Dites que vous avez testé sans résultat.

9. Doit-on indiquer nos sources externes (ex : articles scientifiques), lors de la description de la fonction de la protéine ?
    OUI

 

Taxonomie :
10. Si on doit utiliser interpro, doit-on comparer les informations taxonomiques obtenues par blast et par interpro ?
    Non pas obligatoire, mais possible, si vous le jugez important.

11. Doit-on décrire les taxa trouvés dans le rapport taxonomique et la répartition des E-values ?
    NON, mais expliquez avec chiffe à l’appui de choix de groupe d’étude.

 

Alignement multiple :
12. Faut-il analyser les régions divergentes, les domaines conservés et leur fonction (notamment croiser les résultats avec interpro) ?
13. Faut-il confronter les positions fortement conservées avec les acides aminés annotés
comme ayant des rôles identifiés dans les fiches SWISSPROT/RefSeq/NR des homologues ?
14. Faut-il identifier avec des codes (ex A, B, C...) les régions d'intérêt directement dans l'alignement multiple pour y faire référence dans notre analyse ?

 

12-14 : Non pas obligatoire, mais possible, si vous le jugez important.
Points importants pour la description de l’alignement multiple :
-    Longueur de l’alignement
-    Nombre de positions conservées et/ou avec des substitutions conservatrices
-    Nombres et longueurs approximatives des régions avec gap et leur répartition dans l’alignement
-    Position de début et fin de l’ORF par rapport aux homologues


Arbre :
15. Devons-nous discuter de la cohérence des arbres des gènes avec l'arbre des espèces de référence ? Que faire si, comme dans mon cas, il n’y a pas d’arbre de référence de la répartition des Alphaproteobacteria ?
    OUI. Vous pouvez utiliser soit la taxonomie comme « arbre/structure de référence », soit, trouver une publication scientifique sur la taxonomie du groupe (et y faire référence).

16. Y a-t-il un format à suivre pour le nom des feuilles de l’arbre ? Certaines remarques disent de le faire au format 'Ecolix' (qu’est-ce que c’est ?) ou d’enlever « bacteria ».
    Pas de critère particulier. Gardez des informations pertinentes, et je vous conseille fortement un code couleur. Voir aussi point 2 de l’échange http://annotathon.org/?seeThread=2859

17. Sommes-nous censés être capables d’identifier et de distinguer les événements de duplication ou de spéciation dans notre arbre ? Je ne verrai pas comment faire.
    Si vous suspectez une duplication, essayez de le démontrer (https://ametice.univ-amu.fr/mod/resource/view.php?id=1899654 ). Sinon, tous les noeuds devraient correspondre à des spéciations.

18. Dans le cas où nous avons deux arbres : si le premier permet d’identifier l’ordre auquel appartient l’ORF et le second permet d’aller jusqu’à l’identification de la famille, que doit-on indiquer dans la partie « taxonomie » comme nom de groupe ? Devons-nous être prudents et indiquer le groupe commun des deux arbres (l’ordre), ou indiquer la famille, même si un seul des arbres permet de déduire cela ?
    Choisissez votre hypothèse qui vous semble la plus sûre pour le champ taxonomie, et discutez de l’hypothèse plus risquée dans les analyses ou conclusion.

 

AnaisE
1 Apr 2021 12:32
Contribution non évaluée

Bonjour,

 

Merci beaucoup pour ces précisions.

 

Concernant Interpro et QuickGo, si nous les employons, devons-nous ajouter les détails de nos recherches dans la section "protocole" ?

Meglecz20CTES
1 Apr 2021 16:23
Maître de jeu

Bonjour Anaïs,

 

Concernant Interpro et QuickGo, si nous les employons, devons-nous ajouter les détails de nos recherches dans la section "protocole" ?

 

Oui.