Bonjour,
- "au moment où l'on choisissait notre groupe d'étude, on avait le groupe avec la e-value la plus faible (pelagibacteriale) mais egalement un autre groupe avec de pelagibacterale non classifié avec une e-value très faible egalement."
==> Ceci est à faire apparaître dans votre table 5 (pas le cas pour l'instant) :
- la colonne "sous-classe" correspond à l'ordre
- et ajoutez une colonne famille => Pelagibacteraceae et les "unclassified"
- "on a donc choisi ces deux groupes comme groupe d'étude"
==> le groupe d'étude est donc "pelagibacterales"
- "en supposant que ces non classifiés pourrient être une nouvelle famille des pelagibacterale. ma question est comment conclure sur cette hypotjèse via les arbres trouvés"
==> Vous les avez distingués par des couleurs sur l'arbre, c'est très bien.
==> Par contre, revoyez la légende, ce n'est pas "groupe d'étude1", "groupe d'étude 2" : groupe d'étude = pelagibacterales, et dans votre sélection de séquences, vous avez des "Pelagibacteraceae" en bleu et des "unclassified" en rouge.
==> on pourrait conclure à "une nouvelle famille des pelagibacterale.", si les 2, "Pelagibacteraceae" en bleu et "unclassified" en rouge, formaient 2 groupes monophylétiques distincts. Est-ce le cas ?
-sur l'arbre phyml, les pelagibacterales forment un seul groupe monophylétique, avec les seq rouges incluses dans les bleues.
-sur l'arbre NJ, peut-etre 2 groupes monophyletiques, avec une majorité des seq rouges dans un des groupes (une exception dans l'autre groupe)
Mais en y regardant de plus près, vous avez des "Cu : Candidatus; unclassified" dans les 2 groupes monophylétiques, qui dérivent des 2 branches soeurs.
Donc, je pense un seul groupe monophylétique, une seule famille, "Pelagibacteraceae" .
Par contre, dans votre arbre, je vois des seq xxxxPCu1 à XXXPCu13, ce qui n'apparaît pas dans les séq sélectionnées dans le paragraphe "Rapport taxonomique" (ca s'arrête à xxxPCu9).
Ce qui signifie que les séq utilisées pour l'alignement multiple et la reconstruction phylogénétique ne correspondent pas à celle présentées dans le paragraphe "Rapport taxonomique".
C'est à revoir.
En parcourant rapidement votre travail, j'ai également noté quelques autres petites choses à revoir :
- Revoir les Protocoles :
cf règles du jeu : Sous la rubrique "PROTOCOLE", spécifiez le résumé des informations nécessaires pour pouvoir reproduire l'analyse, au minimum: le nom de l'outil utilisé, son URL et les paramètres d'analyse.
Evitez : "copiez-collez...", "Refaire la manipulation et generer...", "Utilisez le site...."; "Recuperer et conserver ...", "Ouvrir le logiciel", "Coller les séquences", etc....
ou encore cliquer sur... etc...
Par exemple, paragraphe ORF : a) et b) OK
Protocole BLAST : => en une ligne : c) NCBI BLAST/ BLASTP/ url / quelle BDD ? / quels paramètres utilisés ?
- Paragraphe ORF :
- Il faut revoir votre figure, pb d'affichage : chaque brin est sur 2 lignes
Et il faut respecter la proportion des ORFs / au brin : par exemple votre ORF2 de la position 101 à 811 sur un fragment de 1335 pb.
Si la proportion par rapport au fragment n'est pas respectée, on ne peut pas conclure sur les chevauchements.
-Dans votre analyse il faut aussi éviter les listes de phrases :
- il y a deux ORF Kown ....
- trois ORF faux positifs ...
OU
L'ORF étudiée pour la suite de l'éxpèrience , est l'ORF2 car c'est un gêne codant pour une protéine et :
-Possède une taille en AA la plus élevé : 237 AA
-non chevauchant
-sur BLAST nr alignement de 5000 (homologues)
-Pourcentage inférieur à 97% et supèrieur à 50 %
==> Nous demandons un effort de rédaction, un travail rédigé.
Attention aussi à la variation dans la taille de police.
Bon travail,
BW