Forum "Recherche d'homologues: BLAST"

Thread subject: Rapport taxonomique

[ Return to forums ]
Rapport taxonomique
Vincent-Marine
21 Apr 2017 11:31
Non evaluated contribution

Bonjour,

Lors de notre analyse sur la séquence 2, nous avons effectue un BLAST contre NR  a 5000 séquences cibles et nous avons obtenu plus de 6000 alignements dans notre groupe d'étude. 

Comment est-ce possible ?

Merci d'avance

Marine et Vincent

 

B_Wirth_17
22 Apr 2017 15:49
Game master

Bonjour,

Vous êtes bien sûrs d'avoir effectué le Blast vs NR avec 5000 séq cibles ? Dans ce cas, vous avez forcément 5000 séq cibles dans le résultat du blast (on peut le vérifier en prenant le résultat brut du blast au format texte, et en le collant dans gedit pour voir le nb de lignes).

Dans ce cas, la différence vient forcément de l'outil local utilisé pour le TaxReport. Peut-être de la distinction "nb d'alignements ou lignes" et "nb de hits". Rappelez-vous, la banque NR est Non-Redondante, alors qu'il s'agit en fait de plusieurs banques interrogées : une même séquence peut donc être répertoriée das plusieurs de ces banques de données. En fait, la redondance est traitée secondairement dans le résultat. Du coup, dans le résultat, un alignement peut correspondre à plusieurs séquences identiques, issues de différentes bases de données, donc à plusieurs hits. La différence vient probablement de là...

Ou alors, c'est un problème au niveau de la base NR téléchargée en local, un problème de mise à jour, ou de redondance, qui ferait en sorte qu'une même séquence est répertoriée plusieurs fois, possible aussi...

Bon travail,

BW

 

 

Vincent-Marine
22 Apr 2017 17:52
Non evaluated contribution

Bonjour,

Oui nous avons vérifié en exportant les résultats du blast pour les copier dans Excel, et nous avons bien 5k séquences. Il s'agit surement d'un souci que vous avez détaillé. Du coup il n'y a pas d'incohérence que nous pouvons corriger car cela provient des algorithmes utilisés.

Vous voulez que nous précision que les algorithmes utilisaient et que les actualisations des bases de donnée peuvent ne  pas être correcte du aux nombreux soucis rencontré avec les logiciels/bases qui se trouve être en local ?

Comme par exemple aussi le logiciel qui ne veut pas enraciner l’arbre à cause du même bug que on avait remarqué la dernière fois. Du coup nous n’avons pas un arbre correctement enraciné avec les valeurs des nœuds. Mais je vous en parlerai Mardi en TP, car vous nous demander l’arbre avec les valeurs des nœuds mais comme le logiciel a plusieurs soucis….

Aussi le site phylogénie reste assez instable, il crash puis revient, puis lag…. Le site miroir reste beaucoup plus lent….

Tous ces soucis informatiques viennent ralentir notre travail et entrave le bon déroulement des TP entre les crashs et les bugs … Si jamais vous arriviez à faire remonter tout cela pour que les prochaines années pour les futures étudiants le site phylogénie résiste un peu plus par exemple …

A Mardi

Cordialement

B_Wirth_17
22 Apr 2017 22:11
Game master

Bonsoir,

> "Oui nous avons vérifié en exportant les résultats du blast pour les copier dans Excel, et nous avons bien 5k séquences. Il s'agit surement d'un souci que vous avez détaillé. Du coup il n'y a pas d'incohérence que nous pouvons corriger car cela provient des algorithmes utilisés."

==> Oui, précisez simplement que vous avez fait la vérification, que vous avez bien 5000 séq dans le résultat de blast, et que la différence doit être due à l'utilisation de l'outil TaxReport.

> "Comme par exemple aussi le logiciel qui ne veut pas enraciner l’arbre à cause du même bug que on avait remarqué la dernière fois. Du coup nous n’avons pas un arbre correctement enraciné avec les valeurs des nœuds. Mais je vous en parlerai Mardi en TP, car vous nous demander l’arbre avec les valeurs des nœuds mais comme le logiciel a plusieurs soucis…."

==> Mettez-moi 2 arbres PhyML : celui enraciné avec TreeDyn pour avoir un meilleur enracinement, et celui enraciné avec l'outil local pour avoir les valeurs de support des noeuds. Pour la description, vous décrivez l'arbre le mieux enraciné des deux, et vous citez simplement qq valeurs remarquables pour les embranchements les plus importants.

> "Aussi le site phylogénie reste assez instable, il crash puis revient, puis lag…. Le site miroir reste beaucoup plus lent…."

==> Là, malheureusement, ce sont des soucis que nous rencontrons à chaque session... Le site Phylogeny.fr étant installé en local à Marseille, mais dans un autre labo... Je remonterai les remarques, mais pour le site phylogeny.fr, je ne sais pas si on pourra améliorer ceci...

Bon Travail

BW

Vincent-Marine
25 Apr 2017 11:33
Non evaluated contribution

Merci de vos réponses