Forum "Recherche d'homologues: BLAST"

Thread subject: Choix d'un groupe externe

[ Return to forums ]
Choix d'un groupe externe
CAE
26 Feb 2012 17:20
Non evaluated contribution
Bonjour
Je rencontre un problème au niveau de l\'analyse du taxonomy report dans le choix d\'un groupe d\'étude et d\'un groupe externe. En effet j\'obtiens un très large chevauchement entre le groupe des protéobactéries et des autres bactéries (firmicutes...) en théorie je devrai donc choisir comme groupe externe : Archébactérie et eucaryote or je n\'obtiens aucune séquences homologues à mon ORF appartenant à ce groupre. Comment faire donc pour sélectionner des séquences pour mon groupe externe si elles n\'existent pas ?

Merci de votre aide.
R_Bourgeas_12
26 Feb 2012 17:52
Game master
Bonjour,
Vous avez bien identifié votre groupe d'étude qui est l'ensemble des bactéries, et votre groupe externe qui est le reste du vivant.
Si vous n'avez pas d'Archées ou d’Eucaryotes parmi les séquences homologues trouvées par BLAST, vous ne pouvez pas constituer de groupe externe. De ce fait, vous devez faire un arbre phylogénétique avec votre groupe d'étude uniquement. Vous aurez donc un arbre non raciné.
Vous pouvez affiner votre recherche dans un second temps en réduisant votre groupe d'étude, en fonction du résultat obtenu avec votre arbre. Par exemple si l'arbre que vous inférez vous indique que votre séquence fait partie des protéobactéries, vous pouvez refaire un second arbre avec les protéobactéries comme groupe d'étude et vous prendrez l'ensemble des bactéries, sauf les protéobactéries comme groupe externe.

Bonne fin de journée,
Raphaël
B_Wirth_12
26 Feb 2012 19:36
Game master
Bonjour,

Tout à fait d'accord avec Raphaël.

Une question supplémentaire, cependant.
Avec Votre BlastP avec 5000 séquences cibles, vous sortez toutes les séquences similaires de la banques (cf e-value de 10 pour la dernière séquence similaire de la liste.
Pourtant, votre Taxonomy Report (cf Résultats bruts) s'arrête sur un score de 129 :
- Streptococcus pseudopneumoniae IS7493 ................................  129 2 hits [firmicutes]  

Avez-vous bien récupéré le Taxonomy Report correspondant au blastP avec les 5000 séquences cibles ???
Vérifiez ce point. J'ai un problème de connexion avec le serveur NCBI, et je ne peux donc pas le vérifier, car je n'arrive pas à charger le Taxonomy Report, correspondant.

Autre point, pour chercher des séquences pour constituer le groupe externe, vous pouvez également REFAIRE un blastP avec votre séq protéique, en choisissant un groupe taxonomique spécifique. Sur la page du blast, sous le menu déroulant pour choisir la banque, vous avez un champ "Organisme" dans lequel vous pouvez choisir le groupe Archaea ou le groupe eucaryote.

En faisant cette analyse avec les Archaea, la séq la plus similaire a un score de 35.8 et une e-value de 2e-04 => Donc, PAS d'homologues chez les Archaea d'après votre seuil.
En faisant cette analyse avec les eucaryotes, la séq la plus similaire a un score de 117 et une e-value de 1e-32 => Donc, des homologues chez les eucaryotes.
=> Ce qui me fait dire que votre Taxonomy Report est peut-être bien incomplet.

Bon travail
Bénédicte
CAE
27 Feb 2012 12:32
Non evaluated contribution
Bonjour

Oui avec mon Blast P vs NR je sors toutes les séquences cibles puisque j'obtiens une E-VAlue de 9.1. Cependant oui mon taxonomy report est incomplet car je n'arrive à le récupérer seulement pour 1000 séquences cibles au maximum imposssible de l'avoir pour 5000 séquences cibles même après de nombreuses tentatives...

J'ai donc mis dans les résultats bruts :
-Le rapport taxonomique pour 1000 séquences cibles (donc incomplet..)
-le rapport taxonomique seulement pour le groupe des eucaryotes ou j'obtiens un score de 117 mais une E-value différente de la votre : 2e-28.
-Le rapport taxonomique seulement pour les archéobactéries avec un score de 35.8 mais là aussi une e-value différente de 9.1.

Cela est t'il suffisant comme explications ?

Merci pour la rapidité et la qualité de vos réponses.
B_Wirth_12
27 Feb 2012 23:30
Game master
Bonjour,

OK, je n'ai effectivement pas réussi à télécharger le taxonomy report pour 5000 séquences cibles : j'avais attribué cela à un pb de connection au serveur du NCBI, mais si vous me dites que vous avez essayé plusieurs fois, sans jamais pouvoir le charger, le pb doit venir d'ailleurs... je ne sais pas d'où, c'est étrange, mais bon, soit, on va faire différemment.

Donc, OK pour le taxonomy report pour 1000 séq cibles, MAIS précisez bien dans votre rapport les difficultés rencontrées pour charger celui correspondant à 5000 séq, pour justifier la présence de celui avec 1000 séq cibles.

Sachant que le taxonomy report à 1000 séq cibles est incomplet, il faut donc effectivement pour vous, faire les BlastP contre nr en spécifiant dans le champ "organism" Archaea et eucaryotes
=> ajouter aussi les résultats bruts de ces blastP dans le paragraphe Blast
=> et ajouter les taxonomy report archaea et eucaryotes dans le paragraphe taxonomy report : TB

Donc pour vous, le groupe externe = eucaryotes, puisque chez les archaea => pas d'homologues.
Choisissez 5-10 séq eucaryotes de facon à représenter tous les sous-groupes taxonomiques des eucaryotes.

Bonne continuation
Bénédicte