Forum "Recherche d'homologues: BLAST"

Thread subject: Choix du groupe d'études

[ Return to forums ]
Choix du groupe d'études
Thonsrouge
2 Mar 2012 1:03
Non evaluated contribution
Bonjour,

Tous d'abord nous avons décidé de considérer nos 5000 mille séquences comme étant des séquences homologues.

En ce qui concerne le choix de notre groupe d'étude et de notre groupe externe, il s'agit-il bien de prendre comme groupe d'étude le groupe auquel appartiennent toutes les séquences ayant le score le plus élevé et qui se suivent ? Et le groupe externe parmi un autre groupe de séquence qui se suivent, mais qui auraient un score inférieur au score de notre groupe d'étude ? (Dans les régle du jeu et la FAQ nous ne trouvons pas d'explication sur cela).

En se basant sur ce principe, nous choisissant comme groupe d'étude les Flavobacteriaceae avec les séquences suivantes :

[i]Kordia algicida OT-1 ...............................................  306  2 hits [CFB group bacteria]  
Bizionia argentinensis JUB59 .......................................  300  2 hits [CFB group bacteria]  
Lacinutrix sp. 5H-3-7-4 ............................................  299  2 hits [CFB group bacteria]    
Zobellia galactanivorans ...........................................  289  2 hits [CFB group bacteria]
Cellulophaga lytica DSM 7489 .......................................  288  2 hits [CFB group bacteria]  
Croceibacter atlanticus HTCC2559 ...................................  285  4 hits [CFB group bacteria]    
Polaribacter irgensii 23-P .........................................  279  4 hits [CFB group bacteria]    
Flavobacterium psychrophilum JIP02/86 ..............................  275  8 hits [CFB group bacteria]    
Psychroflexus torquis ATCC 700755 ..................................  270  6 hits [CFB group bacteria]
Gramella forsetii KT0803 ...........................................  265  4 hits [CFB group bacteria]    
Dokdonia donghaensis MED134 ........................................  265  4 hits [CFB group bacteria]    
Krokinobacter sp. 4H-3-7-5 .........................................  264  6 hits [CFB group bacteria]    
Cellulophaga algicola DSM 14237 ....................................  265  6 hits [CFB group bacteria]    
Flavobacterium columnare ATCC 49512 ................................  264  2 hits [CFB group bacteria]    
Mesoflavibacter zeaxanthinifaciens S86 .............................  259  2 hits [CFB group bacteria]    
Flavobacteriaceae bacterium HQM9 ...................................  251  2 hits [CFB group bacteria]    
Riemerella anatipestifer DSM 15868 .................................  236  4 hits [CFB group bacteria]    
Riemerella anatipestifer RA-YM .....................................  236  2 hits [CFB group bacteria]    
Riemerella anatipestifer RA-GD .....................................  236  2 hits [CFB group bacteria]    
Flavobacteriaceae bacterium S85 ....................................  235  1 hit  [CFB group bacteria][/i]

Et prendre comme groupe externe 10 séquences au hasard parmi les autres bactéries, comme par exemple prendre 10 séquences parmi les g-proteobacteria, ou encore parmi les spirochetes.

Cela vous semble t-il juste ? Si cela est le cas nous rencontrons un problème pour notre groupe d'étude car, nous n'avons pas la trentaine de séquence demander mais seulement une vingtaine.
Thonsrouge
2 Mar 2012 1:07
Non evaluated contribution
[size=8][i]Merci d'avance
Abdel[/i][/size]
R_Bourgeas_12
2 Mar 2012 11:28
Game master
Pour le choix des groupes externe et d'étude, je vous renvoie au fichier pdf "guide de sélection des groupes d'études et extérieurs" que vous trouverez dans la FAQ sous "l'arbre de la vie vu par les microbes".
Le groupe d'étude se définit à partir du "Taxonomy Report" de BLASTp contre nr, et vous devez en effet prendre un phylum avec le score le plus élevé, dans votre cas, les CFB. Cependant, si jamais le groupe suivant a des scores qui se chevauchent beaucoup avec les CFB, vous devez agrandir votre groupe d'études à ce nouveau groupe. Pour le choix du groupe externe, c'est plus simple et très bien expliqué dans le pdf.

Bonne continuation,

Raphaël Bourgeas

P.S. : Pour les domaines protéiques, vous ne devez pas mettre dans le tableau des domaines qui se chevauchent ; et surtout pas des domaines noIPR.
Thonsrouge
4 Mar 2012 6:38
Non evaluated contribution
merci
Thonsrouge
4 Mar 2012 6:45
Non evaluated contribution
merci
Thonsrouge
4 Mar 2012 6:46
Non evaluated contribution
Bonjour,
J'ai essayé de faire mon arbre mais, il est inexploitable car après l'étape de curation il ne reste que 1% de séquence conservée, j'ai donc fait l'arbre sans curation mais, celà nous donne un arbre avec un pourcentage de position de gap à 88% donc inexploitable lui aussi. J'ai donc changé mes groupes, et même essayer sans enracinement (les résultats sont dans les annotations de notre 3ème séquence, à partir du blast ce sont les résultats de la première séquence) et malgré cela la conservation après curation n'excéde pas 7%...
Si vous pouviez me guider, ou me dire ce qui ne va pas...
    Merci d'avance.
Abdel
R_Bourgeas_12
6 Mar 2012 19:40
Game master
Vu en TP.