Upload
joelle-miller
View
27
Download
0
Embed Size (px)
DESCRIPTION
Performance de anotação automática com grupos de ortólogos KOG. Se vc conhece os grupos de ortólogos de MO E vc pode conhecer a anotação correta de ESTs de um MO Um experimento pode ser feito! Mas… vc tem que conhecer o cutoff para o alinhamento de uma EST com a sua proteína cognata. - PowerPoint PPT Presentation
Citation preview
BIOINFORMÁTICA UFMG
A TGC Performance de anotação automáticacom grupos de ortólogos KOG
Se vc conhece os grupos de ortólogos de MO
E vc pode conhecer a anotação correta de ESTs de um MO
Um experimento pode ser feito!
Mas… vc tem que conhecer o cutoff para o alinhamento de uma EST com a sua proteína cognata
BIOINFORMÁTICA UFMG
A TGC As seqüências analisadas
ORGANISM ESTs PROTEINS KOGs
Arabidopsis thaliana 178.538 24.154 13.744
Caenorhabditis elegans 215.200 17.101 10.581
Drosophila melanogaster 261.404 10.517 8.445
Homo sapiens 1.941.556 26.324 19.039
pUC18 846 1
BIOINFORMÁTICA UFMG
A TGC Seqüências de pUC reunidas por 82% de similaridade equivalem a 96% de identidade
82%
.93
BIOINFORMÁTICA UFMG
A TGC Os cutoffs se aproximam de 80% de similaridadepara alinhamentos EST-proteina correta
BIOINFORMÁTICA UFMG
A TGC O teste de anotação
cel
dmehsa
athKOG
dmeESTs
Assigned ESTsto desired KOGs
BLASTCutoff 78%
BIOINFORMÁTICA UFMG
A TGC Elimine o KOG para um organismo por vez(transforme-o em um transcriptoma novo)
cel
dmehsa
athKOG
dmeESTs
• correct: same KOG• changed: distinct KOG• speculated: not assigned
BLAST
BIOINFORMÁTICA UFMG
A TGC A especulação minimiza com o cutoff apropriado de “designação”
correct
especulated
changed
BIOINFORMÁTICA UFMG
A TGC A anotação correta é maior que 90%
correct changed especulated
89,3%
5,2%5,5%
96,7%
1,6%1,8%
91,9%
3,0%5,1%
96,3%
2,4%1,2%
BIOINFORMÁTICA UFMG
A TGC Quantas ESTs eu preciso para descobrir oKOG todo?(com ou sem o organismo cognato na base)
Picturing Discovering