14
BIOINFORMÁTICA UFMG A T G C

Performance de anotação automática com grupos de ortólogos KOG

Embed Size (px)

DESCRIPTION

Performance de anotação automática com grupos de ortólogos KOG. Se vc conhece os grupos de ortólogos de MO E vc pode conhecer a anotação correta de ESTs de um MO Um experimento pode ser feito! Mas… vc tem que conhecer o cutoff para o alinhamento de uma EST com a sua proteína cognata. - PowerPoint PPT Presentation

Citation preview

BIOINFORMÁTICA UFMG

A TGC

BIOINFORMÁTICA UFMG

A TGC Performance de anotação automáticacom grupos de ortólogos KOG

Se vc conhece os grupos de ortólogos de MO

E vc pode conhecer a anotação correta de ESTs de um MO

Um experimento pode ser feito!

Mas… vc tem que conhecer o cutoff para o alinhamento de uma EST com a sua proteína cognata

BIOINFORMÁTICA UFMG

A TGC Como é uma entrada KOG?

BIOINFORMÁTICA UFMG

A TGC As seqüências analisadas

ORGANISM ESTs PROTEINS KOGs

Arabidopsis thaliana 178.538 24.154 13.744

Caenorhabditis elegans 215.200 17.101 10.581

Drosophila melanogaster 261.404 10.517 8.445

Homo sapiens 1.941.556 26.324 19.039

pUC18 846 1

BIOINFORMÁTICA UFMG

A TGC Seqüências de pUC reunidas por 82% de similaridade equivalem a 96% de identidade

82%

.93

BIOINFORMÁTICA UFMG

A TGC Os cutoffs se aproximam de 80% de similaridadepara alinhamentos EST-proteina correta

BIOINFORMÁTICA UFMG

A TGC O teste de anotação

cel

dmehsa

athKOG

dmeESTs

Assigned ESTsto desired KOGs

BLASTCutoff 78%

BIOINFORMÁTICA UFMG

A TGC Elimine o KOG para um organismo por vez(transforme-o em um transcriptoma novo)

cel

dmehsa

athKOG

dmeESTs

• correct: same KOG• changed: distinct KOG• speculated: not assigned

BLAST

BIOINFORMÁTICA UFMG

A TGC A especulação minimiza com o cutoff apropriado de “designação”

correct

especulated

changed

BIOINFORMÁTICA UFMG

A TGC A anotação correta é maior que 90%

correct changed especulated

89,3%

5,2%5,5%

96,7%

1,6%1,8%

91,9%

3,0%5,1%

96,3%

2,4%1,2%

BIOINFORMÁTICA UFMG

A TGC Quantas ESTs eu preciso para descobrir oKOG todo?(com ou sem o organismo cognato na base)

Picturing Discovering

BIOINFORMÁTICA UFMG

A TGC Por categoria funcional

C. elegans

D. melanogasterpicturing sampling

BIOINFORMÁTICA UFMG

A TGC Schistosoma mansoniK

OG

cat

egor

y

BIOINFORMÁTICA UFMG

A TGC Sumarizando

80% equivale a 96% cutoff usado no UniGene

Anotação com KOG é acima de 90% correta

Clusters KOG de S. mansoni não foram completamente descobertos