Upload
internet
View
110
Download
1
Embed Size (px)
Citation preview
Rua do Rocio, 351 - 5º andar - cj 5104552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-
3760www.vidatis.com.br
Ontologias e Bancos de Dados
Dedutivos para Integração de
Informações em Saúde Lincoln de Assis Moura Jr.1,2 Fabiane Nardon1,2
1Atech / VIDATIS Sistemas de Informação em Saude2Escola Politécnica da Universidade de São Paulo
2mai-04 Copyright VIDATIS 2004
Agenda
Motivação
Compartilhamento de Conhecimento e Integração de Informações em Saúde
Web Semântica
Ontologias
Inferência
3mai-04 Copyright VIDATIS 2004
Motivação
A informação em saúde é complexa, pouco estruturada e freqüentemente distribuída em sistemas heterogêneos
Integrar informações heterogêneas é importante para: Recuperar o histórico do paciente Compartilhar conhecimento Realizar consultas horizontais
4mai-04 Copyright VIDATIS 2004
Compartilhamento de Conhecimentoe Integração de InformaçõesCompartilhamento de Conhecimento
utilização de bases de conhecimento, ou partes destas bases, em sistemas diferentes daqueles para os quais elas foram originalmente criadas
Integração de Informações possibilidade de se recuperar informação de
diferentes fontes que estão distribuídas e possivelmente armazenadas em ambientes heterogêneos
5mai-04 Copyright VIDATIS 2004
Desafios do Compartilhamento de Conhecimento / Integração de Informações
Heterogeneidade Computacional Diferentes sistemas operacionais, SGBDs, linguagens de
programação, etc
Heterogeneidade Semântica Diferentes formas de representação para o mesmo conceito Diferentes conceitos com o mesmo nome Diferentes nomes para o mesmo conceito
A probabilidade de duas pessoas usarem o mesmo nome para um mesmo objeto, mesmo sendo
especialistas no mesmo domínio, é de apenas 7 a18%
(FURNAS, G.W. et al. "The vocabulary problem in human-system communication“, ACM, 1987)
6mai-04 Copyright VIDATIS 2004
Padrões para representação de Conhecimento
Representação de Ontologias KIF (Knowledge Interchange Format) Ontolingua OKBC (Open Knowledge Base Connectivity)
Protocol SHOE (Simple HMTL Ontology Extension) OIL (Ontology Interchange Language)
Conhecimento em Saúde Arden Syntax GLIF (Guidelines Interchange Format) GEHR (Good Electronic Health Record) /
OpenEhr
7mai-04 Copyright VIDATIS 2004
Web Semântica
Tim Berners-Lee, 2002http://www.w3.org/DesignIssues/diagrams/sw-stack-2002.png
8mai-04 Copyright VIDATIS 2004
Resource Description Framework (RDF)
Criado inicialmente para representar meta-informações sobre recursos na Web
Vantagens Simples e flexível URI
Asserções RDF <Sujeito> <Predicado> <Objeto>
9mai-04 Copyright VIDATIS 2004
RDF
http://hospitalexemplo.org/paciente#ID1234
mailto:[email protected]
http://www.vocabulariox.org.br#CancerHepatico
João da Silva
http://hospitalexemplo.org/#diagnostico
http://hospitalexemplo.org/#medicoResponsavel
http://hospitalexemplo.org/#nomePaciente
10mai-04 Copyright VIDATIS 2004
Representação de Conhecimento e Ontologias Ontologias
Descreve conceitos de um domínio e os relacionamentos semânticos entre estes conceitos
Ontologias têm como objetivo criar padrões de modelos, taxonomias, vocabulários e terminologias para um domínio
Estes padrões são usados para criar módulos de conhecimento
Tomografia
Tomografia por Emissão
PET SPECT
Procedimento
Atendimento Is aIs a
Is a
Is a
Has procedure
11mai-04 Copyright VIDATIS 2004
DAML+OIL and OWL
DAML+OIL: DARPA Agent Markup Language (DAML) e Ontology Inference Layer (OIL) Padrão para representar ontologias em RDF Baseado na Lógica de Descrições (define conceitos e
papéis)
Web Ontology Language (OWL) Padrão do W3C para representar ontologias Baseado no DAML+OIL
12mai-04 Copyright VIDATIS 2004
Semantic Web
Tim Berners-Lee, 2002http://www.w3.org/DesignIssues/diagrams/sw-stack-2002.png
DAML+OILDAML+OILOWLOWL
13mai-04 Copyright VIDATIS 2004
Ontologias para Sistemas de Informação em Saúde
Foram criadas duas ontologias DAML+OIL: Para conceitos do UMLS
• Conceitos básicos e relacionamentos para o domínio da saúde
• Mapeamento de vocabulários ajuda a integrar informação
• Relacionamentos entre conceitos permitem inferir novas informações
Para o padrão do Cartão Nacional de Saúde• Ontologia para Sistemas de Informação em Saúde• Define conceitos básicos em sistemas de informação
em saúde (identificação do paciente, categoria profissional, dados de atendimento, etc).
• Usa conceitos definidos na ontologia do UMLS
14mai-04 Copyright VIDATIS 2004
UMLS Ontologyhttp://www.tridedalo.com.br/2003/07/umls/
Neste slide: 67 asserções de 1696
15mai-04 Copyright VIDATIS 2004
Brazilian National Health Card Ontologyhttp://www.tridedalo.com.br/2003/07/cns/
Neste slide: 25 asserções de 852
16mai-04 Copyright VIDATIS 2004
Inferência
Tendo uma ontologia e uma representação de conhecimento padronizada, é possível inferir novas informações Descobrir informação implícita Obter respostas a perguntas simples para
seres humanos, mas difíceis para computadores
Inferência é um assunto muito discutido atualmente na Web Semântica
17mai-04 Copyright VIDATIS 2004
Bancos de Dados Dedutivos (BDD)Bancos de Dados que, além de sua parte
tradicional, ou seja, as informações contidas nas relações básicas que são explicitamente inseridas, possui um conjunto de regras dedutivas que permite derivar novas informações a partir das relações básicas. Estas novas informações formam as relações derivadas
18mai-04 Copyright VIDATIS 2004
TRI-DEDALO
TRI-DEDALO (TRIples, DEdução,DAdos e LÓgica)
Sistema de Banco de Dados Dedutivo que permite fazer consultas e inferências a partir de uma ontologia RDF ou DAML+OIL
pacienteTemFebre(Nome?N) :- Pacientes(Nome?N,Temperatura?T),
T > 37.
pacienteTemFebre(Nome?N):-stm(x, rdf:type, cns:Paciente),stm(x, vocabulario:temperatura, y),y > 37.
19mai-04 Copyright VIDATIS 2004
Semantic Web
Tim Berners-Lee, 2002http://www.w3.org/DesignIssues/diagrams/sw-stack-2002.png
DAML+OILDAML+OIL
TRI-DEDALOTRI-DEDALO
20mai-04 Copyright VIDATIS 2004
Tradução RDF / TRI-DEDALO
subClassOf stm(x, rdfs:subClassOf, y) :- stm(x, rdfs:subClassOf, z),
stm(z, rdfs:subClassOf, y). stm(x, y, z) :- stm(x, y, w), stm(w, rdfs:subClassOf, z).
subPropertyOfstm(x, rdfs:subPropertyOf, y) :- stm(x, rdfs:subPropertyOf, z),
stm(z, rdfs:subPropertyOf, y). stm(x, y, z) :- stm(x, w, z), stm(w, rdfs:subPropertyOf, y).
range (restrição de integridade) rangeViolation(x, y, z) :- stm(x, y, z),
stm(y, rds:range, w), not(stm(z, rdf:type, w)).
complementOfstm(x, rdf:type, ex:PacientesComAlta) :-
stm(x, rdf:type, ex:Paciente), not(stm(x, rdf:type, ex:PacienteInternado)).
21mai-04 Copyright VIDATIS 2004
Exemplo
“O mesmo paciente não pode realizar mais que uma tomografia em um período de 30 dias”ProcedimentoInvalido(solicitacao?x) :-
stm(x, rdf:type, ex:SolicitacaoProcedimento),stm(x, ex:procedimentoSolicitado, umls:C0040395),stm(x, ex:paciente, y), stm(y, cns:procedimentoRealizado, w),stm(w, cns:dataHoraAtendimento, d1), stm(w, umls:isa, umls:C0040395),stm(x, ex:dataSolicitacao, d2), (d1 + 30) < d2.
ins stm(ex:solicitacao134, rdf:type, ex: SolicitacaoProcedimento).ins stm(ex: solicitacao134, ex:paciente, ex:456).ins stm(ex: solicitacao134, ex: procedimentoSolicitado, umls:C0040399).
ID RG Nome Procedimento
Data
123 123.456 Joao S. Santo C0032743 01/11/2004
Código Identidade NM Proc DT
456 123.456 Joao Silva C0040399 23/07/2004
Sistema 1
Sistema 2
22mai-04 Copyright VIDATIS 2004
daml:samePropertyOf
cns:dataHoraAtendimentocns:ProcedimentoRealizado
daml:samePropertyOf
cns:temDocumentoIdentificacao
ID RG Nome Procedimento
Data
123 123.456 Joao S. Santo C0032743 01/11/2004
Código Identidade NM Proc DT
456 123.456 Joao Silva C0040399 23/07/2004
Sistema 1
Sistema 2
Exemplo
23mai-04 Copyright VIDATIS 2004
cns:Identidade
rdf:type
cns:numeroDocumentoIdentificacao
rdf:type
cns:numeroDocumentoIdentificacao
ID RG Nome Procedimento
Data
123 123.456 Joao S. Santo C0032743 01/11/2004
Código Identidade NM Proc DT
456 123.456 Joao Silva C0040399 23/07/2004
Sistema 1
Sistema 2
Exemplo
24mai-04 Copyright VIDATIS 2004
umls:childumls:child
umls:C0040398
umls:C0040395
umls:child
ID RG Nome Procedimento
Data
123 123.456 Joao S. Santo C0032743 01/11/2004
Código Identidade NM Proc DT
456 123.456 Joao Silva C0040399 23/07/2004
Sistema 1
Sistema 2
Exemplo
25mai-04 Copyright VIDATIS 2004
“O mesmo paciente não pode realizar mais que uma tomografia em um período de 30 dias”
Deduções:• Paciente 123 e 456 são o mesmo indivíduo (propriedade
temDocumentoIdentificacao é Unambiguous)• Procedimentos C0040399 e C0032743 são Tomografias• Paciente 456 realizou uma tomografia em 01/11/2004• A restrição de integridade foi violada
ID RG Nome Procedimento
Data
123 123.456 Joao S. Santo C0032743 01/11/2004
Código Identidade NM Proc DT
456 123.456 Joao Silva C0040399 23/07/2004
Sistema 1
Sistema 2
Exemplo
26mai-04 Copyright VIDATIS 2004
Conclusões A Web Semântica propõe padrões para compartilhamento de
conhecimento e integração de informações que deveriam ser exploradas em sistemas de informação em saúde
A classificação de fontes de dados heterogêneas usando ontologias torna possível estabelecer o relacionamento entre conceitos, atingindo desta forma a interoperabilidade semântica
Nem todos os relacionamentos da Rede Semântica do UMLS são expressos na base de conhecimento do UMLS. Neste sentido, os relacionamentos do Metathesaurus, embora não tão completos quanto os da Rede Semântica, são mais úteis para integração de dados e compartilhamento de conhecimento, já que eles estão presentes para quase todos os conceitos da base de conhecimento
Existe ainda muito trabalho a ser feito na área de inferência da Web Semântica