26
Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760 www.vidatis.com.br Ontologias e Bancos de Dados Dedutivos para Integração de Informações em Saúde Lincoln de Assis Moura Jr. 1,2 Fabiane Nardon 1,2 1 Atech / VIDATIS Sistemas de Informação em Saude 2 Escola Politécnica da Universidade de São Paulo

Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760 Ontologias e Bancos de Dados Dedutivos

Embed Size (px)

Citation preview

Page 1: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

Rua do Rocio, 351 - 5º andar - cj 5104552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-

3760www.vidatis.com.br

Ontologias e Bancos de Dados

Dedutivos para Integração de

Informações em Saúde Lincoln de Assis Moura Jr.1,2 Fabiane Nardon1,2

1Atech / VIDATIS Sistemas de Informação em Saude2Escola Politécnica da Universidade de São Paulo

Page 2: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

2mai-04 Copyright VIDATIS 2004

Agenda

Motivação

Compartilhamento de Conhecimento e Integração de Informações em Saúde

Web Semântica

Ontologias

Inferência

Page 3: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

3mai-04 Copyright VIDATIS 2004

Motivação

A informação em saúde é complexa, pouco estruturada e freqüentemente distribuída em sistemas heterogêneos

Integrar informações heterogêneas é importante para: Recuperar o histórico do paciente Compartilhar conhecimento Realizar consultas horizontais

Page 4: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

4mai-04 Copyright VIDATIS 2004

Compartilhamento de Conhecimentoe Integração de InformaçõesCompartilhamento de Conhecimento

utilização de bases de conhecimento, ou partes destas bases, em sistemas diferentes daqueles para os quais elas foram originalmente criadas

Integração de Informações possibilidade de se recuperar informação de

diferentes fontes que estão distribuídas e possivelmente armazenadas em ambientes heterogêneos

Page 5: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

5mai-04 Copyright VIDATIS 2004

Desafios do Compartilhamento de Conhecimento / Integração de Informações

Heterogeneidade Computacional Diferentes sistemas operacionais, SGBDs, linguagens de

programação, etc

Heterogeneidade Semântica Diferentes formas de representação para o mesmo conceito Diferentes conceitos com o mesmo nome Diferentes nomes para o mesmo conceito

A probabilidade de duas pessoas usarem o mesmo nome para um mesmo objeto, mesmo sendo

especialistas no mesmo domínio, é de apenas 7 a18%

(FURNAS, G.W. et al. "The vocabulary problem in human-system communication“, ACM, 1987)

Page 6: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

6mai-04 Copyright VIDATIS 2004

Padrões para representação de Conhecimento

Representação de Ontologias KIF (Knowledge Interchange Format) Ontolingua OKBC (Open Knowledge Base Connectivity)

Protocol SHOE (Simple HMTL Ontology Extension) OIL (Ontology Interchange Language)

Conhecimento em Saúde Arden Syntax GLIF (Guidelines Interchange Format) GEHR (Good Electronic Health Record) /

OpenEhr

Page 7: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

7mai-04 Copyright VIDATIS 2004

Web Semântica

Tim Berners-Lee, 2002http://www.w3.org/DesignIssues/diagrams/sw-stack-2002.png

Page 8: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

8mai-04 Copyright VIDATIS 2004

Resource Description Framework (RDF)

Criado inicialmente para representar meta-informações sobre recursos na Web

Vantagens Simples e flexível URI

Asserções RDF <Sujeito> <Predicado> <Objeto>

Page 9: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

9mai-04 Copyright VIDATIS 2004

RDF

http://hospitalexemplo.org/paciente#ID1234

mailto:[email protected]

http://www.vocabulariox.org.br#CancerHepatico

João da Silva

http://hospitalexemplo.org/#diagnostico

http://hospitalexemplo.org/#medicoResponsavel

http://hospitalexemplo.org/#nomePaciente

Page 10: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

10mai-04 Copyright VIDATIS 2004

Representação de Conhecimento e Ontologias Ontologias

Descreve conceitos de um domínio e os relacionamentos semânticos entre estes conceitos

Ontologias têm como objetivo criar padrões de modelos, taxonomias, vocabulários e terminologias para um domínio

Estes padrões são usados para criar módulos de conhecimento

Tomografia

Tomografia por Emissão

PET SPECT

Procedimento

Atendimento Is aIs a

Is a

Is a

Has procedure

Page 11: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

11mai-04 Copyright VIDATIS 2004

DAML+OIL and OWL

DAML+OIL: DARPA Agent Markup Language (DAML) e Ontology Inference Layer (OIL) Padrão para representar ontologias em RDF Baseado na Lógica de Descrições (define conceitos e

papéis)

Web Ontology Language (OWL) Padrão do W3C para representar ontologias Baseado no DAML+OIL

Page 12: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

12mai-04 Copyright VIDATIS 2004

Semantic Web

Tim Berners-Lee, 2002http://www.w3.org/DesignIssues/diagrams/sw-stack-2002.png

DAML+OILDAML+OILOWLOWL

Page 13: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

13mai-04 Copyright VIDATIS 2004

Ontologias para Sistemas de Informação em Saúde

Foram criadas duas ontologias DAML+OIL: Para conceitos do UMLS

• Conceitos básicos e relacionamentos para o domínio da saúde

• Mapeamento de vocabulários ajuda a integrar informação

• Relacionamentos entre conceitos permitem inferir novas informações

Para o padrão do Cartão Nacional de Saúde• Ontologia para Sistemas de Informação em Saúde• Define conceitos básicos em sistemas de informação

em saúde (identificação do paciente, categoria profissional, dados de atendimento, etc).

• Usa conceitos definidos na ontologia do UMLS

Page 14: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

14mai-04 Copyright VIDATIS 2004

UMLS Ontologyhttp://www.tridedalo.com.br/2003/07/umls/

Neste slide: 67 asserções de 1696

Page 15: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

15mai-04 Copyright VIDATIS 2004

Brazilian National Health Card Ontologyhttp://www.tridedalo.com.br/2003/07/cns/

Neste slide: 25 asserções de 852

Page 16: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

16mai-04 Copyright VIDATIS 2004

Inferência

Tendo uma ontologia e uma representação de conhecimento padronizada, é possível inferir novas informações Descobrir informação implícita Obter respostas a perguntas simples para

seres humanos, mas difíceis para computadores

Inferência é um assunto muito discutido atualmente na Web Semântica

Page 17: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

17mai-04 Copyright VIDATIS 2004

Bancos de Dados Dedutivos (BDD)Bancos de Dados que, além de sua parte

tradicional, ou seja, as informações contidas nas relações básicas que são explicitamente inseridas, possui um conjunto de regras dedutivas que permite derivar novas informações a partir das relações básicas. Estas novas informações formam as relações derivadas

Page 18: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

18mai-04 Copyright VIDATIS 2004

TRI-DEDALO

TRI-DEDALO (TRIples, DEdução,DAdos e LÓgica)

Sistema de Banco de Dados Dedutivo que permite fazer consultas e inferências a partir de uma ontologia RDF ou DAML+OIL

pacienteTemFebre(Nome?N) :- Pacientes(Nome?N,Temperatura?T),

T > 37.

pacienteTemFebre(Nome?N):-stm(x, rdf:type, cns:Paciente),stm(x, vocabulario:temperatura, y),y > 37.

Page 19: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

19mai-04 Copyright VIDATIS 2004

Semantic Web

Tim Berners-Lee, 2002http://www.w3.org/DesignIssues/diagrams/sw-stack-2002.png

DAML+OILDAML+OIL

TRI-DEDALOTRI-DEDALO

Page 20: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

20mai-04 Copyright VIDATIS 2004

Tradução RDF / TRI-DEDALO

subClassOf stm(x, rdfs:subClassOf, y) :- stm(x, rdfs:subClassOf, z),

stm(z, rdfs:subClassOf, y). stm(x, y, z) :- stm(x, y, w), stm(w, rdfs:subClassOf, z).

subPropertyOfstm(x, rdfs:subPropertyOf, y) :- stm(x, rdfs:subPropertyOf, z),

stm(z, rdfs:subPropertyOf, y). stm(x, y, z) :- stm(x, w, z), stm(w, rdfs:subPropertyOf, y).

range (restrição de integridade) rangeViolation(x, y, z) :- stm(x, y, z),

stm(y, rds:range, w), not(stm(z, rdf:type, w)).

complementOfstm(x, rdf:type, ex:PacientesComAlta) :-

stm(x, rdf:type, ex:Paciente), not(stm(x, rdf:type, ex:PacienteInternado)).

Page 21: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

21mai-04 Copyright VIDATIS 2004

Exemplo

“O mesmo paciente não pode realizar mais que uma tomografia em um período de 30 dias”ProcedimentoInvalido(solicitacao?x) :-

stm(x, rdf:type, ex:SolicitacaoProcedimento),stm(x, ex:procedimentoSolicitado, umls:C0040395),stm(x, ex:paciente, y), stm(y, cns:procedimentoRealizado, w),stm(w, cns:dataHoraAtendimento, d1), stm(w, umls:isa, umls:C0040395),stm(x, ex:dataSolicitacao, d2), (d1 + 30) < d2.

ins stm(ex:solicitacao134, rdf:type, ex: SolicitacaoProcedimento).ins stm(ex: solicitacao134, ex:paciente, ex:456).ins stm(ex: solicitacao134, ex: procedimentoSolicitado, umls:C0040399).

ID RG Nome Procedimento

Data

123 123.456 Joao S. Santo C0032743 01/11/2004

Código Identidade NM Proc DT

456 123.456 Joao Silva C0040399 23/07/2004

Sistema 1

Sistema 2

Page 22: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

22mai-04 Copyright VIDATIS 2004

daml:samePropertyOf

cns:dataHoraAtendimentocns:ProcedimentoRealizado

daml:samePropertyOf

cns:temDocumentoIdentificacao

ID RG Nome Procedimento

Data

123 123.456 Joao S. Santo C0032743 01/11/2004

Código Identidade NM Proc DT

456 123.456 Joao Silva C0040399 23/07/2004

Sistema 1

Sistema 2

Exemplo

Page 23: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

23mai-04 Copyright VIDATIS 2004

cns:Identidade

rdf:type

cns:numeroDocumentoIdentificacao

rdf:type

cns:numeroDocumentoIdentificacao

ID RG Nome Procedimento

Data

123 123.456 Joao S. Santo C0032743 01/11/2004

Código Identidade NM Proc DT

456 123.456 Joao Silva C0040399 23/07/2004

Sistema 1

Sistema 2

Exemplo

Page 24: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

24mai-04 Copyright VIDATIS 2004

umls:childumls:child

umls:C0040398

umls:C0040395

umls:child

ID RG Nome Procedimento

Data

123 123.456 Joao S. Santo C0032743 01/11/2004

Código Identidade NM Proc DT

456 123.456 Joao Silva C0040399 23/07/2004

Sistema 1

Sistema 2

Exemplo

Page 25: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

25mai-04 Copyright VIDATIS 2004

“O mesmo paciente não pode realizar mais que uma tomografia em um período de 30 dias”

Deduções:• Paciente 123 e 456 são o mesmo indivíduo (propriedade

temDocumentoIdentificacao é Unambiguous)• Procedimentos C0040399 e C0032743 são Tomografias• Paciente 456 realizou uma tomografia em 01/11/2004• A restrição de integridade foi violada

ID RG Nome Procedimento

Data

123 123.456 Joao S. Santo C0032743 01/11/2004

Código Identidade NM Proc DT

456 123.456 Joao Silva C0040399 23/07/2004

Sistema 1

Sistema 2

Exemplo

Page 26: Rua do Rocio, 351 - 5º andar - cj 51 04552-000 São Paulo, SP - Fone: 11 3053-3770 - Fax: 11 3053-3760  Ontologias e Bancos de Dados Dedutivos

26mai-04 Copyright VIDATIS 2004

Conclusões A Web Semântica propõe padrões para compartilhamento de

conhecimento e integração de informações que deveriam ser exploradas em sistemas de informação em saúde

A classificação de fontes de dados heterogêneas usando ontologias torna possível estabelecer o relacionamento entre conceitos, atingindo desta forma a interoperabilidade semântica

Nem todos os relacionamentos da Rede Semântica do UMLS são expressos na base de conhecimento do UMLS. Neste sentido, os relacionamentos do Metathesaurus, embora não tão completos quanto os da Rede Semântica, são mais úteis para integração de dados e compartilhamento de conhecimento, já que eles estão presentes para quase todos os conceitos da base de conhecimento

Existe ainda muito trabalho a ser feito na área de inferência da Web Semântica