Sem¢ntica em Integra§£o de Dados – Ontologia Contextual Vin­cius Torres

  • View
    104

  • Download
    0

Embed Size (px)

Text of Sem¢ntica em Integra§£o de Dados – Ontologia Contextual...

  • Slide 1
  • Semntica em Integrao de Dados Ontologia Contextual Vincius Torres
  • Slide 2
  • Roteiro Integrao de Esquemas Pr-processamento para Integrao Word Sense Disambiguation Spell Check Expanso de abreviao e acrnimos Contexto Modelagem Contextual Ontologia Contextual Ontologia Contextual para pr-processamento
  • Slide 3
  • Integrao de Esquemas Integrao de Informao: comeou com integrao de BD, e tem sido estudado pela comunidade de Banco de Dados desde a dcada de 80. Problema: schema matching, que lida com 2 (ou mais) esquemas de banco de dados para produzir um mapeamento entre seus atributos. Objetivo: merging dos esquemas em um esquema global nico.
  • Slide 4
  • Integrao de Esquemas Integrao de esquemas o processo que recebe esquemas de fontes de dados distintos e produz um esquema unificado.
  • Slide 5
  • Integrando 2 esquemas Ex1: S1S2 CustCustomer CodeNumber NameFirst Name Phone Last Name Phone Number Ex2: S1S2 CustCustomer CNoCustID CompNameContact FirstNamePhone
  • Slide 6
  • Pr-processamento para Integrao Tokenizao: A tokenizao o processo de identificar e transformar os atributos em palavras. Remoo de caracteres: -, _, . .. UpperCase: FirstName, MyHouse Stop-words: Remoo de palavras sem relevncia semntica(artigos, preposies, etc).
  • Slide 7
  • Pr-processamento para Integrao Spell-check: Um problema adicional na normalizao a correo ortogrfica. expansion of abbreviations and acronyms; schema element sense disambiguation; 4 tipos de erros insero(computter, com letras a mais); deleo(com letras a menos, hous); substituio(housi, com o i no lugar do e) ; transposio(dgo, com o g e o em posies invertidas).[Chan, 2005]
  • Slide 8
  • Pr-processamento para Integrao Expanso de Abreviaes e Acrnimos: escolher o sentido correto de acordo com o contexto onde o termo apresentado ; difcil, pois pode existir mais de sugesto de expanso, ou ainda, nenhuma.
  • Slide 9
  • Pr-processamento para Integrao Expanso de Abreviaes e Acrnimos: 2 categorias de abreviaes (Hill, 2008) Simples: nica Palavra Prefixo: attri(attribute) Aleatrio: msg(Message) e src(Source) Composta: Multi-palavas Acrnimos: ssn(Social Security Number) Partes das Palavras: doctype(Document Type)
  • Slide 10
  • Pr-processamento para Integrao Expanso de Abreviaes e Acrnimos: Expanso baseada em diconrios: mais de um termo encontrado; problema expandido quando de utiliza a web; dicionrio precisa ser constantemente atualizado.
  • Slide 11
  • Pr-processamento para Integrao Ferramentas para normalizao: (Belian, 2008) Cupid Tokenizao, expanso e eliminao(prepositio ns) Thesaurus Embley et al. ExpansoWordnet COMA++ ExpansoThesaurus OntoBuilder TokenizaoWordnet
  • Slide 12
  • WordNet Alguns relacionamentos do synset car.
  • Slide 13
  • Contexto Contexto definido como um informao contextual usada para representar circunstncias envolvendo certas entidades, onde a entidade pode ser uma pessoa, lugar, objeto ou um procedimento que considerado relevante na interao entre usurios e aplicao. [Strang et al., 2003].
  • Slide 14
  • Contexto Sistemas Sensveis ao Contexto auxiliam pessoas nas tarefas dirias adaptando seu comportamento baseado em informaes contextuais do usurio. Contexto Computacional qualquer informao relevante descrevendo entidades em um interao homem-mquina. [Neto, 2005].
  • Slide 15
  • Contexto (Fases)
  • Slide 16
  • Modelagem Contextual Definir e usar contexto em aplicaes computacionais requer um modelo contextual bem definido que deve representar e lidar com o conhecimento contextual. [Strang et al., 2003] Compartilha um entendimento comum da estrutura da informao; Reuso de conhecimento contextual; Raciocnio.
  • Slide 17
  • Contexto Ontologia Contextual para Integrao precisa incluir informaes contextuais: Fontes de Dados; Esquemas; Vocabulario(significado, relacionamentos semnticos, lxico) Elementos Contextuais Usurio; Ambiente; Dados; Associaes; Procedimentos; e Aplicao.
  • Slide 18
  • Ontologia Contextual para Integrao [Belian, 2008]
  • Slide 19
  • Ontologia Contextual para Integrao [Belian, 2008]
  • Slide 20
  • Ontologia Contextual para Integrao [Belian, 2008]
  • Slide 21
  • Ontologia Contextual para Integrao [Belian, 2008]
  • Slide 22
  • Ontologia Contextual - Raciocnio A utilizao de Ontologias para representao contextual nos permite inferncias: Se paciente = {any}; Se cliente = {sade privada}; Se usurio = {sade pblica, tratamento de drogas}.
  • Slide 23
  • Contexto para resoluo semntica O processo de integrao de esquemas geralmente baseado nas seguintes etapas: 1.Pre- Integrao(processemento); 2.Comparao de Esquemas; 3.Merging entre as diversas fonte de dados. [Belian, 2008].
  • Slide 24
  • Contexto para resoluo semntica Pr-Integrao: 1.Expanso de abreviaes e acrnimos. 2.Desambiguao de significado; 3.Spell-check.
  • Slide 25
  • Contexto para resoluo semntica Expanso de abreviao e acrnimos: Exemplo: PA
  • Slide 26
  • Contexto para Word Sense Disambiguation Word sense disambiguation determinar qual o significado da palavra em questo a depender do contexto.[Jurafksy, 2000] Exemplo Clssico: Word: Manga Dicionrio Aurlio On-line manga 1 sf. 1. Parte do vesturio onde se enfia o brao. 2. Qualquer pea de forma tubular que reveste ou protege outra pea. 3. O fruto da mangueira
  • Slide 27
  • Contexto para Word Sense Disambiguation Outro Exemplo: Word: Usurio 1.Usurio de Computador. 2.Usurio de drogas em tratamento. 3.Usurio do SUS.(na esfera particular pode ser cliente ou paciente). Domnio de Sade. Porm subdomnios diferentes: Psicologia SUS
  • Slide 28
  • Contexto para Word Sense Disambiguation Ainda no exemplo: Word: Usurio
  • Slide 29
  • Aplicao Exemplo Normalizao: Atributo: diag_code Entidade: office_visit [Belian, 2008] 1.Obtem-se o termo completo formado pelos tokens diag e code; 2.O termo diag code classificado na ontologia levando em considerao os elementos contextuais; 3.Diag expandido na ontologia para Diagnoses; 4.O termo Diagnoses Code classificado na ontologia.
  • Slide 30
  • Aplicao Exemplo [Belian, 2008]
  • Slide 31
  • Referncias [Chan, 2005] Chan, S., He, B. & Ounis, I. (2005), An in-depth survey on the automatic detection and correction of spelling mistakes, in Proceedings of the 5th Dutch-Belgian Information Retrieval Workshop (DIR) . [Hill, 2008] Hill, E. et al. AMAP: Automatically Mining Abbreviation Expansions in Programs to Enhance Software Maintenance Tools. MSR. 2008 [Strang et al. 2003] Strang, T., Linnhoff-Popien, C., Frank, K.: CoOL: A Context Ontology Language to enable Contextual Interoperability. Proceedings of 4th IFIP WG 6.1, International Conference on Distributed Applications and Interoperable Systems, DAIS, 2003. [Belian, 2008]Belian, Rosalie Barreto A context-based name resolution approach for semantic schema integration - Tese. Recife 2008.
  • Slide 32
  • Dvidas ? [Belian, 2008]