Sem¢ntica em Integra§£o de Dados – Ontologia Contextual

  • View
    34

  • Download
    0

Embed Size (px)

DESCRIPTION

Semântica em Integração de Dados – Ontologia Contextual. Vinícius Torres. Roteiro. Integração de Esquemas Pré-processamento para Integração Word Sense Disambiguation Spell Check Expansão de abreviação e acrônimos Contexto Modelagem Contextual Ontologia Contextual - PowerPoint PPT Presentation

Text of Sem¢ntica em Integra§£o de Dados – Ontologia Contextual

  • Semntica em Integrao de Dados Ontologia ContextualVincius Torres

  • RoteiroIntegrao de Esquemas

    Pr-processamento para Integrao

    Word Sense DisambiguationSpell CheckExpanso de abreviao e acrnimos

    Contexto

    Modelagem Contextual

    Ontologia Contextual

    Ontologia Contextual para pr-processamento

  • Integrao de EsquemasIntegrao de Informao: comeou com integrao de BD, e tem sido estudado pela comunidade de Banco de Dados desde a dcada de 80.

    Problema: schema matching, que lida com 2 (ou mais) esquemas de banco de dados para produzir um mapeamento entre seus atributos.

    Objetivo: merging dos esquemas em um esquema global nico.

  • Integrao de EsquemasIntegrao de esquemas o processo que recebe esquemas de fontes de dados distintos e produz um esquema unificado.

  • Integrando 2 esquemasEx1:S1S2CustCustomerCodeNumberNameFirst NamePhone Last NamePhone Number

    Ex2:S1S2CustCustomerCNoCustIDCompNameContactFirstNamePhone

  • Pr-processamento para IntegraoTokenizao: A tokenizao o processo de identificar e transformar os atributos em palavras.

    Remoo de caracteres: -, _, . ..

    UpperCase: FirstName, MyHouse

    Stop-words: Remoo de palavras sem relevncia semntica(artigos, preposies, etc).

  • Pr-processamento para IntegraoSpell-check:

    Um problema adicional na normalizao a correo ortogrfica. expansion of abbreviations and acronyms;schema element sense disambiguation;4 tipos de erros

    insero(computter, com letras a mais);deleo(com letras a menos, hous);substituio(housi, com o i no lugar do e) ;transposio(dgo, com o g e o em posies invertidas).[Chan, 2005]

  • Pr-processamento para IntegraoExpanso de Abreviaes e Acrnimos:

    escolher o sentido correto de acordo com o contexto onde o termo apresentado ;

    difcil, pois pode existir mais de sugesto de expanso, ou ainda, nenhuma.

  • Pr-processamento para IntegraoExpanso de Abreviaes e Acrnimos:

    2 categorias de abreviaes (Hill, 2008)

    Simples: nica PalavraPrefixo: attri(attribute)Aleatrio: msg(Message) e src(Source)

    Composta: Multi-palavasAcrnimos: ssn(Social Security Number)Partes das Palavras: doctype(Document Type)

  • Pr-processamento para IntegraoExpanso de Abreviaes e Acrnimos:

    Expanso baseada em diconrios:

    mais de um termo encontrado;problema expandido quando de utiliza a web;dicionrio precisa ser constantemente atualizado.

  • Pr-processamento para IntegraoFerramentas para normalizao: (Belian, 2008)

    CupidTokenizao, expanso e eliminao(prepositions) ThesaurusEmbley et al.ExpansoWordnetCOMA++ExpansoThesaurusOntoBuilderTokenizaoWordnet

  • WordNetAlguns relacionamentos do synset car.

  • ContextoContexto definido como um informao contextual usada para representar circunstncias envolvendo certas entidades, onde a entidade pode ser uma pessoa, lugar, objeto ou um procedimento que considerado relevante na interao entre usurios e aplicao.[Strang et al., 2003].

  • ContextoSistemas Sensveis ao Contexto auxiliam pessoas nas tarefas dirias adaptando seu comportamento baseado em informaes contextuais do usurio. Contexto Computacional qualquer informao relevante descrevendo entidades em um interao homem-mquina. [Neto, 2005].

  • Contexto(Fases)

  • Modelagem ContextualDefinir e usar contexto em aplicaes computacionais requer um modelo contextual bem definido que deve representar e lidar com o conhecimento contextual.[Strang et al., 2003]

    Compartilha um entendimento comum da estrutura da informao;

    Reuso de conhecimento contextual;

    Raciocnio.

  • ContextoOntologia Contextual para Integrao precisa incluir informaes contextuais:

    Fontes de Dados;Esquemas;Vocabulario(significado, relacionamentos semnticos, lxico)Elementos Contextuais

    Usurio;Ambiente;Dados;Associaes;Procedimentos; e Aplicao.

  • Ontologia Contextualpara Integrao[Belian, 2008]

  • Ontologia Contextualpara Integrao[Belian, 2008]

  • Ontologia Contextualpara Integrao[Belian, 2008]

  • Ontologia Contextualpara Integrao[Belian, 2008]

  • Ontologia Contextual- RaciocnioA utilizao de Ontologias para representao contextual nos permite inferncias:

    Se paciente = {any};Se cliente = {sade privada};Se usurio = {sade pblica, tratamento de drogas}.

  • Contexto para resoluo semnticaO processo de integrao de esquemas geralmente baseado nas seguintes etapas:

    Pre- Integrao(processemento);Comparao de Esquemas;Merging entre as diversas fonte de dados.

    [Belian, 2008].

  • Contexto para resoluo semnticaPr-Integrao:

    Expanso de abreviaes e acrnimos.

    Desambiguao de significado;

    Spell-check.

  • Contexto para resoluo semnticaExpanso de abreviao e acrnimos:

    Exemplo: PA

  • Contexto para Word Sense DisambiguationWord sense disambiguation determinar qual o significado da palavra em questo a depender do contexto.[Jurafksy, 2000]Exemplo Clssico:Word: Manga

    Dicionrio Aurlio On-linemanga 1 sf. 1. Parte do vesturio onde se enfia o brao. 2. Qualquer pea de forma tubular que reveste ou protege outra pea.3. O fruto da mangueira

  • Contexto para Word Sense DisambiguationOutro Exemplo:Word: Usurio

    Usurio de Computador. Usurio de drogas em tratamento.Usurio do SUS.(na esfera particular pode ser cliente ou paciente).

    Domnio de Sade. Porm subdomnios diferentes:

    PsicologiaSUS

  • Contexto para Word Sense DisambiguationAinda no exemplo:Word: Usurio

  • Aplicao ExemploNormalizao:Atributo: diag_code Entidade: office_visit[Belian, 2008]Obtem-se o termo completo formado pelos tokens diag e code;O termo diag code classificado na ontologia levando em considerao os elementos contextuais;Diag expandido na ontologia para Diagnoses;O termo Diagnoses Code classificado na ontologia.

  • Aplicao Exemplo[Belian, 2008]

  • Referncias[Chan, 2005] Chan, S., He, B. & Ounis, I. (2005), An in-depth survey on the automatic detection and correction of spelling mistakes, in Proceedings of the 5th Dutch-Belgian Information Retrieval Workshop (DIR).[Hill, 2008] Hill, E. et al. AMAP: Automatically Mining Abbreviation Expansions in Programs to Enhance Software Maintenance Tools. MSR. 2008[Strang et al. 2003] Strang, T., Linnhoff-Popien, C., Frank, K.: CoOL: A Context OntologyLanguage to enable Contextual Interoperability. Proceedings of 4th IFIP WG 6.1, InternationalConference on Distributed Applications and Interoperable Systems, DAIS, 2003.[Belian, 2008]Belian, Rosalie Barreto A context-based name resolution approach for semantic schema integration - Tese. Recife 2008.

  • Dvidas

    ?

    [Belian, 2008]