30
Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Embed Size (px)

Citation preview

Page 1: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Casamento de EsquemasIAGO RAPHAEL VASCONCELOS MARINHO

Page 2: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Roteiro Motivação

Objetivos

Conceitos fundamentais

Técnicas

Ferramentas atuais

Desafios

Page 3: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Motivação Aplicações

◦ Aplicações web: alinhar catálogos de produtos.◦ Web semântica: alinhar ontologias◦ Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de

outro.◦ Ex.: Mapeamento objeto-relcional

◦ Aplicações médicas

Page 4: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Motivação Aplicações

◦ Aplicações web: alinhar catálogos de produtos.◦ Web semântica: alinhar ontologias◦ Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de

outro.◦ Ex.: Mapeamento objeto-relcional

◦ Aplicações médicas

Operação complexa!

Page 5: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Motivação Aplicações

◦ Aplicações web: alinhar catálogos de produtos.◦ Web semântica: alinhar ontologias◦ Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de

outro.◦ Ex.: Mapeamento objeto-relcional

◦ Aplicações médicas

Operação complexa!

Por envolver diversos modelos de dados e domínios de aplicação, o problema deve ser estudado de forma genérica.

Page 6: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

ObjetivosIntroduzir o problema

de casamento de esquemas;apresentar as abordagens

e ferramentas para resolvê-lo.

Page 7: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Conceitos fundamentais Esquema

◦ Descrição em linguagem formal◦ Conjunto de elementos que se relacionam◦ Ex.: SQL Schema, XML Schema, descrição de ontologia

Operação de “casamento” (matching):◦ Toma dois esquemas como entrada e devolve um mapeamento (correspondências entre os elementos).◦ Mapeamento é expresso em sintaxe específica◦ Problema: encontrar correspondências entre elementos de dois esquemas!

Page 8: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasTaxonomia

Page 9: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasAbordagens iniciais…

◦ Casamento linguístico (Linguistic matching)◦ Algoritmos de processamento e casamento entre strings◦ Substrings, tokenização, stemização

Page 10: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasAbordagens iniciais…

◦ Casamento linguístico (Linguistic matching)◦ Algoritmos de processamento e casamento entre strings◦ Substrings, tokenização, stemização

◦ Uso de informações adicionais!◦ Dicionários, tesauros (dicionário de ideias afins)

Page 11: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasAbordagens iniciais…

◦ Casamento baseado em estrutura◦ Grupos de elementos com estrutura semelhante◦ Relacionamentos semelhantes

Page 12: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasAbordagens iniciais…

◦ Casamento baseado em estrutura◦ Grupos de elementos com estrutura semelhante◦ Relacionamentos semelhantes

◦ Casamento baseado em restrições◦ Ex.: Correspondência UF/Estado: restritos a {AC, AL, …., TO}

Page 13: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasAbordagens iniciais…

◦ Casamento baseado em instâncias

Page 14: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasAbordagens iniciais…

◦ Casamento baseado em instâncias

◦ Casamento baseado em regras◦ Lógica de primeira ordem

Page 15: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasNovos tipos de informação…

Page 16: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasNovos tipos de informação…

◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas.

Page 17: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasNovos tipos de informação…

◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas.

◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las.

Page 18: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasNovos tipos de informação…

◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas.

◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las.

◦ Top-k matching: “melhores matches” são apresentados ao usuário.

Page 19: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasNovos tipos de informação…

◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas.

◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las.

◦ Top-k matching: “melhores matches” são apresentados ao usuário.

◦ Matching incremental: usuário seleciona um elemento do esquema e algoritmo devolve melhor correspondência (ou melhores, como no top-k).

Page 20: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasCasamento de esquemas de grande porte?...

Page 21: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasCasamento de esquemas de grande porte…

◦ Matching em paralelo

◦ Baseado em partições

◦ Redução do espaço de busca

◦ Otimizações diversas: matrizes de similaridade, otimizações no casamento de strings

Page 22: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

TécnicasCorrespondências com tags…

◦ Tagging semântico◦ Correspondências são marcadas quanto ao seu sentido◦ Ex.: igualdade

◦ Tagging condicional◦ Correspondências válidas apenas quando um elemento assume certo valor◦ Ex.: “code” equivale a “ISRC” somente para “music”

Page 23: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Ferramentas atuais Comparação (2011)

Page 24: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Ferramentas atuais COMA

Page 25: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Ferramentas atuais Harmony

Page 26: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Ferramentas atuais Agreement-maker

Page 27: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Ferramentas atuais Benchmarking: XBenchMatch

Page 28: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Ferramentas atuais Benchmarking: XBenchMatch

Page 29: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO

Desafios Facilitar o reuso de mapeamentos

Melhoria da visualização gráfica dos mapeamentos