44
CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA [email protected] +55 12 3947-6941 Introdução à Web Semântica e Ontologias

CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA [email protected]

Embed Size (px)

Citation preview

Page 1: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

CE-262 Ontologia e Web Semântica

Prof. José M Parente de Oliveira

Sala 120 – Prédio da ComputaçãoInstituto Tecnológico de Aeronáutica - ITA

[email protected]+55 12 3947-6941

Introdução à Web Semântica e Ontologias

Page 2: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Sumário de Conteúdo do Tópico

Motivação

Web Semântica: o que é?

Arquitetura da Web Semântica (W3C)

Desafios da Web Semântica

Perspectivas da Web Semântica

Noção de Ontologia

Page 3: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Material de Referência

Projeto e Construção de OntologiasProf. Luiz A M Palazzo - Universidade Católica de Pelotas

Ontology Engineering for the Semantic Web and BeyondProf. Natalya F. Noy - Stanford University

The Semantic Web Dr. V. Richard BenjaminsiSOCO

Jena TutorialAnna V. ZhdanovaDERI AT

Page 4: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Material de Referência

Ontologias, modelos e busca em JAVAAdriana da Silva Jacinto

Ian Horrocks and Alan RectorUniversity of ManchesterManchester, UK

Page 5: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação

Page 6: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação

Page 7: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação

Page 8: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação

Page 9: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação

Page 10: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação

Page 11: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação

Page 12: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação

É necessário navegar muito pela Web antes de se encontrar o conteúdo de interesse

Problema: a tecnologia atual de busca não entende o que se está procurando:

• Procura apenas por palavras-chave

• = string de caracteres

• Retorno de informação em vez de resposta a uma questão!

Page 13: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação Web Sintática

[Hendler & Miller 02]

Page 14: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação: Web Sintática

[Hendler & Miller 02]

A place where computers do the presentation (easy) and people do the linking and interpreting (hard).

– A hypermedia, a digital library• A library of documents called (web pages)

interconnected by a hypermedia of links– A database, an application platform

• A common portal to applications accessible through web pages, and presenting their results as web pages

– A platform for multimedia• BBC Radio 4 anywhere in the world! Terminator 3

trailers!– A naming scheme

• Unique identity for those documents

Page 15: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Motivação: Web Sintática

[Hendler & Miller 02]

Why not get computers to do more of the hard work?

Page 16: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Web Semântica: o que é?

“A Web Semântica é uma extensão da Web atual em que cada informação é dada por um significado bem definido, fazendo com que computadores e pessoas trabalhem melhor em cooperação”

Tim Berners-Lee, James Hendler, Ora LassilaScientific American, May 2001

Page 17: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Web Semântica: o que é?

Page 18: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Web Semântica: o que é?

“O poder real da Web Semântica será percebido quando as pessoas criarem programas que coletem conteúdo de diversas fontes, processem a informação e troquem os resultados com outros programas. A eficácia de tais agentes de software aumentará exponencialmente assim como mais máquinas leitoras do conteúdo Web e serviços automatizados (incluindo outros agentes) tornarem-se disponíveis.”

Tim Berners-Lee, James Hendler, Ora LassilaScientific American, May 2001

Page 19: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Web Semântica: o que é?

Web Semântica é a idéia de se ter dados na Web definida e interconectada por um caminho que pode ser usado para mais descobertas eficazes, automação, integração e reutilização através de várias aplicações.

A Web pode encontrar todo o seu potencial se tornar-se um local onde dados podem ser tão bem processados por ferramentas automatizadas como o são por pessoas.

W3C

Page 20: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Web Semântica: o que é?

Iniciativa do W3C com o objetivo de adicionar significado à Web

Baseada na tecnologia xml/rdf, fazendo evoluir a html da Web Sintática

WWW Consortium - http://www.w3.org

Page 21: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Arquitetura da Web Semântica

Page 22: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Arquitetura da Web Semântica

Dados

Web Semântica

Mecanismo de Busca

Ontologia Ontologia Ontologia

Camada deEstrutura

CamadadeEsquema

Regras de InferênciaCamadaLógica

… E-commerce

Page 23: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Arquitetura da Web Semântica

Camada de Estrutura

Responsável por estruturar os dados e definir seu significado:

XML, NamespacesURI, Unicode

Page 24: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Arquitetura da Web Semântica

Camada de Esquema

Responsável por definir relações entre os dados

Uso de ontologias em páginas Web torna mais simples a resolução de indefinição ou conflito de terminologia

RDF Schema, RDF M&S

Page 25: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Arquitetura da Web Semântica

Camada Lógica

Responsável por definir mecanismos para fazer inferência sobre os dados

Composta por um conjunto de regras de inferência

Regras de inferência fornecem aos agentes computacionais o poder de raciocinar sobre as estruturas de dados

Page 26: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Desafios da Web Semântica

Carência de profissionais especializados

Evolução de culturas (html – xml/rdf)

Padrões digitais de mídia instáveis

Crescimento simultâneo e continuado da Web Sintática

Falta de investimento adequado

Falta de visibilidade da área

Page 27: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Perspectivas

Base para a computação móvel e pervasiva

Grande disseminação prevista a médio prazo

Novo patamar para as interações humano-computador

Novos produtos e oportunidades de pesquisa

Aplicação em grande escala em educação e gestão de conhecimento

e-Science

Page 28: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Noção de Ontologia

Corpo de conhecimento declarativo sobre um dado domínio, assunto ou área de conhecimento

Na prática, hierarquias de conceitos (classes) com suas relações, restrições, axiomas e terminologia associada

Termo às vezes mal-empregado. Ontologias não são:

•Simples hierarquias

• Conjuntos de conceitos associados a palavras-chave

• Esquemas de bancos de dados

Page 29: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Noção de Ontologia

Definição de Ontologia:

Especificação formal e explícita de uma conceitualização compartilhada (Gruber, 1993)

Conceitualização: : modelo das entidades, relações, axiomas e regras de algum domínio

Formal: • Processável por máquina• Permitindo raciocínio automático• Com semântica lógica formal

Compartilhada: por uma comunidade, permitindo entendimento

Page 30: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Noção de Ontologia

Uma ontologia é uma descrição explícita de um domínio:

• Conceitos

• Propriedades - atributos de conceitos

• Restrições em propriedades e atributos

• Indivíduos (às vezes, mas não sempre)

Page 31: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Noção de Ontologia: Estrutura

Ontologies typically have two distinct components:• Names for important concepts in the domain

– Elephant is a concept whose members are a kind of animal

– Herbivore is a concept whose members are exactly those animals who eat only plants or parts of plants

– Adult_Elephant is a concept whose members are exactly those elephants whose age is greater than 20 years

• Background knowledge/constraints on the domain– Adult_Elephants weigh at least 2,000 kg– All Elephants are either African_Elephants or

Indian_Elephants– No individual can be both a Herbivore and a Carnivore

Page 32: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Noção de Ontologia: Conceitualização

Page 33: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Noção de Ontologia: Conceitualização

There can be two conceptualizations of this tiny world where the task is to make a plan of stack three blocks as the goal configuration using a robot hand

One is with conceptualization of the table and the other is without the table. In the latter, the table is imbedded in the relation onTable(X)

You can easily see the incompatibility between two plans based on each of the two conceptualizations. They are NOT interoperable each other when they come to a situation where they have to talk about the table. So, it is necessary to have an explicit representation of such a conceptualization.

Page 34: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Noção de Ontologia: Conceitualização

Page 35: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Noção de Ontologia: Conceitualização

We can design ontology of this block world corresponding to each of the two conceptualizations like this

It is roughly a hierarchy of things with axioms. Definitions of each concept and relation is omitted here

An example of an axiom is above(X,Z):-on(X,Y), on(Y,Z). There are many more axioms to represent constraints among the concepts and relations

Page 36: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Ontologia em Computação

O que pode ser representado por um computador

Uma ontologia pode ter várias formas, mas ela incluirá necessariamente um vocabulário de termos e alguma especificação de seu significadoUschold 1998, Jaspers & Uschold 1999

Um corpo de conhecimento descrevendo algum domínio de senso comum (Cyc e OpenCyc)

Page 37: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Exemplos de Aplicação de Ontologia

Taxonomias na Web• Yahoo! Categorias

Catálogo para compras on-line• Amazon.com catálogo de produtos

Domínio: especificação de terminologia padrão• Unified Medical Language System (UMLS)• UNSPSC - terminologia para produtos e serviços

Page 38: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Exemplos de Aplicação de Ontologia

Vinhos franceses e região de vinhos

Vinhos da Califórnia

e região de vinhos

Que tipo de vinho eu

devo servir com frutos do mar hoje?

Uma ontologiaUma ontologia compartilhadacompartilhada

de vinho e comidade vinho e comida

Uma ontologiaUma ontologia compartilhadacompartilhada

de vinho e comidade vinho e comida

Page 39: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Pode Haver Diferentes Ontologias para um Domínio

infection

meningitis pneumonia

bacterialpneumonia

acute viralpneumonia

chronic viralpneumonia

viralpneumonia

infection

meningitis pneumonia

chronicpneumonia

acute viralpneumonia

acute bacterialpneumonia

acutepneumonia

Page 40: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Por Que Criar Ontologias?

Para construir declarações explícitas sobre o domínio:

• Mais fácil mudar declarações do domínio (considerar, por exemplo, uma base de conhecimento de genética)

• Mais fácil entender e atualizar a legalidade dos dados

Para separar conhecimento do domínio do conhecimento operacional:

• Reuso do domínio e do conhecimento operacional separadamente

Page 41: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Ferramentas

• We need to provide tools and services to help users to:– Design and maintain high quality ontologies, e.g.:

• Meaningful — all named classes can have instances

• Correct — captured intuitions of domain experts• Minimally redundant — no unintended synonyms• Richly axiomatised — (sufficiently) detailed

descriptions– Store (large numbers) of instances of ontology

classes, e.g.:• Annotations from web pages

– Answer queries over ontology classes and instances, e.g.:

• Find more general/specific classes• Retrieve annotations/pages matching a given

description– Integrate and align multiple ontologies

Page 42: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Por Que é Difícil Criar Ontologias?

• Ontology languages are tricky– “All tractable languages are useless;

all useful languages are intractable”

• Ontologies are tricky– People do it too easily;

People are not logicians• Intuitions hard to formalise

• The evidence– The problem has been about for 3000 years

• But now it matters!– The semantic web means knowledge

representation matters

Page 43: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Alguns Tópicos de Pesquisa

• Web semântica – Padrões, princípios, linguagens, limitações

• Concepção de ontologias– Engenharia de ontologias– Paradoxo: tensão entre aplicação e extensibilidade– Aspectos a serem abordados

• funcional, intencional, social, físico, etc

– Relações parte-todo

Page 44: CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br

Alguns Tópicos de Pesquisa

• Aprendizado e ontologias– Construção de ontologias a partir de texto (Text-to-

Onto)– Anotação semi-automática de páginas baseadas em

ontologias– Extração, agrupamento [Hotho et al 2001] e

classificação de informação (mineração de textos)

• Integração inteligente de informação– Diversidade de visões de ontologias sobre um mesmo

domínio, que o abordam sobre perspectivas distintas– Soluções: mapeamento e integração semântica

através de contextos comuns [Wache & Stuckenschmidt 2001]