CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da...

Preview:

Citation preview

CE-262 Ontologia e Web Semântica

Prof. José M Parente de Oliveira

Sala 120 – Prédio da ComputaçãoInstituto Tecnológico de Aeronáutica - ITA

parente@ita.br+55 12 3947-6941

Introdução à Web Semântica e Ontologias

Sumário de Conteúdo do Tópico

Motivação

Web Semântica: o que é?

Arquitetura da Web Semântica (W3C)

Desafios da Web Semântica

Perspectivas da Web Semântica

Noção de Ontologia

Material de Referência

Projeto e Construção de OntologiasProf. Luiz A M Palazzo - Universidade Católica de Pelotas

Ontology Engineering for the Semantic Web and BeyondProf. Natalya F. Noy - Stanford University

The Semantic Web Dr. V. Richard BenjaminsiSOCO

Jena TutorialAnna V. ZhdanovaDERI AT

Material de Referência

Ontologias, modelos e busca em JAVAAdriana da Silva Jacinto

Ian Horrocks and Alan RectorUniversity of ManchesterManchester, UK

Motivação

Motivação

Motivação

Motivação

Motivação

Motivação

Motivação

Motivação

É necessário navegar muito pela Web antes de se encontrar o conteúdo de interesse

Problema: a tecnologia atual de busca não entende o que se está procurando:

• Procura apenas por palavras-chave

• = string de caracteres

• Retorno de informação em vez de resposta a uma questão!

Motivação Web Sintática

[Hendler & Miller 02]

Motivação: Web Sintática

[Hendler & Miller 02]

A place where computers do the presentation (easy) and people do the linking and interpreting (hard).

– A hypermedia, a digital library• A library of documents called (web pages)

interconnected by a hypermedia of links– A database, an application platform

• A common portal to applications accessible through web pages, and presenting their results as web pages

– A platform for multimedia• BBC Radio 4 anywhere in the world! Terminator 3

trailers!– A naming scheme

• Unique identity for those documents

Motivação: Web Sintática

[Hendler & Miller 02]

Why not get computers to do more of the hard work?

Web Semântica: o que é?

“A Web Semântica é uma extensão da Web atual em que cada informação é dada por um significado bem definido, fazendo com que computadores e pessoas trabalhem melhor em cooperação”

Tim Berners-Lee, James Hendler, Ora LassilaScientific American, May 2001

Web Semântica: o que é?

Web Semântica: o que é?

“O poder real da Web Semântica será percebido quando as pessoas criarem programas que coletem conteúdo de diversas fontes, processem a informação e troquem os resultados com outros programas. A eficácia de tais agentes de software aumentará exponencialmente assim como mais máquinas leitoras do conteúdo Web e serviços automatizados (incluindo outros agentes) tornarem-se disponíveis.”

Tim Berners-Lee, James Hendler, Ora LassilaScientific American, May 2001

Web Semântica: o que é?

Web Semântica é a idéia de se ter dados na Web definida e interconectada por um caminho que pode ser usado para mais descobertas eficazes, automação, integração e reutilização através de várias aplicações.

A Web pode encontrar todo o seu potencial se tornar-se um local onde dados podem ser tão bem processados por ferramentas automatizadas como o são por pessoas.

W3C

Web Semântica: o que é?

Iniciativa do W3C com o objetivo de adicionar significado à Web

Baseada na tecnologia xml/rdf, fazendo evoluir a html da Web Sintática

WWW Consortium - http://www.w3.org

Arquitetura da Web Semântica

Arquitetura da Web Semântica

Dados

Web Semântica

Mecanismo de Busca

Ontologia Ontologia Ontologia

Camada deEstrutura

CamadadeEsquema

Regras de InferênciaCamadaLógica

… E-commerce

Arquitetura da Web Semântica

Camada de Estrutura

Responsável por estruturar os dados e definir seu significado:

XML, NamespacesURI, Unicode

Arquitetura da Web Semântica

Camada de Esquema

Responsável por definir relações entre os dados

Uso de ontologias em páginas Web torna mais simples a resolução de indefinição ou conflito de terminologia

RDF Schema, RDF M&S

Arquitetura da Web Semântica

Camada Lógica

Responsável por definir mecanismos para fazer inferência sobre os dados

Composta por um conjunto de regras de inferência

Regras de inferência fornecem aos agentes computacionais o poder de raciocinar sobre as estruturas de dados

Desafios da Web Semântica

Carência de profissionais especializados

Evolução de culturas (html – xml/rdf)

Padrões digitais de mídia instáveis

Crescimento simultâneo e continuado da Web Sintática

Falta de investimento adequado

Falta de visibilidade da área

Perspectivas

Base para a computação móvel e pervasiva

Grande disseminação prevista a médio prazo

Novo patamar para as interações humano-computador

Novos produtos e oportunidades de pesquisa

Aplicação em grande escala em educação e gestão de conhecimento

e-Science

Noção de Ontologia

Corpo de conhecimento declarativo sobre um dado domínio, assunto ou área de conhecimento

Na prática, hierarquias de conceitos (classes) com suas relações, restrições, axiomas e terminologia associada

Termo às vezes mal-empregado. Ontologias não são:

•Simples hierarquias

• Conjuntos de conceitos associados a palavras-chave

• Esquemas de bancos de dados

Noção de Ontologia

Definição de Ontologia:

Especificação formal e explícita de uma conceitualização compartilhada (Gruber, 1993)

Conceitualização: : modelo das entidades, relações, axiomas e regras de algum domínio

Formal: • Processável por máquina• Permitindo raciocínio automático• Com semântica lógica formal

Compartilhada: por uma comunidade, permitindo entendimento

Noção de Ontologia

Uma ontologia é uma descrição explícita de um domínio:

• Conceitos

• Propriedades - atributos de conceitos

• Restrições em propriedades e atributos

• Indivíduos (às vezes, mas não sempre)

Noção de Ontologia: Estrutura

Ontologies typically have two distinct components:• Names for important concepts in the domain

– Elephant is a concept whose members are a kind of animal

– Herbivore is a concept whose members are exactly those animals who eat only plants or parts of plants

– Adult_Elephant is a concept whose members are exactly those elephants whose age is greater than 20 years

• Background knowledge/constraints on the domain– Adult_Elephants weigh at least 2,000 kg– All Elephants are either African_Elephants or

Indian_Elephants– No individual can be both a Herbivore and a Carnivore

Noção de Ontologia: Conceitualização

Noção de Ontologia: Conceitualização

There can be two conceptualizations of this tiny world where the task is to make a plan of stack three blocks as the goal configuration using a robot hand

One is with conceptualization of the table and the other is without the table. In the latter, the table is imbedded in the relation onTable(X)

You can easily see the incompatibility between two plans based on each of the two conceptualizations. They are NOT interoperable each other when they come to a situation where they have to talk about the table. So, it is necessary to have an explicit representation of such a conceptualization.

Noção de Ontologia: Conceitualização

Noção de Ontologia: Conceitualização

We can design ontology of this block world corresponding to each of the two conceptualizations like this

It is roughly a hierarchy of things with axioms. Definitions of each concept and relation is omitted here

An example of an axiom is above(X,Z):-on(X,Y), on(Y,Z). There are many more axioms to represent constraints among the concepts and relations

Ontologia em Computação

O que pode ser representado por um computador

Uma ontologia pode ter várias formas, mas ela incluirá necessariamente um vocabulário de termos e alguma especificação de seu significadoUschold 1998, Jaspers & Uschold 1999

Um corpo de conhecimento descrevendo algum domínio de senso comum (Cyc e OpenCyc)

Exemplos de Aplicação de Ontologia

Taxonomias na Web• Yahoo! Categorias

Catálogo para compras on-line• Amazon.com catálogo de produtos

Domínio: especificação de terminologia padrão• Unified Medical Language System (UMLS)• UNSPSC - terminologia para produtos e serviços

Exemplos de Aplicação de Ontologia

Vinhos franceses e região de vinhos

Vinhos da Califórnia

e região de vinhos

Que tipo de vinho eu

devo servir com frutos do mar hoje?

Uma ontologiaUma ontologia compartilhadacompartilhada

de vinho e comidade vinho e comida

Uma ontologiaUma ontologia compartilhadacompartilhada

de vinho e comidade vinho e comida

Pode Haver Diferentes Ontologias para um Domínio

infection

meningitis pneumonia

bacterialpneumonia

acute viralpneumonia

chronic viralpneumonia

viralpneumonia

infection

meningitis pneumonia

chronicpneumonia

acute viralpneumonia

acute bacterialpneumonia

acutepneumonia

Por Que Criar Ontologias?

Para construir declarações explícitas sobre o domínio:

• Mais fácil mudar declarações do domínio (considerar, por exemplo, uma base de conhecimento de genética)

• Mais fácil entender e atualizar a legalidade dos dados

Para separar conhecimento do domínio do conhecimento operacional:

• Reuso do domínio e do conhecimento operacional separadamente

Ferramentas

• We need to provide tools and services to help users to:– Design and maintain high quality ontologies, e.g.:

• Meaningful — all named classes can have instances

• Correct — captured intuitions of domain experts• Minimally redundant — no unintended synonyms• Richly axiomatised — (sufficiently) detailed

descriptions– Store (large numbers) of instances of ontology

classes, e.g.:• Annotations from web pages

– Answer queries over ontology classes and instances, e.g.:

• Find more general/specific classes• Retrieve annotations/pages matching a given

description– Integrate and align multiple ontologies

Por Que é Difícil Criar Ontologias?

• Ontology languages are tricky– “All tractable languages are useless;

all useful languages are intractable”

• Ontologies are tricky– People do it too easily;

People are not logicians• Intuitions hard to formalise

• The evidence– The problem has been about for 3000 years

• But now it matters!– The semantic web means knowledge

representation matters

Alguns Tópicos de Pesquisa

• Web semântica – Padrões, princípios, linguagens, limitações

• Concepção de ontologias– Engenharia de ontologias– Paradoxo: tensão entre aplicação e extensibilidade– Aspectos a serem abordados

• funcional, intencional, social, físico, etc

– Relações parte-todo

Alguns Tópicos de Pesquisa

• Aprendizado e ontologias– Construção de ontologias a partir de texto (Text-to-

Onto)– Anotação semi-automática de páginas baseadas em

ontologias– Extração, agrupamento [Hotho et al 2001] e

classificação de informação (mineração de textos)

• Integração inteligente de informação– Diversidade de visões de ontologias sobre um mesmo

domínio, que o abordam sobre perspectivas distintas– Soluções: mapeamento e integração semântica

através de contextos comuns [Wache & Stuckenschmidt 2001]