75
Unidade 4: Web Semântica Prof. Cláudio Baptista

Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando: linguagem natural (e.g., English) Gráficos, multimedia

Embed Size (px)

Citation preview

Page 1: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Unidade 4: Web Semântica

Prof. Cláudio Baptista

Page 2: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Motivação

• A Web atual representa informação usando: linguagem natural (e.g., English) Gráficos, multimedia Page layout

• Ok para humanos• Difícil para machine processing

(ambiguidade, formatos de dados sem tipos)

Page 3: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Motivação: Web Atual

Page 4: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Motivação: Web Semântica

Page 5: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Motivação• Os dados na Web são organizados para serem lidos por humanos e não

por programas de computador. (human versus machine understandable)

• Em geral, os computadores não possuem uma forma confiável de processar semântica na Web.

• Idéia: anotar elementos de páginas com instâncias de conceitos definidos em ontologias acessíveis na Web e em formato legível por máquina

• Faz com que a Web possa ser lida tanto por humanos como por máquinas.

Page 6: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Definição

• "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." -- Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001

Page 7: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Definição

• A Web semântica é uma visão: a idéia de se ter dados na Web definidos e interligados de modo que possam ser usados por máquinas não apemas com o propósito de apresentação (display), mas também automação, integração e reuso de dados entre diversas aplicações

Page 8: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Definições• Ambiente onde agentes de software vagariam entre

páginas, podendo realizar tarefas para os usuários;

• WS não é uma outra Web e sim uma extensão da que existe;

• Para o funcionamento da WS, computadores têm que ter acesso a coleções de informações estruturadas e conjuntos de regras de inferência;

Page 9: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Definições• Vai permitir que máquinas possam compreender a

semântica de documentos e dados;

• Existência de diferentes formas de representar a mesma coisa na Web, então é aí que entra as ontologias;

• Com ontologias, pode-se resolver ambiguidades em terminologia. ex.: Zip Code e Postal Code;

Page 10: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Definições

• Ontologias podem aumentar a funcionalidade da Web em muitos aspectos;

• O poder real da WS será quando as pessoas criarem muitos programas que coletam contextos da Web, processam a informação e trocam os resultados com outros programas.

Page 11: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Definições

“Imagine um forno de microondas que, através da Internet, consulta um site de comidas congeladas para otimizar

parâmetros de cozimento”

Page 12: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Princípios básicos da WS

• 1- Qualquer coisa deve ser identificável na WS (uso de URI)

• 2- Informação é parcial e continuará parcial (não esperemos consistência global => erro 404 continuará a existir)

• 3- Fácil Evolução• 4- Simplicidade

Page 13: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Infra-estrutura em camadas da W3C para web semântica

Page 14: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Arquitetura Proposta

Page 15: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Arquitetura Proposta • Schema Layer:

- Estrutura os dados e define o seu significado;

- Representação do Conhecimento – dar significado aos dados, para ser possível elaborar raciocínio lógico.

- Linguagem que permita expressar os dados para definir regras de raciocínio.

- Uso de XML e RDF.

Page 16: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Arquitetura Proposta

• Ontology Layer:

- Define as relações entre os dados;

- Definição de relação entre conceitos – Ontologias;

- Ontologias definem relações entre termos.

Page 17: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Arquitetura Proposta

• Logic Layer:

- Define mecanismos para fazer inferência sobre os dados;

- Conjunto de Regras de Inferência que os agentes utilizam para relacionar e processar informações.

Page 18: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Metadados

• Motivação– Cenário 1: busca por um livro numa biblioteca– Cenário 2: busca por um vídeo numa locadora– Cenário 3: busca por um telefone num serviço

de Yellow Pages– Metadata: Data about Data

• Principal uso: resource-discovery

Page 19: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Metadados

• Motivação– Ferramentas de busca, exceto Yahoo, coletam

metadata de forma crua (através de web robots) sem semântica.

– Isto resulta em baixa precisão e recall– Porém não existe uma instituição www.GOD.org

que regulamenta e obriga o mundo usar metadados– O que fazer?

Page 20: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Metadados

– Ao invés de descartar a idéia de metadados podemos usar RDF

– Como vimos nos cenários, existem muitos metadados em comum

– Portanto, podemos, usando RDF, organizar estes metadados para que possam ser usados por aplicações!!!

Page 21: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Metadados: Dublin Core• Conjunto simples de elementos de metadados para

informação online

• 15 elementos básicos

• projetado para todos os tipos e gêneros de material

• todos os elementos são opcionais

• todos os elementos são repetitivos

• Desenvolvido por um grupo internacional desde 1995

Page 22: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Elementos do Dublin Core

1. Title nome dado ao recurso pelo criador ou publisher.

2. Creator pessoa ou organização responsável pelo conteúdo intelectual do recurso. Por exemplo, autores de documents, artistas, fotógrafos, etc.

3. Subject o tópico do recurso. Tipicamente, é expressado com keywords ou frases que descrevem o assunto ou conteúdo do recurso. O uso de vocabulários controlados e classificação formal é encorajado.

Page 23: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Dublin Core elements

4. Description uma descrição textual do conteúdo do recurso, incluindo abstracts no caso de objetos do tipo documentos ou descrição de conteúdo no caso de recursos visuais.

5. Publisher entidade responsável pela produção do recurso, por exemplo uma editora, departamento de uma universidade, ou uma entidade corporativa.

6. Contributor pessoa ou organização não especificada no elemento creator que teve contribuição na criação intelectual do recurso mas cuja contribuição é secundária. Por exemplo um editor, tradutor, e ilustrador).

Page 24: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Dublin Core elements

7. Date data associada com a criação ou disponibilidade do recurso.

8. Type categoria do recurso, por exemplo home page, novela, poema, working paper, preprint, technical report, ensaio, dicionário.

9. Format formato de dados do recurso, usado para identificar o software e possivelmente hardware que são necessários para manipulação do recurso.

10. Identifier um string ou número usado para unicamente identificar o recurso. Examplo : URL

Page 25: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Dublin Core elements

11. Source informação sobre um segundo recurso do qual o presente recurso é derivado.

12. Language a língua usada no recurso.

13. Relation identificador de um segundo recurso e seu relacionamento com o presente recurso. Este elemento permite links entre recursos relacionados. Examplos incluem uma edição de um trabalho (IsVersionOf), ou um capítulo de um livro (IsPartOf).

Page 26: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Dublin Core elements

14. Coverage localizações espaciais e duração temporal do recurso.

15. Rights contém informação sobre copyright

Page 27: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Dublin Core com Meta Tags

<meta name="publisher" content="OCLC">

<meta name="creator" content="Weibel, Stuart L.">

<meta name="creator" content="Miller, Eric J.">

<meta name="title" content="Dublin Core Reference Page">

<meta name="date" content="1996-05-28">

<meta name="form" content="text/html">

<meta name="language" content="en">

Page 28: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Dublin Core com qualificadores

<title>Digital Libraries and the Problem of Purpose</title><creator>David M. Levy</creator><publisher>Corporation for National Research Initiatives</publisher><date date-type = "publication">January 2000</date><type resource-type = "work">article</type><identifier uri-type = "DOI">10.1045/january2000-levy</identifier><identifier uri-type = "URL">http://www.dlib.org/dlib/january00/01levy.html</identifier><language>English</language> <rights>Copyright (c) David M. Levy</rights>

Page 29: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

RDF e RDFS

• RDF - Resource Description Framework– Modelo para descrever recursos– É uma aplicação XML– Baseado em um modelo de grafo no lugar de

árvore– Melhora a descoberta, o acesso e o

gerenciamento das informações da Web

Page 30: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

RDF: constituintes de uma descrição RDF

• Formas de representação– Tripla:

• Sujeito: recurso• Objeto: outro recurso• Predicado: relação que associa vários recursos

– Como grafo:• Sujeitos são nós• Objetos também são nós ou literais (átomos)• Predicados são os arcos que ligam os nós

• Recursos são unicamente identificados por URI

Page 31: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Exemplo de uso de RDF

[Sujeito = <http://www.sinbad.dsc.ufpb.br/>, Predicado

=<http://gosta.exemplo.org/termo/gosta>, Objeto = <http://www.w3c.org> ]

http://www.sinbad.dsc.ufpb.br/

http://www.w3c.org

http://gosta.exemplo.org/termo/gosta

Page 32: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

RDF: ressurgimento das redes semânticas

• Redes semânticas– Forma de representar linguagem natural – Formato para organizar expressões numa forma

fácil de ser computada• RDF é uma rede semântica para a Web

Page 33: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Redes Semânticas

spine has

vertebrate

mammal bird

canary ostrich

heart

hair

fly

wings

walkdoesn’t fly

yellow

isa

isa

isa

can

freddie hugo

isa

Page 34: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

RDF em XML • Texto tripla:[Sujeito=<http://uri-of-document>, Predicado=<dc:Creator>, Objeto=<Creator_001>][Sujeito=<Creator_001>, Predicado=<card:name>, Objeto=<Jonh Smith>][Sujeito=<Creator_001>, Predicado=<card:email>, Objeto=<[email protected]>]

• XML<rdf:rdf> <rdf:Description rdf:href=“http://uri-of-

document”> <dc:Creator rdf:href=“#Creator_001”/> </rdf:Description> <rdf:Description rdf:ID=“Creator_001”> <card:name> Jonh Smith </card:name> <card:email> [email protected] </card:email> </rdf:Description></rdf:rdf>

Page 35: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

[email protected]

http://uri-of-document Creator_001

dc:Creator

card:name card:email

“John Smith”

RDF em XML: Grafo

Page 36: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

RDF em XML: Árvore

card:name

rdf:Description

rdf:ID Creator_001

card:email

rdf:Description

rdf:href http://uri-of-Document

dc:Creator

rdf:href #Creator_001

“John Smith” “[email protected]

rdf:rdf

Page 37: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

RDF e XMLNS<?xml version=“1.0” ?><rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:dc=“http://purl.org/DC/”>

<rdf:Description about=“http://rama.cpe.fr/index.html”> <dc:Creator rdf:resource=“mailto:[email protected]”/> </rdf:Description></rdf:RDF>

Namespace para as especificações RDF

Namespace para uma especificação customizada

Sujeito

ObjetoPredicado

Page 38: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

RDF Schema (RDFS): definição e motivação

• Provê um sistema de tipo básico• Provê mapeamento entre recursos e

propriedades• Permite a construção de estruturas hierárquicas• Mesma sintaxe que RDF• Interoperabilidade de metadados de diferentes

comunidades• Permite codificar, trocar e reusar estrutura de

metadados

Page 39: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

RDFS: constituintes de um esquema de descrições

• Classes básicas– rdfs:Resource : todas as coisas descritas são recursos

(Objeto)– rdfs:Property: propriedades– rdfs:Class :similar à noção de classe em OO

• Propriedades Básicas– rdf:type: indica que um recurso é membro de uma classe– rdfs:subClassOf: similar à noção de subclasse em OO– rdfs:subPropertyOf: indica que uma propriedade é

especialização de outra

Page 40: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

RDFS em XML: exemplo• Exemplo de RDFS<? xml version=“1.0” ?>< rdf xmlns:rdf = “http://w3.org/TR/Pr-rdf-

syntax#” xmlns:rdfs=“http://w3.org/TR/WD-rdf-schema#” >

<rdf:Description ID = “Title”> <type resource = "http://w3.org/TR/PR-

rdf-syntax#Property" /> <rdfs:label> Title </RDFS:label></rdf:Description> <rdf:Description ID = "Creator" > < rdf:type resource = "http://w3.org/TR/PR-

rdf-syntax#Property" /> <rdfs:label> Author or Creator

</rdfds:label></rdf:Description> </rdf>

• Exemplo de descrição RDF<?xml version=“1.0” ?><rdf:RDF

xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#”> xmlns:dc=“http://purl.org/DC/”>

<rdf:Description about=“http://dstc.com.au/report.htm”> <dc:Creator rdf:resource=“mailto:[email protected]”/> <dc:Title = “Report” /> </rdf:Description></rdf:RDF>

Page 41: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Ontologia

• Permite que informações de diferentes fontes sejam integradas, para tanto requer-se um entendimento compartilhado de um dados domínio.

• Associa termos de vocabulário com entidades identificadas na conceitualização e provê definições para restringir as interpretações destes termos.

Page 42: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Ontologia• Como um XML DTD ou XML Schema, uma

ontologia pode prover um vocabulário de problema.• Entretanto, uma ontologia pode também conter

estruturas ou axiomas que definem as semânticas dos termos do vocabulário.

• Estas semânticas são usadas para:• inferir informação baseado no conhecimento prévio do

domínio • integrar fontes de dados de diferentes domínios.

Page 43: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Ontologia• Definição: especificação (semi-)formal explícita formal explícita de uma concepção concepção

compartilhadacompartilhada– Concepção: Concepção: modelo das entidades, relações, axiomas e regras de algum

domínio– Formal:Formal:

• processável por máquina• permitindo raciocínio automático• com semântica lógica formal

– Compartilhada:Compartilhada: por uma comunidade, permitindo entendimento

• Conceitos de computação relacionados:– Base de conhecimento reutilizável– Esquema de banco de dados

Page 44: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Elementos de uma ontologia• Hierarquia de conceitos:

– entidades• cada entidade definida por conjunto de pares atributo-valor• correspondem às classes dos modelos orientado a objetos; às entidades

do modelo relacional; aos termos do modelo lógico• atributos propriedades x atributos relações

– preenchidos por valores atômicos (tipos primitivos) x por outros conceitos• Status epistemológico do valor

– Exatamente conhecida, default, probabilista

– relações• sem hierarquia x em hierarquia paralela a hierarquia de entidades• correspondem: às associações, agregações e atributos dos modelos OO

cujos valores são objetos; às relações do modelo relacional; aos predicados do modelo lógico

Page 45: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Elementos de uma ontologia– Restrições:

• sobre valores possíveis dos atributos do conceitos• correspondem: às assinaturas de classes em modelos OO;

aos axiomas universalmente quantificados em modelos lógicos; às restrições de integridade nos esquema de BD

– Regras dedutivas:• sobre atributos de conceitos• permitem inferência automática da existência de instâncias

de conceitos a partir da existência de outras instâncias• correspondem às regras dos sistemas especialistas e

programação em lógica; aos métodos dos modelos OO; às visões em BD

Page 46: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Elementos de uma ontologia

• Instâncias de conceitos:– definição de entidade e relações específicos

(indivíduos)– correspondem:

• aos fatos de sistemas especialistas e programação em lógica

• aos objetos dos modelos OO• aos dados dos BD

Page 47: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Serviços suportados por uma ontologia

• Consultas e manipulação:– correspondem aos métodos de acesso a valor e de reflexão em

linguagens OO; consultas de interrogação e manipulação em BD; ask, tell e retract das bases de conhecimento

– sobre conceitos:• Quais são as entidades E relacionadas a entidade e0 via relações r1,

r2?• Quais são as relações R mais gerais que r1?• Definição d de entidade E é consistente com o resto da ontologia?

– sobre instâncias• um indivíduo I com propriedades P1, ..., Pn é instância de quais

conceitos?

• Raciocínio automático (geralmente dedutivo)

Page 48: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Ontologias• Uma ontologia define os termos usados para descrever

uma área de conhecimento.• Ontologias são usadas por pessoas, SGBD e aplicações

que necessitam compartilhar informação de domínio (medicina, biologia, finanças, vendas de veículos, etc)

• Ontologias incluem definições (entendidas por computador) de conceitos num domínio e os relacionamentos entre eles– Ontologias codificam conhecimento entre domínios,

permitindo reusabilidade de conhecimento

Page 49: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Ontologias• Ontologia tem sido usado com vários

significados: taxonomia de vocabulários (ex. hierarquia do Yahoo), metadata schema (ex. Dublin Core) e teorias lógicas

• Na Web Semântica, precisamos de ontologias que especifiquem 3 tipos de conceitos:

• Classes• Relacionamentos• Propriedades

Page 50: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Ontologias

• XML e XML Schema representam apenas sintaxe

• RDF e RDFs são a primeira tentativa de ser ter semântica associada.

• RDFS pode ser chamada de uma linguagem de ontologia simples

• Limitações: não faz inferência, não permite especificar disjunção de classes, dentre outros.

Page 51: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Ontologia - Histórico– O trabalho em Ontologias remonta muitos anos nos campos

de filosofia, IA, biblioteconomia– Representação do conhecimento na Web usando ontologias

surgiu na década de 90: 1995 - SHOE (Simple HTML Ontology Extensions), Univ of Maryland. 1996/7 - Ontobroker, Univ. of Karlsruhe 1997-1999 - OIL (Ontology Interchange Level), Amsterdam led EU project

– Investimento governamental em WS: 1999 - The DARPA Agent Markup Language Program 2000 - EU IST Project (Framework 5, 6) 2000 - outras propostas nos EUA, Japão e Austrália

Page 52: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Tipos de Ontologias• Especialista:Especialista: modela um domínio particular restrito• Geral:Geral:

– modela o conhecimento de senso comum compartilhado por todos os seres humanos

– parte de mais alto nível, reutilizável em vários domínios• Conceitual:Conceitual: fundamentada na capacidade de raciocinar• Lingüística:Lingüística: fundamenta no vocabulário de uma(s) língua(s)• De meta-dados:De meta-dados: “especializada” na descrição de recursos on-

line, no entanto sobre qualquer domínio• De tarefas e métodos:De tarefas e métodos: modela procedimentos e

comportamentos abstratos no lugar de entidades ou relações

Page 53: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Ontologias - Aplicações

• 1- Web Portals: – ponto de partida para se colher uma informação

específica– formam uma comunidade que interage num

determinado assunto => pode-se classificar os conceitos, ex. Jornal é uma publicação

– Exemplo de portal que usa WS: Open Directory Project (http://dmoz.org/)

• grande diretório da Web editado manualmente. (usa RDF)

Page 54: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Ontologias - Aplicações• 2- Coleções Multimídia

– ontologias podem ser usadas para fazer anotações de imagens, vídeos, áudios e textos

– MM ontologias:• Content-specific• Media-specific

– Exemplo: um site de móveis antigos• usuário busca por um ‘late Georgian’• Ontologia ajuda a inferir o período que equivale a 1760 e 1811 e que a

cultura é ‘British’• Também poder-se-ia inferir o tipo de madeira usada naquela época

repassando esta informação na busca

Page 55: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Exemplo de ontologia especialista: fragmentos de uma ontologia

acadêmicaem UML

Page 56: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Personaddress : Stringeditor : Publicationemail : Stringfax : StringfirstName : StringlastName : StringmemberOfPC : EventmiddleInitial : Stringname : StringorganizerOrChairOf : Eventphone : Stringphoto : Stringpublication : Publication

Employeeaffiliation : OrganizationheadOf : ProjectheadOfGroup : ResearchGroupworksAtProject : Project

StudentstudiesAt : University

PhDStudentsupervisor : AcademicStaff

ResearchercooperatesWith : ResearchermemberOf : ResearchGroupresearchInterest : ResearchTopic

AcademicStaffsupervises : PhDStudent

Lecturer

AdministrativeStaff

TechnicalStaffSecretarysecretaryOf : ResearchGroup

Page 57: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

ConferencePaperconference : ConferencefirstPage : NumberlastPage : NumberproceedingsTitle : String

ArticleInBookbook : BookfirstPage : NumberlastPage : Number

JournalArticlefirstPage : Numberjournal : JournallastPage : Number

TechnicalReportnumber : Numberorganization : Organizationseries : String

WorkshopPaperfirstPage : NumberlastPage : NumberproceedingsTitle : Stringworkshop : Workshop

Article

BookcontainsArticle : ArticleInBookeditor : Personpublisher : Organization

OnlinePublicationonlineVersionOf : Publicationtype : String

JournalcontainsArticle : JournalArticleeditor : Personnumber : Numberpublisher : Organizationvolume : Number

Publicationabstract : Stringauthor : PersondescribeProject : ProjectonlineVersion : OnlinePublicationtitle : Stringyear : Number

SpecialIssue

Page 58: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Conf erence

number : Numberseries : String

Conf erencePaper

conf erence : Conf erencef irstPage : NumberlastPage : NumberproceedingsTitle : String

1 n1 n

has accepted

Article

Publication

abstract : Stringauthor : PersondescribeProject : ProjectonlineVersion : OnlinePublicationtitle : Stringy ear : Number

Person

address : Stringeditor : Publicationemail : Stringf ax : Stringf irstName : StringlastName : StringmemberOf PC : Ev entmiddleInitial : Stringname : StringorganizerOrChairOf : Ev entphone : Stringphoto : Stringpublication : Publication

0..n0..n 0..n0..n

<<is author>>

Ev ent

atEv ent : Ev entdate : Stringev entTitle : StringhasParts : Ev entlocation : StringorgCommittee : PersonprogramCommittee : Personpublication : Publication

n

0..n

n

0..n

is member of PC

Page 59: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Exemplo de ontologia conceitual geral: fragmentos da ontologia de senso comum

de Russell e Norvig em UML

Page 60: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Anything

AbstractObjectsEvents

Sets Numbers RepresentationalObjects

Categories

Sentences Measurements

Intervals PlacesPhysicalObjects Processes

MomentsThings Stuff

Animals Agents

Humans

Solid Liquid Gas

Page 61: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Exemplo de ontologia lingüística geral:

fragmentos de WordNet em UML

Page 62: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Wordnet

• Princeton WordNet: • rede semântica de 70.100 significados • de 95.600 palavras (57.000 substantivos) do inglês• organizados em 4 categorias sintática: substantivos,

verbos, adjetivos e advérbios,• são agrupados em conjuntos de sinônimos• disponível online:

http://www.cogsci.princeton.edu/~wn/• resulta de 15 anos de desenvolvimento manual por

time de psico-lingüistas

Page 63: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

EuroWordnet

• EuroWordNet: http://www.hum.uva.nl/~ewn/• Resultado de um grande projeto da comunidade

européia• Versão multi-língue adicionando e interligando

WordNets do Espanhol, Francês, Italiano, Alemão, Holandês, Tcheco e Estoniano ao do Inglês

Page 64: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Wordnet

antonímiameronímia

family, household, menage

Person, individual, someone, human

sister, sis arm

relative, relation

unit, social unit

Brother, blood brother

body,organic structure

leg

hipernímiaLegenda:

sinonímia

Page 65: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

WordNet Online

Page 66: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia
Page 67: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Aplicações com o WordNet

• Extração e recuperação de informação• Classificação de texto• Ensino de línguas• Construção de redes semânticas em outras

linguagens (EuroWordnet)• Chatterbots (Geração e interpretação de texto)

Page 68: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Linguagens de Ontologias - Requisitos de Projeto (W3C Ontology Language)

– Compartilhamento de Ontologias por diversas fontes de dados

– Evolução– Interoperabilidade– Detecção de inconsistência– Balanço entre expressividade e escalabilidade– Fácil de usar – Compatibilidade com outros padrões (XML, RDF, UML)– Internacionalização

Page 69: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Exemplos: Ontobroker

• inclui una linguagem de definição de ontologias, uma ling. de anotação de web page, um web crawler, interfaces de consulta e máquina de inferência

• é baseado em frame-logic• é voltado para intranets

Page 70: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Object[].Person :: Object.

Faculty :: Person.Chair :: Faculty.

Student :: Person.Organization :: ObjectDepartment :: Organization.Person[

name =>> STRING;headOf =>> Organization].

Faculty[teaches =>> Class;advises =>> Student].

FORALL X, YX:Chair <- X:Person[headOf ->> Y] AND Y:Department

ANOTAÇÃO: <a onto=" ’http://www.state.edu/users/jsmith/’:Chair">

Page 71: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Exemplo: RDF e RDFS

• Implementa uma rede semântica• É uma aplicação de XML• Com RDFSchema permite a construção de

vocabulários controlados, estensíveis e compartilhados

• Uso de rdfs:Class, rdfs:Property e rdfs:subClassOf

Page 72: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

<?xml version="1.0"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/TR/1999/PR-rdf-schema-19990303#"><rdfs:Class rdf:ID="Faculty"><rdfs:subClassOf rdf:resource="http://schema.org/general#Person" /></rdfs:Class><rdfs:Class rdf:ID="Student"><rdfs:subClassOf rdf:resource="http://schema.org/general#Person" /></rdfs:Class><rdfs:Class rdf:ID="Chair"><rdfs:subClassOf rdf:resource="#Faculty" /></rdfs:Class><rdfs:Property rdf:ID="advises"><rdfs:domain rdf:resource="#Faculty" /><rdfs:domain rdf:resource="#Student" /></rdfs:Property></rdf:RDF>

Page 73: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Exemplo DAML

• DARPA Agent Markup Language• Involve alto investimento da academia,

governo e indústria• Hoje juntou-se a linguagem OIL (Ontology

Inference Layer) formando DAML+OIL• Escrito em RDF• Baseado em Description Logic

Page 74: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

<?xml version="1.0"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/TR/1999/PR-rdf-schema-19990303#"xmlns:daml="http://www.daml.org/2001/03/daml+oil#" > <daml:Ontology rdf:about=""> <daml:versionInfo>1.0</daml:versionInfo> <daml:imports rdf:resource="http://schema.org/base#" /> </daml:Ontology> <daml:Class rdf:ID="Husband"> <rdfs:subClassOf rdf:resource="#Male" /> <rdfs:subClassOf> <daml:Restriction> <daml:onProperty rdf:resource="#isMarriedTo" /> <daml:hasClass rdf:resource="#Female" /> </daml:Restriction> </rdfs:subClassOf> </daml:Class></rdf:RDF>

Page 75: Unidade 4: Web Semântica Prof. Cláudio Baptista. Motivação A Web atual representa informação usando:  linguagem natural (e.g., English)  Gráficos, multimedia

Futuro: W3C Web Ontology Language

– The WOWG está trabalhando na criação de uma recomendação para a "Web Ontology Language": OWL 51 Membros de 30 W3C Organizations

Companies: Agfa, Daimler-Chrysler, EDS, Fujitsu, Hewlett-Packard, IBM, Intel, IVIS, Lucent, Network Inference, Nisus, Nokia, Philips, Stilo, Sun, Unisys

Public Sector: DISA, Electricite de France, Intelink, INTAP, MITRE, NIST

Research projects/Labs: DFKI, FZI, Ibrow group, Stanford, U. Bristol, U. Maryland, U. Southhampton

Invited Experts: Medical, Digital Library, Defense, Technical