73
WEB SEMÂNTICA Disciplina: IF696 Jefferson Ramos Lucas dos Anjos [email protected]

Disciplina: IF696 Jefferson Ramos Lucas dos Anjos [email protected]

Embed Size (px)

Citation preview

Page 1: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

WEB SEMÂNTICADisciplina: IF696

Jefferson Ramos Lucas dos [email protected]

Page 2: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Roteiro Introdução Motivação Estudo do Caso

Problema Possível Solução

Web Semântica Noções Básicas da WS

Semântica Explícita Vocabulários Controlados e Universais URI

Relações, Taxonomias e Ontologias RDF e RDFS DLG Nós na Rede OWL

Conclusão

Page 3: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Introdução O que é Web Semântica? É uma extensão para a Web atual onde

o conteúdo publicado será mais facilmente processável pelas máquinas.

Inserção de significado (semântica) Forma a se automatizarem.

Page 4: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Introdução Propagada pelo World Wide Web

Consortium (W3C). Tim Berners-Lee Espera com essa iniciativa a realização

de sua visão original da Web. Significado da informação com papel

mais importante do que temos hoje na Web.

Page 5: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Motivação Semântica?

Não Ambíguo “Relacionado ao

significado de algo”.

Page 6: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Estudo do Caso Extrair automaticamente de páginas

Web, informações sobre lançamentos de livro, como:

Assunto Autor Título

Page 7: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Editora A

Page 8: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Como o ser humano vê

LivroTítuloAutor

Page 9: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Como a máquina vê

Table

<tr><td>

<font>

<a href>

Page 10: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Problema Como Delimitar cada “elemento” de

dados no documento. Como delimitar no documento:

LivroTítuloAutor

Page 11: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Uma Possível Solução Marcação XML Do HTML ao XML

HTML marcações de formato, estrutura e links

XML marcação flexível

Page 12: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Árvore em HTML

Page 13: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Árvore em XML

Page 14: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Marcação HTML

Table

<tr><td>

<font>

<a href>

<table><tr><td> <font size=2><a href=“...”>

O Guia do Mochileiro das Galáxias</a></font><font size=1> Douglas Adams</font><td><tr></table>

Page 15: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Marcação XML

titleauthor

book

<book> <title>O Guia do Mochileiro das Galáxias</a></title> <author> Douglas Adams</author></book>

Page 16: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Situação 1

titleauthor

book

<book> <title>O Guia do Mochileiro das Galáxias</a></title> <author> Douglas Adams</author></book>

Page 17: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Pergunta 1 Como a máquina deve interpretar

<book>, <title> e <author>?

Page 18: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Situação 2

tituloautor

livro

<livro> <titulo>O Guia do Mochileiro das Galáxias</a></titulo> <autor> Douglas Adams</autor></livro>

Page 19: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Pergunta 2 Há Equivalências entre:

<book> e <livro><title> e <título><author> e <autor>?

Page 20: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Situação 3

titlecreator

publication

<publication> <title>O Guia do Mochileiro das Galáxias</a></title> <creator> Douglas Adams</creator></publication>

Page 21: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Pergunta 3 Qual a relação entre <book> e

<publication>, entre <author> e <creator>?

Page 22: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Situação 4 Representar:

Sr. Horácio é autor da página: http://www.paleo.org/dino.html em XML

Page 23: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Situação 4 Possível Representação 1:

Page 24: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Situação 4 Possível Representação 2:

Page 25: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Situação 4 Possível Representação 3:

Page 26: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Situação 4 Possível Representação 4:

Page 27: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Situação 4

Qual a melhor forma de realizar a representação?

Page 28: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Web Semântica

Page 29: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Web Semântica

Page 30: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Semanitc Web Vision “... a ideia de ter dados na web definidos

e ligados de um modo que podem ser utilizados pelas máquinas não apenas para fins de exibição, mas para a automação, a integração e a reutilização de dados através de várias aplicações.”

W3C Semantic Web Activity Group

Page 31: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Noções da Web Semântica

Page 32: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Noções da Web Semântica

Semântica Explícita

Page 33: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Web Semântica x Macondo Macondo: cidade fictícia onde se

desenrola o romance Cem Anos de Solidão.

Page 34: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Web Semântica x Macondo

Page 35: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

A Web na Ótica humana

Page 36: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

A Web na Ótica de Reconhecimento de padrões

Page 37: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

A Web Semântica

Page 38: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Noções da Web Semântica

Vocabulários Controlados e Universais

Page 39: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Vocabulário Controlado “Um vocabulário controlado é uma maneira de

inserir uma camada interpretada de semântica entre os termos inseridos pelo usuário e o banco de dados subjacente, para melhor representar a intenção original dos termos do usuário” (Leise, 2002).

“Listas organizadas de palavras e frases, ou sistemas de notação, que são usados inicialmente para marcar o conteúdo (tag), e depois encontrá-lo através de navegação ou pesquisa”(Amy, 2010)

Page 40: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

URI - Concordância “”[...] os URIs garantem que aqueles

conceitos não são apenas palavras em um documento, mas estão ligadas a uma definição única que todo mundo pode encontrar na Web”. (Tim Berners-Lee, 2001)

Page 41: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Ancorando Termos com URIs URIs garantem que termos são únicos e

podem ser referenciados em qualquer lugar da Web.

Page 42: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br
Page 43: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br
Page 44: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br
Page 45: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br
Page 46: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Noções da Web Semântica

Relações, Taxonomias e Ontologias

Page 47: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br
Page 48: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br
Page 49: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Alinhamento

Page 50: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Quem é p:mesmo_que?

Page 51: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br
Page 52: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br
Page 53: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Relações taxonômicas entre termos

Page 54: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

RDF e RFD SchemaResource Description Framework

Modelo(grafos) e Linguagem Representa de forma homogênea

descrições associadas a recursos endereçáveis através da Web.

Representação é propícia para “Consumo por computadores”.

Atua sobre problemas de interoperabilidade semântica.

Page 55: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Questões Como identificar dentro da página onde

está cada informação? Descrição independente ligada

Um livro sobre biologia por exemplo, estará identificado como “biologia” ou como “ciências biológicas”? Ontologias

O programa continuará funcionando se o layout da página sofrer modificações? Sim

Page 56: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Resource Description Framework Representação de informações se

baseia na associação de descrições a recursos.

Page 57: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Declaração Descrição é formada de unidades

menores, as declarações. Cada declaração estabelece um valor,

para uma propriedade associada a um recurso.

Page 58: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Tripla Toda declaração resume-se à tripla:

(Recurso, Propriedade, Valor) Lê-se:

O livro “Vida dos dinossauros” tem como autor o Sr. Horácio.

Page 59: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

DLG Uma declaração RDF é frequentemente

expressa na forma de um Grafo Direcionado e Rotulado (Directed Labelled Graph = DLG)

Page 60: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Resource Description Framework Recurso: qualquer coisa que pode ser

identificado através da Web. Ex: uma página um livro, um carro, etc.

Page 61: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Funções do URI Fazer referência a um recurso.

Page 62: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Funções do URI Fazer referência a um elemento dentro

de um documento.

Page 63: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Questões sobre URI URI cumprir papel de identificador

unificado, não importando conteúdo endereçado.

URI apenas fornece subsídios para identificação única:Um identificador x muitos recursosUm recurso x muitos identificadores

Page 64: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Resource Description Framework

Page 65: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Nós da Rede - URIs Sujeito é identificado através de URI. Predicado exige um URI. Objeto pode ser identificado por um URI

ou uma string.

Page 66: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Ontologias Acima do RDF Especificação formal explícita de um

conceito formado Provendo um conceito compartilhado de

um referido domínio. Ferramenta:

OWL

Page 67: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

OWL Linguagem Ontológica Surgiu na necessidade de mais

expressividade para a definição de alguns casos.

Tais casos não poderiam ser modelados a partir de utilização simples de RDF e RDF Schema devido suas limitação.

Page 68: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Exemplos RDFS não prevê que algumas classes

possam ser disjuntas entre si:Ex: As classes “Macho” e “Fêmea” deveriam

ser disjuntas, porem não há como modelar isto em RDFS.

A construções de novas classes a partir de operadores de união, intersecção e complemento não é provida por RDFSEx: A classe “Pessoa” poderia ser a união

das classes “Mulher” e “Homem”.

Page 69: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Exemplos A definição de restrições de cardinalidade,

estabelecendo quantos valores distintos uma determinada propriedade pode assumir:Ex: a classe “Pessoa” poderia ter uma restrição

na propriedade “pais” que determinasse cardinalidade dois.

RDFS não prevê a utilização de transitividade (ex: “maior que”), unicidade (ex:“é mãe de”), inversão (ex: “como” e “é comido por”).

Page 70: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Exemplos

Page 71: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Conclusões WS não é inteligência artificial WS não se trata de uma nova rede de informações,

mas sim de um projeto para aplicar conceitos inteligentes na internet atual.

Desta forma você não vai mais precisar minerar a internet em busca daquilo que você procura, ela vai passar a se comportar como um todo, e não mais como um monte de informação empilhada.

É a tecnologia de um novo passo na internet transformando a rede virtual de informações em um ambiente cada vez mais humano

(Web 3.0).

Page 72: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

DÚVIDAS?

Page 73: Disciplina: IF696 Jefferson Ramos Lucas dos Anjos jrla@cin.ufpe.br

Referências [1]. BERNERS-LEE, T. et al. The Semantic Web: A new form of Web content that is meaningful to computers will

unleash a revolution of new possibilities. Disponível em: . Acesso em: 15 ago. 2008.

[2]. ANTONIOU, G.; HARMELEN, F. A Semantic Web Primer. 2.ed. Cambridge: MIT Press, 2008. [6]. BRAY, T. et al. Extensible Markup Language (XML) 1.0 Third Edition. W3C Recommendation, fev. 2004. Disponível

em: . Acesso em: 14 out. 2008.

[3]. MANOLA, F.; MILLER, E. RDF Primer W3C Recommendation 10 February 2004. Disponível em: . Acesso em: 27 out. 2008.

[4]. LE HORS, A.; JACOBS, I. HTML 4.01 Specification. W3C Recommendation 24 December 1999. . Acesso em: 27 out. 2008.

[5]. PEMBERTON, S. et al. XHTML™ 1.0 The Extensible HyperText Markup Language (Second Edition). A Reformulation of HTML 4 in XML 1.0. W3C Recommendation 26 January 2000, revised 1 August 2002. Disponível em: . Acesso em: 28 out. 2008.

[6]. MCBRIDE, B. RDF Vocabulary Description Language 1.0: RDF Schema. W3C Recommendation 10 February 2004. Disponível em: . Acesso em: 03 nov. 2008.

[7]. MCILRAITH, S. et al. Semantic Web Services. IEEE Intelligent Systems (Special Issue on the Semantic Web). Nova Iorque v. 16, n.2, p. 46-53, mar. 2001.

[8]. MARTIN, D. et al. OWL-S: Semantic Markup for Web Services. W3C Member Submission, nov. 2004. Disponível em: . Acesso em: 14 set. 2008.