30
1/30 Anotação Semântica de Conteúdo Web Utilizando Micro-formatos e RDFa Mestrado em Sistemas e Computação Sistemas Web e Hipermídia Prof. Celso Saibel Luiz Matos – luizmatos.eti.br Salvador, Maio de 2008

Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

Embed Size (px)

DESCRIPTION

Trata dos princípios da Web Semântica. Da definição e uso dos Microformatos e do RDFa. Apresenta um exemplo prático.

Citation preview

Page 1: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

1/30

Anotação Semântica de Conteúdo Web

Utilizando Micro-formatos e RDFa

Mestrado em Sistemas e Computação

Sistemas Web e HipermídiaProf. Celso Saibel

Luiz Matos – luizmatos.eti.br

Salvador, Maio de 2008

Page 2: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

2/30

Introdução Micro-formatos RDFa Exemplo Prático Considerações Finais Referências

AGENDA

Page 3: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

3/30

INTRODUÇÃO

Motivação

O usuário da Web, além de consumidor, torna-se produtor de informação;

Crescimento significativo da quantidade de informação disponível;

Maior complexidade no processo de obtenção de informação útil;

Estrutura dos dados interpretável somente por humanos.

Page 4: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

4/30

INTRODUÇÃO

Usuários de Internet no mundo em 2007: ~1,3 bi (STATS, 2008)

Média de crescimento entre 2000 e 2007: ~265% (STATS, 2008)

Páginas indexadas pelo Google em 2006: ~20 bi (ALLSOPP, 2007; GOOGLE SEARCH, 2008)

(STATS, 2008)

Page 5: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

5/30

Tipo de Arquivos

Quantidade

Páginas Web 6.046.425.000

Documentos / Programas

170.369.580

Web Semântica 28.021.500

Multimídia 3.404.532

TOTAL 6.248.220.612

Resultados de busca em Google.com no dia 20/02/2008. (palavra-chave: filetype:arq)

INTRODUÇÃO

Usuários da Internet no Mundo

(STATS, 2008)

Page 6: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

6/30

Objetivo Apresentar os princípios da Web Semântica e

duas alternativas para a anotação de conteúdo Web: micro-formatos e RDFa.

Metodologia Levantamento bibliográfico; Leitura e sumarização das idéias; Implementação do exemplo prático; Documentação (artigo + apresentação).

INTRODUÇÃO

Page 7: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

7/30

Web Semântica

Uma extensão da Web atual para permitir que os computadores e as pessoas cooperem entre si.

Fornece um significado bem definido ao conteúdo Web.

Permite que as máquinas interpretem a semântica dos documentos e dos dados.

Linguagens não direcionadas ao humano.

(BERNERS-LEE e outros, 2001; OSSENBRUGGEN e outros, 2002)

INTRODUÇÃO

Page 8: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

8/30

Web Semântica

Ontologias: especificação explícita de uma conceitualização.

RDF: descrição de informação/recursos na Web.

OWL: representação formal das ontologias.

GRDDL: junta informações representadas em variações de XML/XHTML em uma representação comum.

SPARQL: linguagem de consulta e um protocolo de acesso a dados.

Frameworks: desenvolvimento de aplicações. Ex.: JENA, RAP.

INTRODUÇÃO

(GRUBER, 1993; RDF, 2004; OWL, 2004; GRDDL, 2007; SPARQL, 2008; MCBRIDE, 2005; WESTPHAL e BIZER,

2004)

Page 9: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

9/30

• Anotação Semântica

“Esquema específico para geração e uso de metadados, possibilitando novos métodos de acesso a informação”.

(KIRYAKOV e outros, 2003)

“É a representação do conteúdo em uma linguagem formal e adicionada ao documento”.

(EUZENAT, 2002)

INTRODUÇÃO

Page 10: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

10/30

Aumentar o significado de um conteúdo específico;

Tornar o conteúdo interpretável por aplicações;

Entender a estrutura do documento e recuperar informação;

(EUZENAT, 2002;

KIRYAKOV e outros, 2003)

INTRODUÇÃO

• Benefícios

Page 11: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

11/30

O que são?Um conjunto de formatos de dados simples construídos sobre padrões existentes e adotados em larga escala.

(ALLSOPP, 2007)

Por quê? Resolver o problema de criação de uma semântica

de marcação para a Web atual;

Enquanto mecanismos mais complexos, como o RDF, não se estabelecem aplica-se a “lowercase semantic web”.

(MICROFORMATS, 2008; ÇELIK e KHARE, 2006)

MICRO-FORMATOS

Page 12: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

12/30

Princípios

Resolver um problema específico;

Simplicidades e Modularidade;

Primeiramente para humanos, depois para máquinas.

(MICROFORMATS, 2008; ÇELIK e KHARE, 2006)

MICRO-FORMATOS

Page 13: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

13/30

MICRO-FORMATOSPágina com XHTML puro

Página com XHTML e Micro-formatos

Page 14: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

14/30

MICRO-FORMATOS

Page 15: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

15/30

Especificações em Micro-formatos (µFs):

hCard: informações de contato de pessoas ou organizações.

hCalendar: informações de eventos (seminários, reuniões, etc).

XFN: relacionamentos entre pessoas.

hReview: revisões/avaliações na Web.

hResume: publicação de curriculum.

geo: marcação de coordenadas geográficas.

Entre outras..

MICRO-FORMATOS

Page 16: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

16/30

Estado da Arte

Micro-formatos + RDF + OWL + GRDDL; - Como em (QUINT et all, 2006), (SCHAPRANOW, 2006) e

outros.

Adoção pelos “gigantes” da computação e Internet; - “We need microformats.” (Bill Gates) - Yahoo! lança serviço específico para páginas com micro-formatos

Adoção pela indústria dos navegadores:- Plugins Firefox: Operator, Tails Export

MICRO-FORMATOS

Page 17: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

17/30

O que é?Conjunto de atributos utilizados em linguagens como o HTML e o XHTML, para expressar a estrutura dos dados em páginas Web.

Por quê?Embutir estruturas RDF em documentos XHTML válidos para descrever metadados.

Meio termo da Web Semântica ?!?Proposta W3C para os micro-formatos ?!?

RDFa

(RDFa, 2008)

Page 18: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

18/30

Sujeito: indicado pelo atributo about

Predicado: representado pelos atributos property, rel ou rev

Objeto: utilizam-se os atributos href, resource ou src

Literal: o atributo utilizado é o content junto com um atributo opcional chamado datatype ou conteúdo do elemento

RDFa

SujeitoPredicado

Objeto

Page 19: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

19/30

RDFa

http://www.luizmatos.eti.br

contact:fn Luiz Augusto Matos da Silva

contact:email

[email protected]

contact:titleAluno

contact:org

Universidade Salvador

(UNIFACS)

Page 20: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

20/30

RDFa

Estado da Arte

Nativo no XHTML 2.0 (ainda não disponível);

Sintaxe diferenciada do HTML padrão;

Estudos muito recentes;

Tema de discussão no WWW2008.

Fonte: http://www.w3c.org

Page 21: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

21/30

EXEMPLO PRÁTICO

Descrição das Etapas

Informações sobre um evento foram inseridas em duas páginas XHTML, cada uma com anotação semântica em um formato específico.

Transformação do documento XHTML em um conjunto de dados RDF.

Realização de consultas SPARQL

Page 22: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

22/30

EXEMPLO PRÁTICOPágina com o micro-formato hCalendar

Page 23: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

23/30

EXEMPLO PRÁTICOPágina com RDFa

Page 24: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

24/30

EXEMPLO PRÁTICO

Validação do XHTML

Transformação para RDF

Arquivos XSL em:

http://www.w3.org/2002/12/cal/glean-hcal

http://www-sop.inria.fr/acacia/ soft/RDFa2RDFXML.xsl

Page 25: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

25/30

EXEMPLO PRÁTICO

Conteúdo RDF obtido

Page 26: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

26/30

EXEMPLO PRÁTICO

Grafo RDF obtido

Page 27: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

27/30

EXEMPLO PRÁTICO

Consulta e Resultado SPARQL

Page 28: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

28/30

Diante do: Crescimento exponencial de dados na Web; Complexidade de manutenção e recuperação de informação

útil;

Abordamos: Os princípios básicos relacionados à proposta da Web

Semântica.

Apresentamos: Duas alternativas de anotação semântica do conteúdo Web:

micro-formatos e RDFa.

Realizamos: Um exemplo prático com anotação semântica e manipulação

de dados.

CONSIDERAÇÕES FINAIS

Page 29: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

29/30

Micro-formatos: solução mais apropriada para a marcação semântica do que as propostas oficiais;

RDFa: possui facilidades semelhantes às dos micro-formatos, porém, ainda não possui uma versão final;

A existência de qualquer mecanismo de anotação semântica é mais benéfico do que a sua total ausência.

CONSIDERAÇÕES FINAIS

Page 30: Anotação Semântica de Conteúdo Web Utilizando Microformatos e RDFa

30/30

ALLSOPP, John. Microformats: empowering your markup for web 2.0. New York: Springer, 2007.EUZENAT, Jérôme. Eight Questions About Semantic Web Annotations. IEEE Intelligent System,

vol. 17, n. 2, pp. 55-62, 2002.GRDDL. Gleaning Resource Descriptions from Dialects of Languages. Disponível em:

<http://www.w3.org/ TR/grddl/>. Acesso em: 21 fev. 2008.KIRYAKOV, Atanas; POPOV, Borislav; TERZIEV, Ivan; MANOV, Dimitar; OGNYANOFF, Damyan.

Semantic annotation, indexing and retrieval. Journal of Web Semantics, ISWC 2003 Special Issue, 1(2):671–680, 2004.

MCBRIDE, Brian. An Introduction to RDF and the Jena RDF API, 2005. Disponível em: <http://jena.sourceforge.net/tutorial/RDF_API/index.html>. Acesso em: 27 fev. 2008.

MICROFORMATS. Website dos Micro-formatos. Disponível em: <http://www.microformats.org>. Acesso em: 20 fev. 2008.

OSSENBRUGGEN, Jacco van; HARDMAN, Lynda; RUTLEDGE, Lloyd. Hypermedia and the Semantic Web: a research agenda. Journal of Digital Information, vol. 3, n. 1, 2002.

QUINT, Vincent; VATTON, Irène; FLORES, Francesc Campoy. Templates, Microformats and Structured Editing. Document Engineering 06, Out. 2006.

RDF. Resource Description Framework (RDF): Concepts and Abstract Syntax. W3C Recommendation, 2004. Disponível em: <http://www.w3.org/TR/rdf-concepts/>. Acesso em: 22 fev. 2008.

SCHAPRANOW, Matthieu-P. Microformats: a xml-document-immanent way for semantic annotationsof web contents. University of Potsdam, Hasso-Plattner-Institute for IT Systems Engineering, 2006.

SPARQL. Query Language for RDF W3C Recommendation, 2008. Disponível em: <http://www.w3.org/TR/ rdf-sparql-query/>. Acesso em: 22 fev. 2008.

THOMPSON, Henry S. Formalising the Proximate Semantics of XML Languages with UML, OWL and GRDDL. In: XTech Conference, França, 2007.

WESTPHAL, Daniel; BIZER, Chris. Introduction to RAP, 2004. Disponível em: <http://www4.wiwiss.fu-berlin.de/bizer/rdfapi/tutorial/introductionToRAP.htm>. Acesso em: 20 fev. 2008.

ÇELIK, Tantek; KHARE, Rohit. Microformats: a pragmatic path to the semantic web. WWW 2006, Maio, 2006.

REFERÊNCIAS