Web Semântica 1+1=3

Preview:

DESCRIPTION

Apresentação sobre Web Semântica que eu e Giselle fizemos em Maio 2012 na Infoglobo como parte da iniciativa 1+1=3

Citation preview

Web semântica 101e coisas mais

Maio 2012

Giselle Porto Maiagiselle.maia@infoglobo.com.br

Marcelo Carvalho Fernandesmarcelo.fernandes@infoglobo.com.br

O último grito!

todos são sobre dados!como conectá-los e fazê-los ter significado para as máquinas

web semântica = web 3.0 = web dos dados

mas como chegamos até aqui?

“A web semântica é uma extensão da web atual, onde a informação possui um significado claro e bem definido, possibilitando uma melhor interação entre computadores e pessoas.”

Tim Berners-Lee, 2001

web 1.0

web 1.0relacionando documentos

o que seu computador entende:

caracteresformatação

imagens

web 1.0web 2.0

web 2.0relacionando pessoas

o que seu computador entende:

caracteresformatação

imagens

web 1.0web 2.0

web 3.0

web 3.0relacionando dados

o que seu computador entende: coisas

relacionamentos

títuloautores

preço

capa

significado para máquinas, como?

• coisas com identificadores únicos

• relacionamentos com identificadores únicos

• triplas

significado para máquinas, como?

• coisas com identificadores únicos

• relacionamentos com identificadores únicos

• triplas

significado para máquinas, como?

• coisas com identificadores únicos

• relacionamentos com identificadores únicos

• triplas

significado para máquinas, como?

• coisas com identificadores únicos

• relacionamentos com identificadores únicos

• triplas

usando triplas

artigo | tem | título.

coisarelacionamento

coisa

usando triplas

artigo | tem | título.

objetosujeitopredicado

usando triplas

artigo | tem | título.

fácil, não?!ISTO É UMA TRIPLA!

O que mudou?A web original A web semânt ica

Projeto Triplificação

• P&D de piloto objetivando enriquecimento de informações na geração automática de páginas de conteúdo e o relacionamento entre elas.

• Aplicação de conceitos da web semântica e da Linked Open Data, para geração de valor para os produtos da Infoglobo.

Plano de trabalhoO que já fizemos

• Ambiente na Amazon EC2;

• Virtuoso triple store;

• Kettle + Add-in SPARQL/RDF do GRECO NCE/UFRJ

• Definição dos vocabulários a serem utilizados (schema.org e rNews)

• Transformação e carga das triplas da extração de entidades (Zunnit);

• Obtenção das triplas relativas a estas entidades na dbPedia;

Próximos passos

• Carga das triplas da dbPedia;

• Identificação das estratégia de ligação dos dados Zunnit x dbPedia

• Ligação dos dados com Silk

• Desenvolvimento protótipo de utilização semântica para tópicos

• Desambiguação;

• Geração automática da ficha de dados.

Próximos 1+1=3

RDF

RDFsRDFa

triplas

OWL

SPARQL

Linked Data

Dublin Core

SIOC

triplestoreOntologias

Microformatos

extração de entidades

RESTtaxonomias

microdados

vocabulários

Obrigado!

Pra saber mais• W3C Semantic Web - http://www.w3.org/standards/semanticweb/

• Weaving the Web, Tim Berners-Lee - http://www.w3.org/People/Berners-Lee/Weaving/

• W3C RDF - http://www.w3.org/RDF/

• SPARQL By Example - http://www.cambridgesemantics.com/pt/semantic-university/sparql-by-example

• dbPedia Virtuoso SPARQL Query Form - http://pt.dbpedia.org/sparql

• An Uber-comparison of RDFa, Microdata and Microformats, Manu Sporny - http://manu.sporny.org/2011/uber-comparison-rdfa-md-uf/

• Schema.org – http://schema.org

• Sindice inspector - http://inspector.sindice.com/

• Virtuoso - http://virtuoso.openlinksw.com/

• Comparison of Triple Stores - http://www.bioontology.org/wiki/images/6/6a/Triple_Stores.pdf

• Practical Semantic Web and Linked Data Applications - http://www.markwatson.com/opencontent/book_java.pdf

• Jena, a Java framework for building Semantic Web applications - http://jena.apache.org/

Recommended