Upload
marcelo-fernandes
View
241
Download
1
Embed Size (px)
DESCRIPTION
Apresentação sobre Web Semântica que eu e Giselle fizemos em Maio 2012 na Infoglobo como parte da iniciativa 1+1=3
Citation preview
Web semântica 101e coisas mais
Maio 2012
Giselle Porto [email protected]
Marcelo Carvalho [email protected]
O último grito!
todos são sobre dados!como conectá-los e fazê-los ter significado para as máquinas
web semântica = web 3.0 = web dos dados
mas como chegamos até aqui?
“A web semântica é uma extensão da web atual, onde a informação possui um significado claro e bem definido, possibilitando uma melhor interação entre computadores e pessoas.”
Tim Berners-Lee, 2001
web 1.0
web 1.0relacionando documentos
o que seu computador entende:
caracteresformatação
imagens
web 1.0web 2.0
web 2.0relacionando pessoas
o que seu computador entende:
caracteresformatação
imagens
web 1.0web 2.0
web 3.0
web 3.0relacionando dados
o que seu computador entende: coisas
relacionamentos
títuloautores
preço
capa
significado para máquinas, como?
• coisas com identificadores únicos
• relacionamentos com identificadores únicos
• triplas
significado para máquinas, como?
• coisas com identificadores únicos
• relacionamentos com identificadores únicos
• triplas
significado para máquinas, como?
• coisas com identificadores únicos
• relacionamentos com identificadores únicos
• triplas
significado para máquinas, como?
• coisas com identificadores únicos
• relacionamentos com identificadores únicos
• triplas
usando triplas
artigo | tem | título.
coisarelacionamento
coisa
usando triplas
artigo | tem | título.
objetosujeitopredicado
usando triplas
artigo | tem | título.
fácil, não?!ISTO É UMA TRIPLA!
O que mudou?A web original A web semânt ica
Projeto Triplificação
• P&D de piloto objetivando enriquecimento de informações na geração automática de páginas de conteúdo e o relacionamento entre elas.
• Aplicação de conceitos da web semântica e da Linked Open Data, para geração de valor para os produtos da Infoglobo.
Plano de trabalhoO que já fizemos
• Ambiente na Amazon EC2;
• Virtuoso triple store;
• Kettle + Add-in SPARQL/RDF do GRECO NCE/UFRJ
• Definição dos vocabulários a serem utilizados (schema.org e rNews)
• Transformação e carga das triplas da extração de entidades (Zunnit);
• Obtenção das triplas relativas a estas entidades na dbPedia;
Próximos passos
• Carga das triplas da dbPedia;
• Identificação das estratégia de ligação dos dados Zunnit x dbPedia
• Ligação dos dados com Silk
• Desenvolvimento protótipo de utilização semântica para tópicos
• Desambiguação;
• Geração automática da ficha de dados.
Próximos 1+1=3
RDF
RDFsRDFa
triplas
OWL
SPARQL
Linked Data
Dublin Core
SIOC
triplestoreOntologias
Microformatos
extração de entidades
RESTtaxonomias
microdados
vocabulários
Obrigado!
Pra saber mais• W3C Semantic Web - http://www.w3.org/standards/semanticweb/
• Weaving the Web, Tim Berners-Lee - http://www.w3.org/People/Berners-Lee/Weaving/
• W3C RDF - http://www.w3.org/RDF/
• SPARQL By Example - http://www.cambridgesemantics.com/pt/semantic-university/sparql-by-example
• dbPedia Virtuoso SPARQL Query Form - http://pt.dbpedia.org/sparql
• An Uber-comparison of RDFa, Microdata and Microformats, Manu Sporny - http://manu.sporny.org/2011/uber-comparison-rdfa-md-uf/
• Schema.org – http://schema.org
• Sindice inspector - http://inspector.sindice.com/
• Virtuoso - http://virtuoso.openlinksw.com/
• Comparison of Triple Stores - http://www.bioontology.org/wiki/images/6/6a/Triple_Stores.pdf
• Practical Semantic Web and Linked Data Applications - http://www.markwatson.com/opencontent/book_java.pdf
• Jena, a Java framework for building Semantic Web applications - http://jena.apache.org/