DADOS ABERTOS INTERLIGADOS CIN/UFPE José Luiz Correia Neto

Preview:

Citation preview

DADOS ABERTOS INTERLIGADOS

CIN/UFPEJosé Luiz Correia Neto

WEB ATUAL

Internet Contemporânea:

constante processo de evolução

Hipertexto

Documentos de diversas áreas

do conhecimento

Objetivos de apresentaçãohttp://www.w3c.br/cursos/dados-abertos/curso/Parte-1-Modulo-4-Linked%20Data.pdf

WEB ATUAL

A Web atual pode ser classificada como sintática

e o processo de interpretação dos conteúdos

disponibilizados fica geralmente a cargo dos

usuários.

(CUNHA, LÓSCIO, & SOUZA)

PROBLEMA E SOLUÇÃO

Dados na Web lidos ou compreendidos por

humanos e não por agentes de software

Processar a semântica

Atribuição de significado:Elementos

Dados

Expressões

PROBLEMA E SOLUÇÃO

Relação de significância

entre os conteúdos

publicados

Perceptível pelos usuários e

agentes de software

Nova visão da Web: Web

Semântica

WEB SEMÂNTICA

Web Semântica:

extensão da Web

Facilita a interpretação e

integração dos dados

LINKED DATA

Linked Data: conjunto de boas

práticas

“Web de Dados”

HTTP e URI

A Web de Dados cria inúmeras

oportunidades para a

integração semântica

PADRÕES

URIs

Usadas para identificar

objetos e conceitos

O dereferenciamento

resulta uma descrição RDF

PADRÕES

HTTP

Protocolo responsável pelo

tratamento de pedidos e

respostas entre cliente e

servidor na Web

PADRÕES

RDF

Linguagem para

representar informação na

Internet.

Componentes:SujeitoPredicadoObjeto

PADRÕES

SPARQL

Linguagem de consulta

padrão para recuperação

de informações contidas

em grafos RDF

Estrutura:

Select-From-Where

WEB DE DOCUMENTOSVS. WEB DE DADOS

WEB DE DOCUMENTOS

Navegadores HTML

Hiperlinks

WEB DE DADOS

Navegadores RDF

Links RDF

WEB DE DOCUMENTOSVS. WEB DE DADOS

WEB DE DOCUMENTOS

Mecanismo de identificação

global único (URIs)

Mecanismo de acesso

universal (HTTP)

Formato de representação de

conteúdo (HTML)

WEB DE DADOS

Mecanismo de identificação

global único (URIs)

Mecanismo de acesso universal

(HTTP)

Modelo padrão para

representação de dados (RDF)

Linguagem de consulta (SPARQL)

PRINCÍPIOS LINKED DATA

Princípios básicos:

1. Usar URIs como nome para recursos

2. Usar URIs HTTP para que as pessoas possam

encontrar esses nomes

3. Quando alguém procurar por uma URI, garantir

que informações úteis possam ser obtidas por

meio dessa URI

4. Incluir links para outras URIs para que outros

recursos possam ser descobertosTim Berners-Lee

LOD

Fundado em 2007

Apoiado pelo W3C

Semantic Web Education

and Outreach Group

Objetivo: identificar

conjuntos de dados sob

licenças abertas e

convertê-lo para RDF

LOD

Fase inicial: pesquisadores

e desenvolvedores de

laboratórios universitários e

empresas de pequeno

porte

Requisitos: conjunto de

dados de acordo com os

princípios do Linked Data e

interligação aos conjuntos

de dados existentes

Maio de 2007

Visão geral de conjuntos de dados publicados e seus relacionamentos no contexto do projeto Linking Open Data

Mais de 500 milhões de triplas RDF

Cerca de 120 mil links RDF entre fontes de dados

Outubro de 2007

Novembro de 2007

Novembro de 2007

Fevereiro de 2008

Março de 2008

Setembro de 2008

Março de 2009

Março de 2009

Julho de 2009

Setembro de 2010

Setembro de 2011

Agosto de 2014

5 ESTRELAS DOS DADOS ABERTOS Segundo Berners-Lee, “Dados Abertos

Interligados são Dados Linkados publicados

por meio de licenças abertas”

Dados Interligados não são necessariamente

abertos

Dado Aberto Interligado só é assim

considerado se for aberto

5 ESTRELAS DOS DADOS ABERTOS

Disponível na Internet (em qualquer formato. Por exemplo: PDF), desde que com licença aberta, para que seja considerado Dado Aberto

Disponível na Internet de maneira estruturada (em um arquivo Excel com extensão XLS)

Disponível na Internet, de maneira estruturada e em formato não proprietário (CSV em vez de Excel)

Seguindo todas as regras acima, mas dentro dos padrões estabelecidos pelo W3C (RDF e SPARQL): usar URL para identificar coisas e propriedades, de forma que as pessoas possam direcionar para suas publicações

Todas as regras acima, mais: vincular seus dados aos de outras pessoas, de forma a fornecer um contexto.

CONSUMO DE DADOS INTERLIGADOS Aumento de dados disponíveis de acordo com os princípios

Linked Data.

Aplicações:

Browsers

Motores de Busca

Aplicações para domínios específicos

CONSUMO DE DADOS INTERLIGADOS Browser Linked Data - Lodlive

Permite alimentá-lo com

uma URI e de forma

interativa, seguir os links

associados. URIs podem vir

de DBedia, Freebase, entre

outras.

Browser Lodlive

CONSUMO DE DADOS INTERLIGADOS

Motores de Busca - Sindice

Coleta de dados na web de

muitas maneiras e oferece

busca e consulta através dos

dados.

CONSUMO DE DADOS INTERLIGADOS

Aplicações para domínios específicos - DBPedia

Provê a visualização de um

mapa com informações

oriundas das entidades

DBpedia e informações de

outras bases de conhecimento

DESAFIOS

Criar meios eficientes que viabilizem o uso do grande

volume de dados

Informação útil, específica e relevante

Linked Data é a chave para a transformação da Web

Os princípios do Linked Data devem ser ainda mais

discutidos

REFERÊNCIAS

CUNHA, D. R. B.; SOUZA, D. Y. ; LOSCIO, B. F. (2011) Linked Data: da Web de

Documentos para a Web de Dados. V Escola Regional de Informática Ceará,

Maranhão, Piauí: Livro texto dos minicursos, 07 e 08 de novembro de 2011. [livro

eletrônico]

Linked Data (http://www.w3.org/DesignIssues/LinkedData.html)

Publicação de Dados Governamentais no Padrão Linked Data (http://

www.w3c.br/cursos/dados-abertos/curso/Parte-1-Modulo-4-Linked%20Data.pdf)

LiAM: Linked Archival Metadata: Semantic Web browsers. (

http://sites.tufts.edu/liam/2014/03/22/browsers/)

REFERÊNCIAS

Lodlive (http://en.lodlive.it/)

Sindice (http://sindice.com/)

DBPedia Applications (http://wiki.dbpedia.org/Applications)

As 5 Estrelas dos Dados Abertos (platform.od4d.org/articles/filter/about/CSV?

locale=pt)