75
da Web de Documentos para a Web de Dados Bernadette Farias Lóscio [email protected] Linked Data:

Linked Data: da Web de Documentos para a Web de Dados

Embed Size (px)

DESCRIPTION

 

Citation preview

da Web de Documentos para a Web de Dados!

Bernadette Farias Lóscio [email protected]

Linked Data:!

!!

Era uma vez …!

2

motivação

Vários dados que viviam isolados em ilhas de informação.

3

<....> <....> <....> <....>

<....> <....> <....> <....>

<....> <....> <....> <....>

Os dados eram guardados em arquivos e tinham muitos problemas de redundância entre si.

motivação

Um belo dia, para resolver esses problemas, os dados resolveram se organizar em bancos de dados.

4

Disciplinas! Prof!

Cursos!

motivação

Médico! Paciente!

Enferm.!

Livro ! Editora !

Autor !

Com o passar do tempo, os bancos de dados foram se organizando em grupos e daí surgiram os

sistemas de bancos de dados distribuídos e as federações de bancos de dados.

5

motivação

E os anos foram passando…

6

… até que um dia, Tim Berners Lee teve uma ideia brilhante e criou a World Wide Web.

motivação

7

O volume de dados digitais cresceu imensamente e a Web tornou-se um espaço global de

informações.

<....> <....> <....> <....>

<....> <....> <....> <....>

<....> <....> <....> <....>

<....> <....> <....> <....>

<....> <....> <....> <....>

<....> <....> <....> <....>

<....> <....> <....> <....>

<....> <....> <....> <....>

Páginas html!

WWW!

motivação

Hoje, aos vinte e poucos anos, a Web já não é mais a mesma…

Além de ser um espaço global de informações, ela está se transformando em uma Web de dados.

8

<....> <....> <....> <....>

<....> <....> <....> <....>

<....> <....> <....> <....>

WWW!

motivação

Páginas html!

xml!rdf!

microformatos!

9

motivação

Bancos de dados podem ser publicados na Web

Disciplinas! Prof!

Cursos!

nem todos os dados podem ser encontrados por meio dos mecanismos de busca não é possível especificar consultas complexas sobre os dados assim como no tempo dos arquivos, os dados na Web ainda vivem isolados uns dos outros :-(

10

motivação

Porém…

11

motivação

Dados podem ser combinados por meio das Web APIs e dos mashups

Web API!

mashup!

Web API! Web API!

Onde encontrar Web APIs? http://www.programmableweb.com

as APIs oferecem interfaces proprietárias mashups são baseados em um conjunto fixo de fontes de dados não se pode “linkar” dados de APIs diferentes 12

motivação

Porém…

O que fazer para transformar a Web em um verdadeiro espaço global de dados?

13

motivação

aumentar a estrutura do conteúdo da Web? prover significado para os dados? estabelecer padrões para a publicação de dados e criação de links entre eles?

Então, mais uma vez, Tim Berners Lee teve outra ideia revolucionária: a Web Semântica!

14

web semântica

“The Semantic Web is the extension of the World Wide Web that enables people to share content beyond the boundaries of applications and websites. It has been

described in rather different ways: as a utopic vision, as a web of data, or merely as a natural paradigm shift in our

daily use of the Web.”

semanticweb.org

Na Web Semântica, os dados estão mais ricos, são associados a vocabulários e possuem um

significado.

15

web semântica

Assim, os dados não precisam mais viver isolados e podem ser compartilhados por diversas

aplicações :-)

Os dados, agora chamados de recursos, são únicos e possuem a sua própria identificação na Web!

16

web semântica

A Web Semântica é uma ideia muito interessante, mas como os recursos são representados?

17

web semântica

Como representar os dados dos bds ou das páginas html para que eles possam ser compartilhados na

Web?

id! title! author!Mar Morto!01! Jorge Amado!

year!

02!03!04!05!

A Estrada do Mar!1936! romance!

genre!

Jorge Amado! 1938! poem!O mundo da Paz! Jorge Amado! trips!1951!

Rachel de Queiroz! 1930! romance!Tieta do Agreste! Jorge Amado! 1977! romance!O Quinze!

Literatura brasileira

rdf – resource description framework

Os dados podem ser distribuídos em:

Linhas Colunas Células

rdf – resource description framework

Mar Morto!01! Jorge Amado!04!

1936! romance!Rachel de Queiroz!1930! romance!O Quinze!

02!03!

A Estrada do Mar!Jorge Amado! 1938! poem!O mundo da Paz! Jorge Amado! trips!1951!

05! Tieta do Agreste! Jorge Amado! 1977! romance!

1!2!3!

Distribuição por linha

rdf – resource description framework

eita... Cadê o esquema? Quem é o quê?

Mar Morto!01! Jorge Amado!04!

1936! romance!O Quinze! Rachel de Queiroz! 1930! romance!

02!03!

A Estrada do Mar! Jorge Amado! 1938! poem!O mundo da Paz! Jorge Amado! trips!1951!

05! Tieta do Agreste! Jorge Amado! 1977! romance!

1!2!

3!title!

rdf – resource description framework

year!1936! romance!

genre!

1938! poem!trips!1951!

1930! romance!1977! romance!

author!Jorge Amado!Jorge Amado!Jorge Amado!Rachel de Queiroz!

Jorge Amado!

title!Mar Morto!A Estrada do Mar!O mundo da Paz!

Tieta do Agreste!O Quinze!

1! 2!

3!

Distribuição por coluna

rdf – resource description framework

... e agora??? Quem é quem?

year!1936! romance!

genre!

1938! poem!trips!1951!

1930! romance!1977! romance!

author !Jorge Amado!Jorge Amado!Jorge Amado!Rachel de Queiroz!Jorge Amado!

title!Mar Morto!A Estrada do Mar!O mundo da Paz!

Tieta do Agreste!O Quinze!

Id!1!

2!

3!

rdf – resource description framework

O mundo da Paz!title!

row 3!Jorge Amado!author!

row 1!

1977!year!

row 5!genre!romance!row 1!

genre!poem!row 2!

1!

2!

3!

Distribuição por célula

rdf – resource description framework

poxa... Complicou mais ainda :-( Como eu vou saber “quem é o quê” e

“quem é quem” ?

rdf – resource description framework

Quer dizer então que eu preciso ter uma maneira global para referenciar

As linhas

As colunas

E os valores

sujeito !

predicado!

objeto!

rdf – resource description framework

27

rdf – resource description framework

28

http://www.w3.org/RDF/

“RDF is a standard model for data interchange on the Web. RDF has features that facilitate data merging even if the underlying schemas differ, and it specifically supports the evolution of schemas over time without requiring all the

data consumers to be changed.”

rdf – resource description framework

subject! predicate!Row 5!

object!

Row 2!romance!

title! A Estrada do Mar!Row 2! year! 1938!

author! Rachel de Queiroz!

Row 3! genre! trips!Row 4!

genre!

Nós precisamos de triplas!

rdf – resource description framework

subject! predicate!Jorge Amado!

object!

Zelia Gattai!Mar Morto!

Married! Jorge Amado!Jorge Amado! Lived in! Salvador!

Is in! Bahia!Bahia! Part of! Brazil !Salvador!

Wrote!

Ceará! Part of! Brazil !Jorge Amado! Tieta do Agreste!Wrote!

Várias triplas podem fazer referência a uma mesma entidade!

rdf – resource description framework

Triplas podem ser representadas por meio de grafos

Zelia Gattai!

Mar Morto!

married!

Jorge Amado!livedIn !

Salvador!isIn!

Bahia!partOf!

Brazil!wrote!

Ceará!partOf!

Tieta do Agreste!

wrote!

rdf – resource description framework

E tem mais... Triplas de fontes diferentes podem ser

combinadas em um mesmo grafo!

rdf – resource description framework

Zelia Gattai!

Mar Morto!

married!

Jorge Amado!livedIn!

Salvador!isIn!

Bahia!partOf!

Brazil !wrote!

Ceará!partOf!

Tieta do Agreste!

wrote!

fonte 1!

rdf – resource description framework

Mar Morto!

Jorge Amado!

wrote!

Tieta do Agreste!

O Mundo da Paz!

A Estrela do Mar!

Seara Vermelha!

Tocaia Grande!

Capitães da Areia!

wrote!wrote!

wrote!

fonte 2!

rdf – resource description framework

Bahia!

Brazil !

partOf!Paraíba!

Pernambuco!

Alagoas!

Maranhão!

Ceará!

Piauí!

partOf!partOf!

partOf!

Rio Grande do Norte!

partOf!

fonte 3!

rdf – resource description framework

Zelia Gattai!

married!

Jorge Amado! livedIn!

Salvador!isIn!

partOf!

wrote!

Mar Morto!

Bahia!

Brazil !partOf!

Tieta do Agreste!

O Mundo da Paz!

A Estrela do Mar!Seara Vermelha!

Tocaia Grande!Capitães da Areia! Paraíba!

Pernambuco!

Alagoas!

Maranhão!

Ceará!

Piauí!

Rio Grande do Norte!

wrote!

wrote!

wrote !partOf!

partOf!

partOf!

partOf!

Grafo combinado!

rdf – resource description framework

blz :-) Mas como os grafos são combinados?

Como saber que os nós em conjuntos de dados diferentes são correspondentes?

Jorge Amado! Jorge Amado!

fonte 1 ! fonte 2!?!=!

rdf – resource description framework

URIs (Uniform Resource Identifiers) podem ser usados para identificação única de

recursos.

URI é qualquer identificador único (ex: cpf, isbn, URL).

rdf – resource description framework

Jorge Amado? Ahhhh todo mundo conhece!

autor! fundação!

rdf – resource description framework

Por meio das URIs cada recurso pode ter um identificador global e único na Web!

Assim uma coisa é uma coisa e outra coisa é outra coisa ;-)

www.websemantica.com.br/exemplosLit#JorgeAmado!www.websemantica.com.br/exemplosFound#JorgeAmado!

rdf – resource description framework

Finalmente aplicações Web podem fazer referência a mesma “coisa”!

Basta referenciar o mesmo URI!

www.websemantica.com.br/exemplosLit#JorgeAmado!

Aplicação 1!

Aplicação 2!

Aplicação n !

web semântica

hmmmmm.... mas esse URI é muito grande... pode ficar difícil de manipular :-( Será que tem como simplificar?

Sim! Por meio dos namespaces!

namespace: identifier!

rdf – resource description framework

subject! predicate!lit : Jorge Amado!

object!lit : wrote!

lit : Jorge Amado! lit : wrote!

lit : Jorge Amado! lit : wrote!

lit : Jorge Amado! lit : wrote!lit : Jorge Amado! lit : wrote!

lit : Mar Morto!lit : Tieta do Agreste!

lit : Capitães da Areia!

lit :O Mundo da Paz!

lit : Seara Vermelha!

Livros de Jorge Amado com qnames

www.websemantica.com.br/exemplosLit#!

rdf – resource description framework

subject! predicate!geo: Bahia!

object!geo: Brazil!

geo: Piauí!

geo: Ceará!

geo: Maranhão!

geo: Paraíba!

geo: partOf!

geo: partOf!

geo: partOf!

geo: partOf!

geo: partOf!

geo: Brazil!

geo: Brazil!

geo: Brazil!

geo: Brazil!

Informações geográficas com qnames

www.websemanticaUFC.com.br/exemplosGeo#!

rdf – resource description framework

subject ! predicate! object!lit : Jorge Amado! lit : wrote!lit : Jorge Amado! lit : wrote!

lit : Mar Morto!lit : Tieta do Agreste!

bio : Zélia Gattai! bio : married! lit : Jorge Amado!

bio : Zélia Gattai! bio : livedWith! lit : Jorge Amado!lit : Jorge Amado! bio : livedIn! geo: Slavador!geo : Salvador! geo : isIn! geo: Bahia!geo: Bahia! geo: Brazil!geo: partOf!

geo: Ceará! geo: partOf! geo: Brazil!

triplas com namespaces variados

rdf – resource description framework

recurso RDF URI

46

resumindo...

tá certo… mas e o linked data?

Onde ele entra nessa história toda?

47

linked data

Conjunto de melhores práticas para a publicação de dados estruturados na Web.

48

linked data

“Linked Data is about using the Web to connect related data that wasn't previously linked, or

using the Web to lower the barriers to linking data currently linked using other methods.”

linkeddata.org

”A term used to describe a recommended best practice for exposing, sharing, and connecting pieces of data, information, and knowledge on the Semantic

Web using URIs and RDF.” wikipedia

49

Link RDF!

linked data

RDF! RDF! RDF!

RDF!RDF!RDF!

RDF! RDF!Link RDF! Link RDF!

Link RDF!

Link RDF!

Usar URIs como nomes para recursos Usar URIs HTTP para que as pessoas possam encontrar esses nomes Quando alguém procurar por uma URI, através dessa, providenciar informações úteis, por meio de RDFs Incluir sentenças RDF que ligam para outras URIs de forma que eles possam descobrir mais recursos.

50

princípios do linked data

1!2!

3!

4!

51

linked data

pd:cygr! foaf:Person!

Richard Cyganiak !

dbpedia:Berlin!

rdf: type!

foaf: name !

foaf: based_near !

dbpedia:Berlin = http://dbpedia.org/resource/Berlin!

dados linkados

52

linked data

pd:cygr!foaf:Person!

Richard Cyganiak !

3.405.259!dbpedia:Berlin!

dp:Cities_in_Germany!

rdf: type!

foaf: name !

foaf: based_near ! dp:population!

skos:subject!

dados linkados

53

linked data

pd:cygr!foaf:Person!

Richard Cyganiak !

3.405.259!dbpedia:Berlin!

dp:Cities_in_Germany!

rdf: type!

foaf: name !

foaf: based_near ! dp:population!

skos:subject!dbpedia:Hamburg!

dbpedia:Muenchen!

skos:subject!

skos:subject!

dados linkados

Finalmente, chegamos ao espaço global de dados, a Web de Dados, onde:

54

web de dados

qualquer pessoa pode publicar seus dados na Web de Dados itens de dados são conectados por links aplicações podem descobrir novas fontes navegando pelos links os dados são auto descritivos

poxa.... E isso já é realidade? Já existem dados na Web de Dados?

55

web de dados

Sim!

56

linking open data

“The goal of the W3C SWEO Linking Open Data community project is to extend the Web

with a data commons by publishing various open data sets as RDF on the Web and by setting RDF

links between data items from different data sources.”

http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

57

linking open data

É importante saber que...

58

os nós são conjuntos de dados publicados em formato Linked Data. o tamanho dos círculos corresponde ao número de triplas em cada conjunto de dados. as setas indicam a existência de pelo menos 50 ligações entre dois conjuntos de dados. uma ligação (link) é uma tripla RDF, onde sujeito e objeto estão em namespaces de conjuntos de dados diferentes.

linking open data

Dicas importantes: Usar URIs HTTP para tudo. Defina seus URIs em um namespace HTTP que fique sob seu controle. Usar URIs curtos e que possam ser facilmente lembrados

59

Existem várias outras regras para a escolha de uma boa URI em http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/

publicando dados na nuvem do LOP

Dicas importantes:

Dê preferência aos vocabulários conhecidos. Friend-of-a-Friend (FOAF): para descrever pessoas. Semantically-Interlinked Online Communities (SIOC): vocabulários para representar comunidades online. Description of a Project (DOAP): vocabulários para descrever projetos. Music Ontology: providencia termos para descrever artistas, albuns e trilhas sonoras. Creative Commons (CC): descrever termos de licença.

60

publicando dados na nuvem do LOP

61

“DBpedia is a community effort to extract structured information from Wikipedia and to make this information

available on the Web. DBpedia allows you to ask sophisticated queries against Wikipedia, and to link other

data sets on the Web to Wikipedia data.”

http://dbpedia.org

publicando dados na nuvem do LOP

BBC Music beta site. http://www.bbc.co.uk

62

aplicações

63

http://en.wikipedia.org/wiki/Amy_Winehouse

aplicações

64

http://musicbrainz.org/artist/dfe9a7c4-8cf2-47f4-9dcb-d233c2b86ec3

aplicações

65

http://www.geonames.org

aplicações

66

aplicações

67

aplicações

68

http://sig.ma/

aplicações

69

aplicações

70

aplicações

Agora é com vocês ;-)

Que tal uma sugestão de aplicação?

71

aplicações

72

A Web de Dados é mais um passo na evolução da Web e no gerenciamento de dados.

Soluções existentes podem ser adaptadas e novas

soluções precisam ser desenvolvidas.

O que será que vai acontecer daqui pra frente? Ideias? Sugestões?

considerações finais

73

!…e ficamos por aqui!!

Este não é o fim, mas apenas o começo!!

!Obrigada!!

BIZER, C., HEATH, T., LEE, T. B., Linked data - the story so far. International Journal on Semantic Web and Information Systems (IJSWIS), 2009.

BRIN, S., PAGE, L., The Anatomy of a Large-Scale Hypertextual Web Search Engine, 1998. Computer Networks and ISDN Systems, 30(1-7):107-117.

CAMPOS M. L. (2010): GT-LinkedDataBR – Exposição, compartilhamento e conexão de recursos de dados abertos na Web (Linked Open Data). Disponível em http://www.rnp.br/pd/gts2010-2011/gt_linkeddatabr.html

HEATH, T., BIZER, C., Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool, 2011.

74

referências

JACOBS, I., WALSH, N., Architecture of the World Wide Web, Volume One, 2004. http://www.w3.org/TR/webarch/.

KLYNE, G., CARROL, J. J., Resource Description Framework (RDF): Concepts and Abstract Syntax - W3C Recommendation, 2004. http://www.w3.org/TR/rdf-concepts/.

LEE, T. B., Linked Data - Design Issues, 2006. http://www.w3.org/DesignIssues/LinkedData.html

NOWACK, B., PAGGR: Linked Data widgets and dashboards, Web Semantics: Science, Services and Agents on the World Wide Web, Volume 7, Issue 4, Semantic Web challenge 2008, December 2009, Pages 272-277, ISSN 1570-8268

http://racionalp2p.wordpress.com/2011/04/06/tim-berners-lee-a-web-esta-sendo-ameacada-de-varias-formas/

75

referências