Transcript

Web Semântica

Talita Pagani | @talitapagani

Apresentação

• Talita Pagani

– Bacharel em Ciência da Computação

– Especialista em Gestão de Projetos

– Mestranda em Ciência da Computação

– Analista de Negócios e Requisitos na MSTECH

– Professora de pós-graduação na USC e SENAC

– Palestrante em eventos de desenvolvimento web

– Atuando na área de TI há 10 anos

08/04/2015 2

Agenda

• Web Semântica = Web dos Dados

• Conceitos fundamentais

• Linked Data

• RDF

• Microdados / Microdata

• Ontologias

• SPARQL

08/04/2015 3

Escopo desta palestra

O que será abordado

• Introdução à Web

Semântica

• Visão geral sobre os

principais conceitos

• Apresentar as

possibilidades de

utilização de seus

recursos associados

O que não será abordado

• Detalhes técnicos de

implementação

• Uso de ferramentas para

apoiar a construção de

ontologias

08/04/2015 4

Web Semântica = Web dos Dados

• Web tem uma forma de estruturar as

informações e vincula-lás (hiperlinks)

Link

Link

Link

Link

08/04/2015 5

Fonte: http://webdoc.sub.gwdg.de/edoc/ia/eese/schreiber/Chapter2.html

08/04/2015 6

Fonte: http://webdoc.sub.gwdg.de/edoc/ia/eese/schreiber/Chapter2.html

?

? ?

?

?

?

?

? ?

08/04/2015 7

Web Semântica = Web dos Dados

A compreensão do que está na web e dos

vínculos que as informações possuem ainda

é nossa (dos humanos).

Máquinas ainda não compreender o

significado das informações vinculadas.

08/04/2015 8

Fonte: http://webdoc.sub.gwdg.de/edoc/ia/eese/schreiber/Chapter2.html

Página da universidade Página do departamento Site do professor

Publicações científicas Artigo Conferência onde foi

publicado o artigo

08/04/2015 9

Web Semântica = Web dos Dados

Os humanos sabem como combinar as

informações.

Máquinas (ainda) não.

08/04/2015 10

Web Semântica - Definição

Web Semântica é uma forma de estender a

web como conhecemos hoje através de

padrões que permitem expressar o

relacionamento entre páginas web e seus

conteúdos, possibilitando que as pessoas e

máquinas compreendam melhor o

significado (semântica) de dados inter-

relacionados.

08/04/2015 11

Web Semântica - Definição

“A Web Semântica não é uma Web

separada, mas uma extensão da atual no

qual é dado significado bem definido às

informações, permitindo que computadores

e pessoas trabalhem melhor em conjunto”

(Tim Berners-Lee, 2001)

08/04/2015 12

Web Semântica - Definição

“A Web Semântica traz estrutura ao

conteúdo significativo de páginas web ”

(Tim Berners-Lee, 2001)

08/04/2015 13

Web Semântica = Web dos Dados

Web Semântica

Informações a serem consumidas por agentes inteligentes

Web de Hoje

Informações a serem consumidas por humanos

08/04/2015 14

Transformar isto...

08/04/2015 15

Nisto...

08/04/2015 16

08/04/2015 17

O que significa Web dos Dados?

Significa conseguir extrair e

estruturar informações

relacionadas e seus

significados.

08/04/2015 18

O que significa Web dos Dados?

• Estruturação mais orgânica das informações presentes na web

• Associação de informações pelo significado que elas representam

• Relacionamento entre informações e não apenas linkagem entre diferentes documentos

• Permitir que os computadores possam consumir melhor as informações a serem disponibilizadas e buscadas pelas pessoas

08/04/2015 19

Porque Web Semântica é a Web

dos Dados?

• Dados (mais) inteligentes

Encontrar – combinar –

agir sobre a informação

• Web de Documentos Web de Dados e

Serviços para todos

08/04/2015 20

Porque Web Semântica é a Web

dos Dados?

• Dados (mais) inteligentes

– Fazer com que os dados sejam mais fáceis

de serem encontrados, acessados e

processados por máquinas

• Expressar os dados e significados em formado

padronizado inteligível para máquinas

– Fornecer suporte ao gerenciamento e

definição descentralizada através da rede

08/04/2015 21

O que significa uma web mais

semântica

• Correlacionar dados e informações de

diferentes lugares e agregá-los

• Melhoria automatizada de conteúdo

• Identificar relação entre recursos e

vinculá-los adequadamente

08/04/2015 22

08/04/2015 24

Fonte: http://www.linkeddatatools.com/introducing-rdf

Página

Web

Página

Web

08/04/2015 26

Fonte:

https://www.iconfinder.com/icons/473635/communication_earth_global_international_inte

rnet_network_world_icon#size=512

O que não é Web Semântica

• Web Semântica é diferente de semântica

de código, embora elas estejam

relacionadas

• Inteligência Artificial

08/04/2015 27

Porque precisamos da Web

Semântica? • Geralmente precisamos combinar dados de

diferentes locais da Web, por exemplo:

– Hotel, transporte, reuniões e informações pessoais

de diferentes sites;

– Referência cruzada de bibliotecas digitais;

– Mineração de dados em bancos de dados sobre

bioquímica, genética, farmacêuticos e pacientes;

– Integrar dados de uma empresa.

08/04/2015 28

Porque precisamos da Web

Semântica? • Exemplos:

– Reserva online de passagem aérea • Sabe as suas preferências

• Constrói conhecimento baseado no seu passado

– Pode combinar a informação local com serviços remotos através da Web:

• Preferências de voos;

• Requisitos de dieta;

• Calendário.

– Um link para o meu currículo que é possível saber que é um link diferente do meu calendário

08/04/2015 29

08/04/2015 30

08/04/2015 31

08/04/2015 32

Arquitetura

08/04/2015 33 Fonte: http://www.dgz.org.br/dez07/Art_04.htm

Arquitetura

08/04/2015 34 Fonte: http://www.w3.org/2001/12/semweb-fin/w3csw

Conceitos

• Tripla

Recurso – vínculo ou relação – Recurso

Ou

Item – Propriedade – Valor

Ou

Sujeito – Predicado – Objeto/Valor

08/04/2015 35

Conceitos

• Tripla

SENAC é uma instituição de ensino

SENAC / é uma / instituição de ensino

08/04/2015 36

SENAC Instituição de ensino

É uma (is a)

Conceitos

• URI

– Unified Resource Identifier

– Fornecer nomes não ambíguos para partes

da informação

– Identificar definição de conceitos

08/04/2015 37

08/04/2015 38

SENAC Instituição de ensino

É uma (is a)

http://www.sp.senac.br

Ensino técnico http://purl.org/dc/terms/educationLevel

Ensino superior

Ensino profissionalizante

http://purl.org/dc/terms/educationLevel

http://purl.org/dc/terms/educationLevel

08/04/2015 40

Sujeito

Predicado

Objeto

Fonte: http://www.linkeddatatools.com/introducing-rdf

08/04/2015 41

http://www.linkedd

atatools.com/cloth

es#t-shirt

http://www.linkedd

atatools.com/colo

rs#white

Fonte: http://www.linkeddatatools.com/introducing-rdf

Linked Data ou Dados Linkados

• É o conceito-chave da Web Semântica

– Usar a web para relacionar dados que não

estavam previamente vinculados

• Para linkar dados, é preciso ter um formatos

padrões para estruturar as informações

• O RDF é a base para a publicação e

linkagem de dados

08/04/2015 42

RDF

• Resource Description Framework

– O modelo de descrição de recursos na Web

• Modelo de dados para vincular e

relacionar dados heterogêneos

Como Objeto A se relaciona com Objeto B

08/04/2015 43

RDF

• O formato dos dados para a

base de dados

–A forma como um modelo de

dados em grafo é escrito

08/04/2015 44

RDF <?xml version="1.0" encoding="UTF-8"?>

<rdf:RDF

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:dc="http://purl.org/dc/elements/1.1/"

xmlns:region="http://www.country-regions.fake/">

<rdf:Description rdf:about="http://en.wikipedia.org/wiki/Oxford">

<dc:title>Oxford</dc:title>

<dc:coverage>Oxfordshire</dc:coverage>

<dc:publisher>Wikipedia</dc:publisher>

<region:population>10000</region:population>

<region:principaltown rdf:resource="http://www.country-regions.fake/oxford"/>

</rdf:Description>

</rdf:RDF>

08/04/2015 45

Estrutura do RDF

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">

<rdf:Description rdf:about=“sujeito">

<predicado rdf:resource=“objeto" />

<predicado>valor literal</predicado>

<rdf:Description>

</rdf:RDF>

08/04/2015 46

Exemplo

08/04/2015 47

Exemplo

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:feature="http://www.linkeddatatools.com/clothing-features#">

<rdf:Description rdf:about="http://www.linkeddatatools.com/clothes#t-shirt">

<feature:size>12</feature:size>

<feature:color rdf:resource="http://www.linkeddatatools.com/colors#white"/>

</rdf:Description>

</rdf:RDF>

08/04/2015 48

Microdata

• Inclusão da semântica em documentos

HTML

• Formato para representação de

informações descritas com o uso de um

vocabulário específico

08/04/2015 49

Microdata

• Possibilita que mecanismos de busca e

agentes inteligentes compreendam e

relacionem as informações

08/04/2015 50

Microdata

<div itemscope itemtype="http://data-vocabulary.org/Organization">

<h1 itemprop="name">Senac Taboão da Serra</h1>

<p itemprop="tel">(11) 4245-2000</p>

<p itemprop="address" itemscope itemtype="http://data-

vocabulary.org/Address">

<span itemprop="street-address">Rua Salvador Branco de

Andrade, 182</span>,

<span itemprop="locality">Taboão da Serra</span>,

<span itemprop="region">SP</span>.

</p>

</div>

08/04/2015 51

Microdata

<div itemscope itemtype="http://data-vocabulary.org/Organization">

<h1 itemprop="name">Senac Bauru</h1>

<p itemprop="tel">(14) 3321-3199</p>

<p itemprop="address" itemscope itemtype="http://data-

vocabulary.org/Address">

<span itemprop="street-address">Av. Nações Unidas 10-22 - Centro</span>,

<span itemprop="locality">Bauru</span>,

<span itemprop="region">SP</span>.

</p>

</div>

08/04/2015 52

URI

Microdata

• Onde encontro vocabulários

controlados para microdata?

–http://schema.org/

08/04/2015 53

08/04/2015 54 http://schema.org/Book

Ontologias – a parte das regras

• Camada semântica

• Especificação formal que provê uma representação partilhável e reutilizável de conhecimento

• Conjuntos destinados a oferecer significados concisos para assuntos específicos – Vocabulário controlado para prover significado das

coisas

08/04/2015 55

Ontologias

• Vocabulário controlado para

– Conceitos

– Propriedades

– Relacionamentos entre conceitos

– Restrições sobre como os relacionamentos

podem ser utilizados

08/04/2015 56

Ontologias

Vocabulário controlado prove

interoperabilidade e cruzamento

de dados de forma adequada

entre fontes distintas de

informações. 08/04/2015 57

OWL

• Web Ontology Language

• É como um schema de banco de dados,

mas com sintaxe baseada na RDF

08/04/2015 58

OWL

• Inclui vocabulário padrão para descrever

propriedades e classes:

– Tipos de dados (integer, data, string, etc.);

– Relacionamento (subclass of, property of);

– Cardinalidade;

– Características da propriedade (simetria);

– Etc.

08/04/2015 59

OWL - Exemplo

<?xml version="1.0"?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xml:base="http://www.animals.fake/animals#">

<rdf:Description rdf:ID="animal">

<rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>

</rdf:Description>

<rdf:Description rdf:ID="horse">

<rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>

<rdfs:subClassOf rdf:resource="#animal"/>

</rdf:Description>

</rdf:RDF>

08/04/2015 60

SPARQL

• A linguagem de busca em uma base de dados em RDF

• Comandos básicos:

– PREFIX

– SELECT

– FROM

– WHERE

– ORDER BY

08/04/2015 61

SPARQL

PREFIX plant: <http://www.linkeddatatools.com/plants>

FROM <http://www.linkeddatatools.com/plantsdata/plants.rdf>

SELECT ?name WHERE {

?planttype plant:planttype ?name.

}

ORDER BY ?name

08/04/2015 62

SPARQL

PREFIX plant: <http://www.linkeddatatools.com/plants>

FROM <http://www.linkeddatatools.com/plantsdata/plants.rdf>

SELECT * WHERE {

?name plant:family "Magnoliaceae".

}

ORDER BY ?name

08/04/2015 63

Comparação:

Banco de dados Relacional x Grafo

Tipo Formato Dados Metadados Identificador Query Semântica

Relacional MS SQL,

Oracle,

MySQL, etc.

Valores

em

tabelas

Definição

de colunas

das tabelas

Chave primária SQL Não

Grafo RDF/XML RDF RFDS/OWL URI SPARQL Sim, usando

RFDS e

OWL

08/04/2015 64

Fonte: http://www.linkeddatatools.com/semantic-modeling

Áreas de utilização

• Plataformas comunitárias (redes sociais);

• Classificação de documentos e

bibliografias;

• Busca de informações na internet;

• Comércio eletrônico;

• Sistemas de recomendação;

• Intranets.

08/04/2015 65

Web Semântica + Ciência da Informação (Souza; Alvarenga, 2004)

• Projetos de novos e melhorados motores de busca;

• Construção de novas interfaces com o usuário para sistemas de informação;

• Construção automática de tesauros e vocabulários controlados;

• Indexação automática de documentos;

• Gestão do conhecimento organizacional;

• Gestão da Informação Estratégica e da Inteligência Competitiva.

08/04/2015 66

Resumindo

• Semântica Web permite “conectar os pontos” entre as informações

• O mote são dados linkados

• A forma de realizar esse vínculo é através de RDF

• Utilizamos URI para ajudar a integrar os dados estruturados na RDF

• Utilizamos as ontologias para definir restrições entre os relacionamentos de informações e procurar melhor as informações com uso da OWL

• E usamos o SPARQL para procurar as informações

08/04/2015 67

Referências

• W3C. Semantic Web. http://www.w3.org/standards/semanticweb/

• Cordova, Y. (2015). Web Semântica: a Web dos significados e relações. http://imasters.com.br/gerencia-de-ti/tendencias/web-semantica-web-dos-significados-e-relacoes/

• Souza, R. R.; Alvarenga, L. (2004). A Web Semântica e suas contribuições para a ciência da informação. Ci. Inf. [online]. 2004, vol.33, n.1 [cited 2015-04-08], pp. 132-141. http://www.scielo.br/scielo.php?pid=S0100-19652004000100016&script=sci_arttext

• Linked Data Tools. http://www.linkeddatatools.com/index.php

• Ramalho, R. A. S.; Vidotti, S. A. B. G.; Fujita, M. S. L. (2007). Web semântica: uma investigação sob o olhar da Ciência da Informação. http://www.dgz.org.br/dez07/Art_04.htm

• Pagani, T. (2010). Introdução a Microdata no HTML5. http://tableless.com.br/introducao-a-microdata-no-html5/

• Schreiber, T. (1999). Hypertext Theory. http://webdoc.sub.gwdg.de/edoc/ia/eese/schreiber/Chapter2.html

• A web semântica: quais são as aplicações atualmente? http://pt.kioskea.net/faq/6129-a-web-semantica-quais-sao-as-aplicacoes-atualmente

08/04/2015 68

Referências

• Herman, I. Questions (and Answers) on the Semantic Web. http://www.w3.org/People/Ivan/CorePresentations/SW_QA/Slides.html

• Bratt, S. Emerging Web Technologies to Watch. http://www.w3.org/2006/Talks/1023-sb-W3CTechSemWeb/#(1)

• Dimitrov, M. (2010). Introduction to the Semantic Web. http://pt.slideshare.net/marin_dimitrov/introduction-to-th

• Sheth, A. (2012). Semantic Web: introduction & overview. http://pt.slideshare.net/apsheth/semantic-web-introduction-overview

• Darnell, M. (2012). A short introduction to Semantic Web. http://pt.slideshare.net/popart/a-short-introduction-to-semantic-web-2012

• Vermeulen, J. (2008). Semantic Web Technologies for HCI. http://pt.slideshare.net/jozilla/semantic-web-technologies-for-hci-514935

• Elin, G. (2009). WTF Is the Semantic Web?. http://pt.slideshare.net/greg.elin.sunlight/wtf-is-the-semantic-web-ignite

08/04/2015 69

OBRIGADA!

PERGUNTAS?

[email protected] | twitter.com/talitapagani | talitapagani.github.io

08/04/2015 70