84
Um papo sobre Web Semântica Eduardo Nicola F. Zagari zagari em abril com br NIH - Núcleo de Engenharia e Pesquisa Abril Digital São Paulo, 09/11/2009 Monday, November 9, 2009

Papo Sobre Web Semântica

Embed Size (px)

DESCRIPTION

A Web Semântica vem como "carro chefe" da terceira grande onda da Web, que traz também consigo novidades como Cloud Computing, Ubiquidade e RTWApps. Esta palestra mostra o esforço tecnológico que vem sendo feito no desenvolvimento da plataforma para a mesma, as possibilidades de aplicações que se abririam, as dificuldades de sua implantação e os próximo passo em sua direção: um movimento social "open-data".

Citation preview

Page 1: Papo Sobre Web Semântica

Um papo sobreWeb Semântica

Eduardo Nicola F. Zagarizagari em abril com br

NIH - Núcleo de Engenharia e PesquisaAbril Digital

São Paulo, 09/11/2009

Monday, November 9, 2009

Page 2: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Sumário

Apresentação do NIHIntroduçãoAbordagensAplicaçõesTecnologias para Anotação de Conteúdo: RDF, Microformatos, RDFa, OWL, SPARQLNLP e Extração de EntidadesConsiderações Finais

Monday, November 9, 2009

Page 3: Papo Sobre Web Semântica

Eduardo Nicola Zagari

NIH• Monitorar de forma sistemática novas

técnicas, linguagens, interfaces, arcabouços e sistemas computacionais utilizados na Web que possam ser implantados em nossos produtos;

• Desenvolver Novos Serviços de Inteligência Computacional, de Infraestrutura de Backend e de Interfaces Visuais para nossos produtos;

• Investigar novas soluções algorítmicas, técnicas e de interfaces para problemas das novas features, proposta, prototipação e avaliação das mesmas e

• Disseminar dentro da ABD os conhecimentos adquiridos na área, através de Tech Talks e/ou treinamentos.

Monday, November 9, 2009

Page 4: Papo Sobre Web Semântica

Eduardo Nicola Zagari

NIHBibliotecas compartilhadas por serviços (Runner, HTMLParsing, Instrumentation, Stats etc)

Flash Cassino, Veja Lua, Handler-Uploader de Imagens

Classificador Automático

Super Robot

NER, Visualização de Grandes Massas de Dados

Monday, November 9, 2009

Page 5: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Definição na Wikipedia:

a term used to describe persistent social, corporate or institutional culture that avoids using or buying already existing products, research or knowledge because of its different origins. It is normally used in a pejorative sense.

a term and label developed in the computer industry referring to organizations incapable of using technology from other organizations.

NIH

Monday, November 9, 2009

Page 6: Papo Sobre Web Semântica

Eduardo Nicola Zagari

IntroduçãoNo começo, existia a Web e as pessoas gostavam de surfar por suas páginas, trocar e-mails, fazer programas para suas empresas... A vida era boa... Só que um dia, as “pessoas” começaram a gostar tanto dela, que resolveram usar seu conteúdo de novas formas... Mas a Web foi feita para compartilhar documentos e não os dados internos de suas páginas... E estas “pessoas” ficaram tristes...Aí surge a Web Semântica... e “elas” voltarão a ser felizes em breve! :-)

Monday, November 9, 2009

Page 7: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web Semântica

Monday, November 9, 2009

Page 8: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

Monday, November 9, 2009

Page 9: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

uma plataforma tecnológica de metadados da Web

Monday, November 9, 2009

Page 10: Papo Sobre Web Semântica

Eduardo Nicola Zagari

(Plataforma Tecnológica)

Computadores devem estar aptos a saber:

o que uma determinada requisição significa;

sobre o que são dados e documentos particulares;

o relacionamento entre tudo isto.

Monday, November 9, 2009

Page 11: Papo Sobre Web Semântica

Eduardo Nicola Zagari

(Evolução das Aplicações)

Processamento de Dados

Processamento de Informação

Processamento de Conhecimento

Processamento Inteligente

informação

dados

conhecimento

inteligência

Monday, November 9, 2009

Page 12: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web Semântica

Monday, November 9, 2009

Page 13: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

Monday, November 9, 2009

Page 14: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

uma plataforma tecnológica de metadados da Web

Monday, November 9, 2009

Page 15: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

uma plataforma tecnológica de metadados da Webum movimento social de “abertura de dados” (open-source data)

Monday, November 9, 2009

Page 16: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

uma plataforma tecnológica de metadados da Webum movimento social de “abertura de dados” (open-source data)uma nova encarnação da Inteligência Artificial clássica

Monday, November 9, 2009

Page 17: Papo Sobre Web Semântica

Eduardo Nicola Zagari

(Web Semântica e Inteligência Artificial)

Segundo Sir Tim Beners-Lee:

mas...

Habilidade da máquina de resolver problemas ‘bem definidos’, realizando operações ‘bem definidas’ em dados existentes ‘bem definidos’

Monday, November 9, 2009

Page 18: Papo Sobre Web Semântica

Eduardo Nicola Zagari

(Inteligência Artificial)Alan Turing, 1956

IA Forte e IA Fraca

Sistemas Especialistas, Redes Neuronais, Lógica Fuzzy

Inverno da IA - Aprendizado de Máquinas, Robótica, Visão Computacional

Algoritmos Genéticos, Computação Bio-inspirada

Monday, November 9, 2009

Page 19: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web Semântica

Um passo além da onda iniciada em 2004, a Web Colaborativa (Web 2.0)

Web 3.0 ?Web Semântica, Cloud Computing, Ubiqüidade, WRTAp

Monday, November 9, 2009

Page 20: Papo Sobre Web Semântica

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

Monday, November 9, 2009

Page 21: Papo Sobre Web Semântica

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

Monday, November 9, 2009

Page 22: Papo Sobre Web Semântica

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

Monday, November 9, 2009

Page 23: Papo Sobre Web Semântica

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

Monday, November 9, 2009

Page 24: Papo Sobre Web Semântica

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

Monday, November 9, 2009

Page 25: Papo Sobre Web Semântica

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

rw

Monday, November 9, 2009

Page 26: Papo Sobre Web Semântica

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

rwrwx

Monday, November 9, 2009

Page 27: Papo Sobre Web Semântica

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

rwrwx

tec.

Monday, November 9, 2009

Page 28: Papo Sobre Web Semântica

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

rwrwx

tec.soc.

Monday, November 9, 2009

Page 29: Papo Sobre Web Semântica

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

rwrwx

tec.soc.

tec + soc

Monday, November 9, 2009

Page 30: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web SemânticaCom os computadores entendendo os conteúdos, eles teoricamente estarão aptos a resolver problemas que hoje estão fora de alcance

Monday, November 9, 2009

Page 31: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web Semântica

Objetivo:

Interligar conteúdos publicados na Web

A associação deve ser perceptível tanto pelo homem (manualmente) como pela máquina (automática)

Com os computadores entendendo os conteúdos, eles teoricamente estarão aptos a resolver problemas que hoje estão fora de alcance

Monday, November 9, 2009

Page 32: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Web Semântica

Objetivo:

Interligar conteúdos publicados na Web

A associação deve ser perceptível tanto pelo homem (manualmente) como pela máquina (automática)

Problema:

Atribuição de significado (sentido) aos conteúdos...

Com os computadores entendendo os conteúdos, eles teoricamente estarão aptos a resolver problemas que hoje estão fora de alcance

Monday, November 9, 2009

Page 33: Papo Sobre Web Semântica

Eduardo Nicola Zagari

AbordagensBottom-up (Clássica):

Anotação de informação nas páginas, usando RDF, para que seja “legível” por máquinas

Top-down (Conhecimento semântico vertical):Alavancagem de informações em páginas web já existentes, como estão, para extrair significado automaticamentereconhecimento de nomes e verbos cotidianos

Monday, November 9, 2009

Page 34: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Aplicações

Desktop Web Semântico (Browsers (Glue), Emails, Gerenciador de Janelas)

Blogging Semântico (Zemanta)

Wikis Semânticas

Máquinas de Busca Semânticas

Redes Sociais Semânticas

Monday, November 9, 2009

Page 35: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Yahoo! Search

Monday, November 9, 2009

Page 36: Papo Sobre Web Semântica

Eduardo Nicola Zagari

ZoomInfoConstrução de perfil

através da associação de dados

de diferentes

fontes

Monday, November 9, 2009

Page 37: Papo Sobre Web Semântica

Eduardo Nicola Zagari

TripItAgregador de

Viagens

Monday, November 9, 2009

Page 38: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Dapperadição

de anotação semântic

a em páginas

Monday, November 9, 2009

Page 39: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Tecnologias de Anotação

RDF - Resource Description Framework

RDFa e Microformatos

SPARQL

OWL

Monday, November 9, 2009

Page 40: Papo Sobre Web Semântica

Eduardo Nicola Zagari

RDF

Monday, November 9, 2009

Page 41: Papo Sobre Web Semântica

Eduardo Nicola Zagari

RDFLinguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados

Monday, November 9, 2009

Page 42: Papo Sobre Web Semântica

Eduardo Nicola Zagari

RDFLinguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados

Formato de grafo de dados

Monday, November 9, 2009

Page 43: Papo Sobre Web Semântica

Eduardo Nicola Zagari

RDFLinguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados

Formato de grafo de dados

Árvore

Monday, November 9, 2009

Page 44: Papo Sobre Web Semântica

Eduardo Nicola Zagari

RDFLinguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados

Formato de grafo de dados Grafo

Árvore

Monday, November 9, 2009

Page 45: Papo Sobre Web Semântica

Eduardo Nicola Zagari

RDFUsa triplas: {Recurso, Predicado, Objeto}

Empregado em RSS e FOAF

Idéia básica

cada item de dado deve ter um identificador Web único (URI)

atributo central do modelo: relacionamento de URIs entre itens de dados

Monday, November 9, 2009

Page 46: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Um Grafo RDF Simples<?xml version="1.0"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">

<rdf:Description rdf:about="http://bike.zagari.org/"> <dc:title>Viagens com a Magrela</dc:title> </rdf:Description>

<rdf:Description rdf:about="http://bike.zagari.org/"> <dc:creator rdf:resource="http://zagari.org/foaf.rdf#me"/> </rdf:Description>

Monday, November 9, 2009

Page 47: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Um Grafo RDF Simples

Monday, November 9, 2009

Page 48: Papo Sobre Web Semântica

Eduardo Nicola Zagari

RDFa e Microformatos

Web -> HTML

-> Linguagem de dados não estruturada

Microformatos e RDFa

Forma de codificar dados dentro de documentos HTML e XHTML

Monday, November 9, 2009

Page 49: Papo Sobre Web Semântica

Eduardo Nicola Zagari

HTML

<div>

<div>Nicola Zagari</div> <div>Abril Digital</div> <div>11-3818-1234</div> <a href="http://www.abril.com.br/"> http://www.abril.com.br/</a> </div>

Monday, November 9, 2009

Page 50: Papo Sobre Web Semântica

Eduardo Nicola Zagari

HTML

<div>

<div>Abril Digital</div> <div>Nicola Zagari</div> <div>11-3818-1234</div> <a href="http://www.abril.com.br/"> http://www.abril.com.br/</a> </div>

Monday, November 9, 2009

Page 51: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Microformatos

Com microformato hCard:

<div class="vcard"> <div class="fn">Nicola Zagari</div> <div class="org">Abril Digital</div> <div class="tel">11-3818-1234</div> <a class="url" href="http://www.abril.com.br/"> http://www.abril.com.br/</a> </div>

Monday, November 9, 2009

Page 52: Papo Sobre Web Semântica

Eduardo Nicola Zagari

RDFa

<div xmlns:dc="http://purl.org/dc/elements/1.1/" about="http://www.example.com/books/wikinomics"> <span property="dc:title">Wikinomics</span> <span property="dc:creator">Don Tapscott</span> <span property="dc:date">2006-10-01</span></div>

Monday, November 9, 2009

Page 53: Papo Sobre Web Semântica

Eduardo Nicola Zagari

RDFa<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"><html xmlns="http://www.w3.org/1999/xhtml" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:dc="http://purl.org/dc/elements/1.1/" version="XHTML+RDFa 1.0" xml:lang="en"> <head> <title>John's Home Page</title> <base href="http://example.org/john-d/" /> <meta property="dc:creator" content="Jonathan Doe" /> </head> <body> <h1>John's Home Page</h1> <p>My name is <span property="foaf:nick">John D</span> and I like <a href="http://www.neubauten.org/" rel="foaf:interest" xml:lang="de">Einstürzende Neubauten</a>. </p> <p> My <span rel="foaf:interest" resource="urn:ISBN:0752820907">favorite book</span> is the inspiring <span about="urn:ISBN:0752820907"><cite property="dc:title">Weaving the Web</cite> by <span property="dc:creator">Tim Berners-Lee</span></span> </p> </body></html>

Monday, November 9, 2009

Page 54: Papo Sobre Web Semântica

Eduardo Nicola Zagari

RDFa x Microformato

Microformato especifica:

a sintaxe para embutir os dados dentro do documento HTML

um vocabulário de termos específicos para cada tipo de informação (eventos, contatos, localização geográfica etc)

RDFa especifica apenas a sintaxe:

especificação de termos é independente

Monday, November 9, 2009

Page 55: Papo Sobre Web Semântica

Eduardo Nicola Zagari

SPARQL

SPARQL (Simple) Protocol and RDF Query Language

Permite realizar queries em grafos de dados RDF

É determinístico

Monday, November 9, 2009

Page 56: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Query SPARQLPREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>

PREFIX edu:<http://www.us.edu/universities#>PREFIX surf:<http://www.surf.com/surf#>

SELECT ?university

WHERE {?university rdf:type edu:University .?university go:within_3_power_10_meters ?beach .?beach rdf:type surf:Beach .?beach surf:temperature ?temperature?temperature unit:type http://imetro.com.br/temp.rdf#celsius .FILTER (?temperature > 22)

}

Monday, November 9, 2009

Page 57: Papo Sobre Web Semântica

Eduardo Nicola Zagari

OWL

Web Ontology Language

Linguagem para definir e instanciar ontologias na Web

Pode incluir descrições de classes, suas respectivas propriedades e relacionamentos

É uma extensão de RDF para permitir a representação da semântica de modelos de dados mais complexos

Monday, November 9, 2009

Page 58: Papo Sobre Web Semântica

Desafios

Monday, November 9, 2009

Page 59: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-UpDesafios Técnicos

Monday, November 9, 2009

Page 60: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-UpDesafios Técnicos

Como criar os documentos de descrição de dados?

Algoritmo de NLP?

Manual?

Monday, November 9, 2009

Page 61: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-UpDesafios Técnicos

Como criar os documentos de descrição de dados?

Algoritmo de NLP?

Manual?

Quem os geraria? Centralizado (Google-like) ou os próprios sites? Qual a motivação?

Monday, November 9, 2009

Page 62: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-UpDesafios Técnicos

Como criar os documentos de descrição de dados?

Algoritmo de NLP?

Manual?

Quem os geraria? Centralizado (Google-like) ou os próprios sites? Qual a motivação?

No caso da abordagem distribuída, como fica a questão de padronização?

Monday, November 9, 2009

Page 63: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-UpDesafios Científicos

Monday, November 9, 2009

Page 64: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-UpDesafios Científicos

Problema NP-completo

Monday, November 9, 2009

Page 65: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-UpDesafios Científicos

Problema NP-completo

Lidar com a Incerteza

Representação precisa dos fatos

Monday, November 9, 2009

Page 66: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-Up versus Top-Down

Por estes aspectos, a abordagem Top-Down apresenta-se mais interessante que a Bottom-Up, mas...

Monday, November 9, 2009

Page 67: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Top-Down

Primeiro, é uma abordagem simplista e não a Web Semântica como ela foi pensada

Um conjunto de apps e serviços web que geram valor a partir de semânticas simples

Nem sempre chegam a resultados corretos, devido à ambiguidade

Monday, November 9, 2009

Page 68: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-Up e Top-DownDesafios de Negócio

Monday, November 9, 2009

Page 69: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-Up e Top-DownDesafios de Negócio

Qual o real valor para o usuário?

Redução de tempo?

Monday, November 9, 2009

Page 70: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Bottom-Up e Top-DownDesafios de Negócio

Qual o real valor para o usuário?

Redução de tempo?

Quais as aplicações que podem ser construídas no topo da Web Semântica?

Monday, November 9, 2009

Page 71: Papo Sobre Web Semântica

Eduardo Nicola Zagari

NLP e NER

NLP

Subárea de IA e da linguística que estuda os problemas da geração e compreensão automática de linguas humanas naturais

NER:

ramo do processamento de linguagem natural que procura extrair e classificar as entidades mencionadas em um texto

Monday, November 9, 2009

Page 72: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Calais

Monday, November 9, 2009

Page 73: Papo Sobre Web Semântica

Eduardo Nicola Zagari

CMS

Monday, November 9, 2009

Page 74: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Considerações Finais

Monday, November 9, 2009

Page 75: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Considerações Finais

Web Semântica: a bola da vez

Monday, November 9, 2009

Page 76: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Considerações Finais

Web Semântica: a bola da vez

Ponto de inflexão

Monday, November 9, 2009

Page 77: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Considerações Finais

Web Semântica: a bola da vez

Ponto de inflexão

Abordagem por Segmentos

Monday, November 9, 2009

Page 78: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Considerações Finais

Monday, November 9, 2009

Page 79: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Considerações Finais

Big Player?

Monday, November 9, 2009

Page 80: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Considerações Finais

Big Player?

Aplicações inovadoras (killer apps)

Monday, November 9, 2009

Page 81: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Considerações Finais

Big Player?

Aplicações inovadoras (killer apps)

Agentes Inteligentes / máquinas de inferência

Monday, November 9, 2009

Page 82: Papo Sobre Web Semântica

Eduardo Nicola Zagari

Considerações Finais

Big Player?

Aplicações inovadoras (killer apps)

Agentes Inteligentes / máquinas de inferência

Conteúdo relevante e de alta qualidade: gerência de conteúdo => inteligência social

Monday, November 9, 2009

Page 83: Papo Sobre Web Semântica

Eduardo Nicola Zagari

ReferênciasRDF. W3C, http://www.w3.org

RDF, Microformats, OWL, SPARQL. Wikipedia, http://en.wikipedia.org/wiki/Main_Page

The Road to the Semantic Web. Alex Iskold, http://www.readwriteweb.com/archives/semantic_web_road.php

Semantic Web Patterns: A Guide to Semantic Technologies. Alex Iskold, http://www.readwriteweb.com/archives/semantic_web_patterns_a_guide_redux.php

Semantic Web FOR DUMmIES. Jeff rey T. Pollock, Wiley Publishing, Inc.

WEB 2.0 AND BEYOND - Understanding the New Online Business Models, Trends, and Technologies. Tom Funk, Praeger Publishers

Semantic Web: Difficulties with the Classic Approach. Alex Iskoldhttp://www.readwriteweb.com/archives/semantic_web_difficulties_with_classic_approach.php

Top-Down: A New Approach to the Semantic Web. Alex Iskold, http://www.readwriteweb.com/archives/the_top-down_semantic_web.php

Monday, November 9, 2009

Page 84: Papo Sobre Web Semântica

Web SemânticaEduardo Nicola F. Zagarizagari em abril com br

Ekke Ekke Ekke Ptang Zoo Boing - Núcleo de Engenharia e Pesquisa Abril Digital

Monday, November 9, 2009