Papo Sobre Web Semântica

Preview:

DESCRIPTION

A Web Semântica vem como "carro chefe" da terceira grande onda da Web, que traz também consigo novidades como Cloud Computing, Ubiquidade e RTWApps. Esta palestra mostra o esforço tecnológico que vem sendo feito no desenvolvimento da plataforma para a mesma, as possibilidades de aplicações que se abririam, as dificuldades de sua implantação e os próximo passo em sua direção: um movimento social "open-data".

Citation preview

Um papo sobreWeb Semântica

Eduardo Nicola F. Zagarizagari em abril com br

NIH - Núcleo de Engenharia e PesquisaAbril Digital

São Paulo, 09/11/2009

Monday, November 9, 2009

Eduardo Nicola Zagari

Sumário

Apresentação do NIHIntroduçãoAbordagensAplicaçõesTecnologias para Anotação de Conteúdo: RDF, Microformatos, RDFa, OWL, SPARQLNLP e Extração de EntidadesConsiderações Finais

Monday, November 9, 2009

Eduardo Nicola Zagari

NIH• Monitorar de forma sistemática novas

técnicas, linguagens, interfaces, arcabouços e sistemas computacionais utilizados na Web que possam ser implantados em nossos produtos;

• Desenvolver Novos Serviços de Inteligência Computacional, de Infraestrutura de Backend e de Interfaces Visuais para nossos produtos;

• Investigar novas soluções algorítmicas, técnicas e de interfaces para problemas das novas features, proposta, prototipação e avaliação das mesmas e

• Disseminar dentro da ABD os conhecimentos adquiridos na área, através de Tech Talks e/ou treinamentos.

Monday, November 9, 2009

Eduardo Nicola Zagari

NIHBibliotecas compartilhadas por serviços (Runner, HTMLParsing, Instrumentation, Stats etc)

Flash Cassino, Veja Lua, Handler-Uploader de Imagens

Classificador Automático

Super Robot

NER, Visualização de Grandes Massas de Dados

Monday, November 9, 2009

Eduardo Nicola Zagari

Definição na Wikipedia:

a term used to describe persistent social, corporate or institutional culture that avoids using or buying already existing products, research or knowledge because of its different origins. It is normally used in a pejorative sense.

a term and label developed in the computer industry referring to organizations incapable of using technology from other organizations.

NIH

Monday, November 9, 2009

Eduardo Nicola Zagari

IntroduçãoNo começo, existia a Web e as pessoas gostavam de surfar por suas páginas, trocar e-mails, fazer programas para suas empresas... A vida era boa... Só que um dia, as “pessoas” começaram a gostar tanto dela, que resolveram usar seu conteúdo de novas formas... Mas a Web foi feita para compartilhar documentos e não os dados internos de suas páginas... E estas “pessoas” ficaram tristes...Aí surge a Web Semântica... e “elas” voltarão a ser felizes em breve! :-)

Monday, November 9, 2009

Eduardo Nicola Zagari

Web Semântica

Monday, November 9, 2009

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

Monday, November 9, 2009

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

uma plataforma tecnológica de metadados da Web

Monday, November 9, 2009

Eduardo Nicola Zagari

(Plataforma Tecnológica)

Computadores devem estar aptos a saber:

o que uma determinada requisição significa;

sobre o que são dados e documentos particulares;

o relacionamento entre tudo isto.

Monday, November 9, 2009

Eduardo Nicola Zagari

(Evolução das Aplicações)

Processamento de Dados

Processamento de Informação

Processamento de Conhecimento

Processamento Inteligente

informação

dados

conhecimento

inteligência

Monday, November 9, 2009

Eduardo Nicola Zagari

Web Semântica

Monday, November 9, 2009

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

Monday, November 9, 2009

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

uma plataforma tecnológica de metadados da Web

Monday, November 9, 2009

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

uma plataforma tecnológica de metadados da Webum movimento social de “abertura de dados” (open-source data)

Monday, November 9, 2009

Eduardo Nicola Zagari

Web SemânticaMúltiplas faces:

uma plataforma tecnológica de metadados da Webum movimento social de “abertura de dados” (open-source data)uma nova encarnação da Inteligência Artificial clássica

Monday, November 9, 2009

Eduardo Nicola Zagari

(Web Semântica e Inteligência Artificial)

Segundo Sir Tim Beners-Lee:

mas...

Habilidade da máquina de resolver problemas ‘bem definidos’, realizando operações ‘bem definidas’ em dados existentes ‘bem definidos’

Monday, November 9, 2009

Eduardo Nicola Zagari

(Inteligência Artificial)Alan Turing, 1956

IA Forte e IA Fraca

Sistemas Especialistas, Redes Neuronais, Lógica Fuzzy

Inverno da IA - Aprendizado de Máquinas, Robótica, Visão Computacional

Algoritmos Genéticos, Computação Bio-inspirada

Monday, November 9, 2009

Eduardo Nicola Zagari

Web Semântica

Um passo além da onda iniciada em 2004, a Web Colaborativa (Web 2.0)

Web 3.0 ?Web Semântica, Cloud Computing, Ubiqüidade, WRTAp

Monday, November 9, 2009

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

Monday, November 9, 2009

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

Monday, November 9, 2009

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

Monday, November 9, 2009

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

Monday, November 9, 2009

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

Monday, November 9, 2009

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

rw

Monday, November 9, 2009

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

rwrwx

Monday, November 9, 2009

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

rwrwx

tec.

Monday, November 9, 2009

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

rwrwx

tec.soc.

Monday, November 9, 2009

Eduardo Nicola Zagari

As 3 ondas da Web

Fonte: Semantic Webde Jeffrey Pollockext

r

rwrwx

tec.soc.

tec + soc

Monday, November 9, 2009

Eduardo Nicola Zagari

Web SemânticaCom os computadores entendendo os conteúdos, eles teoricamente estarão aptos a resolver problemas que hoje estão fora de alcance

Monday, November 9, 2009

Eduardo Nicola Zagari

Web Semântica

Objetivo:

Interligar conteúdos publicados na Web

A associação deve ser perceptível tanto pelo homem (manualmente) como pela máquina (automática)

Com os computadores entendendo os conteúdos, eles teoricamente estarão aptos a resolver problemas que hoje estão fora de alcance

Monday, November 9, 2009

Eduardo Nicola Zagari

Web Semântica

Objetivo:

Interligar conteúdos publicados na Web

A associação deve ser perceptível tanto pelo homem (manualmente) como pela máquina (automática)

Problema:

Atribuição de significado (sentido) aos conteúdos...

Com os computadores entendendo os conteúdos, eles teoricamente estarão aptos a resolver problemas que hoje estão fora de alcance

Monday, November 9, 2009

Eduardo Nicola Zagari

AbordagensBottom-up (Clássica):

Anotação de informação nas páginas, usando RDF, para que seja “legível” por máquinas

Top-down (Conhecimento semântico vertical):Alavancagem de informações em páginas web já existentes, como estão, para extrair significado automaticamentereconhecimento de nomes e verbos cotidianos

Monday, November 9, 2009

Eduardo Nicola Zagari

Aplicações

Desktop Web Semântico (Browsers (Glue), Emails, Gerenciador de Janelas)

Blogging Semântico (Zemanta)

Wikis Semânticas

Máquinas de Busca Semânticas

Redes Sociais Semânticas

Monday, November 9, 2009

Eduardo Nicola Zagari

Yahoo! Search

Monday, November 9, 2009

Eduardo Nicola Zagari

ZoomInfoConstrução de perfil

através da associação de dados

de diferentes

fontes

Monday, November 9, 2009

Eduardo Nicola Zagari

TripItAgregador de

Viagens

Monday, November 9, 2009

Eduardo Nicola Zagari

Dapperadição

de anotação semântic

a em páginas

Monday, November 9, 2009

Eduardo Nicola Zagari

Tecnologias de Anotação

RDF - Resource Description Framework

RDFa e Microformatos

SPARQL

OWL

Monday, November 9, 2009

Eduardo Nicola Zagari

RDF

Monday, November 9, 2009

Eduardo Nicola Zagari

RDFLinguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados

Monday, November 9, 2009

Eduardo Nicola Zagari

RDFLinguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados

Formato de grafo de dados

Monday, November 9, 2009

Eduardo Nicola Zagari

RDFLinguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados

Formato de grafo de dados

Árvore

Monday, November 9, 2009

Eduardo Nicola Zagari

RDFLinguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados

Formato de grafo de dados Grafo

Árvore

Monday, November 9, 2009

Eduardo Nicola Zagari

RDFUsa triplas: {Recurso, Predicado, Objeto}

Empregado em RSS e FOAF

Idéia básica

cada item de dado deve ter um identificador Web único (URI)

atributo central do modelo: relacionamento de URIs entre itens de dados

Monday, November 9, 2009

Eduardo Nicola Zagari

Um Grafo RDF Simples<?xml version="1.0"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">

<rdf:Description rdf:about="http://bike.zagari.org/"> <dc:title>Viagens com a Magrela</dc:title> </rdf:Description>

<rdf:Description rdf:about="http://bike.zagari.org/"> <dc:creator rdf:resource="http://zagari.org/foaf.rdf#me"/> </rdf:Description>

Monday, November 9, 2009

Eduardo Nicola Zagari

Um Grafo RDF Simples

Monday, November 9, 2009

Eduardo Nicola Zagari

RDFa e Microformatos

Web -> HTML

-> Linguagem de dados não estruturada

Microformatos e RDFa

Forma de codificar dados dentro de documentos HTML e XHTML

Monday, November 9, 2009

Eduardo Nicola Zagari

HTML

<div>

<div>Nicola Zagari</div> <div>Abril Digital</div> <div>11-3818-1234</div> <a href="http://www.abril.com.br/"> http://www.abril.com.br/</a> </div>

Monday, November 9, 2009

Eduardo Nicola Zagari

HTML

<div>

<div>Abril Digital</div> <div>Nicola Zagari</div> <div>11-3818-1234</div> <a href="http://www.abril.com.br/"> http://www.abril.com.br/</a> </div>

Monday, November 9, 2009

Eduardo Nicola Zagari

Microformatos

Com microformato hCard:

<div class="vcard"> <div class="fn">Nicola Zagari</div> <div class="org">Abril Digital</div> <div class="tel">11-3818-1234</div> <a class="url" href="http://www.abril.com.br/"> http://www.abril.com.br/</a> </div>

Monday, November 9, 2009

Eduardo Nicola Zagari

RDFa

<div xmlns:dc="http://purl.org/dc/elements/1.1/" about="http://www.example.com/books/wikinomics"> <span property="dc:title">Wikinomics</span> <span property="dc:creator">Don Tapscott</span> <span property="dc:date">2006-10-01</span></div>

Monday, November 9, 2009

Eduardo Nicola Zagari

RDFa<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"><html xmlns="http://www.w3.org/1999/xhtml" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:dc="http://purl.org/dc/elements/1.1/" version="XHTML+RDFa 1.0" xml:lang="en"> <head> <title>John's Home Page</title> <base href="http://example.org/john-d/" /> <meta property="dc:creator" content="Jonathan Doe" /> </head> <body> <h1>John's Home Page</h1> <p>My name is <span property="foaf:nick">John D</span> and I like <a href="http://www.neubauten.org/" rel="foaf:interest" xml:lang="de">Einstürzende Neubauten</a>. </p> <p> My <span rel="foaf:interest" resource="urn:ISBN:0752820907">favorite book</span> is the inspiring <span about="urn:ISBN:0752820907"><cite property="dc:title">Weaving the Web</cite> by <span property="dc:creator">Tim Berners-Lee</span></span> </p> </body></html>

Monday, November 9, 2009

Eduardo Nicola Zagari

RDFa x Microformato

Microformato especifica:

a sintaxe para embutir os dados dentro do documento HTML

um vocabulário de termos específicos para cada tipo de informação (eventos, contatos, localização geográfica etc)

RDFa especifica apenas a sintaxe:

especificação de termos é independente

Monday, November 9, 2009

Eduardo Nicola Zagari

SPARQL

SPARQL (Simple) Protocol and RDF Query Language

Permite realizar queries em grafos de dados RDF

É determinístico

Monday, November 9, 2009

Eduardo Nicola Zagari

Query SPARQLPREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>

PREFIX edu:<http://www.us.edu/universities#>PREFIX surf:<http://www.surf.com/surf#>

SELECT ?university

WHERE {?university rdf:type edu:University .?university go:within_3_power_10_meters ?beach .?beach rdf:type surf:Beach .?beach surf:temperature ?temperature?temperature unit:type http://imetro.com.br/temp.rdf#celsius .FILTER (?temperature > 22)

}

Monday, November 9, 2009

Eduardo Nicola Zagari

OWL

Web Ontology Language

Linguagem para definir e instanciar ontologias na Web

Pode incluir descrições de classes, suas respectivas propriedades e relacionamentos

É uma extensão de RDF para permitir a representação da semântica de modelos de dados mais complexos

Monday, November 9, 2009

Desafios

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-UpDesafios Técnicos

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-UpDesafios Técnicos

Como criar os documentos de descrição de dados?

Algoritmo de NLP?

Manual?

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-UpDesafios Técnicos

Como criar os documentos de descrição de dados?

Algoritmo de NLP?

Manual?

Quem os geraria? Centralizado (Google-like) ou os próprios sites? Qual a motivação?

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-UpDesafios Técnicos

Como criar os documentos de descrição de dados?

Algoritmo de NLP?

Manual?

Quem os geraria? Centralizado (Google-like) ou os próprios sites? Qual a motivação?

No caso da abordagem distribuída, como fica a questão de padronização?

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-UpDesafios Científicos

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-UpDesafios Científicos

Problema NP-completo

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-UpDesafios Científicos

Problema NP-completo

Lidar com a Incerteza

Representação precisa dos fatos

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-Up versus Top-Down

Por estes aspectos, a abordagem Top-Down apresenta-se mais interessante que a Bottom-Up, mas...

Monday, November 9, 2009

Eduardo Nicola Zagari

Top-Down

Primeiro, é uma abordagem simplista e não a Web Semântica como ela foi pensada

Um conjunto de apps e serviços web que geram valor a partir de semânticas simples

Nem sempre chegam a resultados corretos, devido à ambiguidade

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-Up e Top-DownDesafios de Negócio

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-Up e Top-DownDesafios de Negócio

Qual o real valor para o usuário?

Redução de tempo?

Monday, November 9, 2009

Eduardo Nicola Zagari

Bottom-Up e Top-DownDesafios de Negócio

Qual o real valor para o usuário?

Redução de tempo?

Quais as aplicações que podem ser construídas no topo da Web Semântica?

Monday, November 9, 2009

Eduardo Nicola Zagari

NLP e NER

NLP

Subárea de IA e da linguística que estuda os problemas da geração e compreensão automática de linguas humanas naturais

NER:

ramo do processamento de linguagem natural que procura extrair e classificar as entidades mencionadas em um texto

Monday, November 9, 2009

Eduardo Nicola Zagari

Calais

Monday, November 9, 2009

Eduardo Nicola Zagari

CMS

Monday, November 9, 2009

Eduardo Nicola Zagari

Considerações Finais

Monday, November 9, 2009

Eduardo Nicola Zagari

Considerações Finais

Web Semântica: a bola da vez

Monday, November 9, 2009

Eduardo Nicola Zagari

Considerações Finais

Web Semântica: a bola da vez

Ponto de inflexão

Monday, November 9, 2009

Eduardo Nicola Zagari

Considerações Finais

Web Semântica: a bola da vez

Ponto de inflexão

Abordagem por Segmentos

Monday, November 9, 2009

Eduardo Nicola Zagari

Considerações Finais

Monday, November 9, 2009

Eduardo Nicola Zagari

Considerações Finais

Big Player?

Monday, November 9, 2009

Eduardo Nicola Zagari

Considerações Finais

Big Player?

Aplicações inovadoras (killer apps)

Monday, November 9, 2009

Eduardo Nicola Zagari

Considerações Finais

Big Player?

Aplicações inovadoras (killer apps)

Agentes Inteligentes / máquinas de inferência

Monday, November 9, 2009

Eduardo Nicola Zagari

Considerações Finais

Big Player?

Aplicações inovadoras (killer apps)

Agentes Inteligentes / máquinas de inferência

Conteúdo relevante e de alta qualidade: gerência de conteúdo => inteligência social

Monday, November 9, 2009

Eduardo Nicola Zagari

ReferênciasRDF. W3C, http://www.w3.org

RDF, Microformats, OWL, SPARQL. Wikipedia, http://en.wikipedia.org/wiki/Main_Page

The Road to the Semantic Web. Alex Iskold, http://www.readwriteweb.com/archives/semantic_web_road.php

Semantic Web Patterns: A Guide to Semantic Technologies. Alex Iskold, http://www.readwriteweb.com/archives/semantic_web_patterns_a_guide_redux.php

Semantic Web FOR DUMmIES. Jeff rey T. Pollock, Wiley Publishing, Inc.

WEB 2.0 AND BEYOND - Understanding the New Online Business Models, Trends, and Technologies. Tom Funk, Praeger Publishers

Semantic Web: Difficulties with the Classic Approach. Alex Iskoldhttp://www.readwriteweb.com/archives/semantic_web_difficulties_with_classic_approach.php

Top-Down: A New Approach to the Semantic Web. Alex Iskold, http://www.readwriteweb.com/archives/the_top-down_semantic_web.php

Monday, November 9, 2009

Web SemânticaEduardo Nicola F. Zagarizagari em abril com br

Ekke Ekke Ekke Ptang Zoo Boing - Núcleo de Engenharia e Pesquisa Abril Digital

Monday, November 9, 2009