38
Franklin Ramalho DSC-CCT-UFCG Web Semântica Franklin de Souza Ramalho DSC-CCT-UFCG [email protected] http://www.cin.ufpe.br/~fsr

Franklin Ramalho DSC-CCT-UFCG Web Semântica Franklin de Souza Ramalho DSC-CCT-UFCG [email protected] fsr

Embed Size (px)

Citation preview

Franklin RamalhoDSC-CCT-UFCG

Web Semântica

Franklin de Souza [email protected]

http://www.cin.ufpe.br/~fsr

Franklin Ramalho DSC-CCT-UFCG

O que será abordado? Motivação Estudo de caso: engenhos de busca Web Semântica

Introdução Arquitetura Ferramentas Aplicações

Considerações Finais

Franklin Ramalho DSC-CCT-UFCG

Motivação“WWW: espaço onde a informação tem um

significado bem definido, facilitando a cooperação entre pessoas e agentes computacionais” (Tim Berners Lee)

Enfoque da Web atual é na comunicação humana

Visão de Berners Lee ainda não foi alcançada

Franklin Ramalho DSC-CCT-UFCG

Motivação

Páginas Web atuais: HTML HTML

Define apenas elementos de apresentação de texto e elementos gráficos

Não agrega nenhuma semântica aos dados Dados apresentados em linguagem natural Não possui flexibilidade

Franklin Ramalho DSC-CCT-UFCG

Motivação

Franklin Ramalho DSC-CCT-UFCG

Motivação<meta NAME="Author" CONTENT="Jacques Robin"><meta NAME="Description" CONTENT="Personal

HOme-page of Jacques Robin professor"> …<h3><font face="Arial">Research

Interests</font></h3><ul> <li> Artificial Intelligence </li>

<li> Multi-Agent Systems </li> <li> Computational Linguistics </li>

<li> NLP </li><li> Hypertext Generation </li>

<li> Intelligent Databases </li><li> Logic Programming </li><li>Data Warehousing and OLAP</li>

</ul>

Franklin Ramalho DSC-CCT-UFCG

Motivação Dificuldade por parte dos agentes

computacionais em tratar a informação na Web Recuperação de Informação (engenhos de busca) Comércio eletrônico Integração da Informação Chat-Bots Web Services Comunicação entre agentes …

Franklin Ramalho DSC-CCT-UFCG

Estudo de Caso: o problema dos Engenhos de Busca

Engenhos de Busca Busca baseada em palavras-chave Robôs realizam download das páginas Web Indexadores extraem termos chaves das

páginas Interface de consulta recebe termos que

são comparados com a base de termos indexados

Franklin Ramalho DSC-CCT-UFCG

Estudo de Caso: o problema dos Engenhos de Busca

Baixa precisão

Baixa Cobertura

Franklin Ramalho DSC-CCT-UFCG

Estudo de Caso: o problema dos Engenhos de Busca

Como coletar a informação desejada precisamente?

Como coletar informação distribuída?

Como coletar informação implícita?

Como realizar consultas sofisticadas?

Como diminuir o esforço humano?

Franklin Ramalho DSC-CCT-UFCG

Franklin Ramalho DSC-CCT-UFCG

Web Semântica Extensão da Web atual Informação estruturada e com semântica

bem definida Agentes computacionais capazes de

processar e entender os dados Facilita a automação, integração e

distribuição dos dados Visão de Tim Berners Lee é alcançada:

Cooperação entre pessoas e agentes computacionais

Franklin Ramalho DSC-CCT-UFCG

Arquitetura

Dados

Regras de Inferência

Web Semântica

Engenho de Busca

Ontologia Ontologia Ontologia

Camada deEstrutura

Camada deEsquema

CamadaLógica

… E-commerce

Franklin Ramalho DSC-CCT-UFCG

Camada de Estrutura Responsável por estruturar os dados e definir

seu significado Tecnologia já vinha sendo estudada há algum

tempo por pesquisadores de IA (LOOM, LISP, etc) Sistemas centralizados Limitação das questões a serem colocadas

Estas limitações não são incorporadas na Web Semântica

Tecnologias atuais: XML e RDF

Franklin Ramalho DSC-CCT-UFCG

XML (eXtensible Markup Language)

Meta-linguagem de editoração Baseada em rótulos que descrevem a

estrutura do documento Separação entre rótulos de descrição e

apresentação do conteúdo Baseado no modelo de árvore XML é texto

Franklin Ramalho DSC-CCT-UFCG

XML<FirstName>Jacques</FirstName><LastName>Robin</LastName><Email>[email protected]</Email>…

<Research_Topic> Artificial Intelligence </Research_Topic><Research_Topic> Multi-Agent Systems </Research_Topic><Research_Topic> Computational Linguistics </Research_Topic><Research_Topic> NLP </Research_Topic><Research_Topic> Hypertext Generation </Research_Topic><Research_Topic> Intelligent Databases </Research_Topic> …<Research_Topic> Data Warehousing and OLAP

</Research_Topic>…

Franklin Ramalho DSC-CCT-UFCG

RDF (Resource Definition Framework)

Modelo para descrever recursos Baseado em um modelo de grafo no lugar

de árvore Sintaxe: (Sujeito, Predicado, Objeto) Usa XML como sintaxe Melhora a descoberta, o acesso e o

gerenciamento das informações da Web

Franklin Ramalho DSC-CCT-UFCG

RDF

http://www.cin.ufpe.br/~jr Date

Creator

Description

Jacques Robin

02-05-2002

Personal home-page …

http://www.cin.ufpe.br

Professor

Franklin Ramalho DSC-CCT-UFCG

RDF<rdf:RDF

xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#xmlns:dc=http://pur1.org/metadata/dublin_core#

><rdf:Description about=http://www.cin.ufpe.br/~jr><dc:Creator>Jacques Robin</dc:Creator><dc:Date>05-02-2002</dc:Date><dc:Description>Personal home-page …</dc:Description><Professor rdf:resource=“http://www.cin.ufpe.br”/></rdf:Description>

</rdf:RDF>

Franklin Ramalho DSC-CCT-UFCG

Arquitetura

Dados

Regras de Inferência

Web Semântica

Engenho de Busca

Camada deEstrutura

Ontologia Ontologia OntologiaCamada deEsquema

CamadaLógica

… E-commerce

Franklin Ramalho DSC-CCT-UFCG

Camada de Esquema Responsável por definir relações entre os

dados Ontologia: “Entendimento comum e

compartilhado de um domínio” Documento que define formalmente a

relação entre termos de um domínio Uso de ontologias em páginas web torna

mais simples a resolução de indefinição ou conflito de terminologia

Franklin Ramalho DSC-CCT-UFCG

Camada de Esquema Elementos de uma ontologia

Hierarquia de conceitos Relações Restrições de Integridade Instâncias dos conceitos

Não existe ainda nenhuma linguagem que contemple todos os conceitos de uma ontologia

Franklin Ramalho DSC-CCT-UFCG

Camada de EsquemaOntologia

Person Employee :: PersonAcademicStaff :: EmployeeResearcher :: AcademicStaffPhDStudent :: ResearcherEmployee[

affiliation : Organization;worksAtProject : Project;headOf : Project;headOfGroup : ResearchGroup].

AcademicStaff[supervises :PhDStudent].

Researcher[researchInterest : ResearchTopic;

memberOf : ResearchGroup;cooperatesWith : Researcher].

Franklin Ramalho DSC-CCT-UFCG

Camada de Esquema Formalismos para representar

ontologias Ontolingua, LOOM, Flogic, KIF XMLS RDFS DAML OIL DAML-OIL OWL

Franklin Ramalho DSC-CCT-UFCG

Camada de Esquema<rdfs:Class rdf:ID="Researcher"> <rdfs:subClassOf rdf:resource="#AcademicStaff"/>

<daml:Restriction daml:mincardinality="n" daml:maxcardinality="1">

<daml:onProperty rdf:resource="#researchInterest"/> <daml:toClass rdf:resource="#ResearchTopic"/> </daml:Restriction>

</rdfs:subClassOf></rdfs:Class>

<daml:ObjectProperty rdf:ID=“supervises”><caml:inversOf rdf:resource=“supervisor”/>

</daml:ObjectProperty>

Franklin Ramalho DSC-CCT-UFCG

Arquitetura

Dados

Web Semântica

Engenho de Busca

Ontologia Ontologia Ontologia

Camada deEstrutura

Camada deEsquema

Regras de InferênciaCamadaLógica

… E-commerce

Franklin Ramalho DSC-CCT-UFCG

Camada de Lógica Responsável por definir mecanismos para

fazer inferência sobre os dados Composta por um conjunto de regras de

inferência Regras de inferência fornecem aos agentes

computacionais o poder de raciocinar sobre as estruturas de dados

RuleML, DAML-L, XRML, RFML, URML, AORML …

Franklin Ramalho DSC-CCT-UFCG

RuleML

Linguagem independente de padrões proprietários

Abrange regras reativas, dedutivas e de produção

Representação de fatos Sintaxe XML (versão 0.8 em DTD)

Franklin Ramalho DSC-CCT-UFCG

RuleML - exemplo<imp>

<_head> <atom> <rel>cooperatesWith</rel> <var>person2</var> <var>person1</var>

</atom></_head><_body> <atom> <rel>cooperatesWith</rel> <var>person1</var> <var>person2</var> </atom></body>

</imp>

Franklin Ramalho DSC-CCT-UFCG

Agentes Computacionais O verdadeiro valor da Web Semântica

representar valor para os seus utilizadores Agentes computacionais

Compreender o significado e relação entre objetos

Raciocinar sobre eles Trocar resultados Trocar provas

Autenticidade e confiabilidade Assinaturas difitais Crenças (estado mental)

Franklin Ramalho DSC-CCT-UFCG

Infra-estrutura em camadas para Web Semântica

Franklin Ramalho DSC-CCT-UFCG

Ferramentas

Construir páginas Web com semântica é uma tarefa muito laboriosa

Ferramentas de apoio: Validação XML: XMLSpy … Construção Ontologias: OilEd, OntoEdit, Protégé … Anotação de Páginas: OntoMat,

OntoAnnotate,UBOT… Motores de Inferência: LoPix, TRIPLE …

Franklin Ramalho DSC-CCT-UFCG

Ferramentas - OntoEdit

Franklin Ramalho DSC-CCT-UFCG

Aplicações Engenho de Busca: OntoBroker Sistemas de recomendação: MyPlanet E-commerce: MKBEEM, SMART-EC NLP: OncoTerm, PANGLOSS,

OntoGeneration Integração da Informação: Ariadne,

OBSERVER Web Services

Franklin Ramalho DSC-CCT-UFCG

Considerações Finais

Web mais inteligente! Grande quantidade de agentes

computacionais fazendo uso da WS Maior sinergia entre diversas

comunidades de pesquisa

Franklin Ramalho DSC-CCT-UFCG

Considerações Finais

XML – ponto de partida para padronização de conteúdos na comunicação entre agentes computacionais

Markup Languages extensíveis Markup Languages cada vez mais

“verborreicas” Ferramentas de apoio são necessárias

Franklin Ramalho DSC-CCT-UFCG

Considerações Finais Grupos da W3C ainda trabalham de

forma isolada Necessidade de uma única linguagem

que expresse dados e regras para raciocínio sobre estes.

Como prover tratamento de provas e credibilidade?

O que vem por ai? ?ML, ?ML, ?ML …

Franklin Ramalho DSC-CCT-UFCG

Considerações Finais