View
231
Download
0
Category
Preview:
Citation preview
Franklin RamalhoDSC-CCT-UFCG
Web Semântica
Franklin de Souza RamalhoDSC-CCT-UFCGfsr@cin.ufpe.br
http://www.cin.ufpe.br/~fsr
Franklin Ramalho DSC-CCT-UFCG
O que será abordado? Motivação Estudo de caso: engenhos de busca Web Semântica
Introdução Arquitetura Ferramentas Aplicações
Considerações Finais
Franklin Ramalho DSC-CCT-UFCG
Motivação“WWW: espaço onde a informação tem um
significado bem definido, facilitando a cooperação entre pessoas e agentes computacionais” (Tim Berners Lee)
Enfoque da Web atual é na comunicação humana
Visão de Berners Lee ainda não foi alcançada
Franklin Ramalho DSC-CCT-UFCG
Motivação
Páginas Web atuais: HTML HTML
Define apenas elementos de apresentação de texto e elementos gráficos
Não agrega nenhuma semântica aos dados Dados apresentados em linguagem natural Não possui flexibilidade
Franklin Ramalho DSC-CCT-UFCG
Motivação<meta NAME="Author" CONTENT="Jacques Robin"><meta NAME="Description" CONTENT="Personal
HOme-page of Jacques Robin professor"> …<h3><font face="Arial">Research
Interests</font></h3><ul> <li> Artificial Intelligence </li>
<li> Multi-Agent Systems </li> <li> Computational Linguistics </li>
<li> NLP </li><li> Hypertext Generation </li>
<li> Intelligent Databases </li><li> Logic Programming </li><li>Data Warehousing and OLAP</li>
</ul>
Franklin Ramalho DSC-CCT-UFCG
Motivação Dificuldade por parte dos agentes
computacionais em tratar a informação na Web Recuperação de Informação (engenhos de busca) Comércio eletrônico Integração da Informação Chat-Bots Web Services Comunicação entre agentes …
Franklin Ramalho DSC-CCT-UFCG
Estudo de Caso: o problema dos Engenhos de Busca
Engenhos de Busca Busca baseada em palavras-chave Robôs realizam download das páginas Web Indexadores extraem termos chaves das
páginas Interface de consulta recebe termos que
são comparados com a base de termos indexados
Franklin Ramalho DSC-CCT-UFCG
Estudo de Caso: o problema dos Engenhos de Busca
Baixa precisão
Baixa Cobertura
Franklin Ramalho DSC-CCT-UFCG
Estudo de Caso: o problema dos Engenhos de Busca
Como coletar a informação desejada precisamente?
Como coletar informação distribuída?
Como coletar informação implícita?
Como realizar consultas sofisticadas?
Como diminuir o esforço humano?
Franklin Ramalho DSC-CCT-UFCG
Web Semântica Extensão da Web atual Informação estruturada e com semântica
bem definida Agentes computacionais capazes de
processar e entender os dados Facilita a automação, integração e
distribuição dos dados Visão de Tim Berners Lee é alcançada:
Cooperação entre pessoas e agentes computacionais
Franklin Ramalho DSC-CCT-UFCG
Arquitetura
Dados
Regras de Inferência
Web Semântica
Engenho de Busca
Ontologia Ontologia Ontologia
Camada deEstrutura
Camada deEsquema
CamadaLógica
… E-commerce
Franklin Ramalho DSC-CCT-UFCG
Camada de Estrutura Responsável por estruturar os dados e definir
seu significado Tecnologia já vinha sendo estudada há algum
tempo por pesquisadores de IA (LOOM, LISP, etc) Sistemas centralizados Limitação das questões a serem colocadas
Estas limitações não são incorporadas na Web Semântica
Tecnologias atuais: XML e RDF
Franklin Ramalho DSC-CCT-UFCG
XML (eXtensible Markup Language)
Meta-linguagem de editoração Baseada em rótulos que descrevem a
estrutura do documento Separação entre rótulos de descrição e
apresentação do conteúdo Baseado no modelo de árvore XML é texto
Franklin Ramalho DSC-CCT-UFCG
XML<FirstName>Jacques</FirstName><LastName>Robin</LastName><Email>jr@cin.ufpe.br</Email>…
<Research_Topic> Artificial Intelligence </Research_Topic><Research_Topic> Multi-Agent Systems </Research_Topic><Research_Topic> Computational Linguistics </Research_Topic><Research_Topic> NLP </Research_Topic><Research_Topic> Hypertext Generation </Research_Topic><Research_Topic> Intelligent Databases </Research_Topic> …<Research_Topic> Data Warehousing and OLAP
</Research_Topic>…
Franklin Ramalho DSC-CCT-UFCG
RDF (Resource Definition Framework)
Modelo para descrever recursos Baseado em um modelo de grafo no lugar
de árvore Sintaxe: (Sujeito, Predicado, Objeto) Usa XML como sintaxe Melhora a descoberta, o acesso e o
gerenciamento das informações da Web
Franklin Ramalho DSC-CCT-UFCG
RDF
http://www.cin.ufpe.br/~jr Date
Creator
Description
Jacques Robin
02-05-2002
Personal home-page …
http://www.cin.ufpe.br
Professor
Franklin Ramalho DSC-CCT-UFCG
RDF<rdf:RDF
xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#xmlns:dc=http://pur1.org/metadata/dublin_core#
><rdf:Description about=http://www.cin.ufpe.br/~jr><dc:Creator>Jacques Robin</dc:Creator><dc:Date>05-02-2002</dc:Date><dc:Description>Personal home-page …</dc:Description><Professor rdf:resource=“http://www.cin.ufpe.br”/></rdf:Description>
</rdf:RDF>
Franklin Ramalho DSC-CCT-UFCG
Arquitetura
Dados
Regras de Inferência
Web Semântica
Engenho de Busca
Camada deEstrutura
Ontologia Ontologia OntologiaCamada deEsquema
CamadaLógica
… E-commerce
Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema Responsável por definir relações entre os
dados Ontologia: “Entendimento comum e
compartilhado de um domínio” Documento que define formalmente a
relação entre termos de um domínio Uso de ontologias em páginas web torna
mais simples a resolução de indefinição ou conflito de terminologia
Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema Elementos de uma ontologia
Hierarquia de conceitos Relações Restrições de Integridade Instâncias dos conceitos
Não existe ainda nenhuma linguagem que contemple todos os conceitos de uma ontologia
Franklin Ramalho DSC-CCT-UFCG
Camada de EsquemaOntologia
Person Employee :: PersonAcademicStaff :: EmployeeResearcher :: AcademicStaffPhDStudent :: ResearcherEmployee[
affiliation : Organization;worksAtProject : Project;headOf : Project;headOfGroup : ResearchGroup].
AcademicStaff[supervises :PhDStudent].
Researcher[researchInterest : ResearchTopic;
memberOf : ResearchGroup;cooperatesWith : Researcher].
Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema Formalismos para representar
ontologias Ontolingua, LOOM, Flogic, KIF XMLS RDFS DAML OIL DAML-OIL OWL
Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema<rdfs:Class rdf:ID="Researcher"> <rdfs:subClassOf rdf:resource="#AcademicStaff"/>
<daml:Restriction daml:mincardinality="n" daml:maxcardinality="1">
<daml:onProperty rdf:resource="#researchInterest"/> <daml:toClass rdf:resource="#ResearchTopic"/> </daml:Restriction>
</rdfs:subClassOf></rdfs:Class>
<daml:ObjectProperty rdf:ID=“supervises”><caml:inversOf rdf:resource=“supervisor”/>
</daml:ObjectProperty>
Franklin Ramalho DSC-CCT-UFCG
Arquitetura
Dados
Web Semântica
Engenho de Busca
Ontologia Ontologia Ontologia
Camada deEstrutura
Camada deEsquema
Regras de InferênciaCamadaLógica
… E-commerce
Franklin Ramalho DSC-CCT-UFCG
Camada de Lógica Responsável por definir mecanismos para
fazer inferência sobre os dados Composta por um conjunto de regras de
inferência Regras de inferência fornecem aos agentes
computacionais o poder de raciocinar sobre as estruturas de dados
RuleML, DAML-L, XRML, RFML, URML, AORML …
Franklin Ramalho DSC-CCT-UFCG
RuleML
Linguagem independente de padrões proprietários
Abrange regras reativas, dedutivas e de produção
Representação de fatos Sintaxe XML (versão 0.8 em DTD)
Franklin Ramalho DSC-CCT-UFCG
RuleML - exemplo<imp>
<_head> <atom> <rel>cooperatesWith</rel> <var>person2</var> <var>person1</var>
</atom></_head><_body> <atom> <rel>cooperatesWith</rel> <var>person1</var> <var>person2</var> </atom></body>
</imp>
Franklin Ramalho DSC-CCT-UFCG
Agentes Computacionais O verdadeiro valor da Web Semântica
representar valor para os seus utilizadores Agentes computacionais
Compreender o significado e relação entre objetos
Raciocinar sobre eles Trocar resultados Trocar provas
Autenticidade e confiabilidade Assinaturas difitais Crenças (estado mental)
Franklin Ramalho DSC-CCT-UFCG
Ferramentas
Construir páginas Web com semântica é uma tarefa muito laboriosa
Ferramentas de apoio: Validação XML: XMLSpy … Construção Ontologias: OilEd, OntoEdit, Protégé … Anotação de Páginas: OntoMat,
OntoAnnotate,UBOT… Motores de Inferência: LoPix, TRIPLE …
Franklin Ramalho DSC-CCT-UFCG
Aplicações Engenho de Busca: OntoBroker Sistemas de recomendação: MyPlanet E-commerce: MKBEEM, SMART-EC NLP: OncoTerm, PANGLOSS,
OntoGeneration Integração da Informação: Ariadne,
OBSERVER Web Services
Franklin Ramalho DSC-CCT-UFCG
Considerações Finais
Web mais inteligente! Grande quantidade de agentes
computacionais fazendo uso da WS Maior sinergia entre diversas
comunidades de pesquisa
Franklin Ramalho DSC-CCT-UFCG
Considerações Finais
XML – ponto de partida para padronização de conteúdos na comunicação entre agentes computacionais
Markup Languages extensíveis Markup Languages cada vez mais
“verborreicas” Ferramentas de apoio são necessárias
Franklin Ramalho DSC-CCT-UFCG
Considerações Finais Grupos da W3C ainda trabalham de
forma isolada Necessidade de uma única linguagem
que expresse dados e regras para raciocínio sobre estes.
Como prover tratamento de provas e credibilidade?
O que vem por ai? ?ML, ?ML, ?ML …
Recommended