48
Web Semântica Fred Freitas CIn - UFPE

Web Semântica

  • Upload
    hope

  • View
    39

  • Download
    0

Embed Size (px)

DESCRIPTION

Web Semântica. Fred Freitas CIn - UFPE. Objetivos. Entender a utilidade e a filosofia da Web Semântica Distinguir as camadas da Web Semântica De cada camada: Discernir a expressividade de cada uma delas Entender o papel de cada uma delas Conhecer suas respectivas linguagens. - PowerPoint PPT Presentation

Citation preview

Web Semântica

Fred Freitas

CIn - UFPE

Objetivos

• Entender a utilidade e a filosofia da Web Semântica

• Distinguir as camadas da Web Semântica

• De cada camada:

– Discernir a expressividade de cada uma delas

– Entender o papel de cada uma delas

– Conhecer suas respectivas linguagens

Plano de aula

• Motivação: Problemas e potenciais da Web

• A Web Semântica e suas camadas

• As camadas XML e RDF

• A camada de Ontologias

• Aplicações e perspectivas

Trajetória da Internet

• 1a. Geração - troca de dados entre máquinas distintas

• 2a. Geração - a World Wide Web

• Disponibilizou uma vasta gama de aplicativos e informação para as pessoas

• Comércio eletrônico entre clientes e empresas (b2c)

A Internet

• A linguagem em que são codificadas as páginas da Internet (HTML – HyperText Markup Language) garante apenas apresentação e navegação

• Como achar a informação desejada??

Quero saber o que pesquisa

o Prof. Robin…

Página dele, em HTML

<meta NAME="Author" CONTENT="Jacques Robin">

<meta NAME="Description" CONTENT="Personal HOme-page of Jacques Robin professor">

…<h3><font face="Arial">Research Interests</font></h3><ul> <li> Artificial Intelligence </li>

<li> Multi-Agent Systems </li> <li> Computational Linguistics </li>

<li> NLP </li><li> Hypertext Generation </li>

<li> Intelligent Databases </li><li> Logic Programming </li><li>Data Warehousing and OLAP</li>

</ul>

O que está O que está codificadocodificado na na página dele não diz nadapágina dele não diz nada a respeito do conteúdo! a respeito do conteúdo!

Os Engenhos de Busca se confundem…

Baixa precisão

Baixa Cobertura

Motivação: Problemas de

Recuperação de Informação na Web

• Falta de precisão: muitos resultados irrelevantes

• Principais ausências– Falta de contexto

– Falta de semântica na definição das páginas

• O usuário em busca de informações objetivas é quem fica com o trabalho duro de interpretar, filtrar e combinar os resultados de sistemas de busca

Franklin Ramalho is a PhD student in the Centro de Informática at the Universidade Federal de Pernambuco.

http://www.cin.ufpe.br/~fsr/

http://www.di.ufpe.br/~jr/students.html

O significado dos links está relacionado a:

• O que há em torno

• Um contexto

Jacques Robin's Research StudentsPhD. students:

Franklin Ramalho

Qual o significado dos Links?

„Quais são os competidores da Audi no mercado em Recife ?“?

Motivação: Perguntas que

podem ser respondidas (mas não são!)

Respostas:

Volvo

1 A Audi vende carros de luxo em Recife.

A Volvo vende carros de luxo em Recife.2

3 Audi e são competidores no mercado de Recife.

&

=

Motivação: Informações implícitas

Plano de aula

• Motivação: Problemas e potenciais da Web

• A Web Semântica e suas camadas

• As camadas XML e RDF

• A camada de Ontologias

• Aplicações e perspectivas

3a. Geração - A Web Semântica

• Objetivo: prover contexto e semântica à informação para o software

• Transformar os dados e aplicativos em elementos úteis, legíveis e compreensíveis para o software

• Facilitar a comunicação dinâmica, a cooperação e a inferência para os agentes inteligentes

• Possibilitar o comércio eletrônico entre empresas (b2b)

Camadas da Web Semântica

Troca de dados

Dedução do Implícito

Semântica Explícita

Dados relacionais distrib.

As camadas de lógica, prova e confiança

• Estas camadas ainda estão sendo pesquisadas

• A camada lógica permite a especificação de regras que atuam sobre instâncias e recursos

• A camada de prova as executa

• A camada de confiança avalia se a prova está correta ou não

Plano de aula

• Motivação: Problemas e potenciais da Web

• A Web Semântica e suas camadas

• As camadas XML e RDF

• A camada de Ontologias

• Aplicações e perspectivas

XML• HTML foi abstraída para XML

– eXtensible Markup Language

• As etiquetas (tags) podem ser rotulados

• Dados ganham sintaxe, mas não significado:

• Etiquetas como “livro” e “autor” são intuitivas para nós– Mas não para o computador: o que é “livro”? Quais as relações? ...

<livraria> <livro> <titulo>O Lobo da Estepe</titulo> <autor>Herman Hesse</autor> <isbn>0836217462</isbn> </livro></livraria>

A camada XML

Definições de Tipos

de Documentos (DTDs)

• DTDs definem a estrutura (e sintaxe) de um documento

• Classes, atributos, valores default e ordem de aparecimento dos dados das instâncias – Aninhamento léxico

<!DOCTYPE livraria [<!ATTLIST livro id ID #IMPLIED><!ATTLIST autor id ID #IMPLIED><!ATTLIST ISBN id ID #IMPLIED>]>

XML

Esquemas XML (XMLS)

• Semelhantes a DTDs, porém mais ricos

• Definem-se ainda tipo e formato exato dos atributos, número exato de instâncias de um aninhamento

• Há mecanismos de inclusão e derivação de esquemas que proporcionam reuso

• A camada XML descreve a estrutura do documento, deixando para as que acima dela a definição do conteúdo

XML

Web Semântica & XML

Empresa 2: <Automovel> <Nome>Jaguar XJ </Nome> <Custo>100.000 US$ </Custo></Automovel>

Empresa 1: <Produto> <tipo>Carro</tipo> <Nome>Jaguar</Nome> <Preco>300.000 R$</Preco></Produto>

Problemas:

–Conflitos de Nome

–Conflitos de Valor

–Conflitos de Estrutura

XML

XML não provê semântica formal

Serve apenas para colaboração previamente acertada, com agentes e páginas num ambiente limitado (comunidade ou intranet)

.. Mas não para páginas a serem disponibilizadas para quaisquer usuários na Internet

• XML organiza os dados em árvores e define sintaxe• Mas só sintaxe não ajuda muito em B2B:

A camada RDF

• Resource Description Framework

• Adiciona semântica a um documento, sem referir-se à sua estrutura

• Usa XML como sintaxe

• Descreve “recursos” (URIs) da Web– Partes específicas de documentos ou dados como lugares,

pessoas, etc

RDF+RDFSchema

Exemplo de descrição em RDF

http://www.cin.ufpe.br/~jr Date

CreatorJacques Robin

02-05-2002

http://www.cin.ufpe.br

Professor

Sujeito (recurso) http://www.cin.ufpe.br/~jr

Predicado

(atributo)Criador (“creator”)

Objeto

(valor)

“Jacques Robin"

Código em RDF

<rdf:RDF

xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#

xmlns:dc=http://pur1.org/metadata/dublin_core#

>

<rdf:Description about= http://www.cin.ufpe.br/~jr>

<dc:Creator>Jacques Robin</dc:Creator>

<dc:Date>05-02-2002</dc:Date>

<dc:Description>Personal home-page …</dc:Description>

<Professor rdf:resource=“http://www.cin.ufpe.br”/>

</rdf:Description>

</rdf:RDF>

Meta-descrição

Descrição

• RDF• Recursos são descritos como trios objetos-atributos-valores

• Os objetos são recursos • Valores são recursos ou strings• Ao invés de árvores, trios representam grafos diretos

rotulados

• RDF Schema– Padroes (primitivas) de modelagem

• class, subclassof, type• property, subpropertyof (hierarquias de propriedade)• domain, range (domínio e imagem)

• Motores de inferência: TRIPLE e Sesame

RDF & RDF(S)RDF+RDFSchema

• RDF• Recursos são descritos como trios objetos-atributos-valores

• Os objetos são recursos • Valores são recursos ou strings• Ao invés de árvores, trios representam grafos diretos

rotulados

• RDF Schema– Padroes (primitivas) de modelagem

• class, subclassof, type• property, subpropertyof (hierarquias de propriedade)• domain, range (domínio e imagem)

• Motores de inferência: TRIPLE e Sesame

RDF & RDF(S)RDF+RDFSchema

TercioFred

Professor

Pessoa

subClassOf subproperty

type

responsavelPordomain

range

typeorienta

Empregado

orientaAluno

Avaliação de RDF & RDF(S)RDF+RDFSchema

• Com RDF(S) é possível :– Falar sobre recursos da Web– Definir vocabulário – Modelar relações simples

• Porém, isto é insuficiente para a Web– Como expressar contexto apropriadamente:

• Igualdade? –ex: 2 páginas que falam sobre um mesmo livro

• Características de relações? –Relações inversas, transitivas, simétricas

• Conjuntos disjuntos• ...

Plano de aula

• Motivação: Problemas e potenciais da Web

• A Web Semântica e suas camadas

• As camadas XML e RDF

• A camada de Ontologias

• Aplicações e perspectivas

Definições de ontologia

• Ontologia: Especificação de uma conceitualização [Gruber 91]

• Hierarquia de conceitos (classes) com suas relações, restrições, axiomas e terminologia associada

Id Modelo

Xy 777

Agente da Cia. Aérea

Ont. de Meios de Transporte

Trem Avião Barco

Transporte Carreira Caça

Avião

Meu agente

777[é-um 777]

Id Modelo

Xy 777

Agente da Cia. Aérea

Ont. de Meios de Transporte

Trem Avião Barco

Transporte Carreira Caça

Avião

Meu agente

777[é-um 777]

[Huhns & Singh 97]

Ontologias

• “Uma ontologia é uma especificação explícita e formal de uma conceitualização compartilhada” [Studer et al 98]

• Explícita: definições declarativas de conceitos, instâncias, relações, restrições e axiomas

• Formal: declarativamente definida, sendo compreensível e manipulável para inferência por agentes e sistemas– Precisa estar representada num formalismo de representação de

conhecimento, como Frames e Lógica de Descrições!

• Conceitualização: modelo abstrato de uma área de conhecimento ou de um universo limitado de discurso

• Compartilhada: conhecimento consensual

OntologiasDefinições de ontologia II

Ontologia Ciência Ontologias

Relações na Ontologia Ciência

• A camada de ontologias foi padronizada pelo W3C usando a linguagem OWL (Web Ontology Language)

• Implementa o formalismo lógica de descrições– Inferência completa e decidível

– Motores de inferência: FAcT, Racer

OntologiasA linguagem OWL

• Classes podem ser construídas por:– União– Interseção– Complemento– Enumeração de instâncias

• Classes podem ter disjunções • Propriedades podem ter:

– transitividade, simetria, atributos inversos– propriedades funcionais

• (se P(x,y) ^ P(y,x) => x=y)

• Igualdade e desigualdade de instâncias

OntologiasExpressividade da camada

de ontologias

Igualdade

x:Professor

x:Person

x:PhD-Student

x:Human

rdfs:Class

x:Fred x:Rafaelx:Tercio

sub-classe

instância

Declaração de classes

x:Human

x:email

x:supervises

x:advises

x:Person x:Person

rdf:Literal

x:Human

rdfs:domain

rdfs:domain

rdfs:range

rdfs:range

rdfs:range

Declaração de propriedades

RDFRDF

Ontologias

igualdade

desigualdade

Igualdade

x:Professor

x:Person

x:PhD-Student

x:Human

rdfs:Class

x:Fred x:Rafaelx:Tercio

sub-classe

instância

Declaração de classes

x:Human

x:email

x:supervises

x:advises

x:Person x:Person

rdf:Literal

x:Human

rdfs:domain

rdfs:domain

rdfs:range

rdfs:range

rdfs:range

Declaração de propriedades

RDFRDF

Ontologias

igualdade

desigualdade

instance(Human) ?

Fred, Tercio, Rafael

Advises( Fred, ?)

Tercio

x:Terciox:Fred

X:Rafael

[email protected]

[email protected]

x:advises

x:email

x:email

x:email

[email protected]

x:supervises

x:isSupervisedBy

Igualdade

x:Professor

x:Person

x:PhD-Student

x:Human

rdfs:Class

x:Fred x:Rafaelx:Tercio

sub-classe

instância

Declaração de classes

x:Human

x:email

x:supervises

x:advises

x:Person x:Person

rdf:Literal

x:Human

rdfs:domain

rdfs:domain

rdfs:range

rdfs:range

rdfs:range

Declaração de propriedades

RDFRDF

Ontologias

igualdade

desigualdade

x:Terciox:Fred

X:Rafael

[email protected]

[email protected]

x:advises

x:email

x:email

x:email

[email protected]

x:supervises

x:isSupervisedBy

Conhecimento adicional•supervises e isSupervisedBy sao inversos• cooperatesWith é simétrica• Os tópicos de pesquisa de um Phd-Student sao um subconjunto dos tópicos do Professor que o orienta

Plano de aula

• Motivação: Problemas e potenciais da Web

• A Web Semântica e suas camadas

• As camadas XML e RDF

• A camada de Ontologias

• Aplicações e perspectivas

Aplicações

• Gestão de Conhecimento– A Web semântica pode ser o elemento agregador, pois o

conhecimento de uma empresa pode ser organizado em torno de ontologias

• Agentes inteligentes!– Poderão trocar e processar informação convenientemente

em processos de comércio eletrônico

– Se programados convenientemente poderão responder a perguntas sobre informações da Web

• ITTALKS: Palestras de TI são anotadas em OWL automaticamente– Usuários são avisados sobre palestras de seu interesse

Perspectivas da Web semântica

• Deve se popularizar primeiro em segmentos empresariais – Comércio eletrônico B2B

– Workflow

– E-government, e-learning

• Florescem aplicações e ferramentas– Motores de inferência

– Ambientes para ontologias

– Anotadores semi-automáticos

Cuidado com padrões complexos!

• Misturar navegação, apresentação e semântica numa só definição prejudica a legibilidade

• È preciso aprender com os erros da Ontolingua

• Problemas relativos à lógica de descrições: OWL é bastante expressivo, mas...– Que usuários estão familiarizados com LD?

– O usuário comum se habituará à LD

Conclusão

• Tecnologias ligadas à Web Semântica podem ser muito úteis– Soluções para Gestão de Conhecimento e de

Documentos

– Muitas possíveis aplicações para a Web

– Muitas possíveis aplicações para eBusiness, e-gov, e-learning...

Conclusão II

• A Web Semântica pode levar o tratamento de informação a outro patamar– Domínios modelados com clareza e interpretação

semântica

– Relações entre itens de informação podem ser descritas com interpretação compreensível para o software

– Usuários recebem respostas, e não listas de links!

Para fixar: Resumo

• A Web Semântica visa transformar os dados e aplicativos em elementos úteis, legíveis, compreensíveis para o software

• Com ela é possível inferir dados implícitos

• As principais camadas são:– A camada XML, que provê sintaxe

– A camada RDF, que provê semântica simples

– A camada de ontologias, que provê rica expressividade para definir domínios de aplicação

• Existem ferramentas para a Web semântica

• Existem repositórios para reuso de ontologias

Próximas aulas

Ferramentas para Manipulação de Ontologias

Reusos de Ontologias Colaboradores remotos

Escritores

Leitores

Aplicações remotas

DB

Aplic. GUI

Aplicações stand-alone

Aplic.

BC

KQML

NGFP

Servidor / Editor de Ontologias

Editor

Servidor

HTTP

NGFP

Tradutores:LOOM,IDL,CLIPS...

Bibl

Transferência de arquivos (Batch)

Aos Interessados

• Tutorial “Ontologias e Web Semântica”– Fred Freitas– JAIA (Jornada de Atualização em IA), Congresso da

Sociedade Brasileira de Computação (SBC), Campinas, 2-8/agosto

• Tutorial “Ontologies: Representation, Engineering, Learning & Applications”– Prof. Dr. Rudi Studer, W3C– 3rd IFIP Conference on E-Commerce, E-business and E-

Government (I3E), Casa Grande Hotel, Guarujá, 21-24/setembro de 2003