Web Semântica e Ontologia

  • Published on
    27-May-2015

  • View
    307

  • Download
    2

Embed Size (px)

DESCRIPTION

Web semntica e seu uso com ontologia.

Transcript

<ul><li> 1. 1 INTRODUO No h dvidas quanto a importncia da Internet nos dias atuais e tambm no h dvidas de que ela marcou o mundo aps sua popularizao. Ainda hoje, a Internet tem a capacidade de alterar a forma com que empresas fecham negcios ou seu modo de operao e tambm tem ainda a capacidade de alterar o cotidiano das pessoas. Um dos grandes desafios na Internet a recuperao da informao. Mesmo com todo o avano tecnolgico e anos de estudos, ainda hoje impossvel ter somente resultados plausveis em um site de busca. Algumas vezes esses sites de busca informam como resultado pginas Web que j foram apagadas. Nesse contexto vislumbra-se como novo e significativo avano, em termos de tecnologia para Internet, a Web Semntica. O projeto est em desenvolvimento na empresa W3C, cujo diretor Tim Berners-Lee, o inventor da Web. De acordo com Wilson (2007), com a Web Semntica em funcionamento, os computadores podero entender o contedo de um site. A seguir trataremos dos ferramentas que sustentam a Web Semntica e permitem seu funcionamento e os desafios a serem superados para implementao dessa poderosa ferramenta. </li></ul> <p> 2. 2 O QUE SER POSSVEL COM A WEB SEMNTICA Um consumidor visita um site de uma loja virtual na Internet em busca de um DVD. Este consumidor sabe o ttulo que procura e as caractersticas do DVD como sua preferncia por DVD simples ou duplo, se prefere tela widescreen ou fullscreen, tem preferncia a respeito de o ttulo ser dublado ou legendado, dentre outros. Para concluir sua tarefa ele necessita visitar vrias pginas web para verificar se as condies especificadas esto sendo correspondidas. Este um exemplo introdutrio de Wilson (2007) e o prprio autor mostra a alternativa da Web Semntica: o consumidor teria em seu computador um programa intitulado agente. Este agente faria a busca na Web e devolveria ao consumidor a(s) melhor(es) resposta(s); da ele carregaria o programa de finanas pessoais do consumidor e registraria o valor gasto; tambm, em seu programa de agenda, registraria a data da entrega. Este programa agente ainda teria a informao se o resultado da compra foi satisfatria ou no, visando compras futuras na loja virtual em que o consumidor fechou negcio. Wilson (2007) conclui que isto possvel porque o agente busca na Web metadados correspondentes s preferncias do consumidor. Metadados so dados que so utilizados no intuito de interpretar outros dados. De acordo com Berners-Lee apud Wilson (2007), estas ferramentas deixaro a Web, atualmente semelhante a um grande livro, como um gigante banco de dados. 3. 3 MARCAO VIA XML E RDF O computador, ou a linguagem da mquina, necessita de programaes especficas para que possa fazer concluses lgicas, relata Wilson (2007). Por exemplo, se o usurio informa no computador que Jos pai de Maria, ao computador somente ser possvel interpretar que Maria filha de Jos se houver uma programao especfica para isso. Nesse contexto se apresenta duas ferramentas primordiais para a Web Semntica: as linguagens de marcao XML e RDF. Conforme Holzner (2001), uma linguagem de marcao uma linguagem de programao para computadores na qual existe uma marcao referente descrio da forma do documento. Um exemplo de linguagem de marcao a Hypertext Markup Language HTML, amplamente utilizada na Web. A Extensible Markup Language XML, tem como vantagem sobre a HTML o fato de ser customisvel, conforme Wilson (2007), isto quer dizer que a XML no rgida e com padres limitados como a HTML, via XML possvel criar uma linguagem de marcao prpria do desnvolvedor, alm de permitir a troca de dados. Mas a XML no substitui a HTML, ela a complementa, acrescenta Wilson (2007), via tags1 que descrevem dados. Holzner (2001) completa que os documentos XML so compostos de marcao e dados de caracteres, a marcao em um documento revela sua estrutura e esta marcao inclui tags de incio, tags de fim, tags de elemento vazio, dentre outras. A Resource Description Framework RDF uma aplicao da XML, define Wilson (2007), especializada em metadados. Via RDF possvel criar vocabulrios com o intuito de descrever recursos, como exemplo tem-se o Dublin Core, que ser tratado mais adiante. Wilson (2007) acrescenta que a RDF trabalha como se tudo fosse um recurso, como um item especfico ou um local na Web, dessa forma, o computador sabe exatamente o que o recurso . Alm disso, quando bem definidos os recursos, o computador identificar a informao exatamente como ela , evitando interpretar que Jos irmo de Maria, citando o exemplo anterior. Holzner (2001) completa que a RDF um pilar para o processamento de metadados; oferecendo interoperabilidade entre aplicaes na Web que trocam 1 Tags so dados de caracteres (linguagem de programao). (Wilson 2007). 4. informaes inteligveis s mquinas. A RDF vale-se de da XML para trocar descries de recursos da Web, mas os recursos que esto sendo descritos podem ser de qualquer tipo, XML e no XML. Para cumprir este objetivo, a RDF usa um trio escrito como tags XML para expressar informao como um grfico. Em analogia a gramtica portuguesa, esse trio funcionaria exatamente como sujeito, o predicado e o objeto em uma frase, e sua denominao, exatamente na ordem, seria sujeito, propriedade e objeto. O exemplo apresentado acima, seria esquematizado via RDF, conforme a figura 1 abaixo. Um exemplo de RDF hoje na internet so os campos de RSS. Figura 1: O trio RDF Fonte: Wilson (2007) At este ponto o computador entende que h dois objetos na sentena e um relacionamento entre eles. Mas ele no sabe o que os objetos so e como se relacionam. As ferramentas para adicionar essa interpretao sero vistas a seguir. 3.1 O DUBLIN CORE Conforme Holzner (2001), a RDF genrica o suficiente para dar suporte a todos os tipos de descricoes de recursos, essa generalidade, para ser til, dever usar termos combinados. Vrias linguagens utilizam a RDF e definem elementos especficos da XML para descrever recursos, neste contexto que aparece o Dublin Core. Para Holzner (2001), o Dublin Core se autodenomina iniciativa de metadados e oferece um modelo de contedo RDF muito utilizado para descrever recursos da Web. 5. 4 URI Mesmo com a estrutura da XML e da RDF, o computador ainda precisa de uma referncia especfica para que possa entender quem ou o que os recursos so, informa Wilson (2007). Para cumprir este objetivo, os computadores se valem dos identificadores de recursos uniformes, em ingls Uniform Resource Identifier URI. O URI tem a habilidade de apontar para qualquer coisa na Web e fora dela, como aplicativos domsticos do usurios. Na figura 2 abaixo, a URI d ao computador um ponto especfico de referncia para cada item do trio, no h possibilidade de mal entendido ou necessidade de interpretao. Figura 2: RDF utilizando URI para direcionar o computador Fonte: Wilson (2007) Wilson (2007) observa que um ponto importante a ser analisado na figura 2 que a URI da propriedade aponta para um local diferente da URI Recuso e da URI Valor, na verdade, ela aponta para um documento que est de um servidor denominado planofamiliar. Se esta pgina realmente existisse, ela seria o namespace XML. Namespace XML so, segundo Holner (2001), documentos constitudos para evitar conflitos de linguagem. Como informado acima, a XML pode ser customizada, assim, h vrias verses da XML que podem se sobrepor, criando conflito. Diferente do HTML, que utiliza padres tags como <b> para negrito e para sublinhado, XML no tem padres tags, informa Holzner (2001). Isto til porque, conforme Wilson (2007), permite a desenvolvedores criarem tags nicos para propsitos 6. especficos. Mas isto significa que o browser no sabe automaticamente o que os tags significam. Um namespace XML basicamente um aplicativo-documento que diz o significado de todos os tags em outros documentos. O criador de um documento XML declara o namespace no incio do documento com uma linha de cdigo. No exemplo acima, a declarao namespace seria: Segundo Wilson (2007), esta linha de cdigo interpretada pelo computador: em qualquer tag que inicie com plf utilize o vocabulrio encontrado neste documento, aqui pode-se encontrar qualquer tag iniciando com plf. Deste modo, as pessoas podem criar um tag XML que precisam para encontrar um documento, sem conflito com outro documento XML na Web. XML e RDF so as linguagens oficiais da Web Semntica, porm, sozinhas no seriam suficientes para fazer todo acesso da Web ao computador. Assim h necessidade de analisar outras camadas, descritas a seguir. 7. 5 LINGUAGENS E VOCABULRIOS: RDFS, OWL E SKOS De acordo com Wilson (2007), outro obstculo a ser superado pela Web Semntica a questo do vocabulrio. Fazendo um paralelo com o cotidiano de uma pessoa e com o computador, percebe-se que para a pessoa fcil entender associaes e conexes entre conceitos, j para o computador esta no uma tarefa rotineira. Para que os computadores possam cumprir esta tarefa, eles so providos de documentos que descrevem todas as palavras e lgicas para fazer as conexes necessrias. Na Web Semntica, conforme Wilson (2007), isto possvel com atravs de duas ferramentas: esquema e ontologia. Uma ontologia um vocabulrio que descreve objetos e como se relacionam uns com outros. J um esquema um mtodo para organizar informao. O acesso ontologia e ao esquema se d atravs de documentos como metadados. O desenvolvedor, quando da criao da pgina web, dever declarar quais ontologias esto referenciadas no incio do documento. De acordo com Holzner (2001), um documento XML, cuja sintaxe foi verificada com sucesso, denominado documento vlido; um documento XML para ser considerado vlido dever conter Definio de Tipo de Documento DTD ou esquema XML associado a ele e se o documento estiver de acordo com a DTD ou com o esquema. Ainda segundo Holzner (2001), as DTDs referem-se todas s especificaes da estrutura e sintaxe dos documentos XML, no seu contedo. Vrias organizaes podem compartilhar uma DTD para colocar uma aplicao XML em prtica. Como mencionado h pouco, o esquema XML tem o poder de validar um documento XML. O esquema XML, de acordo com Holner (2001) uma evoluo da DTD, ou seja, sua funo no de apenas validar documento XML, mas tambm: especificar os tipos de dados reais do contedo de cada elemento, herdar a sintaxe de outros esquemas, dentre outros. Para Wilson (2007), os esquemas e ontologias usadas na Web Semntica incluem: Esquema para Linguagem de Descrio de Vocabulrio RDF (RDFS) RDFS adiciona classes, subclasses e propriedade aos recursos, criando estrutura bsica de linguagem. Por exemplo, o recurso PAI uma subclasse da classe HOMEM. Uma propriedade de PAI poderia ser CARINHOSO. 8. Sistema de Organizao de Conhecimento Simples (SKOS) SKOS classifica recursos em termos de amplo ou curto, permite designao de preferncia e rtulos alternativos e pode levar rapidamente porto tesauro e glossrios da Web. Por exemplo, num glossrio FISIOLOGIA, um termo curto para HOMEM poderia ser JOS e um termo amplo seria BONDADE. Linguagem de Ontologia Web (OWL) OWL, a camada mais complexa, formaliza ontologias, descreve relacionamentos entre classes e usa lgica para fazer dedues. Ele pode tambm construir novas classes baseado em informaes existentes. OWL est disponvel em trs nveis de complexidade: leve, Linguagem Descrio e Total. Wilson (2007) relata que o problema das ontologias que elas so difceis de criar, de implementar e de manter. As ontologias podem ser muito grandes, definindo grande variedade de conceitos e relacionamentos. Este aspecto cria um conflito entre os desenvolvedores: alguns preferem focar na lgica e no nas ontologias. Tal fato, conclui Wilson (2007), pode culminar com a Web Semntica. No exemplo do captulo 2, foi tratado sobre a compra de um DVD. Aqui est como a Web Semntica poderia fazer todo o processo mais simples, em conformidade com Wilson (2007): cada site teria texto e figuras (para as pessoas) e metadados (para os computadores lerem) descrevendo os DVDs disponveis para compra naquele site; os metadados, valendo-se de trios RDF e tags XML, fariam todos os atributos dos DVDs (como configurao e preo) legveis pela mquina; quando necessrio, negcios usariam ontologias para dar o vocabulrio necessrio ao computador para descrever todos os objetos e seus atributos; os sites de compras poderiam usar as mesmas ontologias, tambm todos os metadados seriam uma linguagem comum; cada site vendendo DVDs usaria tambm segurana apropriada e meios de encriptao para proteger a informao dos clientes; 9. aplicaes computadorizadas ou agentes leriam todos os metadados e encontrariam diferentes sites; as aplicaes poderiam ainda comparar informaes, verificando aquelas que as origens eram acuradas e confiveis. Evidentemente, esclarece Wilson (2007), a Web enorme e adicionar todos estes metadados s pginas existentes uma tarefa gigante. Esse e outros obstculos para a Web Semntica sero vistos a seguir. 10. 6 UM OLHAR FUTURO WEB SEMNTICA De acordo com Wilson (2007), muito da Web Semntica ainda est em desenvolvimento. Tal como a World Wide Web, a Web Semntica no est subordinada a nenhuma empresa ou governo. Todavia, algumas pessoas e organizaes tm tomado as rdias de sua estruturao, como a W3C (World Wide Web Consortium). Essa liberdade, ainda segundo Wilson (2007), permite aos desenvolvedores criarem as tags e ontologias de que precisam, porm, pode ocorrer que desenvolvedores que no estejam trabalhando em conjunto, criem tags e ontologias para descrever a mesma coisa de forma diferentes. Outra crtica apontada por Wilson (2007) referente a questo do problema da identidade: um URI representa uma website ou os objetos descritos nela? Como dito acima, h alguns desenvolvedores que preferem focar em lgica e outros em ontologias. Qualquer caminho que se siga, o projeto enorme. 11. REFERNCIAS HOLZNER, Steven. Desvendendo XML. Rio de Janeiro: Campus, 2001. WILSON, Tracy V.. How The Semantic Web Works. 2007. Disponvel em . Acesso em: 06/06/2007. Nossa traduo. </b></p>