Upload
phungkhanh
View
214
Download
0
Embed Size (px)
Citation preview
UNIVERSIDADE CATÓLICA DE PELOTAS
CENTRO POLITÉCNICO
PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA
Aplicações da Web Semântica nas Redes Sociais
Por
André Desessards jardim
Trabalho Individual
TI 2008-2-01
Orientador: Prof. Dr. Luiz Antônio Moro Palazzo
Pelotas, Novembro de 2008
SUMÁRIO
LISTA DE FIGURAS ...................................................................................................... 3
LISTA DE ABREVIATURAS E SIGLAS ...................................................................... 4
RESUMO ......................................................................................................................... 5
ABSTRACT ..................................................................................................................... 6
1. INTRODUÇÃO............................................................................................................ 7
1.2 Objetivos................................................................................................................. 9
1.2 Organização do Texto............................................................................................. 9
2. WEB SEMÂNTICA................................................................................................... 11
2. 1 XML (eXtensible Markup Language) ................................................................ 16
2.2 RDF (Resource Description Framework) ............................................................ 18
2. 3 OWL (Web Ontology Language) ........................................................................ 20
2.4 Vocabulários......................................................................................................... 21
2.4 FOAF (Friend of a Friend) .............................................................................. 21
2.5 Dublin Core ...................................................................................................... 22
3. WEB 2.0 - REDES SOCIAIS..................................................................................... 24
4. ONTOLOGIAS .......................................................................................................... 30
5. PROTÉGÉ .................................................................................................................. 34
6. ONTOLOGIA DO DOMÍNIO DAS REDES SOCIAIS............................................ 37
7. CONSIDERAÇÕES FINAIS ..................................................................................... 44
8. REFERÊNCIAS BIBLIOGRÁFICAS ....................................................................... 46
9. ANEXOS.................................................................................................................... 51
9.1 Anexo A – Descrição dos conceitos da Ontologia do Domínio das Redes Sociais
.................................................................................................................................... 51
9.2 Anexo B – A evolução da Web ............................................................................ 70
9.2 Anexo C – Web 2.0 Framework........................................................................... 71
9.3 Anexo D – Adoção de Redes Sociais e Web 2.0 nas Empresas Americanas....... 72
9.4 Anexo E – Arquitetura do Social Networks Semantic Server.............................. 73
LISTA DE FIGURAS
Figura 2.1 - Comparação entre Web 1.0, 2.0 e 3.0......................................................... 12
Figura 2.2 – A evolução da Web (Semantic Wave 2008).............................................. 13
Figura 2.3 – As Camadas da Web Semântica................................................................. 16
Figura 3.1 – Tag Cloud com os principais temas da Web 2.0........................................ 24
Figura 3.2 – Web 2.0 Framework................................................................................... 25
Figura 3.3 – Exemplo de site utilizando Redes Sociais.................................................. 28
Figura 3.4 – Adoção das tecnologias de Web 2.0 e Redes Sociais nas empresas
americanas ...................................................................................................................... 29
Figura 5.1 – Interface Protégé versão 3.1.1.................................................................... 35
Figura 6.1 – Social Networks Semantic Server.............................................................. 43
LISTA DE ABREVIATURAS E SIGLAS
URI - Uniform Resource Identifier
XML – eXtensible Markup Language
RDF – Resource Description FRamework
RDFS – RDF Schema
SPARQL – Simple Protocol and RDF Query Language
SQL – Structured Query Language
RIF – Rule Interchange Format
OWL – Web Ontology Language
W3C – World Wide Web Consortium
HTML – HyperText Markup Language
DTD – Document Type Definition
SGML Standard Generalized Markup Language
XSLT - XML Stylesheet Language Transformations
XMI - XML Metadata Interchange
FOAF – Friend of a Friend
DC – Dublin Core
API – Aplication Program Inteface
CGM – Consumer-Generated Media
RESUMO
Até recentemente, a manipulação de grandes quantidades de informação era uma tarefa
de especialistas, agora constitui uma necessidade para pessoas de todas as áreas, tanto
na sua atividade profissional como na maioria das tarefas do dia a dia. A qualidade na
recuperação de informação é crucial em muitas profissões, e a melhoria dos sistemas
pode ter um grande impacto nesta, especialmente quando se trata de coleções de
documentos heterogêneos. A pesquisa na Web tem sido um excelente campo para a
recuperação de informação em grande escala e a indexação automática maciça. O
presente trabalho se propõe um estudo geral sobre Web Semântica, Web 2.0, redes
sociais e ontologias, suas aplicações, linguagens e metodologias, tendo como finalidade
principal, a criação de uma Ontologia do Domínio das Redes Sociais, com o objetivo de
verificar como as redes sociais podem ser potencializadas através da Web Semântica, e
de como no futuro a Web Semântica e as redes sociais irão se integrar. O grande desafio
consiste em modelar este domínio de uma forma a facilitar o desenvolvimento de
aplicações para ele, utilizando tecnologias e ferramentas da Web Semântica. Este
trabalho teve também como objetivo sistematizar o estudo das redes sociais, Web 2.0,
Web Semântica e ontologias, de forma a servir de base e referência para estudos futuros.
Palavras-chave: Web Semântica, Web 2.0, Redes Sociais, Ontologias.
ABSTRACT
Until recently, the handling of large amounts of information was a task for specialists, is
now a need for people from all areas, in their professional and in the tasks of everyday
life. The quality in information retrieval is crucial in many professions, and
improvement of systems can have a major impact on this, especially when it comes to
heterogeneous collections of documents. The research on the Web has been an excellent
field for information retrieval and massive automatic indexing on a large scale. This
research proposes a general study on Semantic Web, Web 2.0, social networks and
ontologies, its applications, languages and methodologies, with the main purpose of
creating of an Social Networks Ontology, in order to see how the social networks can be
enhanced through the Semantic Web, and see how in the future the Semantic Web and
social networks will be integrated. The big challenge is to shape this field in a manner to
facilitate the development of applications for it, using technologies and tools of the
Semantic Web. This work was also intended to systematize the study of social
networks, Web 2.0, Semantic Web and ontologies in order to serve as a basis and
reference for future studies.
Key-words: Semantic Web, Web 2.0, Social Networks, Ontologies.
7
1. INTRODUÇÃO
No início, a Web era caracterizada por sites estáticos, sem interação com os
usuários. A primeira grande mudança na forma em que usamos a Internet veio com a
larga aplicação de sites de comércio eletrônico. Assim, a rede passou a nos oferecer
produtos e serviços. A Seguir veio a fase dos sites de relacionamento e
compartilhamento de conteúdos, a chamada Web 2.0.
A organização da imensa vastidão de conteúdo disponível atualmente na
Internet, de uma forma simples, eficiente e focada em nossas necessidades, se tornou
um problema. Dessa necessidade surgiu a Web Semântica. Sua principal aplicação se
refere à capacidade de os sistemas computacionais interpretarem o conteúdo disponível
nos sites da Internet e conseguir entender de forma diferenciada uma página em que a
palavra bala é um doce ou é um projétil de armas, por exemplo. Ou seja, o conteúdo é
interpretado de acordo com seu contexto (Clicko, 2008).
A Web Semântica representa a evolução da Web atual. Enquanto a Web
tradicional foi desenvolvida para ser compreendida somente pelos usuários, a Web
Semântica está sendo projetada para ser entendida também pelas máquinas. Este
entendimento se dá na forma de agentes computacionais, que são capazes de operar
eficientemente sobre as informações, podendo entender seus significados. Portanto,
auxiliando os usuários em operações na Web (Dziekaniak et al., 2004).
A Web Semântica tem como objetivo incorporar semântica às informações. Com
isso, não somente os usuários entenderão as informações como também as máquinas.
Ela pretende fornecer estruturas e dar significado semântico ao conteúdo das páginas
Web, criando assim um ambiente onde agentes de software possam trabalhar em
conjunto com o usuário (Dziekaniak et al., 2004).
De acordo com Berners-Lee (2001) os computadores necessitam ter acesso a
coleções estruturadas de informações (dados e metadados) e de conjuntos de regras de
inferência que ajudem no processo de dedução automática para que seja administrado o
raciocínio automatizado, ou seja, a representação do conhecimento.
Estas regras são especificadas através de ontologias, as quais permitem
representar explicitamente a semântica dos dados. Através dessas ontologias é possível
elaborar uma rede enorme de conhecimento humano, complementando o processamento
8
da máquina e, portanto, melhorando qualitativamente o nível de serviços na Web (Silva,
2002).
De acordo com Hendler (2001) e citado em Dziekaniak et al. (2004), a Web
Semântica pode ser considerada como a composição de um grande número de pequenos
componentes ontológicos que apontam entre si. Dessa forma, universidades,
companhias, agências governamentais e grupos de interesses específicos terão grande
interesse em ter seus recursos Web ligados a um conteúdo ontológico, pois ferramentas
poderosas serão disponibilizadas para prover interoperabilidade e processar essas
informações entre aplicações Web.
Algumas tecnologias foram desenvolvidas para a Web Semântica, tais como o
XML, linguagem de marcação que permite aos usuários criarem tags
personalizadas
sobre o documento criado. Outra tecnologia utilizada pela Web Semântica é o RDF, que
trabalha com um trio de informação o qual expressa o significado das informações.
Cada componente do trio tem sua própria finalidade, em analogia ao sujeito, verbo e
objeto de uma frase e recebe uma identificação URI. Estas tecnologias são fundamentais
para o funcionamento da Web Semântica e serão abordadas de forma mais específica
nas seções seguintes.
As principais pesquisas no mundo da rede estão focadas na construção da Web
Semântica, baseada mais diretamente nas percepções cognitivas e no modo de ver o
mundo por meio da informação de cada usuário. Uma rede adaptativa, flexível, e
principalmente visível (ou visual) (Saad, 2008). Isso significa que a Web está cada vez
mais Semântica. O impacto desta mudança nas Redes Sociais é muito grande e necessita
ser sistematicamente estudado para ser compreendido e facilitar o desenvolvimento de
aplicações.
As ontologias oferecem um meio de lidar com a representação de recursos de
informação: o modelo de domínio descrito por uma ontologia pode ser usado como uma
estrutura unificadora para dar semântica e uma representação comum à informação
(Falbo et al., 2004).
Atualmente ontologias são utilizadas diversas áreas do conhecimento, com o
objetivo de organizar a informação. Segundo Lima (2001), ontologias fornecem um
entendimento comum e compartilhado de um domínio, que pode ser comunicado
através de pessoas e sistemas de aplicação, tornando-se fator chave para o
9
desenvolvimento da Web Semântica.
Ontologias são muito utilizadas como representações de dados para bases de
conhecimento e marcação de dados na Web Semântica (Berners-Lee et al., 2001).
Abordagens baseadas em ontologias mostraram as vantagens da integração de
informações e interoperabilidade de sistemas incluindo reusabilidade, análise de
verificação, etc. Dessa forma, será criada uma Ontologia do Domínio das Redes Sociais,
com o objetivo de facilitar o desenvolvimento de aplicações para as Redes Sociais
utilizando as ferramentas e recursos da Web Semântica. Ontologias serão abordadas
com mais detalhes nas próximas seções deste trabalho.
1.2 Objetivos
O presente trabalho tem por objetivo principal fazer um estudo aprofundado
sobre Web Semântica, Web 2.0, redes sociais e ontologias, do qual resulta a proposta de
criação de uma ontologia do domínio das redes sociais;
Este trabalho tem como objetivos específicos:
• Estudar os trabalhos já realizados e caracterizar o estado da arte nos
temas citados;
• Pesquisar definições e pesquisas relacionadas com a Web Semântica,
Web 2.0, redes sociais e ontologias;
• Concentrar recursos, ponteiros e informações úteis para auxiliar na
concepção de temas de estudo e pesquisa na área;
• Desenvolver uma ontologia do domínio das redes sociais, utilizando as
ferramentas da Web Semântica para descrever a Web 2.0 e as redes
sociais;
• Registrar e analisar resultados;
• Concluir e levantar novas possíveis questões.
1.2 Organização do Texto
O trabalho está estruturado da seguinte forma: o capítulo 2 diz respeito a Web
Semântica, suas características e os elementos que tornam possível sua existência, como
XML, RDF, OWL, FOAF e Dublin Core. O capítulo 3 aborda as definições e
10
características da Web 2.0, com ênfase nas Redes Sociais. O capítulo 4 apresenta
conceitos e definições de ontologias, assim como suas vantagens, benefícios de sua
utilização, e tipos de ontologias. O capítulo 5, por sua vez, mostra a ferramenta Protégé,
um editor de ontologias que foi utilizado para construir a ontologia neste trabalho. No
capítulo 6 é apresentada a ontologia do domínio das redes sociais, o qual se constitui o
foco principal deste trabalho. Também são apresentadas no capítulo 7 as conclusões,
considerações finais e trabalhos futuros. Nos Anexos, mais especificamente, no anexo
A, são mostradas as descrições de cada um dos conceitos da Ontologia do Domínio das
Redes Sociais. Nos Anexos B, C, D e E são mostradas, de forma realçada, algumas das
figuras presentes no texto
11
2. WEB SEMÂNTICA
A Web Semântica, também conhecida por Web 3.0, consiste na materialização
da proposta de Tim Berners-Lee, o criador da Web de dotar a Web com uma
representação semântica compartilhada, de uma forma que pudesse ser interpretada
simultaneamente por seres humanos e máquinas, permitindo assim a inferência
automática de conteúdo, futuros estados e ações.
De acordo com Berners-Lee (2007), o modo mais simples de explicar a Web
Semântica é o seguinte:
“No seu computador você tem seus arquivos, os documentos que
você lê, e existem arquivos de dados como agendas, programas de
planejamento financeiro, planilhas de cálculo. Estes programas
contêm dados que são usados em documentos fora da web. Eles
não podem ser colocados na Web”.
Segundo o mesmo autor,
“a Web Semântica é sobre a colocação de arquivos de dados na
Web. Não é apenas uma Web de documentos, mas também de
dados. A tecnologia de dados da Web Semântica terá muitas
aplicações, todas interconectadas. Pela primeira vez haverá um
formato comum de dados para todos os aplicativos, permitindo
que os bancos de dados e as páginas da Web troquem arquivos”.
Segundo Berners-Lee et al. (2001), grande parte do conteúdo da Web atual é
projetada para o entendimento humano apenas, não para programas de computador
manipulá-los significativamente, pois as máquinas ainda não possuem um método
seguro para processar a semântica. De acordo com ele, o objetivo da Web Semântica é
trazer estrutura para o conteúdo das páginas Web, aumentando-lhes o significado,
criando um ambiente onde agentes de software podem fluir de página a página,
cumprindo sofisticadas tarefas para os seus usuários.
Ainda de acordo com Berners-Lee et al. (2001), e citado em Ramalho (2006), o
primeiro passo para o desenvolvimento da Web Semântica é a inclusão de dados em um
formato que os sistemas computacionais possam naturalmente compreender de forma
direta ou indireta, tendo como principal objetivo possibilitar um melhor aproveitamento
12
das potencialidades do ambiente Web, onde por meio do uso intensivo de linguagens
computacionais e instrumentos de metadados espera-se obter o acesso automatizado às
informações de maneira mais precisa, utilizando-se para isso processamentos
semânticos de dados e heurísticas automáticas.
Conforme afirmam Berners-Lee et al. (2001): “A Web Semântica é uma
extensão da Web atual, onde a informação possui um significado claro e bem definido,
possibilitando uma melhor interação entre computadores e pessoas”. Deste modo, é
evidente que o objetivo final da Web Semântica é atender as pessoas e não os
computadores, mas para isso torna-se necessário construir instrumentos que forneçam
sentido lógico e semântico para as máquinas. Assim, pode-se verificar que a Web
Semântica é uma tentativa inversa de solução, comparando-se com as tradicionalmente
desenvolvidas, onde a idéia é pensar nas máquinas para que estas possam servir aos
humanos de maneira mais eficiente (Ramalho, 2006).
A Web Semântica representa a evolução da Web atual. A Web tradicional foi
desenvolvida para ser entendida apenas pelos usuários, já a Web Semântica foi
idealizada para ser compreendida também pelas máquinas. Para isso utiliza diversas
tecnologias, que são capazes de operar de maneira eficiente sobre as informações,
podendo entender seus significados, assim, auxiliando os usuários em operações na
Web (Dziekaniak et al., 2004). Ela tem como objetivo fornecer estruturas e dar
significado semântico ao conteúdo das páginas Web, criando um ambiente cooperativo,
onde agentes de software e usuários possam atuar juntos. Esta evolução é ilustrada nas
figuras 2.1 e 2.2.
Figura 2.1 – Comparação entre Web 1.0, 2.0 e 3.0
13
Figura 2.2 – A evolução da Web (Fonte – Semantic Wave 2008)
A figura 2.2 mostra a evolução da Web, com uma projeção até o ano de 2020. O
eixo horizontal mostra o aumento da conectividade social, enquanto o eixo vertical
mostra o aumento da conectividade de conhecimento e raciocínio. Começa no canto
inferior esquerdo, mostrando a Web, que conecta informações. No canto inferior direito
está e Web Social, que conecta pessoas. No canto superior esquerdo se encontra a Web
Semântica, que conecta conhecimento. E por fim, no canto superior direito está a Web
Ubíqua, que conecta inteligência. Dentro de cada quadro se encontram termos
descrevendo características de casa tipo de Web. A figura 2.2 é mostrada de forma
realçada no Anexo B.
Segundo Golbeck et al. (2003), e citado em Jorge (2005), a Web Semântica é
uma visão de futuro da Web que irá dar significado a todos os dados, assim como tornar
as informações públicas e acessíveis a qualquer um que tenha interesse nelas. Enquanto
muitos sites da Web irão querer manter seus dados proprietários, muitos outros irão
optar por tornar suas informações públicas e abertas, usando marcações semânticas nos
conteúdos disponibilizados. Desta forma, continua a autora, a Web Semântica oferece
novas capacidades, tornando possível a adição de documentos que representam o
'conhecimento' sobre uma página, foto ou base de dados, público e de acesso livre, em
14
um formato capaz de ser interpretado também pelas máquinas.
De acordo com Ramalho (2006), uma das bases da Web Semântica reside na
utilização de ontologias, de modo que se espera que, com o desenvolvimento de
ontologias formais, seja possível descrever as informações semânticas dos recursos
Web, possibilitando o compartilhamento e a manipulação de informações que possam
ser interpretadas computacionalmente de maneira automática, a partir da utilização de
regras lógicas. Ontologias serão estudadas mais detalhadamente no capítulo 4.
A Web Semântica é construída de acordo com princípios que são implementados
em camadas de tecnologias e de padrões Web.
A camada Unicode/URI (Uniform Resource Identifier) fornece a
interoperabilidade em relação à codificação de caracteres e ao endereçamento e
nomeação de recursos da Web Semântica. O Unicode é um padrão de codificação para
fornecer uma representação numérica universal e sem ambigüidade para cada caractere
de maneira independente da plataforma de software e do idioma. O URI é um padrão
para identificar um recurso físico ou abstrato de maneira única e global. É o elemento
básico da estruturas a partir dos quais os demais componentes são construídos.
A camada XML, com as definições de namespace e schema, torna possível a
integração das definições da Web Semântica com outros padrões baseados em XML.
XML também permite a criação de novas tags para atender aplicações específicas.
As camadas RDF e RDF Schema tornam possível a definição de vocabulários
que podem ser atribuídos por URIs e também possibilitam estabelecer declarações sobre
objetos com URIs. A camada RDF permite a representação de metadados e é acessível
por máquinas. RDF Schema é um modelo de tipos de dados simples que permite a
criação de classes e propriedades. Permite obter estruturas de informação sem
ambigüidades.
A camada da Ontologia fornece suporte para a evolução de vocabulários e para
processar e integrar a informação existente sem problemas de indefinição ou conflito de
terminologia e também pode definir relações entre conceitos diferentes. Esta camada é o
núcleo da Web Semântica, que não pode ser construída sem ela.
SPARQL é uma linguagem de consulta para os padrões de grafos RDF/RDFS.
Está para a Web Semântica assim como SQL está para as bases de dados relacionais. É
15
formada por padrões de consultas, por um protocolo para uso na Web e formato XML
para a saída dos resultados.
RIF (Rule Interchange Format) é uma proposta de um formato padronizado para
o compartilhamento de regras entre diferentes comunidades: acadêmicas,
governamentais, empresariais, etc.
Lógica Unificadora (Unifying Logic) é uma representação unificada de
expressões SPARQL, RIF e ontologias (descritas em OWL). O grande objetivo desta
camada é oferecer um framework único para possibilitar a combinação dos elementos
das camadas inferiores.
Na camada de prova (Proof), mecanismos de inferência devem especificados
para o uso das regras previamente definidas. É realizada a validação de informações
com o uso de agentes (Palazzo, 2008): software executado sem controle humano direto
ou supervisão constante para cumprir objetivos definidos por um usuário; coletam,
filtram e processam informações na Web, eventualmente com o auxílio de outros
agentes.
Na camada de Criptografia (Crypto), situada transversalmente às diversas
camadas da Web Semântica, muitas vezes é necessário garantir a segurança e
privacidade das informações. Com esta finalidade, mecanismos de criptografia são
integrados às camadas, especialmente em aplicações mais sensíveis.
Na camada de Confiança (Trust), após a informação desejada ser obtida,
é necessário determinar a sua autenticidade Declarações de confiabilidade podem
ser verificadas se houver confirmação de outra entidade (também confiável).
No que diz respeito à camada de Interface com o Usuário e Aplicações (User
Interface & Applications), segundo Palazzo (2008), uma das metas da Web Semântica é
a personalização da interface do usuário em suas aplicações. Para isso é necessário
modelar as preferências, necessidades e interesses de cada usuário Contribuem para essa
meta o desenvolvimento (semi-) automatizado de ontologias pessoais com o uso de
vocabulários controlados como o Dublin Core e o FOAF.
Na Figura 2.3, podemos observar as camadas da Web Semântica.
16
Figura 2.3 – As camadas da Web Semântica
A importância do estudo da Web Semântica reside no fato de que aplicações
baseadas na estrutura usual da Web tendem a incorporar cada vez mais os recursos da
Web Semântica (metadados, ontologias, índices de pesquisa e serviços em geral), uma
vez que tais recursos beneficiam, facilitam e viabilizam grandes aplicações distribuídas.
O principal desafio da Web Semântica é criar uma linguagem que consiga ao
mesmo tempo expressar o significado e estabelecer regras para processar esse
significado de forma a inferir novos dados e regras. As regras para o processamento do
significado devem ser exportadas para a Web de forma a permitir que outros sistemas
inteligentes possam interagir (Morais et al., 2003).
Atualmente, novas formas de representação e recuperação de informação
são cada vez mais necessárias, fundamentando pesquisas em diversas áreas da ciência,
como a ciência da computação, a ciência da informação e a lingüística.
2. 1 XML (eXtensible Markup Language)
XML (eXtensible Markup Language) é uma recomendação da W3C (World
Wide Web Consortium) para gerar linguagens de marcação para necessidades especiais.
É um subtipo de SGML (Standard Generalized Markup Language) capaz de descrever
diversos tipos de dados. Seu propósito principal é a facilidade de compartilhamento de
informações através da Internet.
17
Em determinados aspectos, o XML é semelhante ao HTML. Ambas são
derivadas do SGML e contêm tags para descrever o conteúdo de um documento. A
diferença é que enquanto o HTML (HyperText Markup Language) tem como objetivo
controlar a forma com que os dados serão exibidos, o XML se concentra na descrição
dos dados que o documento contém. Além disso, o XML é flexível no sentido de que
podem ser acrescentadas novas tags à medida que forem necessárias, bastando para isso
que estejam descritas em um DTD (Document Type Definition) específico. Em outras
palavras, qualquer comunidade de desenvolvedores pode criar suas marcações (tags)
específicas que sirvam aos propósitos de descrição de seus dados (Souza et al., 2004).
Estimulado pela insatisfação com os formatos existentes (padronizados ou não),
o W3C começou a trabalhar em meados da década de 1990 em uma linguagem de
marcação que combinasse a flexibilidade da SGML (Standard Generalized Markup
Language) com a simplicidade da HTML. O principio do projeto era criar uma
linguagem que pudesse ser lida por software, e integrar-se com as demais linguagens.
Sua filosofia seria incorporada por vários princípios importantes (Wikipedia, 2008):
• Separação do conteúdo da formatação;
• Simplicidade e Legibilidade, tanto para humanos quanto para
computadores;
• Possibilidade de criação de tags sem limitação;
• Criação de arquivos para validação de estrutura (Chamados DTDs);
• Interligação de bancos de dados distintos;
• Concentração na estrutura da informação, e não na sua aparência.
Segundo Chaves et al (2001), e citado em Jorge (2005), a maior parte dos
documentos disponíveis na Web hoje está identificada apenas com informações de
exibição. Diante da necessidade de se prover meios mais adequados para possibilitar
acesso – mediado por máquina – ao repositório de informações disponível na Web, é
necessária a utilização da tecnologia XML, que possibilita a exploração da semântica
dos conteúdos desses documentos.
XML é uma linguagem simples, de formato texto muito flexível, derivada do
SGML. Originalmente projetada para enfrentar os desafios de publicações eletrônicas
18
de larga escala, está desempenhando um papel cada vez mais importante nas trocas de
uma grande variedade de dados na Web.
Atualmente, a linguagem XML é uma das tecnologias mais amplamente
adotadas para intercâmbio e representação de informações na Web, com a vantagem de
permitir, a cada um, criar suas próprias tags, rótulos ocultos que anotam as páginas
Web, ou seções de texto em uma página (Jorge, 2005).
Existem ainda os recursos dos DTDs, XSLT (XML Stylesheet Language
Transformations), XMI (XML Metadata Interchange) que complementam esta
tecnologia. Pode-se organizar todos os arquivos no formato XML, preenchê-los de
metadados e publicá-los na Internet. Tem-se então a Web Semântica construída.
2.2 RDF (Resource Description Framework)
A RDF é um padrão recomendado pelo W3C que usa notação XML como
sintaxe de codificação para descrição de metadados. Segundo Jorge (2005), RDF é uma
aplicação XML que serve como uma base para o processamento de metadados. Seu
principal objetivo é o de facilitar o intercâmbio de informações, que podem ser
interpretadas por máquinas, entre aplicativos via Web.
Jorge (2005) ainda afirma que a RDF é o padrão para representação de
metadados na Web. Essa linguagem permite aos computadores representar e
compartilhar dados semânticos na Web.
Um documento ou elemento RDF faz declarações sobre recursos. Uma
declaração afirma que um certo recurso possui uma ou mais propriedades. Cada
propriedade tem um tipo, que é um nome, e um valor. O valor de uma propriedade pode
ser um literal, como um texto, um número, ou pode ser outro recurso. Uma declaração é
composta de três partes (Jorge, 2005):
• Recurso (ou Sujeito) – Qualquer objeto que é identificável unicamente,
ou seja, que possui uma URI. Podem ser livros, páginas da Web,
elementos em uma página e pessoas individuais, por exemplo;
• Propriedade (ou Verbo) – É uma característica, um atributo ou um
relacionamento específico de um recurso. Em outras palavras, um
19
recurso que tenha um determinado nome e possa ser utilizado como uma
propriedade;
• Valor (ou Objeto) - Deve ser atômico na natureza (literal de texto ou
números, por exemplo) ou outros recursos, os quais podem ter suas
próprias propriedades. Consiste na combinação de um recurso, de uma
propriedade, e de um valor.
De acordo com Moura (2001), e citado em Dziekaniak et al. (2004), o RDF
proporciona vantagens em diversas áreas:
• Na área de descoberta de recursos, possibilita a implementação de
mecanismos de pesquisa mais eficientes.
• Na área de catalogação, o mesmo pode ser utilizado para descrever os
recursos de informação em um sítio da Web, como em uma biblioteca
digital.
• Na área de agentes inteligentes, pode facilitar o intercâmbio de
informações e o compartilhamento de conhecimento.
O RDF é um sistema para auxílio ao desenvolvimento de metadados cuja
finalidade é promover a interoperabilidade entre aplicações que compartilham
informações que sejam entendidas por sistemas na Web (Dziekaniak et al., 2004).
Metadados representados em RDF são utilizados para dar significado aos recursos da
Web Semântica por permitir que estes sejam manipulados e compreendidos por
máquinas.
Trata-se de um mecanismo de descrição neutro, que tem como objetivo
descrever recursos de qualquer área do conhecimento. Não predefine qualquer
semântica nem pressupõe um domínio específico de conhecimento. (RDF, 1998).
Em RDF, um domínio de conhecimento é definido via um RDF Schema (RDF,
1998). É no RDF Schema, portanto, que é definida a semântica e as características de
uma propriedade. Uma aplicação que crie metadados em RDF e outra que utilize estes
metadados devem utilizar o mesmo Schema para um funcionamento adequado.
20
2. 3 OWL (Web Ontology Language)
A OWL é uma linguagem utilizada para definir e instanciar ontologias na Web.
Uma ontologia OWL pode incluir descrições de classes e suas respectivas propriedades
e seus relacionamentos. Foi projetada para o uso por aplicações que precisam processar
o conteúdo da informação ao invés de apenas apresentá-la aos humanos.
Segundo (Wikipedia, 2008), OWL é vista como uma tecnologia importante para
a futura implementação da Web Semântica. Ela vem ocupando um papel importante em
um número cada vez maior de aplicações, e vem sendo foco de pesquisa para
ferramentas, técnicas de inferências, fundamentos formais e extensões de linguagem.
OWL foi projetada para disponibilizar uma forma comum para o processamento
de conteúdo semântico da informação na Web. Ela foi desenvolvida para aumentar a
facilidade de expressar semântica disponível em XML, RDF e RDFS. Portanto, pode ser
considerada uma evolução destas linguagens em termos de sua habilidade de representar
conteúdo semântico da Web interpretável por máquinas. Visto que é baseada em XML,
a informação pode ser facilmente trocada entre diferentes tipos de computadores
utilizando diferentes sistemas operacionais e linguagens de programação. OWL vem
sendo usada para criar padrões que forneçam um framework para gerenciamento de
ativos, integração empresarial e compartilhamento de dados na Web (Wikipedia, 2008).
De acordo com o W3C e citado por Jorge (2005), a linguagem OWL é projetada
para ser usada por aplicações que necessitam de processar o conteúdo das informações,
ao invés de apenas apresentar informações aos seres humanos. OWL facilita uma maior
interpretação do conteúdo Web por máquinas do que XML, RDF e RDFS, por prover
vocabulário adicional juntamente com a semântica formal. Ainda segundo o W3C,
também citado por Jorge (2005), OWL pode ser usada para:
• Formalizar um domínio pela definição de classes e propriedades destas
classes;
• Definir instâncias e propriedades sobre elas;
• Raciocinar a respeito destas classes e instâncias até o grau permitido pela
semântica formal da linguagem.
OWL possui três sub-linguagens que aumentam gradativamente o nível de
21
expressividade em ordem crescente: OWL Lite, OWL DL e OWL Full (Jorge, 2005).
• OWL Lite suporta aqueles usuários que necessitam principalmente de
uma classificação hierárquica e restrições simples. Embora suporte
restrições de cardinalidade, ela só permite valores de cardinalidade 0 ou
1. Também permite um caminho de migração mais rápido de tesauros e
outras taxonomias. OWL Lite também tem uma menor complexidade
formal que OWL DL.
• OWL DL suporta aqueles usuários que querem a máxima expressividade,
enquanto mantém a computabilidade e decidibilidade. OWL DL inclui
todas as construções da linguagem OWL, porém elas somente podem ser
usadas com algumas restrições. OWL DL é assim chamada devido a sua
correspondência com as lógicas de descrição, um campo de pesquisa que
estudou a lógica que forma a base formal da OWL.
• OWL Full é direcionada àqueles usuários que querem a máxima
expressividade e a liberdade sintática do RDF sem nenhuma garantia
computacional. OWL Full permite que uma ontologia aumente o
vocabulário pré-definido de RDF ou OWL. É improvável que algum
software de inferência venha a ser capaz de suportar completamente cada
recurso da OWL Full.
As linguagens de ontologias, representadas, sobretudo, pela linguagem OWL,
permitem que se escrevam conceituações formais e explícitas de modelos de domínio,
empregando, como requisitos básicos, uma sintaxe bem definida, uma semântica formal
e alto nível de expressividade, fornecendo apoio eficiente ao processo de inferência de
significado.
2.4 Vocabulários
2.4 FOAF (Friend of a Friend)
FOAF, um acrônimo de Friend of a Friend (Amigo de um Amigo), é um
conjunto de dados, legíveis para computadores, descrevendo pessoas (suas atividades,
22
interesses, relações com outras pessoas etc.), como estão conectadas e as cosas que elas
criaram e fazem (Wikipedia, 2008).
O projeto FOAF estabelece um padrão RDF para descrição de pessoas. Utiliza a
Web semântica para criar aplicações que descrevam perfis de pessoas, as ponham em
contato e relacionem seus trabalhos e preferências. Esta ferramenta situa a pessoa na
Web, e o lugar que a Web ocupa em seu próprio mundo.
Com ela será possível compartilhar informação entre páginas diferentes da Web
- como Redes Sociais - e reutilizá-la sem problemas. Também servirá para encontrar
amigos comuns ou pessoas com os mesmos interesses. Cada perfil que se introduz na
ferramenta possui um identificador único, que pode ser um endereço de correio
eletrônico, ou um endereço IP.
FOAF permite que pessoas criem páginas Web que contenham informações
pessoais e que possam ser lida por agentes de software. Uma das propriedades mais
interessantes de FOAF é a foaf: term_knows a qual possibilita que uma pessoa diga
quem ela conhece (Wikipedia, 2008).
2.5 Dublin Core
O padrão Dublin Core tem como objetivo oferecer uma coleção básica de
elementos de metadados para serem utilizados por qualquer comunidade, independente
de sua área de domínio.
O padrão Dublin Core (DC) de metadados consiste em um simples, mas efetivo
conjunto de elementos para descrever uma ampla quantidade de recursos eletrônicos
(Silva, 2007). O DC compreende quinze elementos semânticos que foram estabelecidos
através do consenso de grupos interdisciplinares internacionais de bibliotecários,
cientistas da computação, comunidade de museus, e outros estudiosos deste campo.
De acordo com Rocha (2004), os elementos de Dublin Core estão organizados
em três grupos: Conteúdo, propriedade intelectual e instância. Os elementos que
descrevem o conteúdo do recurso são: Título, assunto, descrição, linguagem, fonte,
recursos relacionados (relação) e abrangência (espacial ou temporal). Os elementos de
propriedade intelectual são: o criador (responsável intelectual pela criação do recurso),
publicador (quem tornou o recurso público), contribuidor e direitos autorais. Os
elementos de instância são data, tipo (ex.: página da Web, artigo, livro), formato (ex.:
23
pdf, world, mp3) e identificador (ex.: URI, ISSBN).
Segundo Silva (2007), o DC tem como objetivo seguir as seguintes
características:
• Simplicidade de criação e manutenção: o conjunto de elementos foi
mantido pequeno a fim de permitir que um não-especialista crie registros
descritivos simples facilmente, enquanto fornece recursos de recuperação
efetiva no ambiente conectado em rede.
• Semântica comumente compreendida: a descoberta de informações na
Internet é dificultada pelas diferenças de terminologias de um campo de
conhecimento para outro.
• Escopo internacional: O conjunto de elementos do DC foi originalmente
desenvolvido em inglês, mas versões foram sendo criadas em outras
linguagens, incluindo finlandês, norueguês, tailandês, japonês, francês,
português, alemão, grego, indonésio, e espanhol.
• Extensibilidade: apesar dos esforços de manter a simplicidade na
descrição dos recursos digitais, o DC reconhece a importância de
fornecer mecanismos de extensão para necessidade de recursos
adicionais descobertos.
24
3. WEB 2.0 - REDES SOCIAIS
Web 2.0 é um termo utilizado para definir a chamada segunda geração da
Internet, fortemente marcada pela interatividade, pelos conteúdos gerados por usuários e
pela personalização de serviços (Costa, 2008). Essa geração da Internet é caracterizada,
principalmente, pelo surgimento das Redes Sociais. Alguns exemplos de sites típicos
são os blogs (e as variações fotologs e videologs), sites de compartilhamento de
arquivos, Wikis (Wikipedia, Wiki Wiki Web, Webopedia), Comunidades Virtuais
(Orkut, Myspace, Facebook) e Fóruns. A figura 3.1 apresenta uma tag cloud (descrição
visual de tags geradas pelos usuários) apresentando os principais temas da Web 2.0.
Figura 3.1 – Tag cloud com os principais temas da Web 2.0
A Web 2.0 é a segunda geração de serviços online e caracteriza-se por
potencializar as formas de publicação, compartilhamento e organização de informações,
além de ampliar os espaços para a interação entre os participantes do processo. Refere-
se não apenas a uma combinação de técnicas, mas também a um determinado período
tecnológico, a um conjunto de novas estratégias mercadológicas e a processos de
comunicação mediados pelo computador (Primo, 2007).
De acordo com Wikipedia (2008), a Web 2.0 tem repercussões sociais
importantes, que potencializam processos de trabalho coletivo, de troca afetiva, de
25
produção e circulação de informações, de construção social de conhecimento apoiada
pela informática. São essas formas interativas, mais do que os conteúdos produzidos ou
as especificações tecnológicas em jogo, que serão aqui discutidas.
A figura 3.2 fornece um framework e explica alguns dos princípios da Web 2.0.
Esta figura se encontra em Framework (2008). Nas entradas (Inputs) se encontram
Conteúdo Gerado por Usuários, que inclui texto, imagens, vídeos, mídias interativas e
arquitetura virtual; Opiniões, que incluem links, clicks, tagging, avaliações e conexões
sociais; e Aplicações, que incluem aplicações Web e Widgets. Dentro de Mecanismos
(Mechanisms) se encontram Tecnologias, com XML, API’s, AJAX e Ruby on Rails;
Recombinação, com Mashups, remixagem, agregação e embarcamento; Filtragem
colaborativa, com ranking e correlações e perfis; Estruturas. Com folksonomias, tag
clouds e mundos virtuais; e Syndication, com RSS. E por fim Resultados Emergentes
(Emergent Outcomes), com os seguintes itens: mais importante se torna visível,
recomendações personalizadas, comunidades com significado, conteúdo relevante
facilmente encontrado, usabilidade reforçada e inteligência coletiva. Esta figura se
encontra de forma realçada no Anexo C.
Figura 3.2 – Web 2.0 Framework
26
Segundo O’Reilly (2006), não há como demarcar precisamente as fronteiras da
Web 2.0. Trata-se de um núcleo ao redor do qual gravitam princípios e práticas que
aproximam diversos sites que os seguem.
Web 2.0 é um termo cunhado em 2004 pela empresa estadunidense O’Reilly
Media para designar uma segunda geração de comunidades e serviços baseados na
plataforma Web, como wikis, aplicações baseadas em folksonomia e redes sociais.
Embora o termo tenha uma conotação de uma nova versão para a Web, ele não se refere
à atualização nas suas especificações técnicas, mas a uma mudança na forma como ela é
encarada por usuários e desenvolvedores (Wikipedia, 2008).
Segundo O’Reilly (2006), Web 2.0 é a mudança para uma Internet como
plataforma, e um entendimento das regras para obter sucesso nesta nova plataforma.
Entre outras, a regra mais importante é desenvolver aplicativos que aproveitem os
efeitos de rede para se tornarem melhores quanto mais são usados pelas pessoas,
aproveitando a inteligência coletiva.
O'Reilly (2006) ainda sugere algumas regras que ajudam a definir sucintamente
a Web 2.0:
• O beta perpétuo: não trate o software como um artefato, mas como um
processo de comprometimento com seus usuários.
• Pequenas peças frouxamente unidas: abra seus dados e serviços para que
sejam reutilizados por outros. Reutilize dados e serviços de outros
sempre que possível.
• Software acima do nível de um único dispositivo: não pense em
aplicativos que estão no cliente ou servidor, mas desenvolva aplicativos
que estão no espaço entre eles.
• Lei da Conservação de Lucros, de Clayton Christensen: lembre-se de que
em um ambiente de rede, APIs abertas e protocolos padrões vencem, mas
isso não significa que a idéia de vantagem competitiva vá embora.
• Dados são o novo “Intel inside”: a mais importante entre as futuras
fontes de fechamento e vantagem competitiva serão os dados, seja
através do aumento do retorno sobre dados gerados pelo usuário, sendo
27
dono de um nome ou através de formatos de arquivo proprietários.
Umas das principais características é que ela pode ser utilizada como uma
plataforma, isto é, viabilizando funções online que antes só poderiam ser conduzidas
por programas instalados em um computador. Isso significa ver a Web não como um
programa, mas sim como um ambiente dinâmico onde o usuário não acessa dados
simplesmente, mas pode criar e editar conteúdos.
A segunda geração da Internet é movida a dados. A chave para a vantagem
competitiva em aplicativos para Internet é permitir que os usuários complementem
dados já disponíveis com seus próprios. Assim, a “arquitetura de participação” vai além
do desenvolvimento de software, com usuários envolvidos de forma a criar conteúdo na
plataforma, assim como na divulgação desta (Costa, 2008).
Um dos pontos principais da Web 2.0 é a Consumer-Generated Media (CGM)
ou mídia gerada pelo consumidor é um termo utilizado para descrever o conteúdo que é
criado e divulgado pelo próprio consumidor. Com o surgimento da Internet e o avanço
das tecnologias digitais, da mesma maneira que o acesso dos consumidores à
informação teve um aumento significativo, aumentou também a facilidade dos
consumidores em expressar suas opiniões.
Na Internet o CGM está presente em comentários, fóruns, lista de discussões,
blogs e fotologs, comunidades, grupos, sites participativos, no YouTube, na própria
Wikipedia. Os consumidores utilizam todas as ferramentas disponíveis (Messenger,
sites, blogs, e-mails, mensagens, celulares, etc.) para divulgar, sobretudo, suas
experiências pessoais e opiniões em relação a produtos, serviços, marcas, empresas,
notícias. Um exemplo é o site Flickr, mostrado na figura 3.3, um site que permite que
usuários postem e compartilhem fotos.
28
Figura 3.3 – Exemplo de site utilizando Redes Sociais
Segundo Wikipedia (2008), Redes Sociais na Internet são as relações entre os
indivíduos na comunicação mediada por computador. Esses sistemas funcionam através
da interação social, com o objetivo de conectar pessoas e proporcionar sua
comunicação, sendo utilizados, portanto, para forjar laços sociais. As pessoas levam em
conta diversos fatores ao escolher conectar-se ou não a alguém. As organizações sociais
geradas pela comunicação mediada por computador podem atuar também de forma a
manter comunidades de suporte que, sem a mediação da máquina, não seriam possíveis
porque são socialmente não-aceitas.
A figura 3.4 mostra uma pesquisa realizada em 2006, em empresas que utilizam
tecnologias de Web 2.0 e Redes Sociais, mostrando a razão pela qual as empresas
adotaram tais tecnologias. A pergunta foi a seguinte: Quais das seguintes razões
descreve melhor por quê sua empresa adotou tecnologias de Redes Sociais e Web 2.0?
Com mais de 80%, a principal resposta foi “Porque elas aumentam a eficiência de
nossos negócios”, seguido de: “Sentimos que era uma necessidade competitiva”; “Elas
resolvem problemas em nossos negócios”; “Foram recomendadas por parceiros”;
“Clientes, funcionários e parceiros exigiram”; e “Elas vieram incluídas em produtos que
adquirimos”. Daí a importância de seu estudo. A figura 3.4 se encontra de forma
realçada no Anexo D.
29
Figura 3.4 – Adoção das tecnologias de Web 2.0 e Redes Sociais nas empresas
americanas
30
4. ONTOLOGIAS
Ontologias são utilizadas em inteligência artificial, Web Semântica, engenharia
de software, arquitetura da informação e em diversas outras áreas da Informática, como
uma forma de representação de conhecimento sobre o mundo ou alguma parte deste. A
sua utilização tem como objetivo estruturar de forma organizada as informações de um
determinado domínio de conhecimento e refletir um entendimento semântico de
situações do mundo real.
Hendler (2001) apresenta a seguinte definição: "Uma ontologia é uma
especificação formal e explícita de uma conceitualização compartilhada". Onde:
"formal" significa legível para computadores; "especificação explícita" diz respeito a
conceitos, propriedades, relações, funções, restrições, axiomas, explicitamente
definidos; "compartilhado" quer dizer conhecimento consensual; e "conceitualização"
diz respeito a um modelo abstrato de algum fenômeno do mundo real. A
conceitualização é formada por um vocabulário controlado que é arranjado
hierarquicamente e através de relações entre conceitos, como nas taxonomias e tesauros.
Uma conceitualização é uma visão abstrata e simplificada do mundo que se deseja
representar.
Os computadores necessitam ter acesso a coleções estruturadas de informações
(dados e metadados) e de conjuntos de regras de inferência que auxiliem no processo de
dedução automática para que seja administrado o raciocínio automatizado, ou seja, a
representação do conhecimento Dziekaniak et al. (2004).
Estas regras são especificadas através de ontologias, as quais permitem
representar explicitamente à semântica dos dados. Através dessas ontologias torna-se
possível a elaboração de uma enorme rede de conhecimento humano, complementando
o processamento da máquina, além de melhorar qualitativamente o nível de serviços na
Web.
Em Hinz (2006), é apresentada uma lista com as principais vantagens da
utilização de ontologias na Ciência da Computação:
• Ontologias fornecem um vocabulário para representação do
conhecimento. Esse vocabulário possui uma conceitualização que o
sustenta, evitando assim interpretações ambíguas do mesmo.
31
• Ontologias permitem o compartilhamento de conhecimento. Caso exista
uma ontologia que modele adequadamente certo domínio de
conhecimento, a mesma pode ser compartilhada e ulitizada por pessoas
que desenvolvam aplicações dentro desse domínio.
• Fornece uma descrição exata do conhecimento. Ao contrário da
linguagem natural em que as palavras podem possuir semântica
totalmente diferente conforme o seu contexto, a ontologia, por ser escrita
em linguagem formal, não deixa espaço para a diferença semântica
existente na linguagem natural.
• É possível fazer o mapeamento da linguagem da ontologia sem que com
isso seja alterada a sua conceitualização, ou seja, uma mesma
conceitualização pode ser expressa em várias línguas.
• Pode ser possível estender o uso de uma ontologia genérica de forma a
que ela se adapte a um domínio específico.
Segundo Schiessl (2007), uma ontologia é projetada levando-se em conta os
propósitos da área de atuação e aplicação e, enfatizado por Gruber (1993), algumas
características relevantes devem ser consideradas no seu planejamento, como se segue:
• Clareza: as definições devem ser objetivas e, quando viável, completas. É
preferível que uma definição seja declarada através de axiomas lógicos.
Todas as definições devem ser documentadas em linguagem natural.
• Coerência: uma ontologia deve permitir inferências que sejam consistentes
com as definições.
• Extensível: uma ontologia deve permitir que novos termos sejam definidos,
para usos especiais, baseados no vocabulário existente, de maneira que não
seja necessária a revisão das definições já existentes.
• Mínimo viés de codificação: a conceituação deve ser especificada no âmbito
do conhecimento, ou seja, a escolha da representação não deve se basear
somente na conveniência da notação ou implementação.
• Mínimo compromisso ontológico: uma ontologia deve necessitar de um
compromisso ontológico apenas o suficiente para permitir que as atividades
32
de compartilhamento do conhecimento esperadas aconteçam.
Existem diverso tipos de ontologias, que de acordo com seu grau de
genericidade, podem ser classificadas como (Gomes-Perez, 1999):
• Ontologias de representação: definem as primitivas de representação –
frames, axiomas, atributos e outros – de forma declarativa;
• Ontologias Gerais: trazem definições abstratas necessárias para a
compreensão de aspectos do mundo, como tempo, processos, papéis, espaço,
seres, coisas, etc;
• Ontologias Centrais ou Genéricas: definem os ramos de estudos de uma área
e/ou conceitos mais genéricos e abstratos desta área. Por exemplo, regras
básicas do direito;
• Ontologias de Domínio: tratam de um domínio mais específico de uma área
genérica de conhecimento, como direito tributário, microbiologia, etc;
• Ontologias de Aplicação: procuram solucionar um problema específico de
um domínio, como identificar doenças do coração, a partir de uma ontologia
de domínio de cardiologia.
Ainda de acordo com Gómez-Perez (1999), existe ainda outra classificação para
ontologias, aplicáveis apenas para as duas últimas citadas acima. São elas:
• Ontologias de tarefas: descrevem tarefas de um domínio – como processos,
planos, metas, escalonamentos, etc – com uma visão mais funcional, embora
declarativa, de um domínio;
• Ontologias de domínio: tem uma visão mais epistemológica do domínio,
focando nos conceitos e objetos do universo discurso.
Ontologias são muito importantes na Web Semântica. Segundo Berners-Lee et
al. (2001) e citado em Jorge (2005), as ontologias típicas para a Web têm uma
taxonomia e um conjunto de regras de inferência. A taxonomia define classes de objetos
e relações entre eles. Pode-se expressar um grande número de relações entre entidades
assinalando propriedades para as classes e permitindo que subclasses herdem suas
propriedades. Regras de inferência fornecem poder adicional às ontologias.
33
Os portais podem se favorecer do uso de ferramentas baseadas em ontologias e
da marcação semântica das páginas da Web de várias maneiras. Berners-Lee et al.
(2001), citado em Jorge (2005), afirma que as ontologias podem aumentar a
funcionalidade da Web das seguintes formas:
• Podem ser usadas de uma maneira simples para melhorar a eficácia de
pesquisas na Web. O programa pesquisador olha hoje apenas para as
páginas que contêm o termo preciso, ao invés de olhar para todas aquelas
que usam termos equivalentes;
• Páginas podem ser direcionadas para outras páginas, cuja ontologia
define como informações relacionadas. As informações são processadas
e podem ser usadas para responder questões que normalmente exigiriam
intervenção de um humano
• Adicionalmente, as marcações com significados específicos tornam mais
fácil o desenvolvimento de programas de software que podem responder
a questões complexas cujas soluções não residem em uma página Web
simples.
34
5. PROTÉGÉ
Para o desenvolvimento da Ontologia foi utilizada uma das ferramentas
disponíveis para edição de ontologias, o Protégé versão 3.1.1. Ela foi escolhida por
possuir uma interface simples, o que permitiu que o desenvolvimento da ontologia não
fosse uma tarefa muito complexa e por ter atendido as necessidades para a conclusão do
trabalho. O desenvolvimento de uma ontologia no Protégé consiste basicamente nos
seguintes passos: primeiramente é definido um esquema com as classes (class),
subclasses (subclass), propriedades e relações (slots) referentes ao domínio que se
deseja modelar, neste caso do domínio das Redes Sociais.
De acordo com Semprebom (2007), O Protégé é uma ferramenta que permite
construir ontologias de domínio, personalizar formulários de entrada de dados, inserir e
editar dados, possibilitando então, a criação de bases de conhecimento guiadas por uma
ontologia. Sua interface gráfica provê acesso a barra de menus e barra de ferramentas,
alem de apresentar cinco áreas de visualização (views) que funcionam como módulos de
navegação e edição de classes, atributos, formulários, instâncias e pesquisas na base de
conhecimento, propiciando a entrada de dados e a recuperação das informações.
De acordo com Gómez-Perez (1999), Protégé possui as seguintes características:
• A linguagem axiomática PAL (Protégé AxiomaticLanguage)
• A geração de arquivos de saída alteráveis. Atualmente podem ser criados
classes e instâncias em CLIPS - a base de conhecimento é gerada
nativamente para esse motor de inferência
• Uma excelente interface para entrada de conhecimento, incluindo um
gerador automático de formulários para as classes definidas, admitindo
ainda a reposição da interface original por componentes mais adequados
à aplicações específicas. Esta interface facilita sobremaneira o
gerenciamento de conhecimento de uma ou mais ontologias.
Sua interface gráfica, como exibida na figura 5.1, provê acesso à barra de menus
e barra de ferramentas, além de apresentar cinco áreas de visualização (views) que
funcionam como módulos de navegação e edição de classes, atributos, formulários,
instâncias e pesquisas na base de conhecimento, propiciando a entrada de dados e a
35
recuperação das informações (Gómez-Perez, 1999). . Esta interface permite que
especialistas sobre um determinado domínio, modelem sua área de conhecimento de
uma maneira fácil e natural.
FIGURA 5.1 - Interface Software Protégé versão 3.1.1
De acordo com Wikipedia (2008), a plataforma Protégé possui duas principais
formas de modelagem de Ontologias:
• O editor de Frames do Protégé. Permite ao usuário construir e preencher
ontologias que são baseadas em frames de acordo com o protocolo
OKBC (Open Knowledge Base Connectivity). Neste modelo, uma
ontologia consiste em um conjunto de classes organizadas em uma
classificação hierárquica para representar os conceitos importantes de um
domínio, um conjunto de slots associados com as classes para descrever
suas propriedades e relacionamentos, e um conjunto de instâncias destas
classes - exemplares individuais dos conceitos que contém valores
específicos para as suas propriedades.
36
• O editor OWL do Protégé. Permite aos usuários construir ontologias para
a Web Semântica, em especial utilizando a linguagem OWL especificada
pela W3C. Uma ontologia desenvolvida em OWL pode incluir
descrições de classes, propriedades e suas instâncias. Dada uma
determinada ontologia, a semântica formal da OWL especifica como
derivar suas conseqüências lógicas, isto é, fatos que não estão
explicitamente presente na ontologia, mas conferida pela semântica.
37
6. ONTOLOGIA DO DOMÍNIO DAS REDES SOCIAIS
O objetivo desta pesquisa é construir uma ontologia do domínio das Redes
Sociais, utilizando o ambiente Protege Beta 3.1.1. Através da análise do domínio foi
possível identificar os termos importantes e relevantes para o contexto. Um exemplo
disso são os conceitos e propriedades que, antes de serem representados formalmente,
devem ser identificados e especificados de maneira informal.
O principal desafio consiste modelar este domínio de uma forma que possa
permitir facilmente o desenvolvimento de aplicações futuras para ele com a tecnologia e
as ferramentas da Web Semântica. A ontologia poderá ser utilizada em várias
aplicações, como por exemplo, na construção de bases de dados tecnológicas.
Para atingir os objetivos descritos acima, as seguintes atividades foram
realizadas: Revisão bibliográfica sobre Web Semântica, Redes Sociais e ontologias;
Estudo e criação de uma ontologia do domínio das Redes Sociais, descrevendo
conceitos e como se relacionam entre si.
A seguir apresenta-se o nível mais alto da ontologia e os principais
relacionamentos binários, assim como uma breve descrição de cada conceito. Todos os
conceitos utilizados na ontologia, assim como as suas respectivas descrições se
encontram no Anexo A do trabalho.
Na criação da Ontologia, tudo na Web foi considerado como recurso. Então,
Resource é o nível mais alto da Ontologia. Na fase inicial do trabalho, foi decidido que
todos os conceitos dentro da ontologia seriam considerados como recursos. Tais
recursos possibilitam e disponibilizam todos os serviços na Web. Dentro deste nível
estão os demais conceitos.
• Agent diz respeito a quem utiliza a Web, seja usuário ou máquina (na
forma de um programa ou aplicação). Os dois tipos de usuários – person e
machine – são considerados agentes, sem os quais a Web 2.0 e as Redes
Sociais não podem existir.
o Person refere-se a um usuário da Web. Os usuários em sistemas
de informação são agentes externos ao sistema que usufruem da
tecnologia para realizar determinado trabalho. Podem ser desde
os usuários comuns do sistema até administradores,
38
programadores ou analistas de sistemas.
o Machine - uma máquina é todo o dispositivo mecânico ou
orgânico que executa ou ajuda no desempenho das tarefas,
precisando para isto de uma fonte de energia. No caso da
ontologia, a principal máquina seria o computador. Denomina-se
computador uma máquina capaz de variados tipos de tratamento
automático de informações ou processamento de dados.
• API (Interface de Programação de Aplicativos), é um conjunto de rotinas e
padrões estabelecidos por um software para a utilização das suas
funcionalidades por programas aplicativos, isto é, programas que não
querem envolver-se em detalhes da implementação do software, mas
apenas usar seus serviços. Após uma extensiva pesquisa na Web, a lista de
API foi feita de acordo com a lista do site Technology Magazine
(http://techmagazine.ws/full-web-20-api-list/ ).
• Service são os serviços oferecido na Web. Web service é uma solução
utilizada na integração de sistemas e na comunicação entre aplicações
diferentes. Com esta tecnologia é possível que novas aplicações possam
interagir com aquelas que já existem e que sistemas desenvolvidos em
plataformas diferentes sejam compatíveis. A escolha do serviços
mostrados na ontologia foi feita após extensiva pesquisa na Web. Os
termos e conceitos foram retirados do site All Things Web 2.0
(http://www.allthingsweb2.com/), que possui uma grande e atualizada lista
de serviços disponíveis na Web 2.0. Todas as listagens, classificações,
comentários, e comparações são feitos pelos usuários finais,
desenvolvedores, investidores e empresários. Possui uma lista de sites com
as principais aplicações, softwares, código-aberto, sites Web, produtos e
serviços sobre cada um dos conceitos listados.
• Artifact consiste em qualquer objeto concreto utilizado na Web (texto,
vídeo, etc). Todas as classes da ontologia utilizam este conceito
o Photo: por definição, fotografia é, essencialmente, a técnica de
criação de imagens por meio de exposição luminosa, fixando esta
39
em uma superfície sensível. Designa-se por fotografia digital
(utilizada na Web) a fotografia tirada com uma câmera digital ou
determinados modelos de telefone celular, resultando num
arquivo de computador que pode ser editado, impresso, enviado
por e-mail ou armazenado em websites ou CD-ROMs, DVD’s,
Pendrives, etc.
o Video: o vídeo é uma a tecnologia de processamento de sinais
eletrônicos analógicos ou digitais para capturar, armazenar,
transmitir ou apresentar imagens em movimento. O Vídeo Digital
(em inglês, Digital Video ou DV) é um formato de vídeo digital
que permite a gravação em fitas magnéticas.
o Sound: o som é a propagação de uma frente de compressão
mecânica ou onda longitudinal; esta onda se propaga de forma
circuncêntrica, apenas em meios materiais - que têm massa e
elasticidade, como os sólidos, líquidos ou gasosos, quer dizer, não
se propaga no vácuo. O som digital ou áudio digital é a
codificação digital de um sinal elétrico que representa uma onda
sonora. A gravação de som digital utiliza formatos digitais
(binários) para arquivar e editar os sons. O som digital pode, por
exemplo, ser captado com um gravador digital ou com um
microfone acoplado à placa de som de um computador.
o Text: em lingüística, a noção de texto é ampla e ainda aberta a
uma definição mais precisa. Grosso modo, pode ser entendido
como manifestação lingüística das idéias de um autor, que serão
interpretadas pelo leitor de acordo com seus conhecimentos
lingüísticos e culturais. Seu tamanho é variável.
• Network: uma rede de computadores consiste de 2 ou mais computadores
e outros dispositivos conectados entre si de modo a poderem compartilhar
seus serviços, que podem ser: dados, impressoras, mensagens (e-mails),
etc. Diz respeito às Redes Sociais (na forma de Comunidades Virtuais) e
às Redes Físicas;
40
o Social: Rede Social é uma das formas de representação dos
relacionamentos afetivos ou profissionais dos seres humanos
entre si ou entre seus agrupamentos de interesses mútuos. A rede
é responsável pelo compartilhamento de idéias entre pessoas que
possuem interesses e objetivo em comum e também valores a
serem compartilhados. Assim, um grupo de discussão é composto
por indivíduos que possuem identidades semelhantes. Essas redes
sociais estão hoje instaladas principalmente na Internet devido ao
fato desta possibilitar uma aceleração e ampla maneira das idéias
serem divulgadas e da absorção de novos elementos em busca de
algo em comum.
o Physical: uma rede de computadores consiste de 2 ou mais
computadores e outros dispositivos conectados entre si de modo a
poderem compartilhar seus serviços, que podem ser: dados,
impressoras, mensagens (e-mails), etc. A Internet é um amplo
sistema de comunicação que conecta muitas redes de
computadores. Existem várias formas e recursos de vários
equipamentos que podem ser interligados e compartilhados,
mediante meios de acesso, protocolos e requisitos de segurança.
• Technology é um termo que envolve o conhecimento técnico e científico e
as ferramentas, processos e materiais criados e/ou utilizados a partir de tal
conhecimento. Diz respeito às técnicas, conhecimentos, métodos,
materiais, ferramentas, e processos usados para resolver problemas ou ao
menos facilitar a solução dos mesmos na Web. Descreve as tecnologias
necessárias para criar e gerenciar os sites na Web. O conhecimento de tais
tecnologias é fundamental para as tarefas citadas.
o HTML (HyperText Markup Language) significa Linguagem de
Marcação de Hipertexto é uma linguagem de marcação utilizada
para produzir páginas na Web. Documentos HTML podem ser
interpretados por navegadores.
o XML (eXtensible Markup Language) é uma recomendação da
W3C para gerar linguagens de marcação para necessidades
41
especiais. É um subtipo de SGML capaz de descrever diversos
tipos de dados. Seu propósito principal é a facilidade de
compartilhamento de informações através da Internet.
o Browser Scripting: linguagens de script são linguagens de
programação executadas do interior de programas e/ou de outras
linguagens de programação. As linguagens de script servem para
estender a funcionalidade de um programa e/ou controlá-lo.
Client-side scripting geralmente refere-se à classe de programas
de computador na Web que são executados do lado do cliente, ao
invés de serem executados do lado do servidor (no servidor Web).
o Server Scripting: linguagens de script são linguagens de
programação executadas do interior de programas e/ou de outras
linguagens de programação. As linguagens de script servem para
estender a funcionalidade de um programa e/ou controlá-lo.
Server-side scripting é uma tecnologia de servidor Web em que
um pedido do usuário é atendido pela execução de um script
diretamente no servidor Web para gerar páginas HTML
dinâmicamente.
o .NET: é um Domínio de topo genérico (gTLD) usado nos DNS's
da Internet. O gTLD.net é administrado atualmente pela VeriSign.
o Multimedia: é a combinação, controlada por computador, de pelo
menos um tipo de mídia estática (texto, fotografia, gráfico), com
pelo menos um tipo de media dinâmica (vídeo, áudio, animação).
o Browsers: o Navegador, também conhecido como Web browser
ou simplesmente browser, é um programa que habilita seus
usuários a interagirem com documentos virtuais, também
conhecidos como páginas HTML, que estão hospedadas num
servidor Web.
Para relacionar estes conceitos, foram criados três tipos de relacionamentos
binários, sendo que na hierarquia de relacionamentos, Supports é o mais importante,
seguido de Relevant_to e Relates_to, respectivamente.
42
• Relates_to indica a qual classe ou instância o conceito se relaciona;
• Relevant_to diz se o conceito é ou não relevante à determinada classe ou
instância;
• Supports indica se determinado conceito suporta algum outro conceito,
como por exemplo, a tecnologia XML suporta RDF.
Segundo Jorge (2005), portais semânticos aparecem como uma evolução natural
dos tradicionais portais Web e podem ser entendidos como portais de informações que
utilizam os padrões de representação de informação propostos pelo W3C para a
chamada Web Semântica. As ontologias formam a base desses novos portais Web,
propiciando melhor organização das informações, além de outras vantagens.
A Ontologia apresentada neste trabalho será utilizada no Servidor Semântico de
Redes Sociais (Social Networks Semantic Server). Consiste em um conjunto de serviços
semânticos estruturados em uma meta-ontologia para criar e administrar redes sociais.
Este servidor deve permitir a construção de Esquemas de Redes Sociais segundo a
especificação de uma ontologia que configura por instanciação: perfis básicos de
usuários e grupos e políticas de modelagem automática; serviços e recursos a
disponibilizar e; esquema da base de dados: informação dinâmica da rede social.
O projeto do Servidor Semântico está apenas no início, com ainda muitas
modificações a serem feitas. A arquitetura atual do servido é mostrada na figura 6.1. Na
parte externa esquerda estão o Supervisor Meta-Raciocínio, Gerenciamento de Contexto
e Ferramentas e Serviços. Dentro da Interface se encontra a Meta-Ontologia para Redes
Sócias. Ainda dentro da Interface está a Base de Dados, composta de três itens:
Modelos de Usuários e Grupos, Motor de Busca Semântica e Classificador
Descritor/Anotador. A figura 6.1 se encontra de forma realçada no Anexo E.
43
Figura 6.1 – Social Networks Semantic Server
44
7. CONSIDERAÇÕES FINAIS
De acordo com Ramalho (2006), a Web Semântica constitui uma evolução no
modo como as informações são organizadas na Web. Foi projetada com o objetivo de
possibilitar a incorporação de aspectos semânticos aos dados, favorecendo assim a
contextualização das informações de forma automatizada, de acordo com o contexto no
qual os dados estão inseridos e os critérios da busca realizados.
As Redes Sociais e a Web 2.0 possuem grande importância, pois com a chamada
“arquitetura de participação” os usuários não só criam, mas também divulgam conteúdo
na Web. As redes sociais criaram meios poderosos para as pessoas se comunicarem e
trocarem informações. Os sites de redes sociais são usados regularmente por centenas
de milhões de pessoas, e estão se tornando parte integral do dia-a-dia das pessoas.
As redes sociais já possuem grande impacto tanto na vida pessoal, como nos
negócios. As empresas já estão utilizando tecnologias de Web 2.0 e de redes sociais,
pois aumentam a eficiência dos negócios, são uma necessidade competitiva, resolvem
problemas nos negócios, e às vezes são exigidas por funcionários e parceiros de
negócios. Isto foi mostrado na figura 3.4. Daí a importância de seu estudo.
Um grande volume de pesquisas sobre ontologias sugere a importância e
utilidade das mesmas na tarefa de organizar informações dentro de um determinado
domínio do conhecimento. A vantagem de sua utilização é que podem proporcionar
melhorias no processo de recuperação da informação, organizando o conteúdo das
fontes de dados que compõem o domínio em questão. Outra importante funcionalidade
das ontologias vem do fato delas possibilitarem a utilização de mecanismos de
inferência para criar um novo conhecimento a partir do conhecimento existente.
Segundo Gruber (1993), uma das metas das pesquisas em ontologias é a
reutilização de componentes de conhecimento e serviços que podem ser chamados a
partir das redes. Nos últimos anos, a utilização de ontologias como modelo de
representação de conhecimento aumentou em grande escala nas diversas áreas de
conhecimento e pesquisa.
Neste trabalho argumentou-se que uma ontologia, além de permitir a
organização de um domínio do conhecimento, pode melhorar a recuperação da
informação e permitir representação formal em lógica e mecanismos de inferência. O
45
uso de ontologias se mostra eficiente na definição de um vocabulário comum onde o
conhecimento a ser compartilhado pode ser representado.
Um dos principais objetivos deste trabalho foi verificar como as redes sociais
podem ser potencializadas através da Web Semântica. Também foi realizado um estudo
de como, no futuro, a Web Semântica e as redes sociais irão se integrar e de como a
Web Semântica pode ser aplicada à Web Social. Essa potencialização das redes sociais
pode ser alcançada com o auxílio do Servidor Semântico, mostrado no capítulo 6. Como
já foi dito, este servidor consiste em um conjunto de serviços semânticos estruturados
em uma meta-ontologia para criar e administrar redes sociais. Deve permitir a
construção de Esquemas de Redes Sociais segundo a especificação de uma ontologia
que configura por instanciação. A partir daí, surge a integração entre a Web Semântica e
as redes sociais.
Espera-se contribuir com este trabalho para um maior entendimento sobre Web
Semântica, Web 2.0, Redes Sociais e ontologias, e também servir como base para outras
pesquisas, além de fornecer um conjunto de referências a serem exploradas com mais
detalhes.
A ontologia do domínio das redes sociais está implementada no seu nível mais
alto. Para trabalhos futuros será realizado um refinamento da ontologia e uma proposta
de vocabulário para redes sociais. Foi feita uma extensa pesquisa na Web e verificou-se
que ainda não existe um vocabulário para redes sociais. Através do vocabulário
proposto, qualquer rede social poderá ser descrita na ontologia realizada neste trabalho,
após ter sido realizado o refinamento da mesma.
Em anexo no cd entregue junto com o TI, estão os arquivos contendo a
ontologia. Além do arquivo .pprj, a ontologia foi exportada para os formatos .owl e
.html, também inclusos no cd.
46
8. REFERÊNCIAS BIBLIOGRÁFICAS
AGUIAR, A. G., Mitos e Verdades sobre a Web Semântica. Curso de Sistemas de Informação, Departamento de Informática e Estatística, Centro Tecnológico. Universidade Federal de Santa Catarina, Revista Abstração, Edição 2, ano 4. Disponível por WWW em http://pet.inf.ufsc.br/abstracao/revistas/4/2/revista_abstracao_ano_4_edicao_2_mitos_e_verdades_sobre_a_web_sem_ntica.pdf
ALESSO, H. P., SMITH, C. S., Thinking on the Web: Berners-Lee, Goedel and Turing. Wiley, New Jersey, 2006.
ALEXANDER, B. Web 2.0: A New Wave of Innovation for Teaching and Learning. EDUCAUSE Review, vol. 41, no. 2 (March/April 2006): 32–44. Disponível por WWW em http://connect.educause.edu/Library/EDUCAUSE+Review/Web20ANewWaveofInnovation/40615
ALMEIDA, M. B., BAX, M. P., Uma Visão Geral sobre Ontologias - Pesquisa sobre Definições, Tipos, Aplicações, Métodos de Avalição e de Construção. The Scientific Electronic Library Online. Ci. Inf., Brasília, v. 32, n. 3, p. 7-20, set./dez. 2003, Disponível por WWW via http://www.scielo.br/pdf/ci/v32n3/19019.pdf
ANTONIOU, G., VAN HARMELEN, F., A Semantic Web Primer, The MIT Press, Cambridge, 2004.
GIBSON, B., Enabling an Accessible Web 2.0. ACM International Conference Proceeding Series; Vol. 225. Proceedings of the 2007 international cross-disciplinary conference on Web accessibility (W4A), Banff, Canada, 2007. Disponível por WWW em http://www.w4a.info/2007/prog/k1-gibson.pdf
BAKER, C., CHEUNG, K. H. (Eds), Semantic Web: Revolutionizing Knowledge Discovery in the Life Sciences. Springer, Berlin, 2007.
BERNERS-LEE, T., HENDLER, J., and LASSILA, O., The Semantic Web, Scientific American, 284(5), pp.34-43, 2001(5).
BERNERS-LEE, T., The Future of the Web. Testimony of Sir Timothy Berners-Lee, CSAIL Decentralized Information Group, Massachusetts Institute of Technology. Before the United States House of Representatives Committee on Energy and Commerce Subcommittee on Telecommunications and the Internet. Hearing on the "Digital Future of the United States: Part I -- The Future of the World Wide Web", março, 2007. Disponível por WWW em http://dig.csail.mit.edu/2007/03/01-ushouse-future-of-the-web
BERNERS-LEE, T., Qual é o futuro da Web, segundo Tim Berners-Lee. Por Peter Moon, especial para o IDG Now! Publicada em 07 de julho de 2007 às 13h56. Atualizada em 18 de setembro de 2007 às 21h04. Disponível por WWW em http://idgnow.uol.com.br/10anos/2007/07/07/idgnoticia.2007-07-06.9935975377/
BUNKE, H, WANG, P. S. P. (Eds), Computational Web Intelligence: Intteligent technology for Web Applications, World Scientific, Singapore, 2004.
CHAVES, M.S.,VIEIRA,R., RIGO,S. Uso de Ontologias para gerenciamento e acesso a documentos na Web. In: V Oficina de Inteligência Artificial, 2001, Pelotas.
47
Disponível por WWW em http://xldb.di.fc.ul.pt/~mchaves/pg_portugues/public/voia.pdf
CLICKO, O início Web 3.0 Web Semântica. Disponível por WWW em http://clicko.blogspot.com/2008/01/o-inicio-web-30-web-semantica.html, 2008.
COSTA, C., Como Funciona a Web 2.0. Artigo publicado no site HowStuffWorks. Disponível por WWW em http://informatica.hsw.uol.com.br/web-20.htm, 2008.
DACONTA, M., OBRST, L., SMITH, K., The Semantic Web: A Guide to XML, Web Services and Knowledge Management. Wiley, Indianapolis, 2003.
DAVIS, M., Project10X’s Semantic Wave 2008 Report: Industry Roadmap to Web 3.0 & Multibillion Dollar Market Opportunities. Executive Summary, January 2008. Disponível por WWW em http://www.isoco.com/pdf/Semantic_Wave_2008-Executive_summary.pdf
DAVIES, J., STUDER, R., WARREN, P. (Eds), Semantic Web Technologies: Trends and Research in Ontology-based Systems. Wiley, Chichester, 2006.
DOU, D., MCDERMOTT, D., QI, P., Translation on the Semantic Web. Lecture Nores in Computer Science. Journal on Data Semantics II, January, 2006. Disponível por WWW em http://cs-www.cs.yale.edu/homes/dvm/daml/ontomerge_odbase.pdf
DZIEKANIAK, G. V., KIRINUS, J. B., Web Semântica. Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, n.18, 2º sem. Disponível por WWW em http://www.encontros-bibli.ufsc.br/Edicao_18/2_Web_Semantica.pdf, 2004
FALBO, R. A., RUY, F. B., PEZZIN, J., MORO, R. D. Ontologias e Ambientes de Desenvolvimento de Software Semânticos. Actas de las IV Jornadas Iberoamericanas de Ingeniería del Software e Ingeniería del Conocimiento, JIISIC'2004, Volumen I, pp. 277-292, Madrid, España, Noviembre, 2004. Disponível por WWW em http://www.inf.ufes.br/%7Efalbo/download/pub/2004-JIISIC-1.pdf
FRAMEWORK, Launching the Web 2.0 Framework – Web 2.0 Framework. Future Exploration Blog, 2008. Disponível por WWW em http://www.futureexploration.net/blog/2007/05/launching_the_web_20_framework.html
GOLBECK, J.; ALFORD, A.; HENDLER, J. Handbook of Human Factors in Web Design, chapter Organization and Structure of Information using Semantic Web Technologies, 2003. Disponível por WWW em http://www.mindswap.org/papers/Handbook.pdf
GOMES-PEREZ, A., Tutorial on Ontological Engineering, Internacional Joint Conference on Artificial Intelligence – IJCAI, 1999.
GRUBER, T. R., Toward Principles for the Design of Ontologies Used for Knowledge Sharing, KSL-93-04, Knowledge Systems Laboratory, Stanford University. Disponível por WWW em http://ksl-web.stanford.edu/, 1993.
LIMA, T. Entrelaçamentos semânticos modelando a integração da informação na Web Semântica. São Carlos, 2001. 117f. Tese (Doutorado em Ciência da Computação) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. 2001
48
HENDLER, J. Agents and the SemanticWweb. IEEE Intelligents Systems, mar./abr. 2001.
HINZ, V. T. Proposta de Criação de uma Ontologia de Ontologias. Trabalho Individual I, Programa de Pós-Graduação em Informática, Centro Politécnico, Universidade Católica de Pelotas, dezembro de 2006.
HUGHES, M. M., Web 2.0 and alternatives. AATEX 14, Special Issue, 313-315 Proc. 6th World Congress on Alternatives & Animal Use in the Life Sciences August 21-25, Tokyo, Japan, 2007. Disponível por WWW em http://wwwsoc.nii.ac.jp/jsaae/zasshi/WC6_PC/paper313.pdf
JORGE, A. M. Ontologias no Suporte a Portais Semânticos. Dissertação de Mestrado, Programa de Pós-Graduação em Ciência da Informação, Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, junho de 2005.
JUNG, J. J., EUZENAT, J. Towards semantic social networks. 4th European Semantic Web
Conference site. ESWC 2007, Tyrol region of Innsbruck, Austria., June 2007. Disponível por WWW em http://www.eswc2007.org/pdf/eswc07-jung.pdf
KIM, H. M. Ontologies for the Semantic Web - Can Social Network Analysis Be Used to Develop Them? Proceedings of the Conference on Computational Analysis of Social and Organizational Systems (CASOS), Pittsburgh, PA, 21-23 June, Disponível por WWW em http://www.yorku.ca/hmkim/files/Kim02-CASOS-wcopyright.pdf
MAEDCHE, A., STAAB, S., Ontology Learning for the Semantic Web. IEE Inteligent Systems. Volume 16, number 2, March, April 2001. Disponível por WWW em http://www.cs.umbc.edu/771/papers/ieeeIntelligentSystems/ontologyLearning.pdf
MEIRELES, J. C., MOURA, M. Web 2.0: Novos Paradigmas Projetuais e Informacionais. InfoDesign, Revista Brasileira de Design da Informação, 4-2, 12-19, ISSN 1808-5377, 2007. Disponível por WWW em http://www.5e.com.br/infodesign/144/web2_novos_paradigmas.pdf
MIKA, P., Ontologies are us - A Unified Model of Social Networks and Semantics. Proceedings of the Fourth International Semantic Web Conference (ISWC 2005), Yolanda Gil, Enrico Motta, Richard V. Benjamins and Mark Musen (eds.), Lecture Notes in Computer Science no. 3729, page 122-136, Galway, Ireland, November, 2005. Disponível por WWW em http://www.cs.vu.nl/~pmika/research/papers/ISWC-folksonomy.pdf
MORAIS, E. F., SOARES, M. B., Web Semântica para Máquinas de Busca. Curso de Pós-Graduação em Ciência da Computação, Projeto e Análise de Algoritmos, Universidade Federal de Minas Gerais, 2003. Disponível por WWW em http://homepages.dcc.ufmg.br/~nivio/cursos/pa03/seminarios/seminario7/seminario7.pdf
MORI, A., CARVALHO, C. L., Metadados no Contexto da Web Semântica. RT-INF_002-04 - Relatório Técnico, Instituto de Informática, Universidade Federal de Goiás, Novembro de 2004.
MOURA, A. M. C. A Web Semântica: fundamentos e tecnologias. Instituto Militar de Engenharia. IME. Rio de Janeiro. 2001. Disponível por WWW em http://ipanema.ime.eb.br/ãnamoura/public/ websemantica.zip.
49
MUSSER, J., O’REILLY, T., Web 2.0: Principles and Best Practices. Executive Summary. ISBN 0-596-52769-1. 2006. Disponível por WWW em http://oreilly.com/catalog/web2report/chapter/web20_report_excerpt.pdf
NIXON, N. J. B., Multimedia, WEB 2.0 and The Semantic Web: A Strategy for Synergy. First Workshop on Semantic Interoperability in the European Digital Library, 5th European Semantic Web Conference Tenerife, Spain, June, 2008. Disponível por WWW em http://www.image.ntua.gr/swamm2006/resources/paper14.pdf
NOY, N. F., MCGUINNESS, D. L.,Ontology Development 101: A Guide to Creating Your First Ontology. Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI-2001-0880, March 2001. Disponível por WWW em http://ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-mcguinness.pdf
PALAZZO, L. A. M., Tópicos Especiais em Web Semântica. Mestrado em Ciência da Computação, Centro Politécnico, Universidade Católica de Pelotas, Pelotas, 2008. Notas de Aula.
PASSIN, T. B., Explorer´s Guide to the Semantic Web. Manning, Greenwich, 2004.
PRIMO, A., O Aspecto Relacional das interações na Web 2.0. E- Compós (Brasília), v. 9, p. 1-21, 2007. Disponível por WWW em http://www6.ufrgs.br/limc/PDFs/web2.pdf
O’REILLY, T., O que é Web 2.0: Padrões de design e modelos de negócios para a nova geração de software. Publicado em O'Reilly (http://www.oreilly.com/) Copyright 2006 O’Reilly Media, Inc., 2006. Disponível em http://www.oreilly.com
RAMALHO, R. A. S., Web Semântica: aspectos interdisciplinares da gestão de recursos informacionais no âmbito da Ciência da Informação. Dissertação de Mestrado, Faculdade de Filosofia e Ciências, Mestrado em Ciência da Informação. Universidade Estadual Paulista, 2006.
RDF. Resource Description Framework. Schema Specification. 1998. Disponível por em http://www.w3.org/TR/1998/WD-rdf-schema/
RDF. Resource Description Framework. Model and Syntax Specification. W3C Recommendation 22 february 1999. Disponível por WWW em http://www.w3.org/TR/1999/REC-rdf-syntax-19990222.
ROCHA, R. P., Metadados,Web Semântica, Categorização Automática: combinando esforços humanos e computacionais para a descoberta e uso dos recursos da Web. Revista Em Questão, Em Questão, Porto Alegre, v. 10, n. 1, p. 109-121, jan./jun. 2004. Disponível por WWW em http://www6.ufrgs.br/emquestao/pdf_2004_v10_n1/EmQuestaoV10_N1_2004_art07.pdf
SAAD, B., Web Semântica e as Narrativas Visuais Interativas. Intermezzo: Reflexões e Notas sobre Jornalismo e Comunicação no Ciberespaço. Disponível por WWW em http://imezzo.wordpress.com/2008/09/11/web-semantica-e-as-narrativas-visuais-interativas-%E2%80%93-parte-i/, 2008.
SALAN, A. F., STEVENS, J. R., Semantic Web Technologies and e-Business. Idea group, Hershey, 2007.
50
SCHIESSL, J. M., Ontologia: O Termo e a Idéia. Departamento de Ciência da Informação, UFSC. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação; Vol. 12, No 24, 2007. Disponível por WWW em http://redalyc.uaemex.mx/redalyc/pdf/147/14702412.pdf
SEMPREBOM, T., MENDONÇA I., CAMADA M. Ontologias e Protégé. Artigo apresentado na Discilpina de Inteligência Artifical Aplicada a Controle e Automação. Curso de Pós-Graduação em Engenharia de Automação e Sistemas, Universidade Federal de Santa Catarina. 2007. Disponível por WWW em http://www.das.ufsc.br/~gb/pg-ia/Protege07/ontologias.pdf
SILVA, J. C., LIMA, T. S., RDF e RDFS na Infra-estrutura de Suporte à Web Semântica. Sociedade Brasileira de Computação, Revista eletrônica de iniciação Científica, Ano II, Volume II, Número 1, março de 2002. Disponível por WWW em http://www.sbc.org.br/reic/edicoes/2002e1/cientificos/RDFeRDFSnaInfraEstruturadeSuporteaWebSemantica.pdf
SILVA, J. W., Recuperação de Informação Através de Recursos da Web Semântica: Modelagem e Implementação. Relatório de Estágio Supervisionado apresentado à disciplina Estágio Supervisionado da Coordenação do Curso Superior em Tecnologia em Sistemas para Internet do Centro Federal de Educação Tecnológica da Paraíba. João Pessoa, 2007.
SIRIN, E., PARSIA, B., HENDLER J., Template-based Composition of Semantic Web Services. Mindswap: Maryland Information and Network Dynamics Lab Semantic Web Agents Project, Virginia, USA, November 2005. Disponível por WWW em http://www.mindswap.org/papers/AAAI-FSS05.pdf
SOUZA, R. R., ALVARENGA, R. A Web Semântica e suas contribuições para a ciência da informação. Revista Ciência da Informação, Brasília, v. 33, n. 1, p. 132-141, jan./abril 2004. Disponível por WWW em http://revista.ibict.br/index.php/ciinf/article/viewFile/50/50
TANIAR, D., RAHAYU, J., Web Semantics Ontology. Idea Group, Hershey, 2006.
TECHNOLOGY, M., Full WEB 2.0 API List. Technology Magazine. August 21st, 2007. Disponível por WWW em http://techmagazine.ws/full-web-20-api-list/
VISSER, U., Intelligent Information Integration for the Semantic Web. Springer, Berlin, 2005.
WIKIPEDIA, Rede Social. Disponível por WWW em http://pt.wikipedia.org/wiki/Redes_sociais, 2008
ZANETE, N. H. Introdução ao RDF: Resource Description Framework. Faculdade Paranaense, 2002 Disponível por WWW em http://www.faccar.com.br/zanete/introducaoRDF.htm
51
9. ANEXOS
9.1 Anexo A – Descrição dos conceitos da Ontologia do Domínio das
Redes Sociais
A seguir é mostrada a descrição de cada um dos conceitos utilizados na
ontologia do domínio das redes sociais.
• Resource: é o nível mais alto da Ontologia. Na fase inicial do trabalho, foi
decidido que todos os conceitos dentro da ontologia seriam considerados como
recursos. Tais recursos possibilitam e disponibilizam todos os serviços na Web.
Dentro deste nível estão os demais conceitos.
• Agent: diz respeito a quem utiliza a Web, seja usuário ou máquina (na forma de
um programa ou aplicação). Os dois tipos de usuários – person e machine – são
considerados agentes, sem os quais a Web 2.0 e as Redes Sociais não podem
existir.
o Person: refere-se a um usuário da Web. Os usuários em sistemas de
informação são agentes externos ao sistema que usufruem da tecnologia
para realizar determinado trabalho. Podem ser desde os usuários comuns
do sistema até administradores, programadores ou analistas de sistemas.
o Machine: uma máquina é todo o dispositivo mecânico ou orgânico que
executa ou ajuda no desempenho das tarefas, precisando para isto de uma
fonte de energia. No caso da ontologia, a principal máquina seria o
computador. Denomina-se computador uma máquina capaz de variados
tipos de tratamento automático de informações ou processamento de
dados.
• API (Application Programming Interface): Interface de Programação de
Aplicativos, é um conjunto de rotinas e padrões estabelecidos por um software
para a utilização das suas funcionalidades por programas aplicativos, isto é,
programas que não querem envolver-se em detalhes da implementação do
software, mas apenas usar seus serviços. Após uma extensiva pesquisa na Web,
a lista de API foi feita de acordo com a lista do site http://techmagazine.ws/full-
web-20-api-list/ (Technology Magazine)
52
o Advertising: conjunto de sites de publicidade. A publicidade é uma
atividade profissional dedicada à difusão pública de idéias associadas a
empresas, produtos ou serviços, especificamente, propaganda comercial.
o Blog Search: ferramentas de buscas e pesquisas em blogs, Listagem de
diretórios de weblogs e ferramentas.
o Bookmarks: o Social Bookmarking, resumidamente, é um sistema de
bookmarks (também conhecido como favoritos ou marcadores) online,
público e gratuito, que tem por finalidade disponibilizar seus favoritos na
internet para o seu fácil acesso e para compartilhar com os usuários deste
tipo de serviço. Pode ser classificado como parte do conceito que é
chamado de Web 2.0.
o Enterprise: diz respeito a API’s de negócios, gerenciamento de recursos
humanos, serviços CRM, serviços de colaboração e conferência, etc.
o Events: marcação de eventos pela Web. Calendário de eventos; Eventos
de descoberta e de procura; Bases de dados de eventos e clubes de dados;
Calendários de eventos colaborativos; pesquisa de eventos locais e
comunidade.
o Internet: constitui serviços de análise e monitoração de sites na Web.
Imagens em thumbnail de Web sites; Rankings de tráfego de sites;
Análise de Web sites; Serviço para criação de API’s; Serviços de
monitoração de sites; Monitoração de site e elaboração de relatórios;
Ferramentas de métrica para sites; Administração de Web sites.
o Job Search: diz respeito à procura de emprego. Ato de procurar
emprego. Serviços de procura de emprego; Quadro de postagem de
trabalhos.
o Media Management: diz respeito ao gerenciamento de dados. Banco de
dados de arquivos multimídia; Serviço de compartilhamento de vídeos e
fotos; Acesso remoto e gerenciamento de mídia digital; armazenamento
de mídia online.
o Medical: a medicina é uma das áreas do conhecimento humano ligada à
manutenção e restauração da saúde. Pesquisa em bases de dados
53
médicas; Serviços de pesquisa em ciências médicas; Pesquisa em bases
de dados de bioinformática.
o Messaging: a Mensagem é, no sentido geral, o objeto da comunicação.
Diz respeito ao envio e recebimentos de mensagens via Web. Mensagens
de email, WAP e SMS; Serviços de mensagens SMS; Serviços de
mensagens de email; Software de comunicação para comunidades online.
o Music: a música constitui-se basicamente de uma sucessão de sons e
silêncio organizada ao longo do tempo. Vários serviços online.
Gerenciamento de playlists; Pesquisa em podcast; Serviço de
catalogação de cd’s online; Serviços de música; Recomendação e
descobertas de músicas; Player de música customizável.
o Recommendations: diz respeito a serviços de recomendação. Serviço de
recomendação distribuída; Serviço de recomendação; Sistema de
avaliações portátil; Avaliações de usuários locais e guias de cidades.
o Reference: em geral, uma referência é uma relação entre objetos na qual
um objeto é designado a outro por meio de um link. Serviços de
pesquisas de negócios; Bancos de dados de livros; Pesquisa de bancos de
dados de informação; Repositório de pesquisa acadêmica; Serviço de
validação de número de telefone; Serviços de referências de bibliotecas
2.0.
o Shopping: diz respeito a sites de compras online. Dados sobre histórico
de vendas de produtos; Serviços de compra e venda; Serviço de
comparação de preços de livros; Ferramenta de comparação de compra e
venda.
o Storage: armazenamento de dados em computação se refere a
componentes de computador, aparelhos e mídia gravável que contêm
dados digitais utilizados para computar algum cálculo por algum período
de tempo. Serviços de armazenamento online; Serviço de
armazenamento de dados online; Serviços de gerenciamento e entrega de
dados; Sistemas de arquivo online.
o Widgets: é um pedaço de código portátil que pode ser instalado e
54
executado dentro de qualquer página HTML separada por um usuário
final sem a necessidade adicional de compilação. Criação e distribuição e
serviços de monitoramentos de widgets; Plataforma Widget; Serviços
Web sociais.
• Service: são os serviços oferecido na Web. Web service é uma solução utilizada
na integração de sistemas e na comunicação entre aplicações diferentes. Com
esta tecnologia é possível que novas aplicações possam interagir com aquelas
que já existem e que sistemas desenvolvidos em plataformas diferentes sejam
compatíveis. A escolha do serviços mostrados na ontologia foi feita após
extensiva pesquisa na Web. Os termos e conceitos foram retirados do site All
Things Web 2.0 (http://www.allthingsweb2.com/), que possui uma grande e
atualizada lista de serviços disponíveis na Web 2.0. Todas as listagens,
classificações, comentários, e comparações são feitos pelos usuários finais,
desenvolvedores, investidores e empresários. Possui uma lista de sites com as
principais aplicações, softwares, código-aberto, sites Web, produtos e serviços
sobre cada um dos conceitos listados. A seguir é apresentado o conceito
genérico de cada termo.
o Áudio: o som é a propagação de uma frente de compressão mecânica ou
onda longitudinal; esta onda se propaga de forma circuncêntrica, apenas
em meios materiais -- que têm massa e elasticidade, como os sólidos,
líquidos ou gasosos, quer dizer, não se propaga no vácuo.
o Blog2Pod: Converte textos de blogs para podcasts.
o Blogging: um weblog, ou blog é uma página da Web, cuja estrutura
permite a atualização rápida a partir de acréscimos de tamanho variável,
(chamados artigos, ou posts).
o Bookmarking: o Social Bookmarking, resumidamente, é um sistema de
bookmarks (também conhecido como favoritos ou marcadores) online,
público e gratuito, que tem por finalidade disponibilizar seus favoritos na
internet para o seu fácil acesso e para compartilhar com os usuários deste
tipo de serviço. Pode ser classificado como parte do conceito que é
chamado de Web 2.0.
55
o Browser: o Navegador, também conhecido como Web browser ou
simplesmente browser, termos em inglês, é um programa que habilita
seus usuários a interagirem com documentos virtuais, também
conhecidos como páginas HTML, que estão hospedadas num servidor
Web.
o Calendar: aplicação usada para manter um calendário para um único
usuário ou um grupo de usuários de uma Intranet ou da Web.
o Chat: um chat, que em português significa "conversação", ou "bate-papo"
usado no Brasil, é um neologismo para designar aplicações de
conversação em tempo real.
o Collaboration: colaboração Web fornece a uma organização a
capacidade de colaborar com os clientes, internamente ou através da
Internet, em tempo real.
o Collect: coleção Web de ClipArt é uma coleção de ícones, alfabetos,
animação, backgrounds, etc que tenham sido recolhidos a partir de
muitos sites individuais, a partir de livros digitalizados, etc ou obtidos
junto de diversas outras fontes e colocados em um site da Web com os
termos de uso que normalmente lhe permite usar o clipart e imagens em
suas próprias páginas pessoais.
o Comics: Webcomics são quadrinhos cuja publicação é veiculada
exclusivamente pela Internet, apesar de existirem muitos quadrinhos
consagrados à moda tradicional que são disponibilizados de forma
digital. Podendo facilmente atingir uma audiência, os quadrinhos on-line
se tornaram o principal meio dos novos cartunistas apresentarem o seu
trabalho.
o Communication: telecomunicações é a transmissão, emissão ou
recepção, por fio, radioeletricidade, meios ópticos ou qualquer outro
processo eletromagnético, de símbolos, caracteres, sinais, escritos,
imagens, sons ou informações de qualquer natureza.
o CRM: Customer Relationship Management (Gestão de Relacionamento
com o Cliente). Foi criada para definir toda uma classe de ferramentas
56
que automatizam as funções de contacto com o cliente, essas ferramentas
compreendem sistemas informatizados e fundamentalmente uma
mudança de atitude corporativa, que objetiva ajudar as companhias a
criar e manter um bom relacionamento com seus clientes armazenando e
inter-relacionando de forma inteligente, informações sobre suas
atividades e interações com a empresa.
o Dbase: Bancos de dados (ou bases de dados), são conjuntos de registros
dispostos em estrutura regular que possibilita a reorganização dos
mesmos e produção de informação. Um banco de dados normalmente
agrupa registros utilizáveis para um mesmo fim.
o Design: Web design é um processo de conceitualização, planejamento,
modelagem e execução de conteúdo de mídia eletrônica entregue via
Internet, sob a forma de tecnologias (como as linguagens de marcação)
adequadas para interpretação e visualização através de um navegador
Web ou outras interfaces gráficas baseadas na Web.
o Dictionary: é uma compilação de palavras ou dos termos próprios, ou
ainda de vocábulos de uma língua, quase sempre dispostos por ordem
alfabética e com a respectiva significação ou a sua versão em outra
língua. Online, com vários tipos de pesquisas
o eCommerce: é um tipo de transação comercial feita especialmente
através de um equipamento eletrônico, como, por exemplo, um
computador.
o E-Learning: é fruto maduro de uma combinação ocorrida entre o ensino
com auxílio da tecnologia e a educação a distância. Ambas modalidades
convergiram para a educação on-line e para o treinamento baseado em
Web, que ao final resultou no e-Learning.
o Filesharing: o compartilhamento de arquivos é a atividade de tornar
arquivos disponíveis para outros usuários através de download pela
Internet e também em redes menores.
o Financials: é a arte e a ciência da gestão de recursos. O campo de estudo
de instituições financeiras, dos mercados financeiros e do funcionamento
57
dos sistemas financeiros, tanto dentro de uma nação quanto no mercado
internacional, também é conhecido como finanças.
o Fun: é uma forma de passar o tempo para obter distração, ou seja,
relaxamento mental ou físico. Enquanto o lazer é uma forma de
entretenimento ou descanso, a recreação exige empenho em atividades de
forma a obter diversão.
o Gambling: os jogos de azar são jogos nos quais a possibilidade de ganhar
ou perder não dependem da habilidade do jogador, mas sim
exclusivamente do azar do apostador, encabeçando essa categoria temos
a roleta.
o Games: um videogame é um jogo eletrônico no qual o jogador interage
com imagens enviadas a um dispositivo que as exibe, geralmente uma
televisão ou um monitor. O termo "videogame", em português, muitas
vezes se refere à plataforma que processa os jogos, em vez de aos jogos
em si.
o Hosting: hospedagem de Sites é um serviço que possibilita a pessoas ou
empresas com sistemas online a guardar informações, imagens, vídeo, ou
qualquer conteúdo acessível por Web.
o Identity: uma identidade on-line é uma identidade social online que os
usuários criam, em comunidades online e sites.
o Images: significa representação visual de um objeto. Nas ciências exatas.
como em matemática, o termo "imagem" é entendido como
representação de um objeto especializado, que exige técnicas e
ferramentas especiais. Gerenciamento online de fotos e aplicações
compartilhadas.
o Knowledge: hoje existem vários conceitos para esta palavra e é sabido
por todos que conhecimento é aquilo que se conhece de algo ou alguém.
Isso em um conceito menos específico.
o Marketing: Internet Marketing, também conhecido com Web Marketing,
é o marketing (comercialização) de produtos ou serviços através da
Internet.
58
o News: um jornal online, também conhecido como um jornal na Web é
um jornal que existe na World Wide Web ou Internet, isoladamente ou
como uma versão online de uma revista impressa.
o Office: o Microsoft Office é uma suíte de aplicativos para escritório que
contém programas como processador de texto, planilha de cálculo, banco
de dados, apresentação gráfica e gerenciador de tarefas, e-mails e
contatos.
o OS: Sistema Operacional é um programa ou um conjunto de programas
cuja função é servir de interface entre um computador e o usuário
o Portal: um portal é um site na Internet que funciona como centro
aglomerador e distribuidor de conteúdo para uma série de outros sites ou
subsites dentro, e também fora, do domínio ou subdomínio da empresa
gestora do portal.
o Powerpoint: é um programa originalmente escrito para sistema
operacional Microsoft Windows e também portado para a plataforma
Mac OS X, que permite a criação e exibição de apresentações, cujo
objetivo é informar sobre um determinado tema, podendo usar imagens,
sons, textos e vídeos, que podem ser animados de diferentes maneiras.
o Projects: gerência de projetos é a aplicação de conhecimentos,
habilidades e técnicas na elaboração de atividades relacionadas para
atingir um conjunto de objetivos pré-definidos.
o Publishing: editoração é o gerenciamento da produção de publicações de
caráter periódico e não periódico, como livros, revistas, boletins,
prospectos, álbuns, cadernos, almanaques etc. Mais recentemente, a
produção editorial foi elevada a todo tipo de material de comunicação
impresso ou eletrônico, reproduzido em gráfica ou em série, como CDs,
fitas e até websites e CD-Roms.
o Scheduling: um calendário ou agenda é uma lista organizada, geralmente
fixadas em forma de quadro, fornecendo informações sobre uma série de
eventos organizados.
o Search: uma ferramenta de busca é um sistema de software projetado
59
para encontrar informações armazenadas em um sistema computacional a
partir de palavras-chave indicadas pelo utilizador, reduzindo o tempo
necessário para encontrar informações.
o Software: é uma seqüência de instruções a serem seguidas e/ou
executadas, na manipulação, redirecionamento ou modificação de um
dado/informação ou acontecimento. Também é o nome dado ao
comportamento exibido por essa seqüência de instruções quando
executada em um computador ou máquina semelhante.
o Stats: estatística se utiliza das teorias probabilísticas para explicar a
freqüência da ocorrência de eventos, tanto em estudos observacionais
quanto em experimentos. Tem por objetivo obter, organizar e analisar
dados estatísticos, a fim de descrever e explicá-los, além de determinar
possíveis correlações e nexos-causais.
o Tagging: é uma palavra-chave (relevante) ou termo associado com uma
informação (ex: uma imagem, um artigo, um vídeo) que o descreve e
permite uma classificação da informação baseada em palavras-chave.
Tags são, usualmente, escolhidas informalmente e como escolha pessoal
do autor ou criador do item de conteúdo - isto é, não é parte de um
esquema formal de classificação. É um recurso encontrado em muitos
sites de conteúdo colaborativo recentes e por essa razão, "tagging"
associa-se com a onda Web 2.0.
o Task Manager: programa usado para fornecer informações sobre os
processos e programas em execução em um computador, assim como o
estado geral do computador. Também pode ser usado para encerrar
processos e programas, bem como alterar a prioridade dos processos.
o Track & Trace: processo de gravação do passado e do presente paradeiro
de uma transferência, uma vez que passa por diferentes manipuladores
em seu caminho até ao seu destino, através de uma rede de distribuição.
o Wi-fi: foi uma marca licenciada originalmente pela Wi-Fi Alliance para
descrever a tecnologia de redes sem fios embarcadas (WLAN) baseadas
no padrão IEEE 802.11.
60
• Artifact: consiste em qualquer objeto concreto utilizado na Web (texto, vídeo,
etc). Todas as classes da ontologia utilizam este conceito.
o Photo: por definição, fotografia é, essencialmente, a técnica de criação
de imagens por meio de exposição luminosa, fixando esta em uma
superfície sensível. Designa-se por fotografia digital (utilizada na Web) a
fotografia tirada com uma câmera digital ou determinados modelos de
telefone celular, resultando num arquivo de computador que pode ser
editado, impresso, enviado por e-mail ou armazenado em websites ou
CD-ROMs, DVD’s, Pendrives, etc.
o Vídeo: é uma a tecnologia de processamento de sinais eletrônicos
analógicos ou digitais para capturar, armazenar, transmitir ou apresentar
imagens em movimento. O Vídeo Digital (em inglês, Digital Video ou
DV) é um formato de vídeo digital que permite a gravação em fitas
magnéticas.
o Sound: é a propagação de uma frente de compressão mecânica ou onda
longitudinal; esta onda se propaga de forma circuncêntrica, apenas em
meios materiais - que têm massa e elasticidade, como os sólidos, líquidos
ou gasosos, quer dizer, não se propaga no vácuo. O som digital ou áudio
digital é a codificação digital de um sinal elétrico que representa uma
onda sonora. A gravação de som digital utiliza formatos digitais
(binários) para arquivar e editar os sons. O som digital pode, por
exemplo, ser captado com um gravador digital ou com um microfone
acoplado à placa de som de um computador.
o Text: em lingüística, a noção de texto é ampla e ainda aberta a uma
definição mais precisa. Grosso modo, pode ser entendido como
manifestação lingüística das idéias de um autor, que serão interpretadas
pelo leitor de acordo com seus conhecimentos lingüísticos e culturais.
Seu tamanho é variável.
• Network: uma rede de computadores consiste de 2 ou mais computadores e
outros dispositivos conectados entre si de modo a poderem compartilhar seus
serviços, que podem ser: dados, impressoras, mensagens (e-mails), etc. Diz
61
respeito às Redes Sociais (na forma de Comunidades Virtuais) e às Redes
Físicas;
o Social: rede Social é uma das formas de representação dos
relacionamentos afetivos ou profissionais dos seres humanos entre si ou
entre seus agrupamentos de interesses mútuos. A rede é responsável pelo
compartilhamento de idéias entre pessoas que possuem interesses e
objetivo em comum e também valores a serem compartilhados. Assim,
um grupo de discussão é composto por indivíduos que possuem
identidades semelhantes. Essas redes sociais estão hoje instaladas
principalmente na Internet devido ao fato desta possibilitar uma
aceleração e ampla maneira das idéias serem divulgadas e da absorção de
novos elementos em busca de algo em comum. São listados os principais
tipos de Redes Sociais existentes.
� Virtual Community: uma comunidade virtual é uma comunidade
que estabelece relações num espaço virtual através de meios de
comunicação a distância. Se caracteriza pela aglutinação de um
grupo de indivíduos com interesses comuns que trocam
experiências e informações no ambiente virtual
� Blog: um weblog, ou blog, é uma página da Web, cuja estrutura
permite a atualização rápida a partir de acréscimos de tamanho
variável, chamados artigos, ou "posts). Estes são organizadas
cronologicamente de forma inversa (como um diário) costumam
abordar a temática do blog, e podem ser escritos por um número
variável de pessoas, de acordo com a política do blog.
� Instant Messaging: um comunicador instantâneo, também
conhecido por IM (do inglês Instant Messaging), é uma aplicação
que permite o envio e o recebimento de mensagens de texto em
tempo real. Através destes programas o usuário é informado
quando algum de seus amigos, cadastrado em sua lista de
contatos, está online, isto é, conectou-se à rede. A partir daí, eles
podem manter conversações através de mensagens de texto as
quais são recebidas pelo destinatário instantaneamente.
62
� List: lista de discussão é uma ferramenta gerenciável pela Internet
que permite a um grupo de pessoas a troca de mensagens via e-
mail entre todos os membros do grupo. O processo de uso
consiste no cadastramento da lista, por exemplo no Yahoo, um
dos sítios que oferece o serviço gratuitamente, e após, no
cadastramento de membros. Uma mensagem escrita por membro
e enviada para a lista, replica automaticamente na caixa postal de
cada um dos cadastrados.
� Podcast: podcasting é uma forma de publicação de arquivos de
mídia digital (áudio, vídeo, foto, etc...) pela Internet, através de
um Feed RSS, que permite aos utilizadores acompanhar a sua
atualização. Com isso, é possível o acompanhamento e/ou
download automático do conteúdo de um Podcast.
� Group: em Sociologia, um grupo é um sistema de relações
sociais, de interações recorrentes entre pessoas. Também pode ser
definido como uma coleção de várias pessoas que compartilham
certas características, interajam uns com os outros, aceitem
direitos e obrigações como sócios do grupo e compartilhem uma
identidade comum - para haver um grupo social, é preciso que os
indivíduos se percebam de alguma forma afiliados ao grupo.
� Mashup um mashup é um website ou uma aplicação web que usa
conteúdo de mais de uma fonte para criar um novo serviço
completo. O conteúdo usado em mashups é tipicamente código
de terceiros através de uma interface pública ou de uma API.
� Wiki: os termos wiki e WikiWiki são utilizados para identificar
um tipo específico de coleção de documentos em hipertexto ou o
software colaborativo usado para criá-lo. Chamado "wiki" por
consenso, o software colaborativo permite a edição coletiva dos
documentos usando um sistema que não necessita que o conteúdo
tenha que ser revisto antes da sua publicação.
o Physical: uma rede de computadores consiste de 2 ou mais
computadores e outros dispositivos conectados entre si de modo a
63
poderem compartilhar seus serviços, que podem ser: dados, impressoras,
mensagens (e-mails), etc. A Internet é um amplo sistema de
comunicação que conecta muitas redes de computadores. Existem várias
formas e recursos de vários equipamentos que podem ser interligados e
compartilhados, mediante meios de acesso, protocolos e requisitos de
segurança.
• Technology: é um termo que envolve o conhecimento técnico e científico e as
ferramentas, processos e materiais criados e/ou utilizados a partir de tal
conhecimento. Diz respeito às técnicas, conhecimentos, métodos, materiais,
ferramentas, e processos usados para resolver problemas ou ao menos facilitar a
solução dos mesmos na Web. Descreve as tecnologias necessárias para criar e
gerenciar os sites na Web. O conhecimento de tais tecnologias é fundamental
para as tarefas citadas.
o HTML (HyperText Markup Language): significa Linguagem de
Marcação de Hipertexto é uma linguagem de marcação utilizada para
produzir páginas na Web. Documentos HTML podem ser interpretados
por navegadores.
� XHTML (eXtensible Hypertext Markup Language): é uma
reformulação da linguagem de marcação HTML baseada em
XML. Combina as tags de marcação HTML com regras da XML;
este processo de padronização tem em vista a exibição de páginas
Web em diversos dispositivos (televisão, palm, celular, etc).
� CSS (Cascading Style Sheets): é uma linguagem de estilo
utilizada para definir a apresentação de documentos escritos em
uma linguagem de marcação, como HTML ou XML. Seu
principal benefício é prover a separação entre o formato e o
conteúdo de um documento.
� TCP/IP (Transmission Control Protocol/ Internet Protocol): o
conjunto de protocolos TCP/IP é um conjunto de protocolos de
comunicação entre computadores em rede. Seu nome vem dos
64
dois protocolos mais importantes do conjunto: o TCP (Protocolo
de Controle de Transmissão) e o IP (Protocolo de Interconexão).
o XML (eXtensible Markup Language): é uma recomendação da W3C
para gerar linguagens de marcação para necessidades especiais. É um
subtipo de SGML capaz de descrever diversos tipos de dados. Seu
propósito principal é a facilidade de compartilhamento de informações
através da Internet.
� DTD (Document Type Definition): contém as regras que definem
quais as tags que podem ser usadas em um documento XML e
quais os valores válidos.
� XML DOM (Document Object Model): é um modelo de objeto
padrão, independente de plataforma ou linguagem para
representar HTML ou XML e formatos relacionados.
� XSL (Extensible Stylesheet Language): permite que a informação
do formato seja associada com os elementos em um original de
fonte para permitir a produção de um formatado original.
� XSL-FO (Formatting Objects): é uma linguagem de marcação
para formatação de documentos XML, que é freqüentemente
usado para gerar os PDFs. XSL-FO é parte da XSL, um conjunto
de tecnologias W3C projetada para a transformação e formatação
de dados.
� XPath: é uma linguagem para selecionar nodos a partir de um
documento XML. Além disso, XPath pode ser utilizada para
calcular valores (strings, números ou valores booleanos), a partir
do conteúdo de um documento XML.
� XQuery: é uma linguagem de consulta (com algumas
características de linguagem de programação) que foi projetada
para consultar coleção de dados em XML. É semanticamente
similar a SQL.
� XLink: a XML Linking Language é uma linguagem de marcação
utilizada para criar hiperlinks em documentos XML. XLink é uma
65
especificação W3C que descreve de maneira geral métodos de
descoberta de links em documentos XML, quer sejam internos ou
externos ao documento.
� XPointer: é um sistema de endereçamento de componentes de
mídia baseados em XML na Internet.
� Schema: é uma linguagem baseada no formato XML para
definição de regras de validação ("esquemas") em documentos no
formato XML.
� XForms: é um formato XML para a especificação de um modelo
de processamento de dados para dados XML e interface de
usuário (s) para os dados XML, tais como formulários Web.
� SOAP (Simple Object Access Protocol): é um protocolo para
troca de informações estruturadas em uma plataforma
descentralizada e distribuída, utilizando tecnologias baseadas em
XML.
� RDF (Resource Description Framework): é uma família de
especificações do W3C, originalmente concebido como um
modelo de dados de metadados, que tem vindo a ser utilizada
como um método geral de modelagem de informações através de
uma variedade de formatos de sintaxe.
� RSS (Realy Simple Syndication): é um subconjunto de "dialetos"
XML que servem para agregar conteúdo ou "Web syndication",
podendo ser acedido mediante programas ou sites agregadores. É
usado principalmente em sites de notícias e blogs.
� WAP (Wireless Application Protocol): em português, Protocolo
para Aplicações sem Fio, é um padrão internacional para
aplicações que utilizam comunicações de dados digitais sem fio
(Internet móvel), como por exemplo o acesso à Internet a partir
de um telefone móvel. WAP foi desenvolvido para prover
serviços equivalentes a um navegador Web com alguns recursos
específicos para serviços móveis.
66
� Web Services: é uma solução utilizada na integração de sistemas
e na comunicação entre aplicações diferentes. Com esta
tecnologia é possível que novas aplicações possam interagir com
aquelas que já existem e que sistemas desenvolvidos em
plataformas diferentes sejam compatíveis. Os Web services são
componentes que permitem às aplicações enviar e receber dados
em formato XML.
o Browser Scripting: linguagens de script são linguagens de programação
executadas do interior de programas e/ou de outras linguagens de
programação. As linguagens de script servem para estender a
funcionalidade de um programa e/ou controlá-lo. Client-side scripting
geralmente refere-se à classe de programas de computador na Web que
são executados do lado do cliente, ao invés de serem executados do lado
do servidor (no servidor Web).
� JavaScript: é uma linguagem de programação criada pela
Netscape em 1995, que a princípio se chamava LiveScript, para
atender, principalmente, as seguintes necessidades: validação de
formulários no lado cliente (programa navegador); Interação com
a página.
� HTML DOM (Document Object Model): define uma forma
padrão para acessar e manipular documentos HTML. O DOM
apresenta um documento HTML como uma estrutura em árvore,
com elementos, atributos, e texto.
� DHTML (Dynamic HTML): é a união das tecnologias HTML,
Javascript e uma linguagem de apresentação, como folhas de
estilo CSS aliada a um Modelo de Objeto de Documentos, para
permitir que uma página Web seja modificada dinamicamente na
própria máquina cliente, sem necessidade de novos acessos ao
servidor Web.
� VBScript (Microsoft Visual Basic Scripting Edition): é um sub-
sistema do Visual Basic usado em Active Server Pages e em
67
Windows Scripting Hosts como uma linguagem de aplicação
universal (general-purpose).
� AJAX (Asynchronous Javascript And XML): é o uso
metodológico de tecnologias como Javascript e XML, providas
por navegadores, para tornar páginas mais interativas com o
usuário, utilizando-se de solicitações assíncronas de informações.
� E4X: ECMAScript para o XML é uma extensão da linguagem de
programação que adiciona suporte nativo para XML
ECMAScript (que inclui o ActionScript, DMDScript, JavaScript,
JScript).
� WLMScript: é o dialeto do JavaScript usado para WML páginas e
é parte da Wireless Application Protocol (WAP).
o Server Scripting: linguagens de script são linguagens de programação
executadas do interior de programas e/ou de outras linguagens de
programação. As linguagens de script servem para estender a
funcionalidade de um programa e/ou controlá-lo. Server-side scripting é
uma tecnologia de servidor Web em que um pedido do usuário é
atendido pela execução de um script diretamente no servidor Web para
gerar páginas HTML dinâmicamente.
� SQL (Structured Query Language): linguagem de Consulta
Estruturada, ou SQL, é uma linguagem de pesquisa declarativa
para banco de dados relacional (base de dados relacional).
� ASP (Active Server Pages): é uma estrutura de programação (não
uma linguagem, asp é um framework) em Script que se utiliza de
VBScript, JScript, PerlScript ou Python processadas pelo lado
servidor para geração de conteúdo dinâmico na Web.
� ADO (ActiveX Data Objects): é um mecanismo Component
Object Model criado pela Microsoft onde os programas o utilizam
para a troca de informações com as bases de dados.
� PHP: acrônimo recursivo para "PHP: Hypertext Preprocessor", é
uma linguagem de programação de computadores interpretada,
68
livre e muito utilizada para gerar conteúdo dinâmico na Web. O
PHP é uma poderosa linguagem orientada a objetos.
o .NET: .net (.network) é um Domínio de topo genérico (gTLD) usado nos
DNS's da Internet. O gTLD.net é administrado atualmente pela VeriSign.
� .NET Microsoft: é a nova estratégia de Internet da Microsoft.
� .NET ASP: é a plataforma da Microsoft para o desenvolvimento
de aplicações Web e é o sucessor da tecnologia ASP.
� .NET Móbile: é uma extensão do framework .NET, chamado
Microsoft Mobile Internet Toolkit (MMIT), ou simplesmente
.NET Mobile.
o Multimedia: multimídia é a combinação, controlada por computador, de
pelo menos um tipo de mídia estática (texto, fotografia, gráfico), com
pelo menos um tipo de media dinâmica (vídeo, áudio, animação)
� Media: pode ser estática (texto, fotografia, gráfico) ou dinâmica
(vídeo, áudio, animação)
� SMIL (Synchronized Multimedia Integration Language): é uma
linguagem de marcação XML utilizada para descrever
apresentações multimídia.
� SVG (Scalable Vector Graphics): é uma especificação e formato
de arquivo XML para descrever gráficos vetoriais
bidimensionais, tanto estáticos quanto dinâmicos (interativo ou
animado).
� Flash: é um software primariamente de gráfico vetorial - apesar
de suportar imagens bitmap e vídeos - utilizado geralmente para a
criação de animações interativas que funcionam embutidas num
navegador web.
o Browsers: o Navegador, também conhecido como Web browser ou
simplesmente browser, é um programa que habilita seus usuários a
interagirem com documentos virtuais, também conhecidos como páginas
69
HTML, que estão hospedadas num servidor Web. Apresenta apenas os
principais navegadores utilizados atualmente.
� Internet Explorer: também conhecido pelas abreviações IE, MSIE
ou WinIE, é um navegador de Internet de licença proprietária
produzido inicialmente pela Microsoft em 23 de agosto de 1995.
É o navegador mais usado nos dias de hoje. É um componente
integrado das versões mais recentes do Microsoft Windows.
� Netscape: Netscape Navigator (conhecido anteriormente por
Netscape Browser, Netscape Communicator ou simplesmente
Netscape) foi um browser para Internet feito pela Netscape.
� Mozilla Firefox: é um navegador livre e multi-plataforma
desenvolvido pela Mozilla Foundation com ajuda de centenas de
colaboradores. A intenção da fundação é desenvolver um
navegador leve, seguro, intuitivo e altamente extensível.
� Opera: é um programa de computadores, caracterizado como
navegador da Web, criado em 1994 pela empresa estatal de
telecomunicações da Noruega Telenor, e atualmente é
desenvolvido pela Opera Software com sede em Oslo. É
conhecido por apresentar constantemente novos recursos, sem
influenciar no desempenho e com estes transformando-se em uma
verdadeira suíte voltada para o mundo online.
� Google Chrome: é um navegador de código-fonte aberto,
desenvolvido pelo Google. O nome é derivado a partir da
interface gráfica da moldura, ou "cromo", de navegadores Web.
70
9.2 Anexo B – A evolução da Web
Evolução da Web, com uma projeção até o ano de 2020.
71
9.2 Anexo C – Web 2.0 Framework Web 2.0 Framework, mostrando alguns dos princípios da Web 2.0.
72
9.3 Anexo D – Adoção de Redes Sociais e Web 2.0 nas Empresas Americanas Pesquisa mostrando o porque da adoção das tecnologias de Web 2.0 e Redes
Sociais nas empresas americanas.
73
9.4 Anexo E – Arquitetura do Social Networks Semantic Server Arquitetura do Social Networks Semantic Server.