63
Universidade de São Paulo Escola de Comunicações e Artes Departamento de Biblioteconomia e Documentação Emerson Issa Kamiya Topic maps como instrumentos de representação e recuperação da informação São Paulo 2005

Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Embed Size (px)

Citation preview

Page 1: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Universidade de São Paulo

Escola de Comunicações e Artes

Departamento de Biblioteconomia e Documentação

Emerson Issa Kamiya

Topic maps como instrumentos de representação e recuperação da informação

São Paulo

2005

Page 2: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Emerson Issa Kamiya

Topic maps como instrumentos de representação e recuperação da informação

Trabalho de conclusão de curso apresentado ao Departamento de Biblioteconomia e

Documentação da Escola de Comunicações e Artes da Universidade de São Paulo como requisito parcial à obtenção do título de

Bacharel em Biblioteconomia

Orientadora: Profª. Drª. Marilda Lopes Ginez de Lara

São Paulo

2005

Page 3: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Autorizo a divulgação total ou parcial deste trabalho, por qualquer meio convencional ou eletrônico, para fins de estudo e pesquisa, desde que citada a fonte. Críticas podem ser enviadas para o e-mail [email protected].

Pequenas correções foram feitas em dezembro de 2008. Porém, o conteúdo do texto permanece inalterado.

KAMIYA, Emerson Issa

Topic maps como instrumentos de representação e recuperação da informação / Emerson Issa Kamiya ; orientadora Marilda Lopes Ginez de Lara. – São Paulo, 2005.

63 p. il.

Monografia (Bacharelado em Biblioteconomia) – Departamento de Biblioteconomia e Documentação, Escola de Comunicações e Artes, Universidade de São Paulo.

Topic maps; Linguagem documentária; Representação da informação; Recuperação da informação; Mapa de conhecimento.

Page 4: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Folha de aprovação

Emerson Issa Kamiya.

Topic maps como instrumentos de representação e recuperação da informação.

Trabalho de conclusão de curso apresentado ao Departamento de Biblioteconomia e

Documentação da Escola de Comunicações e Artes da Universidade de São Paulo como requisito parcial à obtenção do título de

Bacharel em Biblioteconomia.

Aprovado em: 19/12/2005.

Nota: 10.

Banca examinadora:

Profª. Drª. Marilda Lopes Ginez de Lara

Instituição: Universidade de São Paulo

Assinatura: _____________________________________________________________________

Profª. Drª. Nair Yumiko Kobashi

Instituição: Universidade de São Paulo

Assinatura: _____________________________________________________________________

Profª. Mª. Cibele Araujo Camargo Marques dos Santos

Instituição: Fundação Escola de Sociologia e Política de São Paulo.

Assinatura: _____________________________________________________________________

Page 5: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Para

Walter e Mitiko

Page 6: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Agradecimentos

Nesses quatro anos de curso aprendi muito e conheci pessoas admiráveis. Reconheço que, graças a elas, pude crescer em várias “facetas”.

Para a construção desse trabalho, devo muito a Marilda, minha querida orientadora. Tive preciosa ajuda da María Jesús Colmenero Ruiz, da Universidad Carlos III, de Madri, expert em topic maps, e da Nair Yumiko Kobashi, querida professora.

Pude conhecer diversas organizações, pessoas e realidades. Isso contribuiu enormemente para minha formação.

Tive a companhia e o apoio da minha família. Sou muito grato à tia Yoshiko.

Lucia, obrigado por ser minha companheira.

Page 7: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Não vemos as coisas como elas são,

mas como nós somos.

Anaïs Nin

Page 8: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Resumo

KAMIYA, Emerson Issa. Topic maps como instrumentos de representação e recuperação da informação. 2005. 63 p. Monografia (Bacharelado em Biblioteconomia) - Departamento de Biblioteconomia e Documentação, Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2005.

Topic maps são instrumentos de representação de estruturas conceituais e

visualização na forma de mapas de conhecimento. Sua estrutura está formalizada

como norma (ISO 13250) e especificação (XML Topic Maps). Seus principais conceitos

são: tópicos, associações (entre os tópicos), ocorrências (documentos relacionados aos

tópicos), published subject indicators (referências aos assuntos representados nos

tópicos), fusão (entre vários topic maps) e escopo (contextualização dos tópicos,

associações e ocorrências). Sua estrutura é simples, porém, poderosa para lidar com

vastas quantidades de informação. A separação entre a camada conceitual (tópicos) e a

camada de recursos (ocorrências) permite o intercâmbio entre topic maps e seu uso em

diversos repositórios de recursos. Sua estrutura, centrada na informação e não nos

documentos, pode contribuir para uma nova abordagem na Ciência da Informação

voltada para a representação e o acesso à informação.

Palavras-chave: Topic maps; Linguagem documentária; Representação da informação; Recuperação da informação; Mapa de conhecimento.

Page 9: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Abstract

KAMIYA, Emerson Issa Using topic maps as tools for information representation and retrieval. 2005. 63 p. Monograph (Bachelor's degree in Library Science) - Departamento de Biblioteconomia e Documentação, Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2005.

Topic maps are instruments designed to represent conceptual structures and

visualization in the form of knowledge maps. The structure of topic maps is normalized

by ISO 13250 and specified by the XML Topic Maps and their core elements are:

topics, associations (between topics), occurrences (documents related to topics),

published subject indicators (references to the subjects represented in the topics),

merge (between a variety of topic maps) and scope (contextualization of topics,

associations and occurrences). Although structured in a simple way, this tool can

manage large amounts of information with ease. The division into a conceptual layer

(topics) and a resource layer (occurrences) allows the interchange between topic maps

and its use in many resource repositories. Their structure focused on the information,

instead of the documents may contribute to a new approach to information access

within Information Science.

Keywords: Topic maps; Documentary language; Information representation; Information retrieval; Knowledge map.

Translation: Asael Costa da Silva.

Page 10: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Ilustrações

Figura 1: Semiose ilimitada 16

Figura 2: Signo artificial 18

Figura 3: Mapa conceitual 27

Figura 4: Mapa mental 28

Figura 5: Grafo conceitual (rede semântica proposicional) 28

Figura 6: DeCS – descritor "Dor Abdominal" 34

Figura 7: DeCS – "Dor Abdominal" na hierarquia do sistema 34

Figura 8: Tópico Puccini – software Ontopia Omnigator 44

Figura 9: Grafo – Software Ontopia Ominigator 45

Figura 10: Grafo hiperbólico – Web page da Highware Press 46

Figura 11: Grafo tridimensional 46

Page 11: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Abreviaturas e siglas

ABNT – Associação Brasileira de Normas Técnicas

CApH – Conventions for the Application of HyTime

CC – Colon Classification

CRG – Classification Research Group

DDC – Dewey Decimal Classification

DeCS – Descritores em Ciências da Saúde

DTD – Document Type Definition

GPS – Global Positioning System

HTML – HyperText Markup Language

HyTime – Hypermedia/Time-Based Structuring Language

HyTM – HyTime Topic Maps

ISO - International Standards Organization

LCC – Library of Congress Classification

LCSH – Library of Congress Subject Headings

LD – Linguagem Documentária

OWL – Web Ontology Language

PSI – Published Subject Indicator

RDF – Resource Description Framework

SGML – Standard Generalised Markup Language

SKOS – Simple Knowledge Organisation System

SRI – Sistema de Recuperação da Informação

TMCL – Topic Map Constraint Language

TMQL – Topic Map Query Language

URI – Universal Resource Identifier

W3C – World Wide Web Consortium

Web – World Wide Web

WWW – ver Web

XML – eXtensible Markup Language

XTM – XML Topic Maps

Page 12: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Sumário

1 Introdução 11

1.1 Objetivos 13

1.2 Metodologia 13

2 Representação da informação 14

2.1 Signo 14

2.2 Expressão e interpretação dos signos nas ciências especializadas 17

2.3 Signo documentário 17

2.3.1 Signo documentário como representação 19

2.4 Representação como construção 23

2.5 Instrumentos de representação documentária 24

2.6 Mapas de conhecimento 26

2.7 Conclusões 31

3 Sistemas de recuperação da informação 32

4 Topic maps 36

4.1 Histórico 37

4.2 Principais conceitos 38

4.2.1 Tópico (topic) 39

4.2.2 Ocorrência (occurrence) 40

4.2.3 Associação (association) 41

4.2.4 Published subject indicators 42

4.2.5 Fusão (merge) 43

4.2.6 Escopo (scope) 43

4.3 Visualização 44

4.4 Características 47

4.5 Aplicações 48

4.5.1 Integração dos topic maps à Web Semântica 49

5 Considerações finais 51

Referências 53

Apêndice 56

Elementos da XTM 1.0 56

Elementos na estrutura da XTM 1.0 59

Índice 60

Page 13: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 11

1 Introdução

Ouvimos falar ad nauseam que vivemos numa sociedade saturada de informação, e

que isso traz grandes desafios e questões: temos condições de absorver toda a

informação produzida no mundo? Deveríamos começar a produzir menos informação?

Como saber se uma informação existe e como localizá-la?

A preocupação com a recuperação da informação provavelmente surgiu juntamente

com a preocupação com o registro da informação. Milhares de anos atrás, os homens

registravam e recuperavam informações em suas cabeças e o conhecimento coletivo

era transmitido oralmente. Mais tarde, a escrita possibilitou que se ultrapassassem os

limites da memória humana, com o registro da informação em suportes físicos, que

foram mudando com o tempo (tabletes de barro, madeira, seda, papiro, papel...). Com

os suportes físicos surgiram as bibliotecas e as técnicas de organização e localização

dos documentos (esquemas de ordenação e classificação, catálogos) e da informação

contida nesses documentos (sumários, índices). A revolução da imprensa na Europa,

no séc. XV, deu suporte ao aumento da produção escrita e da demanda criada por um

número cada vez maior de leitores.

A produção do conhecimento científico e o número de leitores, crescendo num ritmo

cada vez maior, fizeram com que se produzisse um número cada vez maior de

documentos. As telecomunicações quebraram barreiras espaciais e temporais

(telégrafo, telefone, rádio-difusão). A chamada explosão da informação, em meados do

séc. XX, foi corroborada pelos computadores, máquinas com capacidade de

processamento e armazenamento de informação muito superior à humana. A Ciência

da Informação tentou acompanhar esse fenômeno, desenvolvendo técnicas e

Page 14: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 12

ferramentas para a recuperação de quantidades imensas de informação (classificações

especializadas, tesauros, catálogos legíveis por computador etc.).

Mas, outra revolução viria em meados da década de 1990, chamada Internet. Ela é

uma rede de redes de computadores que não somente aumentou o poder de

comunicação entre as pessoas, mas também a capacidade de produção e disseminação

da informação.

Infelizmente, ainda não conseguimos recuperar as informações tão facilmente como

elas são produzidas. M. Kapor afirma: “Tirar informação da Internet é como beber água

de um hidrante”1. J. Naisbitt, fazendo outra analogia, diz: “Estamos nos afogando em

informações, mas sedentos de conhecimento” (NAISBITT apud BAX e SOUZA, 2001, p.

1). Logo, o grande desafio é desenvolver métodos e ferramentas capazes de gerenciar de

forma eficiente quantidades enormes de informação, não somente na Internet, mas

também dentro de organizações e unidades de informação.

Os topic maps são uma ferramenta que traz conceitos dos antigos (porém

utilíssimos) índices de livro, e é comparada ao GPS2 ao guiar uma pessoa pelo espaço

informacional. Como um índice, os topic maps permitem encontrar com mais exatidão

as informações dentro de um domínio do conhecimento. Uma de suas vantagens é que

as informações aparecem de forma gráfica, possibilitando uma interação muito mais

intuitiva.

1 “Getting information off the Internet is like taking a drink from a fire hydrant.” (KAPOR, 2005).

2 Global Positioning System. Esse sistema permite que uma pessoa, utilizando um aparelho localizador, saiba onde se encontra por meio de coordenadas geográficas (latitude, longitude e altitude).

Page 15: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 13

As técnicas utilizadas pela Ciência da Informação, como os tesauros e

classificações, podem ser apresentados como topic maps. Nesse sentido, essa nova

ferramenta pode ser utilizada para o aprimoramento de sistemas de organização e

recuperação da informação.

1.1 Objetivos

Este trabalho é de cunho exploratório, cujo objetivo principal é vislumbrar o

potencial dos topic maps como instrumentos de representação e recuperação da

informação.

Os objetivos específicos são:

• Discutir os conceitos de representação da informação, signo documentário e

recuperação da informação;

• Analisar os conceitos e as características dos topic maps;

• Discutir as possíveis contribuições dos topic maps à Ciência da Informação.

1.2 Metodologia

As etapas para o desenvolvimento do trabalho foram:

• Revisão da literatura;

• Leitura das especificações sobre topic maps;

• Uso do software Ontopia Omnigator3, que manipula topic maps;

• Redação da monografia.

3 Software e demonstração online disponíveis em http://www.ontopia.net/.

Page 16: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 14

2 Representação da informação

A necessidade de sistemas de representação e recuperação da informação decorre

de uma característica humana essencial: a linguagem simbólica. Para se

comunicarem, as pessoas utilizam a linguagem, simbólica por natureza, para

transmitir e receber informações. Os elementos da comunicação humana são: uma

realidade, os interlocutores (emissor e receptor), as mensagens (conteúdo), os signos

que representam as mensagens (código), e os meios para a transmissão dos signos

(BORDENAVE, 1984). Para haver comunicação é necessário que os interlocutores

usem um código comum (ECO, 1990), ou seja, um conjunto de signos que ambos

compreendam. Porém, essa comunicação não é “perfeita”, no sentido que nem sempre

o receptor interpreta de forma inequívoca a mensagem que o emissor transmite.

Um sistema de recuperação da informação (SRI) atua como interface entre os

documentos e os usuários do sistema. Ele é simultaneamente receptor (das mensagens

contidas nos documentos) e emissor (das representações dos documentos). Veremos a

seguir as características dos signos e sua importância na representação e recuperação

da informação.

2.1 Signo

A linguagem dos animais, que se dá por sinais, é herdada geneticamente e tem por

característica a invariabilidade. Mais propriamente, a linguagem dos animais não é

simbólica. Em contraste, a linguagem humana, construída por signos, tem de ser

aprendida pelos indivíduos, pois o signo é uma construção arbitrária e convencionada

(LOPES, 1995).

O signo, segundo C.S. Peirce, possui três partes:

Page 17: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 15

a) Signo4 (ou representamen): expressão; ele representa, está no lugar do objeto;

b) Objeto (imediato): segmentação do objeto dinâmico, do continuum da realidade.

c) Interpretante: significado; signo/expressão que substitui o signo.

A relação signo/objeto é convencionada e é por esse motivo que não há uma, mas

milhares de línguas faladas no mundo. Um objeto pode ter infinitos nomes ou signos.

Um livro, por exemplo, também é chamado de book (inglês), libro (italiano)…

Além disso, cada língua ou dialeto faz um recorte particular da realidade (objeto

dinâmico). Um exemplo clássico é o das cores do arco-íris, sete em português e dois na

língua bassa (LOPES, 1995). Isso não significa que as pessoas que falam o bassa

enxergam apenas duas cores, mas que a língua faz um recorte da realidade diverso do

recorte que o português faz. Assim, hui corresponde ao espectro que vai do roxo ao

verde, e ziza corresponde ao espectro do amarelo ao vermelho.

Por sua vez, a relação signo/interpretante se dá por um processo de interpretação.

Isso explica a característica plástica do signo, que se amolda aos contextos em que é

usado. Assim, não temos somente um interpretante, mas inúmeros interpretantes

associados ao mesmo signo. A interpretação “apropriada” do signo depende do

4 A palavra signo tem significados diferentes na semiótica de corrente peirceana e na semiologia de Saussure. Para este, o signo é uma entidade que possui dois elementos: o significante (correspondendo ao que Peirce denomina signo) e o significado (que corresponde ao interpretante). A divisão triádica, formulada já na Grécia Antiga pelos estóicos, admite mais um elemento, o referente (objeto imediato). O signo é uma matéria fascinante e, ao mesmo tempo, controversa. Há vários textos que discutem o tema com mais detalhes (ECO, 1984, 1990; EPSTEIN, 1991; GRANGER, 1974; LOPES, 1995; et al.).

Page 18: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 16

contexto de comunicação e da experiência anterior (background knowledge) do

indivíduo5.

Quando falamos sobre algo (signo), em vez de ter contato direto com esse algo

(objeto dinâmico), estamos num processo contínuo chamado por Peirce de semiose

ilimitada. Eco (1984) dá um exemplo de semiose ilimitada, ao descrever um abacaxi

por meio dos seus vários interpretantes: 1) é um fitomorfo; 2) é mais parecido com uma

laranja do que com um elefante; 3) tem um gosto de laranja com grapefruit, porém

mais doce; 4) é o que se chama na Itália de ananas. (…) Esse processo só acaba

quando o indivíduo tem contato direto com o objeto dinâmico (quando come o abacaxi).

Figura 1: Semiose ilimitada6

O processo de comunicação humana é, como vimos, muito complexo. A plasticidade

do signo, que lhe confere uma grande capacidade de expressividade, adaptação e

economia, por outro lado, traz o risco do não-entendimento ou da interpretação

inadequada do receptor.

5 Para Eco (1998 apud LARA 2002), o texto (mensagem) possui muitas lacunas que o receptor deve preencher. ECO, Umberto. Marco Polo e o unicórnio. In: Kant e o ornitorrinco. Rio de Janeiro: Record, 1998.

6 Fonte: Granger (1974). S (signo), O (objeto), I (interpretante). Essa figura é uma variante do triângulo semiótico, cuja diferença está nos vários interpretantes, que ilustram o processo de semiose ilimitada.

Page 19: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 17

2.2 Expressão e interpretação dos signos nas ciências especializadas

A problemática da expressão e interpretação dos signos interessa à Lingüística,

Semiótica, Terminologia e Ciência da Informação. Sager (1993) critica a dissociação

entre o ensino de uma língua (materna ou estrangeira) e o ensino do conhecimento

especializado. Como resultado, as pessoas que aprendem uma língua não conseguem

aplicá-la e as pessoas que aprendem uma matéria especializada não conseguem

expressar de forma satisfatória o que aprenderam.

A Terminologia surgiu como uma necessidade de comunicação efetiva entre

especialistas e entre especialistas e leigos. Além das comunidades dos especialistas e

dos leigos, há uma terceira comunidade, a dos mediadores da comunicação, formada

por tradutores, terminólogos e documentalistas (SAGER, 1993). A mediação feita por

essa comunidade é expressa num nível de linguagem diferente da linguagem do

especialista. Os mediadores compreendem a linguagem especializada a ponto de

poderem re-expressá-la em outra linguagem, mas isso não significa que eles possuem

o mesmo conhecimento do especialista. Saber falar sobre a construção de uma ponte

não significa saber construir uma ponte7.

2.3 Signo documentário

Os signos verbais ou lingüísticos são os únicos que conseguem traduzir quaisquer

outros signos. Eles são meta-signos universais (LOPES, 1995). É por esse motivo que

existem textos que tratam da música e da pintura, mas não sinfonias ou quadros que

7 “Saber una lengua es un saber diferente a saber construir un puente.” (SAGER, 1993, p. 15)

Page 20: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 18

falam sobre literatura. Essa característica dos signos lingüísticos talvez se explique

pela dificuldade em se admitir a existência do pensamento sem a mediação da

linguagem verbal8.

Os signos artificiais, por sua vez, servem a propósitos específicos, como a linguagem

da ciência ou da lógica. A notação matemática (+, -, =, >) ou dos elementos químicos

(H2O, Na) são exemplos de signos artificiais. Na linguagem artificial, há um rígido

controle da interpretação dos signos.

Figura 2: Signo artificial9

A Linguagem Documentária (LD) que, segundo Lara (2005), possui um caráter

intermediário entre as línguas naturais e as linguagens artificiais, se apropria dos

signos lingüísticos para construir seus vocabulários controlados. Porém, na linguagem

documentária os signos lingüísticos não funcionam como nas línguas naturais. Os

8 Para Ervin (1966, p. 57), “considerar a linguagem como um instrumento, um canal, semelhante a um fio telefônico, destinado à transmissão, é adotar uma visão simplista. As palavras que pronunciamos apenas em parte são influenciadas pelo que sabemos e sentimos. A questão a ser examinada mais profundamente é o fato de que as coisas que pensamos e sentimos podem ser influenciadas pelo que dizemos, o que nos faz entrever um efeito inesperado e sutil da linguagem.”

9 Modificação da figura “Semiose ilimitada”, feita pelo autor deste trabalho. Nesse caso, o signo artificial possui um interpretante único. O signo documentário, apesar de se aproximar desse modelo, geralmente não o alcança, pois não é interpretado por uma comunidade homogênea.

Page 21: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 19

signos documentários, cujos interpretantes são controlados, possuem significados

fixados dentro de uma estrutura formal que os relacionam com outros signos do

mesmo conjunto. Com esse mecanismo, pode-se dizer que os interpretantes são

determinados por referências da estrutura relacional das próprias linguagens

documentárias sendo, assim, razoavelmente unívocos. Apesar de se objetivar uma

identidade única entre signo e interpretante, como nas linguagens artificiais, pelo fato

de a LD utilizar signos lingüísticos, não se pode falar na univocidade estrita dos signos

documentários (LARA, 2005).

A arte da representação da informação (contida nos documentos) não é uma

simples rotulação definitiva ou simples atribuição de assuntos e palavras-chave. A

representação envolve escolhas, pois o signo permite infinitas aproximações do objeto.

Por exemplo, a luz pode ser descrita como onda ou partícula, depende de qual aspecto

está sendo tratado.

“O continuum é muito mais rico que as nossas formas do conteúdo. Para outras

porções do continuum é preciso elaborar outras formas do conteúdo que possam ser complementares, assim como na física a luz pode ser explicada como onda ou como corpúsculo. O que são a onda e o corpúsculo? São duas unidades de forma

do conteúdo que procuram explicar alguma coisa que acontece no continuum, isto é, no objeto dinâmico. E, na teoria da complementaridade, certos fenômenos são

bem explicados como onda e certos fenômenos são bem explicados como corpúsculos. Isso significa que a forma global do conteúdo é uma utopia, é uma hipótese reguladora. Na realidade, formalizamos o conteúdo somente quanto a

pequenas porções e, quanto mais aprofundássemos essas porções formalizadas, tanto mais perceberíamos que são contraditórias relativamente a outras

modalidades de formalização de conteúdo.” (ECO, 1984, p. 40)

2.3.1 Signo documentário como representação

A necessidade de comunicar, de compreender e ser compreendido é ilustrada por

Eco na história do Sr. Sigma e um médico:

Suponhamos que o senhor Sigma, durante uma estadia em Paris, começa a sentir dores na “barriga”. Usei um termo genérico porque o senhor Sigma tem

ainda uma sensação confusa. Agora repara melhor e procura definir a dor: ardores

Page 22: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 20

no estômago? Espasmos? Dores viscerais? Tenta dar um nome a estímulos imprecisos: dando-lhes um nome, culturaliza-o, isto é, resume aquilo que era um fenómeno natural em precisas rubricas “codificadas”, tenta assim dar a uma sua [sic] experiência pessoal uma qualificação que a torne semelhante a outras

experiências já denominadas nos livros de medicina ou nos artigos de jornal.

Agora encontrou a palavra que lhe parece certa: esta palavra está pela dor que ele sente. Visto que tenciona comunicar as suas dores a um médico, ele sabe que poderá usar a palavra (que o médico está à altura de compreender) em lugar da

dor (que o médico não sente e talvez jamais tenha sentido). […]

Está finalmente sentado diante do médico, e tenta explicar-lhe o que compreendeu naquela manhã: “J’ai mal au ventre”.

O médico compreendeu as palavras, mas não se fia: não está seguro de que

Sigma tenha indicado com as palavras certas a sensação precisa. Faz perguntas, nasce uma troca verbal, Sigma é levado a precisar o tipo de dor, a posição. O

médico agora apalpa o estômago e o fígado de Sigma: algumas experiências tácteis têm para ele um significado que para outros não têm, porque estudou em livros que explicam como a uma certa experiência táctil deve corresponder uma dada

alteração orgânica. O médico interpreta as sensações que Sigma teve (e que ele não sente) e compara-as às sensações tácteis que está a ter. Se os seus códigos de semiótica médica estão certos, as duas ordens de sensações deveriam

corresponder. Mas as sensações de Sigma chegam ao médico através da língua francesa; o médico tem de estabelecer se as palavras que se manifestam sob a

forma de sons são coerentes segundo os usos verbais correntes, com as sensações de Sigma; mas duvida de que Sigma use as palavras precisas, não porque tenha sensações imprecisas, mas porque traduz mal do italiano para o francês. Sigma

diz “ventre”, mas quer talvez dizer “foie” (e por outro lado pode acontecer que Sigma seja um inculto, e que para ele também em italiano fígado e barriga sejam

uma certa entidade indiferenciada). (ECO, 1990, p. 7-10)

Temos aqui uma situação de comunicação. O Sr. Sigma, um italiano em Paris,

sente dores na barriga e sabe que deve expressar corretamente a dor que sente para

que o médico faça um diagnóstico correto. A linguagem utilizada pelos dois é o francês.

Mas, temos alguns problemas: o francês não é a língua materna de Sigma (por isso o

médico desconfia da exatidão das palavras do paciente); a diferença de linguagem

(geral e especializada) usada pelos dois só é compensada pelos exames realizados pelo

médico (“códigos de semiótica médica”, ou seja, uma outra linguagem).

Imaginemos outra situação: O Sr. Sigma sente dores na barriga e vai à biblioteca

para encontrar informações sobre essas dores e decidir entre se automedicar ou ir ao

Page 23: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 21

médico. Ele vai ao terminal onde há uma base de dados bibliográfica. Neste ponto

podemos ter várias situações:

A) Se as palavras-chave do campo assunto forem retiradas dos documentos, Sigma

terá muitos problemas, pois os documentos que tratam de dores na barriga podem

expressar esse sintoma de várias formas por causa das diferenças de linguagem

(língua, nível de especialidade, público-alvo, abordagem, época etc.). Teremos várias

palavras-chave que designam o mesmo conceito, ou uma palavra-chave que

designa vários conceitos.

B) Se as palavras-chave do campo assunto forem retiradas de um tesauro, mas ainda

apresentadas como metadados, Sigma ainda terá problemas: o sistema não

indicará as relações entre as palavras-chave. Portanto, a estrutura do tesauro

formada pelas relações entre os descritores se perde na interface com o usuário;

C) Se as palavras-chave forem apresentadas na forma de um vocabulário estruturado,

Sigma terá mais facilidade em encontrar os documentos úteis a ele, pois as

palavras “não preferidas pelo sistema” remeterão aos termos “preferidos” (relação

USE/UF), assuntos mais específicos, genéricos ou correlatos poderão ser

encontrados com facilidade (relação TG/TE/TR), e cada termo terá uma explicação

sobre seu uso, às vezes, uma definição (NE).

Na situação A descrita acima, as palavras-chave estão “soltas”, não há um princípio

organizador que as estruture como uma linguagem documentária de fato. Assim, não

há nenhum controle sobre os signos e seus interpretantes. E, como não há um

contexto explicativo para cada palavra-chave (esse contexto está nos documentos de

onde foram retiradas), o Sr. Sigma ou qualquer outra pessoa terá de bancar o

adivinho, tentando inferir o que os autores poderão ter escrito sobre “dor de barriga”

Page 24: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 22

(alguns podem ter falado sobre “dor de barriga”, outros sobre “dor abdominal” e outros

sobre “cólica”. Pior, os autores podem ter se referido a essas palavras de forma

indiscriminada, isto é, um pode ter tratado da dor abdominal querendo dizer cólica,

outro pode ter dito o contrário).

A situação B não melhora muito (talvez até piore) a vida do Sr. Sigma. Ainda não há

contexto (o contexto do tesauro cujos descritores foram extraídos). Ele ainda terá de ter

poderes de adivinhação para descobrir qual é o termo utilizado para todas as

ocorrências de “dor de barriga” (essa situação patética ainda existe em muitas

bibliotecas). O Sr. Sigma terá melhores chances se um solícito bibliotecário de

referência (que tenha um razoável conhecimento do tesauro) se dispuser a auxiliá-lo na

busca. Porém, nem sempre há um bibliotecário solícito nesses momentos (e se Sigma

estiver utilizando a base de dados remotamente, pela Internet, na sua casa?). Além

disso, até o bibliotecário pode ter dúvidas…

Nas situações A e B ainda não temos uma linguagem mediadora entre a população

de documentos e a população de usuários, apenas metadados ou rótulos temáticos. Os

metadados apenas relacionam assuntos a documentos, não os assuntos entre si. Na

situação B, os descritores do tesauro, que formavam um sistema estruturado, quando

aplicados viram simples metadados. Fazendo uma analogia com a localização

geográfica, a situação A é como se indicássemos a casa a um forasteiro dizendo "ela

fica perto do posto de gasolina, em frente à farmácia". A situação B é como se

indicássemos a casa pelo seu endereço (descritores), mas sem mostrar o mapa da

região. Na situação C, indicaremos o endereço da casa (descritores) e o mapa da região

(tesauro).

Page 25: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 23

2.4 Representação como construção

A representação da informação é uma tarefa complexa, pois os signos que usamos

para representar a realidade não são a própria realidade. Quando há uma

representação, implicitamente há um recorte, um ponto de vista em relação ao

continuum da realidade.

Assim, temos de descartar a hipótese da informação como dado (ou reprodução):

Essa crença está fundada na preocupação com a busca da essência ou, dito de

outro modo, da informação objetiva. Tal procedimento remeteria ao polimento do espelho, já que a informação estaria dada aprioristicamente, requerendo um esforço para resgatá-la do documento (LARA, 2002, p. 132).

De acordo com essa hipótese, teríamos uma classificação universal válida para

todos os contextos, cujos signos documentários seriam pedaços da própria realidade.

Porém, a informação não é reprodução, mas uma construção (LARA, 2002). A

representação não é um espelho que reflete a realidade sem distorções, mas um

prisma que privilegia certo espectro dessa realidade.

Além disso, a informação é sempre compartilhada, no sentido de que seu

significado não é definido somente pelo emissor e pela linguagem, mas pelo usuário

dessa informação.

Portanto, a linguagem de interface entre documentos e usuários, em vez de buscar

uma representação única e perfeita do conhecimento, deve mostrar ao usuário sua

estrutura interna, permitindo-o entrever sua “construção”. A representação

documentária tem um objetivo pragmático (ou seja, preocupa-se com um fim, que é a

recuperação de documentos) e não metafísico.

Page 26: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 24

2.5 Instrumentos de representação documentária

Os variados instrumentos de representação documentária utilizam o signo

documentário sob diferentes abordagens.

As classificações enciclopédicas, como a Dewey Decimal Classification (DDC), cujo

escopo abrange todo o conhecimento humano, possuem uma hierarquia rígida, onde

um termo deve necessariamente se enquadrar numa estrutura de

superordenação/subordinação. Por isso, apresentam dificuldades para acomodar

novas categorias e formas de representação da realidade. São sistemas engessados,

identificando-se com o paradigma da informação como reprodução.10

As classificações facetadas, originalmente idealizadas por S.R. Ranganathan nos

anos 1930, em vez de descrever os termos de forma unidimensional, os analisam nas

suas várias facetas ou perspectivas. As cinco categorias da Colon Classification (CC) de

Ranganathan são cinco: Personalidade (faceta principal), Matéria (substância ou

material), Energia (processos ou ações), Espaço e Tempo. O esquema classificatório de

Ranganathan não vingou, mas seus conceitos serviram como base teórica para os

especialistas em classificação. O Classification Research Group (CRG) tem desenvolvido

diversos esquemas facetados para áreas específicas do conhecimento.

10 As classificações enciclopédicas geralmente são usadas com a finalidade de indicar a localização física dos documentos por meio de notações codificadas. Os documentos são organizados segundo a lógica classificatória do esquema utilizado. Porém, a lógica desses esquemas tem sido contestada, principalmente a dos sistemas excessivamente pragmáticos, como a Library of Congress Classification (LCC). As críticas recaem sobre a falta de flexibilidade e interpretações datadas e tendenciosas (por exemplo, na DDC, 90% da classe Religião está reservada ao cristianismo). Entretanto, não defendemos a organização ad hoc dos documentos físicos, apenas criticamos o uso dogmático desses esquemas como se fossem bíblias.

Page 27: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 25

As listas de cabeçalhos de assunto, como a Library of Congress Subject Headings

(LCSH), são construídas de forma empírica, pela ocorrência de termos na literatura, o

que não permite a formalização de sistemas coesos, cujos elementos se relacionem

entre si. São sistemas de bricolagem, não se caracterizando como linguagem num

sentido estrito.

Os tesauros são linguagens estruturadas cujas unidades (descritores) são

relacionadas de acordo com princípios lógico-semânticos. A interpretação de um termo

se dá pela sua relação com outros termos (relações de equivalência, hierarquia e

associação). Há um rigor maior na explicitação das relações entre os termos, porém,

segundo Lara (2002), as normas de construção de tesauros não fornecem diretrizes

para o processo de identificação e escolha dos termos. O trabalho terminológico pode

contribuir para a sistematização do processo de escolha dos termos.

[…] Embora nem todos os trabalhos terminológicos cheguem efetivamente a apresentar mapas conceituais dos domínios (muitas vezes o trabalho se encerra na

elaboração de um dicionário ou de um glossário), é a partir do processo definicional que são criadas as condições para se estabelecer redes de relações entre os

termos.

Os dicionários terminológicos constituem, assim, uma ferramenta imprescindível para a construção da linguagem documentária, já que permitem conferir referência aos descritores. Se antes a biblioteconomia e a documentação

trabalhavam empiricamente a partir de referências da classificação filosófica (enfatizando apenas a segmentação, mas não sua expressão lingüística) e, em

seguida, para dar conta das formas significantes, a partir de palavras (através dos processos de extração baseados em freqüência ou ocorrência) ou da seleção empírica de unidades significativas (sem a definição daquilo que poderia

caracterizar uma unidade significativa), a partir da Terminologia ela passa a contar com instrumentos que trabalham com o termo, unidade que representa o conceito dentro de um domínio ou área de atividade. (LARA, 2002, p. 136)

Nas classificações e nos tesauros, o controle dos interpretantes dos signos é feito

basicamente pelas relações entre os signos. Porém, isso muitas vezes não é suficiente.

Page 28: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 26

As ontologias, foram desenvolvidas na área da Inteligência Artificial, sendo só

recentemente utilizadas para a recuperação da informação. Na Ciência da

Computação, são definidas como um modelo para a descrição do mundo, consistindo

em um conjunto de tipos (types), propriedades (properties) e relacionamentos

(relationships). Possuem uma linguagem de vocabulário aberta (ao contrário dos

sistemas anteriores), que pode ser definida livremente. Para Garshol (2004), um

tesauro pode ser considerado uma ontologia limitada, possuindo um único tipo

(termo), uma propriedade (nota de escopo) e três relacionamentos (de equivalência,

hierarquia e associação).

2.6 Mapas de conhecimento

O mapeamento do conhecimento11 (knowledge mapping) é uma técnica recente,

muito menos desenvolvida do que o mapeamento geográfico. As especificações

formalizadas nos topic maps são um passo adiante no desenvolvimento dessa técnica

(FISHER, 2002).

Há muitos tipos de mapas de conhecimento, entre eles:

• Mapa conceitual (conceptual map): desenvolvido por Joseph D. Novak e seus

discípulos, nos anos 1960, como ferramenta para um tipo de aprendizado chamado

construtivista, em que um conhecimento anterior é usado para a aquisição de um

novo conhecimento (meta-aprendizado, “aprendendo a aprender”);

11 Não discutiremos aqui a noção de conhecimento, adotaremos a tradução literal da denominação na literatura.

Page 29: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 27

Figura 3: Mapa conceitual12

• Mapa mental (mind map): sua criação é atribuída a Tony Buzan, na década de

1970. Sua estrutura é radial, onde, de um tema central surgem várias ramificações.

É utilizado para sumarização, revisão e memorização de idéias;

12 Disponível em http://en.wikipedia.org/wiki/Image:Conceptmap.gif.

Page 30: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 28

Figura 4: Mapa mental13

• Rede semântica (semantic network) : desenvolvido na área de Inteligência Artificial,

que lida com tipos de relacionamento como transitividade (se A é descendente de B

e B é descendente de C, então A é descendente de C), reflexão e simetria (se A é

casado com B, então B é casado com A).

Figura 5: Grafo conceitual (rede semântica proposicional)14

Lima (2004) define o mapa conceitual como uma representação das características

de certos objetos ou idéias e como uma ferramenta para a organização do

13 Disponível em http://en.wikipedia.org/wiki/Image:Guru_Mindmap.jpg.

14 Disponível em http://en.wikipedia.org/wiki/Conceptual_graphs.

Page 31: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 29

conhecimento, “[...] procurando refletir a organização da estrutura cognitiva do

indivíduo sobre um dado assunto” (LIMA, 2004, p. 92). Segundo a autora, os mapas

conceituais podem ser usados para:

• Gerar idéias por meio do brainstorming;

• Facilitar o entendimento de estruturas complexas;

• Possibilitar o aprendizado construtivista por meio da agregação de idéias novas

às idéias já existentes;

• Identificar e comparar idéias conflitantes.

O processo de comunicação e a transferência de informação entre os indivíduos é

um processo complexo. Os mapas de conhecimento se propõem a facilitar essa

transferência.

O conhecimento individual muitas vezes é difícil de ser externalizado. Fisher (2002)

nos dá alguns exemplos: foi pedido a uma classe de estudantes que fosse definido o

conceito de tempo. Ninguém conseguiu dar uma definição satisfatória; um grupo de

geneticistas que iria participar na produção de um programa de TV não chegava a um

acordo quanto à definição de gene (!). Podemos viver confortavelmente com conceitos

vagos na mente, até o momento que temos de externalizar esses conceitos. Os mapas

de conhecimento auxiliam na externalização do conhecimento pessoal ao fazer com

que o indivíduo organize seus pensamentos na forma de conceitos estruturados

(FISHER, 2002).

Os mapas de conhecimento também auxiliam na internalização do conhecimento.

Fisher (2002) relata pesquisas em que o uso de redes semânticas nas salas de aula

Page 32: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 30

permite aos estudantes inferir com mais facilidade o modelo mental dos seu

professores, além de obterem melhores notas nas avaliações.

Uma das vantagens dos mapas de conhecimento é que a informação visual é

vinculada à informação verbal. Fisher (2002) interpreta a valorização da linguagem

visual para a transferência da informação como uma mudança de paradigma.

Standing and colleagues [1970]15 found, for example, that a five-second

exposure to each of a series of more than 2,500 pictures, followed by a recall test, produced more than 90 percent correct recall. Visuals are thus wonderful memory aids (“a picture is worth a thousand words”). Visuals in science typically require clear labels and supporting verbal explanations in order to be understood [Bottrill and Lock 1993]16. A key advantage to such presentations is that the learner can encode information in two distinct information processing systems, one that

represents information verbally (the internal semantic network) and one that represents information visually [Mayer and Sims 1994]17. […] Thus dual coding both increases the amount of information available about an idea and facilitates recall of that idea by providing two separate storage and retrieval systems (FISHER, 2002, p. 499).

O mapa conceitual também apresenta vantagens em relação ao texto linear no

processamento de informações.

Todo conhecimento é processado e organizado pela interação da memória de curta duração com a memória de longa duração. Existe um limite para o processamento da memória de curta duração que nos permite processar de cinco a nove unidades de informação por vez, sendo que cada conceito pode combinar

duas ou três unidades de informação. Assim, podemos processar somente a relação entre dois ou três conceitos de cada vez. O mapa conceitual, com sua característica gráfica, é um instrumento poderoso para permitir a compreensão das

relações entre os conceitos e do conhecimento no todo. Para o cientista da informação, que lida com a análise de assunto para estruturação de uma área do

15 STANDING, L.; CONEZIO, J; HABER, R.N. Perception and memory for pictures: single trial learning of 2500 visual stimuli. Psychonomic Science, n. 19, p. 73-84, 1970.

16 BOTTRILL, J.; LOCK, R. Do students learn from pictures or from text? Science Review, n. 74, p. 109-112, 1993.

17 MAYER, R.E.; SIMS, V.K. For whom is a picture worth a thousand words?: extensions of the dual-coding theory of multimedia learning. Journal of Educational Psychology. N. 46, p. 389-401, 1994.

Page 33: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 31

conhecimento, o mapa conceitual pode se tornar um instrumento importante para ajudá-lo a entender e a lidar com complexos informacionais (LIMA, 2004, p. 95).

2.7 Conclusões

As LDs são instrumentos que estabelecem a mediação entre documentos e

usuários. O processo de semiose é controlado para se evitar problemas de ambigüidade

e não entendimento dos descritores.

Os topic maps apresentam outros mecanismos para o controle dos signos (como o

public subject indicator) e, ao mesmo tempo, oferecem maior flexibilidade para a

representação desses signos (variant names, scope). Esses mecanismos serão descritos

no capítulo Topic maps.

Page 34: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 32

3 Sistemas de recuperação da informação

Os sistemas de recuperação da informação (SRI) têm por objetivo recuperar

documentos relevantes às necessidades de cada pessoa. Lancaster (1979) descreve

esse sistema, que possui numa ponta a “população” de documentos e em outra a

“população” de usuários do sistema. Uma base de dados (cujos dados representam os

documentos) serve de interface entre essas populações. O que garante a eficiência do

sistema é o seu vocabulário, que traduz a linguagem de cada população (usuários e

documentos) para uma linguagem comum.

As pessoas geralmente exploram o SRI de duas formas: por meio da “busca”

(searching) e, quando é possível, da “exploração” ou “navegação” (browsing).

A busca por palavras lida com metadados. Tanto a descrição dos documentos

(autoria, título, data, tamanho etc.) quanto os assuntos tratados neles são

armazenados em campos específicos da base de dados. A recuperação se dá pelo

confronto das palavras inseridas no campo de busca com os campos descritivos dos

documentos. Esse método é eficaz quando o usuário do sistema sabe quais

documentos são relevantes a ele.

Quando o usuário quer encontrar documentos que tratam de determinados

assuntos, mas não sabe quais são, a busca isolada se revela ineficaz. Isso ocorre

porque muitos SRI, nesse contexto, se parecem com uma caixa hermética. Se o

usuário emprega palavras que não estão no sistema, este não fornece os documentos

potencialmente úteis a ele.

A exploração pode tornar a busca muito mais eficiente. Se a linguagem de

indexação, em vez de ser apresentada como metadados, for apresentada como

Page 35: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 33

vocabulário estruturado, o SRI permitirá ao usuário interagir com o sistema, refinando

a busca.

Vamos a um exemplo. Os Descritores em Ciências da Saúde18 (DeCS) são um

vocabulário usado para indexar diversas bases de dados especializados na área da

saúde. Quando pesquisamos nessa base de dados, formulamos uma equação de busca

para recuperarmos os documentos potencialmente úteis. Porém, quando não temos

sucesso na busca, podemos consultar o DeCS para descobrirmos os descritores

possivelmente úteis. Voltando à triste história do Sr. Sigma, nós queremos ajudá-lo,

então procuramos por “dor de barriga” no vocabulário. Infelizmente, não obtemos

resultado. Essa expressão não existe no sistema. Desta vez, procuramos por “dor”,

navegamos pelos descritores recuperados e encontramos o descritor “dor abdominal”.

O sistema fornece uma definição, termos equivalentes em espanhol e inglês, uma nota

de escopo, um termo relacionado e sua localização na estrutura do tesauro. O sistema

ainda indica a posição do descritor na hierarquia do tesauro, embora não indique

termos relacionados.

18 Disponível em: http://decs.bvs.br/.

Page 36: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 34

Figura 6: DeCS – descritor "Dor Abdominal"

Figura 7: DeCS – "Dor Abdominal" na hierarquia do sistema

Se não tivéssemos acesso ao DeCS, teríamos de adivinhar que “dor de barriga”

naquela base de dados é representada por “dor abdominal”. Além de descobrirmos os

termos utilizados pelo sistema, aprendemos um pouco mais mesmo antes de consultar

qualquer documento.

Page 37: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 35

A exploração de um vocabulário controlado é similar à leitura de um texto. Para

Eco,

O texto é uma máquina preguiçosa que solicita a participação do leitor na compreensão dos ditos e no preenchimento dos não ditos e, conseqüentemente, toda leitura é parcial e dependente da experiência anterior do leitor, sua motivação

e objetivos de leitura, mais seu estoque prévio de conhecimento. (ECO, 199819 apud LARA, 2002, p. 127)

Quanto mais “obscuro” for o texto, mais requisitada será a participação do leitor

para o seu entendimento.

De forma análoga, os descritores são como um texto, pois requerem o conhecimento

anterior do leitor para que ele faça inferências a respeito de que espécies de

documentos são representados por eles. Quanto mais estruturado for o vocabulário

controlado, menores serão as lacunas a serem preenchidas pelo usuário. Nos casos de

vocabulários extremamente desestruturados, as inferências feitas serão como saltos no

escuro, o usuário não terá a mínima idéia do que encontrará pela frente.

Os topic maps oferecem mecanismos de estruturação dos tópicos (termos) que

podem ajudar a diminuir as “lacunas textuais” e auxiliar o usuário em sua

investigação. Esses mecanismos serão descritos e analisados a seguir.

19 ECO, Umberto. Marco Polo e o unicórnio. In: Kant e o ornitorrinco. Rio de Janeiro: Record, 1998.

Page 38: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 36

4 Topic maps

Topic maps são ferramentas de representação de universos informacionais em

forma de grafos. Sua estrutura está formalizada como norma (ISO/IEC 13250) e

especificação (XTM 1.0). Sua unidade é o tópico (topic), nó que representa um conceito

ou um elemento, que se relaciona com outros tópicos por meio de associações

(associations). O nó também pode estar conectado a documentos ou recursos externos

ao topic map, denominados ocorrências (occurrences). Apesar de se assemelharem a

um mapa conceitual, seus conceitos foram baseados nos índices de livros.

Pepper compara o índice de um livro ao mapa geográfico: “someone once said that ‘a

book without an index is like a country without a map’” (PEPPER, 2000, p. 1). Um índice

é um mapa, uma réplica em miniatura de um livro, que revela sua estrutura e

conteúdo.

No entanto, um índice eletrônico deve se adaptar às características próprias dos

documentos eletrônicos. Nesse contexto, onde a distinção entre documentos

individuais se torna mais tênue e os agrupamentos de informação se tornam

gigantescos, os índices eletrônicos não podem ser simples réplicas de seus primos de

papel. Por outro lado, a indexação de textos completos hoje praticada se mostra muito

ineficiente (basta checar o desempenho dos mecanismos de busca na Web). Na

verdade, a indexação de textos completos se compara a um índice que elenca todas as

palavras de um livro, e ninguém em sã consciência consultaria um índice desses (mas

achamos o Google o máximo).

Page 39: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 37

4.1 Histórico

O conceito de topic map surgiu no Davenport Group, fundado em 1991 por

fornecedores de sistemas UNIX para encontrar possíveis soluções (como o uso de

índices, glossários e tesauros) para as inconsistências das documentações e

publicações sobre sistemas (software). Em 1993 foi criado o grupo Conventions for the

Application of HyTime (CApH) para a aplicação dos conceitos do padrão HyTime20 (ISO

10744), que provê à linguagem SGML21 sofisticados recursos de multimídia e

hiperlinking.

Em 2000 foi publicada a ISO 13250, que utiliza a notação HyTime. Por isso a

norma também é conhecida como HyTime Topic Maps (HyTM). Logo depois da

publicação da norma ISO, foi fundado o TopicMaps.org para a criação da XML Topic

Maps (XTM), publicada em 2001. A XTM foi criada para ser utilizada mais facilmente

em ambiente Web e as diferenças básicas em relação à ISO 13250 são a notação em

XML22 (linguagem amplamente aceita para uso na Web, menos complexa do que a

SGML) e o uso de uma DTD23 em vez de formas arquiteturais24, que dá uma estrutura

única aos topic maps, facilitando seu intercâmbio.

20 Hypermedia/Time-based Structuring Language.

21 Standard Generalized Markup Language.

22 eXtended Markup Language.

23 Document Type Definition, define parâmetros para aplicações em XML.

24 Architectural forms, oferecem mais flexibilidade aos desenvolvedores, porém, são mais complexas do que a DTD.

Page 40: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 38

Estão em processo de padronização a Topic Map Constraint Language (TMCL),

linguagem que trará parâmetros de validação e consistência à XTM, e a Topic Map

Query Language (TMQL), linguagem de consulta aos dados contidos em topic maps.

4.2 Principais conceitos

Os principais conceitos dos topic maps25 podem ser exemplificados pelos índices de

livros. Vejamos um exemplo dado por Pepper (2000, p. 4):

La Bohème, 10, 70, 197-198, 326

Cavalleria Rusticana, 71, 203-204

The Girl of the Golden West, see La fanciulla del West

Leoncavallo, Ruggiero

I Pagliacci, 71-72, 122, 247-249, 326

Madama Butterfly, 70-71, 234-236, 326

Manon Lescaut, 294

Mascagni, Pietro

Cavalleria Rusticana, 71, 203-204

Puccini, Giacomo, 69-71

La Bohème, 10, 70, 197-198, 326

La fanciulla del West, 291

Madama Butterfly, 70-71, 234-236, 326

Manon Lescaut, 294

Tosca, 26, 70, 274-276, 326

Turandot, 70, 282-284, 326

Rustic Chivalry, see Cavalleria Rusticana

singers, 39-52,

See also individual names

baritone, 46

bass, 46-47

soprano, 41-42, 337

tenor, 44-45

25 Os conceitos estão baseados na XTM e não na ISO 13250.

Page 41: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 39

Tosca, 26, 70, 274-276, 326

Turandot, 70, 282-284, 326

Podemos apontar as seguintes características:

• Cada entrada do índice corresponde a um tópico;

• O ver (see) corresponde aos nomes variantes de um mesmo tópico (não está

representado no exemplo).

• Os números de páginas correspondem às ocorrências;

• O ver também (see also) e as subentradas correspondem às associações;

• As convenções tipográficas (negrito, itálico) e os modificadores (ou qualificadores)

correspondem às diversas classes de tópicos e associações. No exemplo, os nomes

em itálico são as óperas, os números em negrito se referem às sinopses.

Além disso, num topic map os tópicos podem conter definições assim como os

termos de um glossário. As associações entre tópicos podem ser definidas, como num

tesauro.

Os topic maps possuem um pequeno número de conceitos (há somente 19

elementos no XTM26), porém, sua combinação permite estruturar vastas quantidades

de informação.

4.2.1 Tópico (topic)

O tópico é a unidade principal de um topic map. Um tópico representa um assunto

que, segundo a ISO 13250, pode ser qualquer coisa, seja ela o que for (conceito,

26 Esses elementos são descritos no apêndice.

Page 42: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 40

pessoa, entidade etc.). Em outras palavras, o tópico é um objeto (object) que reifica um

assunto (subject)27.

Um tópico pode pertencer a uma ou mais categorias, os topic types, que, por sua

vez, também são tópicos. Por exemplo, Puccini pode pertencer à categoria/tópico

Compositor.

Os tópicos têm 3 características: possuem nomes, ligam-se a ocorrências e

desempenham funções nas associações.

É desejável que um tópico tenha um ou mais nomes para poder ser melhor

entendido e manipulado. Ele pode ser apresentado com um nome ou outro

dependendo do contexto (escopo) definido. Por exemplo, a ópera La fanciulla del West,

no escopo “Inglês”, terá o nome The girl of the Golden West.

4.2.2 Ocorrência (occurrence)

Ocorrência é a indicação para um recurso informacional de qualquer natureza

(documento, comentário, citação etc.) ligado a um tópico. A ocorrência pode ser interna

(por exemplo, as datas e os locais de nascimento e morte de uma pessoa) ou externa ao

topic map (qualquer recurso referente ao tópico: documento, citação etc.).

A ocorrência interna é uma referência dentro do próprio topic map. A ocorrência

externa é a indicação para um recurso externo por meio de uma URI28.

27 Objeto corresponde ao significante/signo. Assunto corresponde ao referente/objeto imediato.

28 Universal Resource Identifier, indicador de recurso que funciona como um link de uma página Web.

Page 43: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 41

A vantagem da ocorrência externa é que se mantém a separação entre o topic map e

a fonte de informação. Em outras palavras, os tópicos e as ocorrências ficam em

“camadas” distintas. Dessa forma, um topic map pode ser aplicado a diversos

conjuntos de documentos, e um desses conjuntos, por sua vez, pode estar ligado a

vários topic maps. Além disso, um topic map, mesmo sem possuir ocorrências, tem

valor por si só, já que oferece a representação de uma ontologia29.

As ocorrências também podem pertencer a classes (occurrence types), tais como

livros, teses, fotos, músicas, web sites etc. Porém, a especificação não prescreve o uso

de metadados para descrever essas ocorrências, ou seja, não é possível descrever os

recursos (autor, título, data de publicação etc.)30.

4.2.3 Associação (association)

Uma associação descreve relações entre um ou mais tópicos. Numa associação

podemos identificar o tipo de associação (association type) e a função (association role)

desempenhada por cada tópico. Por exemplo, na associação entre Puccini e Tosca,

teremos a association type composição (ou obra composta por), onde Puccini tem o

“papel” de o compositor, e Tosca, desempenha o “papel” de ópera (note que, às vezes, a

association role se confunde com o topic type). São as associações que formam a

estrutura do topic map, estabelecendo conexões entre os diversos tópicos.

29 Representação simbólica do conhecimento humano num sistema lógico-formal (VICKERY, 1997).

30 É possível atribuir metadados aos recursos 1) transformando os recursos em tópicos e atribuindo ocorrências internas; 2) acoplando o topic map a um sistema de metadados, como uma base de dados relacional.

Page 44: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 42

4.2.4 Published subject indicators

O elemento subject identity tem por função identificar o conceito de um tópico e

diferenciá-lo dos outros. Isso pode ser feito referenciando um tópico a outro tópico (que

compartilha o mesmo conceito) ou a um URI (que representa o conceito do tópico).

Published subject indicator (PSI) é um URI publicado e reconhecido por uma ampla

comunidade. Segundo Vatant (2002), os PSI devem cumprir três requisitos: a)

Estabilidade (o URI deve ser permanente); b) Autoridade (a definição do PSI deve ter o

respaldo de uma autoridade no assunto); c) Confiança (conseqüência dos itens

anteriores). Por exemplo, um bom PSI para o tópico “topic maps” é o

http://www.topicmaps.org, pois o endereço é estável e os conceitos são discutidos

pelos próprios especialistas no assunto. Isso não significa que os conceitos publicados

num PSI sejam estáveis e definitivos. Pelo contrário, os conceitos são continuamente

debatidos e questionados por especialistas interessados no assunto. O significado dos

signos se modifica com o tempo. Conseqüentemente, os conceitos representados pelos

tópicos, que são signos, também se modificam, e os PSI devem acompanhar essas

mudanças.

This leads us to a sweet paradox. The best PSI is the one that is most likely to

change its content because it is maintained at the core of the community questioning the subject, and most subjects are moving targets (VATANT, 2002, p. 77).

Os PSI são mecanismos poderosos que transformam recursos eletrônicos em

indicadores confiáveis, permitindo a criação, compartilhamento e fusão de vastos

repositórios.

Page 45: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 43

4.2.5 Fusão (merge)

Dois ou mais topic maps podem ser fundidos, formando um só. No processo de

fusão, tópicos iguais presentes nos topic maps são fundidos, acumulando as

características singulares de cada um e eliminando as redundâncias. Há duas

situações em que os tópicos são fundidos:

• Quando os tópicos possuem o mesmo nome usado dentro do mesmo escopo. Por

exemplo, dois tópicos com nome manga dentro do escopo fruta deverão ser

fundidos;

• Quando os tópicos se referirem ao mesmo subject identity. Por exemplo, os tópicos

mandioca e macaxeira, apontando para o mesmo subject identity, serão fundidos.

Essa característica permite o compartilhamento de topic maps criados por diversos

desenvolvedores e organizações, e é um aspecto essencial para a manutenção de

vastos repositórios projetados para o uso na Web.

4.2.6 Escopo (scope)

Se o subject identity identifica o assunto representado por um tópico, o escopo

(scope) identifica o contexto no qual um nome é válido. Desse modo, tópicos diferentes

que possuem o mesmo nome serão diferenciados por meio dos seus respectivos

escopos. Por exemplo, tópicos com o nome manga podem ser diferenciados pelos

escopos fruta e vestuário.

Diferentes nomes dentro de um mesmo tópico são apresentados dentro dos escopos

que os definem. Por exemplo, se eu quero que o topic map seja apresentado em

português e não em italiano, verei os tópicos Brasil, macarrão e futebol, em vez de

Page 46: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 44

Brasile, pasta e calcio. Um biólogo talvez prefira identificar os seres vivos pelos nomes

científicos e não pelos nomes vulgares.

Figura 8: Tópico Puccini – software Ontopia Omnigator

Na figura acima estão exemplificados os conceitos tópico (names), topic type

(composer), scope (normal form; short name), subject identifier (URI remetendo ao

verbete “Puccini” na Wikipedia), occurrence, occurrence type (bibliography, article etc.),

association e association type (born in, composed, died in).

4.3 Visualização

A visualização de um topic map pode ser variada. Como as especificações não

prescrevem os tipos de apresentação, isso fica por conta dos aplicativos. Le Grand

(2002), Le Grand e Soto (2000) e Lima (2004) descrevem alguns tipos de visualização

que podem ser aplicados aos topic maps.

Page 47: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 45

Para fins de busca (search), a apresentação em forma de listas (ver figura acima)

pode ser suficiente. A apresentação gráfica é útil para a navegação (browsing). Há

várias técnicas de visualização gráfica:

• Grafo: apresentação em forma de nós e arcos, úteis para a apresentação da

estrutura global do topic map;

Figura 9: Grafo – Software Ontopia Ominigator

• Grafo hiperbólico: possui uma curvatura que privilegia o detalhe no centro e o

contexto na periferia;

Page 48: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 46

Figura 10: Grafo hiperbólico – Web page da Highware Press31

• Grafo tridimensional: diversas camadas (classes e objetos, ou tópicos e ocorrências)

são apresentadas simultaneamente;

Figura 11: Grafo tridimensional32

31 Disponível em http://highwire.stanford.edu/help/hbt/.

32 Fonte: Le Grand e Soto (2000, p. 8).

Page 49: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 47

• Mapa: apresentação semelhante a um mapa geográfico. A topografia, por exemplo,

pode simular a quantidade de documentos ligados aos tópicos;

• Realidade virtual: topic maps podem ser apresentados, por exemplo, como cidades,

com edifícios (tópicos) interligados por ruas e avenidas (associações).

“Representing topic maps as populated virtual worlds may help users work collectively. Virtual reality techniques include interactivity and the use of different

levels of detail. […] Immersion in virtual worlds makes users feel more involved in the visualization. They may explore the world and interact with data” (LE GRAND, 2002, p. 280).

Apesar de essa última técnica parecer um exagero, ela mostra que as técnicas e os

instrumentos de visualização de mapas de conhecimento ainda podem evoluir muito e

permitir melhor acesso às informações.

Alguns procedimentos podem ser úteis, independentemente da técnica utilizada. A

distância entre os nós pode refletir a proximidade semântica dos tópicos. Cores e

formas podem diferenciar os tipos de nós, associações e ocorrências. A quantidade e o

detalhamento dos elementos devem se ajustar às necessidades de uso. A navegação

deve ser eficiente e intuitiva, além de se ajustar ao tipo de usuário (por exemplo, não

oferecer técnicas complexas aos iniciantes).

4.4 Características

Os topic maps apresentam as seguintes características:

• Equilíbrio entre simplicidade e complexidade: os topic maps possuem um pequeno

número de elementos que, combinados, podem descrever estruturas complexas33;

33 A TMCN (em desenvolvimento) restringe a sintaxe dos topic maps, evitando que os topic maps se tornem muito complexas ou inconsistentes (COLMENERO, 2005).

Page 50: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 48

• Neutralidade e estabilidade: as especificações são desenvolvidas por organizações

independentes, como a ISO, e utilizam uma linguagem aberta (não proprietária) e

amplamente aceita. Isso impede o monopólio das corporações e garante o

desenvolvimento das especificações livre de interesses puramente comerciais;

• Compartilhamento: as especificações possuem mecanismos (cujo principal é a noção

de published subject) que facilitam o compartilhamento de informações entre

diversos topic maps, que podem até ser fundidos.

• Camada conceitual separada da camada recursos: uma das características que

diferencia um topic map dos outros tipos de representação por grafos, como as

redes semânticas, é a existência da camada de ocorrências submetida à camada de

tópicos, que contém os nós e arcos. Dessa forma, uma camada, que é conceitual,

ontológica, se sobrepõe a uma outra camada, formada por elementos que podemos

chamar de recursos, objetos ou documentos.

• Estrutura voltada para conceitos: o conceito (tópico) é a principal unidade. Os

recursos (ocorrências) existem em função dos conceitos (pode haver tópicos sem

ocorrências, mas não o contrário). Ou seja, o modelo é centrado na informação e

não nos recursos (NEWCOMB, 2002).

4.5 Aplicações

Os topic maps podem ser usados para: a) representação de conceitos; b) navegação

hipertextual; c) recuperação da informação (COLMENERO, 2005). Dessa forma, os

topic maps podem ser aplicados na organização de recursos eletrônicos (portais,

enciclopédias, intranets etc.), como instrumento de aprendizado em salas de aula e

como vocabulários estruturados para recuperação da informação.

Page 51: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 49

Garshol (2004) faz uma comparação entre diversos tipos de vocabulários

estruturados (taxonomia, tesauro, classificação facetada, ontologia). Todos esses

vocabulários podem ser representados como topic maps. Os topic maps evidenciam a

potencialidade (e também as limitações) dos diversos vocabulários estruturados, dando

suporte à estruturação, definição e apresentação dos descritores.

4.5.1 Integração dos topic maps à Web Semântica

A Web Semântica (Semantic Web) é um projeto da World Wide Web Consortium

(W3C) para a estruturação da World Wide Web (WWW ou Web, um dos principais

protocolos da Internet), de forma que as informações contidas nessa rede possam ser

organizadas e recuperadas mais facilmente. A primeira linguagem usada para a

construção de web sites foi o HTML34, derivada da SGML, voltada mais para a

apresentação visual e do que para a estruturação do conteúdo. Dessa forma, as

informações contidas num site podem fazer sentido para as pessoas, mas não para as

máquinas35. Por exemplo, a frase “o livro XML Topic Maps, editado por Jack Park,

custa R$ 160,00” é, para a máquina, uma simples cadeia de palavras (ou bits), não

haverá distinção entre livro, autor e preço.

Por esse motivo, foi criada a linguagem XML), subconjunto da SGML, simplificada e

orientada para a Web, cuja ênfase é permitir a interpretação do conteúdo por

máquinas por meio de marcas (tags) de conteúdo. A W3C desenvolveu ferramentas

baseadas em XML, como a RDF36, a OWL37 e o SKOS38 para a construção de esquemas

34 Hypertext Markup Language.

35 A “interpretação” das máquinas se dá em termos de processamento, não tem nada a ver com a interpretação humana.

36 Resource Description Framework.

Page 52: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 50

de metadados e vocabulários, que permitirão aos agentes automatizados interpretarem

dados estruturados.

Os topic maps, apesar de não serem um produto da W3C, podem ser usados em

conjunto com a RDF e a OWL, já que, apesar de esses instrumentos terem aspectos em

comum, são complementares (FREESE, 2002; VATANT, 2004).

37 Web Ontology Language.

38 Simple Knowledge Organisation System.

Page 53: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 51

5 Considerações finais

Está na moda falar em mudança de paradigma. Na Ciência da Informação não é

diferente. Do paradigma da conservação do acervo passamos para o paradigma do

acesso do usuário à informação. Com muito custo começamos a perceber que mais

vale um livro na mão do que dois mofando.

Os topic maps representam de fato uma mudança de paradigma. As bases de dados

bibliográficas baseiam-se em metadados, ou seja, na representação dos documentos

por meio de seus atributos. Essa abordagem se mostra eficiente quando damos

importância aos documentos e não às informações contidas neles. É possível

realizarmos buscas insólitas por livros que tenham entre 150 e 170 páginas, que foram

editados em São Paulo ou que tenham índices e sumários. Isso não é o paradigma do

acervo?

Os topic maps baseiam-se na representação de estruturas conceituais aos quais os

documentos são relacionados. Representam um modelo centrado na informação, não

nos documentos. Esse modelo permite filtragem de informações para a apresentação

somente de aspectos relevantes. Também pode oferecer modelos sofisticados de busca.

The topic maps paradigm recognizes that everything and anything can be a subject of conversation, and that every subject of conversation can be a hub around which data resources can orbit. Unlike the resource-centric view in which metadata orbits data resources, in the subject-centric view, data orbits subjects […]

(NEWCOMB, 2002, p. 43)

Com os topic maps podemos efetivamente abandonar o paradigma do acervo e

adotar o paradigma da informação.

Page 54: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação 52

A Web é, provavelmente, o maior repositório de informação jamais criado, porém,

ela é ainda muito desestruturada (CHISLENKO, 199739 apud PARK, 2002). Em

contraste, as bibliotecas e unidades de informação possuem acervos limitados (em

comparação com a Web), porém, altamente estruturados. A Ciência da Informação,

naturalmente, pode contribuir (e já contribui) para a estruturação do conteúdo na

Web. Porém, o movimento contrário também pode ocorrer. Os topic maps, concebidos

para a organização da Web, oferecem uma nova perspectiva às bibliotecas.

39 CHISLENKO, Alexander. Semantic Web vision paper [online]. 1997. Disponível em: http://lucifer.com/~sasha/articles/SemanticWeb.html. Acesso em: 2 dez. 2005.

Page 55: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação

53

Referências40

ADAMS, Katherine. The Semantic Web. Online, Weston, Conn., v. 26, n. 4, p. 20-3, July/Aug. 2002.

BAX, Marcelo P.; SOUZA, Renato R. Uma Proposta de Uso de Agentes e Mapas Conceituais para Representação de Conhecimentos Altamente Contextualizados [online] In: SIMPÓSIO INTERNACIONAL DE GESTÃO DO CONHECIMENTO/GESTÃO DE DOCUMENTOS - ISKM/DM, 4., 2001, Curitiba. Disponível em: <http://www.bax.com.br/research/publications/agentes>. Acesso em: 21 abr. 2005.

BORDENAVE, Juan. O que é comunicação. São Paulo: Brasiliense, 1984.

BOTTRILL, J.; LOCK, R. Do students learn from pictures or from text? Science Review, n. 74, p. 109-112, 1993.

CASTELLS, Manuel. Internet e sociedade em rede. In: MORAES, Denis de (org). Por uma outra comunicação. Rio de Janeiro: Record, 2003. p. 255-287.

CHISLENKO, Alexander. Semantic Web vision paper [online]. 1997. Disponível em: http://lucifer.com/~sasha/articles/SemanticWeb.html. Acesso em: 2 dez. 2005.

COLMENERO RUIZ, María Jesús. Introducción al modelo Topic Maps (ISO/IEC13250:2003). Revista Digital de Biblioteconomia e Ciência da Informação, v. 3, n. 1, 2005.

ECO, Umberto. Conceito de texto. São Paulo: T.A. Queiroz; Edusp, 1984.

ECO, Umberto. Marco Polo e o unicórnio. In: Kant e o ornitorrinco. Rio de Janeiro: Record, 1998.

ECO, Umberto. O signo. 4ª ed. Lisboa: Presença, 1990.

EPSTEIN, Isaac. O signo. 4. ed. São Paulo: Ática, 1991.

ERVIN, Susan. A linguagem na psicologia humana. In: Tax, S. (org.) Panorama da Antropologia. Rio de Janeiro: Fundo de Cultura, 1966. p. 55-65.

FISHER, Kathleen M. Prediction: a profound paradigm shift. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps: creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 16, p. 477-506.

FREESE, Eric. Topic maps and RDF. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps: creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 12, p. 283-325.

40 Norma utilizada: ABNT. NBR 6023: Informação e documentação: Referências: Elaboração. Rio de Janeiro, 2002.

Page 56: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação

54

GARSHOL, Lars M. Metadata? Thesauri? Taxonomies? Topic Maps!: Making sense of it all [online]. 26 Oct. 2004. Disponível em: <http://www.ontopia.net/topicmaps/materials/tm-vs-thesauri.html>. Acesso em: 25 abr. 2005.

GRANGER, Gilles G. Filosofia do estilo. São Paulo: Perspectiva, 1974.

ISO; IEC. ISO/IEC 13250: Topic maps [online]. 2nd ed. 2002. Disponível em: <http://y12web2.y12.doe.gov/sgml/sc34/document/0322_files/iso13250-2nd-ed-v2.pdf>. Acesso em: 28 nov. 2005.

KAPOR, Mitchell. Mitchell Kapor quotes. In: BrainyQuote [online]. Disponível em: <http://www.brainyquote.com/quotes/quotes/m/mitchellka163583.html>. Acesso em: 24 nov. 2005.

LANCASTER, F.W. Information retrieval systems: characteristics, testing and evaluation. New York: John Wiley & Sons, 1979.

LARA, Marilda L.G. É possível falar em signo e semiose documentária? Encontros Bibli, n. 21, 2005. No prelo.

LARA, Marilda L.G. O processo de construção da informação documentária e o processo de conhecimento. Perspectivas em Ciência da Informação, Belo Horizonte, v. 7, n. 2, p. 127-139, jul./dez. 2002.

LE GRAND, Bénédicte. Topic map visualization. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps : creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 11, p. 267-282.

LE GRAND, Bénédicte; SOTO, Michel. Information management - Topic Maps visualization. In: XML Europe 2000 [online], 2000, Paris. 11 p. Disponível em: <http://www.gca.org/papers/xmleurope2000/pdf/s29-03.pdf>. Acesso em: 21 abr. 2005.

LIMA, Gercina A.B.O. Mapa hipertextual (MHTX): um modelo para organização hipertextual de documentos. 2004. 199 f. Tese (Doutorado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2004.

LOPES, Edward. Fundamentos da Lingüística contemporânea. São Paulo: Cultrix, 1995.

MARCONDES, Carlos H. Representação e economia da informação. Ciência da Informação [online], Brasília, v. 30, n. 1, p. 61-70, jan./abr. 2001. Disponível em: <http://www.ibict.br/cienciadainformacao/viewarticle.php?id=260&layout=abstract>. Acesso em 28 nov. 2005.

MAYER, R.E.; SIMS, V.K. For whom is a picture worth a thousand words?: extensions of the dual-coding theory of multimedia learning. Journal of Educational Psychology, n. 46, p. 389-401, 1994.

Page 57: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação

55

MOREIRO GONZÁLEZ, José; et al. De los tesauros a los topic maps: nuevo estándar para la representación y la organización de la información [online]. Encontros Bibli, Florianópolis, n. 18, 2. sem. 2004. Disponível em: <http://www.encontros-bibli.ufsc.br/Edicao_18/1_De_los_tesauros.pdf>. Acesso em: 07 maio 2005.

NEWCOMB, Steven R. A perspective on the quest for global knowledge interchange. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps : creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 3, p. 31-50.

PARK, Jack. Topic maps, the Semantic Web, and education. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps : creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 17, p. 507-529.

PEPPER, Steve. The TAO of Topic Maps: finding the way in the age of infoglut [online]. 11 Apr. 2000. Disponível em: <http://www.gca.org/papers/xmleurope2000/pdf/s11-01.pdf>. Acesso em: 20 abr. 2005.

RATH, H.H. The topic maps handbook [online]. Version 1.1. Gütersloh, Germany: Empolis, 2003. Disponível em: <http://www.empolis.com/downloads/empolis_TopicMaps_Whitepaper20030206.pdf>. Acesso em: 21 jun. 2005.

SAGER, Juan C. Prólogo: la terminología, puente entre varios mundos. In: CABRÉ, M.T. La terminología: teoría, metodología, aplicaciones. Barcelona: Antártida; Empúres, 1993. p. 11-17.

STANDING, L.; CONEZIO, J; HABER, R.N. Perception and memory for pictures: single trial learning of 2500 visual stimuli. Psychonomic Science, n. 19, p. 73-84, 1970.

TOPICMAPS.ORG. XML Topic Maps (XTM) [online]. Version 1.0. 2001. Disponível em: <http://topicmaps.org/xtm/>. Acesso em: 28 nov. 2005.

VALENCIA, Asdrúbal. El libro e su futuro. Revista Interamericana de Bibliotecología, Medellín, v. 21, n. 1, p. 15-47, ene./jun. 1998.

VATANT, Bernard. Ontology-driven topic maps [online]. 2004. Disponível em: <http://www.idealliance.org/europe/04/call/xmlpapers/03-03-03.91/.03-03-03.html>. Acesso em: 18 nov. 2005.

VATANT, Bernard. Topic maps from representation to identity: conversation, names, and published subject indicators. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps : creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 5, p. 67-79.

VICKERY, B.C. Ontologies. Journal of Information Science, v. 23, n. 4, p. 277-286, 1997.

WIKIPEDIA [online]. Disponível em: <http://wikipedia.org/>. Acesso em 21 jun. 2005.

Page 58: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação

56

Apêndice

Elementos da XTM 1.0

Breve descrição dos 19 elementos do XTM. “Sub-elementos” indica os elementos

subordinados ao elemento descrito. “Ocorre em” indica os elementos superordenados

onde o elemento descrito pode aparecer.

<association>

Estabelece uma relação entre topics.

Subelementos: <instanceOf>, <scope>, <member>.

Ocorre em: <topicMap>.

<baseName>

Nome base de um topic.

Sub-elementos: <scope>, <baseNameString>, <variant>.

Ocorre em: <topic>.

<baseNameString>

Cadeia de caracteres que representa o base name de um topic.

Ocorre em: <baseName>.

<instanceOf>

Aponta para um topic ou subject indicator que representa uma classe (topic type/association type/occurrence type).

Sub-elementos: <topicRef>, <subjectIndicatorRef>.

Ocorre em: <topic>, <occurrence>, <association>.

<member>

Aponta para um ou mais topics que possuem uma determinada função (role) numa association.

Sub-elementos: <roleSpec>, <topicRef>, <resourceRef>, <subjectIndicatorRef>.

Ocorre em: <association>.

<mergeMap>

Aponta para um topic map externo para fins de fusão (merge).

Sub-elementos: <topicRef>, <resourceRef>, <subjectIndicatorRef>.

Ocorre em: <topicMap>.

Page 59: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação

57

<occurrence>

Aponta para informações e recursos considerados relevantes a um topic.

Sub-elementos: <instanceOf>, <scope>, <resourceRef>, <resourceData>.

Ocorre em: <topic>.

<parameters>

Parâmetros para a exibição do variant name.

Sub-elementos: <topicRef>, <subjectIndicatorRef>.

Ocorre em: <variant>.

<resourceData>

Cadeia de caracteres que representa uma occurrence ou um variant name.

Ocorre em: <occurrence>, <variantName>.

<resourceRef>

Referencia um recurso endereçável (addressable resource).

Ocorre em: <member>, <mergeMap>, <occurrence>, <scope>, <subjectIdentity>, <variantName>.

<roleSpec>

Especifica a função (role) de um ou mais topics numa association.

Sub-elementos: <topicRef>, <subjectIndicatorRef>.

Ocorre em: <member>.

<scope>

Referencia topics, addressable resources e subject indicators que definem(m) o escopo.

Sub-elementos: <topicRef>, <resourceRef>, <subjectIndicatorRef>.

Ocorre em: <baseName>, <occurrence>, <association>.

<subjectIdentity>

Assunto ou conceito reificado (representado) por um topic por meio de um addressable resource, subject indicator ou outro topic.

Sub-elementos: <resourceRef>, <topicRef>, <subjectIndicatorRef>.

Ocorre em: <topic>.

<subjectIndicatorRef>

Referencia um subject indicator.

Ocorre em: <instanceOf>, <member>, <mergeMap>, <parameters>, <roleSpec>, <scope>, <subjectIdentity>.

Page 60: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação

58

<topic>

Tópico (topic).

Sub-elementos: <instanceOf>, <subjectIdentity>, <baseName>, <occurrence>.

Ocorre em: <topicMap>.

<topicMap>

Documento topic map.

Sub-elementos: <topic>, <association>, <mergeMap>.

<topicRef>

Referencia um topic.

Ocorre em: <instanceOf>, <member>, <mergeMap>, <parameters>, <roleSpec>, <scope>, <subjectIdentity>.

<variant>

Forma variante de um base name que serve a propósitos específicos, como ordenação (sort) e exibição (display) em dispositivos específicos (como handhelds).

Sub-elementos: <parameters>, <variantName>, <variant>.

Ocorre em: <baseName>.

<variantName>

Cadeia de caracteres ou referência a elementos externos (imagens, sons etc.) que representa um variant name.

Sub-elementos: <resourceRef>, <resourceData>.

Ocorre em: <variant>.

Page 61: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação

59

Elementos na estrutura da XTM 1.0

<topicMap>

<topic>

<instanceOf>

<subjectIdentity>

<resourceRef>

<topicRef>

<subjectIndicatorRef>

<baseName>

<scope>

<baseNameString>

<variant>

<parameters>

<variantName>

<resourceRef>

<resourceData>

<variant>

<occurrence>

<instanceOf>

<scope>

<resourceRef>

<resourceData>

<association>

<instanceOf>

<scope>

<member>

<roleSpec>

<topicRef>

<subjectIndicatorRef>

<topicRef>

<resourceRef>

<subjectIndicatorRef>

<mergeMap>

<topicRef>

<resourceRef>

<subjectIndicatorRef>

Page 62: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação

60

Índice

associação (topic map), 42

cabeçalho de assunto, 26

Ciência da Informação

paradigmas, 52–53

classificação enciclopédica, 25

classificação facetada, 25

conhecimento

externalização, 30

internalização, 30

continuum. ver objeto dinâmico

DeCS, 34

Document Type Definition. ver DTD

DTD, 38

escopo (topic map), 44–45

fusão (topic map), 44

GPS, 13

grafo, 46

grafo hiperbólico, 46

grafo tridimensional, 47

HTML, 50

HyperText Markup Language. ver HTML

HyTime, 38

índice, 37, 39

informação

como construção, 24

como reprodução, 24, 25

interpretação, 36

produção, 12

recuperação, 12, 13, 22–24

representação, 15–32

Internet, 13

interpretante, 16, 20

ISO 13250, 38

linguagem simbólica, 15

mapa, 26, 48

mapa conceitual, 26, 27

mapa de conhecimento, 27–31

mapa mental, 28

metadado, 23, 33, 51, 52

objeto dinâmico, 16, 20

objeto imediato, 16

ocorrência (topic map), 41–42

ontologia, 27

OWL, 51

published subject indicator, 43

RDF, 51

realidade virtual (visualização), 48

recuperação da informação, 12, 13, 22–24

rede semântica, 29

representação da informação, 15–32

Resource Description Framework. ver RDF

Semantic Web. ver Web Semântica

SGML, 38

signo, 15–24

signo artificial, 19

signo documentário, 19–25

Simple Knowledge Organisation System. ver SKOS

sistema de recuperação da informação. ver SRI

SKOS, 51

SRI, 15, 33–36

subject identity (topic map), 43

Page 63: Topic maps como instrumentos de representa o e … 8: Tópico Puccini – software Ontopia Omnigator 44 Figura 9: Grafo ... 4.2.2 Ocorrência (occurrence ) 40 4.2.3 Associação (association

Topic maps como instrumentos de representação e recuperação da informação

61

Terminologia, 26

tesauro, 26, 27

TMCL, 39

TMQL, 39

topic map, 13, 37–51

aplicações, 49

association, 42

conceitos, 39–45

histórico, 38–39

merge, 44

occurrence, 41–42

published subject indicator, 43

scope, 44–45

topic, 40–41

visualização, 45–48

Topic Map Constraint Language. ver TMCL

Topic Map Query Language. ver TMQL

tópico (topic map), 40–41

triângulo semiótico, 15

visualização (topic map), 45–48

vocabulário estruturado, 25–27, 34, 50

Web, 44, 50

Web Ontology Language. ver OWL

Web Semântica, 50–51

World Wide Web. ver Web

XML, 51

XML Topic Maps. ver XTM

XTM, 38