6
TESAUROS E SUA IMPORTÃNCIA PARA SISTEMAS DE RECUPERAÇÃO DA INFORMAÇÃO Cristina Gomes Ferreira Jislaine Silveira da Silva Joyce Liliane Silva Araújo Natallie Nazareth Alcantara Chagas Rosana do Socorro Corrêa da Igreja RESUMO A importância do tesauro para a construção de um sistema de recuperação da informação, é significante. No presente trabalho, demonstram-se as diferenças entre tesauros e outros tipos de terminologias, estabelecendo as relações existentes entre os termos e explicando no que consiste um sistema de recuperação de informação, com o objetivo de auxiliar o usuário a empreender a busca que necessita. Palavras-chave: Tesauro. Informação sistema de recuperação. Usuário. ABSTRACT The importance of the thesaurus to build a system of information retrieval is significant. In this study, the differences between thesaurus and other types of terminologies are demonstrate, establishing the relationship between the terms and explaining what system of information retrieval speaks about, with the objective of helping the user to undertake the search that he needs. Keywords: Thesaurus. Information retrieval system. User.

Tesauro e sua importância para sistemas de recuperação da informação

Embed Size (px)

DESCRIPTION

Artigo elaborado por alunas da turma de Biblioteconomia 2007 da Universidade Federal do Pará (UFPA)

Citation preview

Page 1: Tesauro e sua importância para sistemas de recuperação da informação

TESAUROS E SUA IMPORTÃNCIA PARA SISTEMAS DE

RECUPERAÇÃO DA INFORMAÇÃO

Cristina Gomes Ferreira

Jislaine Silveira da Silva

Joyce Liliane Silva Araújo

Natallie Nazareth Alcantara Chagas

Rosana do Socorro Corrêa da Igreja

RESUMO

A importância do tesauro para a construção de um sistema de recuperação da

informação, é significante. No presente trabalho, demonstram-se as diferenças entre

tesauros e outros tipos de terminologias, estabelecendo as relações existentes entre os

termos e explicando no que consiste um sistema de recuperação de informação, com o

objetivo de auxiliar o usuário a empreender a busca que necessita.

Palavras-chave: Tesauro. Informação – sistema de recuperação. Usuário.

ABSTRACT

The importance of the thesaurus to build a system of information retrieval is significant.

In this study, the differences between thesaurus and other types of terminologies are

demonstrate, establishing the relationship between the terms and explaining what

system of information retrieval speaks about, with the objective of helping the user to

undertake the search that he needs.

Keywords: Thesaurus. Information – retrieval system. User.

Page 2: Tesauro e sua importância para sistemas de recuperação da informação

INTRODUÇÃO

O tesauro, junto aos sistemas de classificação bibliográfica, são as

linguagens documentárias mais conhecidas. No presente artigo, estabelece-se sua

definição, expõem-se as diferenças entre tesauros, cabeçalhos de assuntos e

vocabulários controlados, além de demonstrar quais as relações existentes entre os

termos. Em seguida, mostra-se de que forma ocorre a construção de um tesauro. Nos

tópicos seguintes, demonstra-se a função de um sistema de informação e sua definição

para, em seguida explicar qual a importância do tesauro para um sistema de recuperação

da informação.

1 VOCABULÁRIOS CONTROLADOS, CABECALHOS DE ASSUNTOS E

TESAUROS

Vocabulários controlados, cabeçalhos de assuntos e tesauros são os tipos de

terminologias que têm trazido avanços para a área de busca e recuperação da

informação. Os vocabulários controlados são listas de palavras-chave ordenadas em

seqüência ou em ordem alfabética sem nenhum tipo de relação e controle mínimo das

palavras. Os cabeçalhos também são listas de termos.

Porém, os cabeçalhos apresentam controle maior sobre os termos e com

relação maior entre eles. Os tesauros apresentam um controle persistente e várias

relações entre os termos. Segundo Robredo (1978), os tesauros podem ser definidos de

acordo com sua função ou estrutura.

Considerando a sua função, um thesaurus é um instrumento de controle

terminológico que permite traduzir a linguagem natural dos documentos, dos

indexadores ou dos usuários numa “linguagem sistêmica” mais rígida

(linguagem documentária, linguagem de informação).

Levando em consideração a sua estrutura, um thesaurus é um vocabulário

controlado e dinâmico de termos relacionados semântica e genericamente, que

cobre um campo específico de conhecimentos.1

1 ROBREDA, 1978, p. 87.

Page 3: Tesauro e sua importância para sistemas de recuperação da informação

A diferença entre os tesauros e os cabeçalhos de assuntos está presente nos

tipos de relações entre os termos: relações hierárquicas, de equivalência e associação.

Eis uma definição de tesauro:

Um tesauro pode ser definido como um vocabulário controlado que

representa hierarquias, relações de equivalência, pertinência e associação

entre os termos, com objetivo de auxiliar o usuário potencial a encontrar a

informação de que necessita com a menor margem de erro possível. 2

Os termos de um tesauro, os termos descritores, podem ser compostos por

uma única palavra ou por várias palavras formando um termo composto. As relações

hierárquicas do tesauro são as relações de ordenação entre os termos. As expressões

“BROADER TERM” (termo mais amplo – BT) e “NARROWER TERM” (termo

específico – NT) indicam estas relações.

As relações de equivalência dizem respeito ao estudo e delimitação de

termos diferentes com o mesmo significado e termos idênticos com significados

diferentes. As expressões “USE” (use – U) e “USED FOR” (usado no lugar de – UF)

indicam as relações equivalentes.

Junto à estas relações, estabelecem-se as de pertinência, que envolvem o

estabelecimento de um termo padrão. Por fim, as relações associativas não se

enquadram em nenhuma daquelas citadas acima, mas são importantes para a

recuperação da informação. A expressão que indica sua existência é a “RELATED

TERM” (termo relacionado – RT).

A elaboração de um tesauro requer o conhecimento de documentos

produzidos na área, o entendimento dos termos empregados e a construção de conceitos

para explicar os termos. O profissional precisa saber incorporar as mudanças que a

linguagem sofre, mas sem abandonar os conceitos das palavras.

2 CONSTRUINDO TESAUROS

São variadas as metodologias empregadas para se construir um tesauro. De

modo geral, existem certas etapas que devem ser realizadas, não importando a ordem

em que ocorrem. Precisa-se considerar, porém, a especialização do tesauro. As etapas

são:

2COLEPÍCOLO, sem data, p. 2.

Page 4: Tesauro e sua importância para sistemas de recuperação da informação

Seleção de termos: realizada a partir de termos que demonstrem alguma

significância, encontradas nos documentos ou nos índices bibliográficos.

Organização dos termos: os termos são agrupados por classes (ex: assuntos),

determinando suas relações.

Estabelecimento das relações: determinam-se as relações hierárquicas e

associativas.

Avaliação crítica e atualização: realiza-se a eliminação de termos inúteis, assim

como incorporam-se novos termos.

Sua estrutura também pode ser modificada com o objetivo de melhorar sua

qualidade. Os tesauros também podem ser classificados em monolíngues ou bilíngües,

em macrotesauros ou microtesauros (de acordo com a especificidade de seus termos).

Os tesauros também podem ser voltados a um assunto (aqueles voltados a uma

disciplina científica) ou a um problema (tesauros multidisciplinares).

3 SISTEMAS DE RECUPERAÇÃO DA INFORMAÇÃO (SRI)

A principal função de um sistema de recuperação da informação consiste em

dar acesso às informações contidas em documentos registrados, organizados e

processados. De modo geral, todos os sistemas se definem em:

Indexar: selecionam-se os tópicos a serem representados pelos termos de

indexação com base no julgamento subjetivo, depois se extraem os termos

atribuídos de um documento e os associam a uma linguagem de indexação,

controlada (lista de termos aprovada) ou não controlada (quaisquer termos que

se julgue adequado).

Armazenar: registram-se os termos atribuídos e compila-se um arquivo

invertido.

Recuperar: localizam-se documentos e itens de informação.

São os sistemas de recuperação da informação que possibilitam a

organização e disseminação da informação e, conseqüentemente, do conhecimento. As

linguagens documentárias são os instrumentos desses sistemas e se apresentam sob duas

maneiras: alfabética e sistemática

Page 5: Tesauro e sua importância para sistemas de recuperação da informação

O tratamento da informação depende das funções que ocorrem nos sistemas

de informação e recuperação, já que variam de acordo com dois fatores: a) o

detalhamento desejado pelo sistema; b) o instrumental utilizado. Tais questões são

decididas pelo tipo de sistema ou recuperação de informação em que o tratamento

ocorre. O volume e a complexidade de informação existente atualmente requer a

existência de um instrumento preciso, como o tesauro.

4 A IMPORTÃNCIA DO TESAURO PARA O SRI

O tesauro tem como objetivo principal auxiliar o usuário a encontrar

documentos de acordo com sua necessidade. É o mecanismo que surge como alternativa

para resolver certos problemas, como por exemplo, no caso de usuários diferentes que

expressam suas necessidades de informação, ainda que a mesma, utilizando uma

linguagem diferente.

Além disso, o tesauro pode ainda representar a riqueza das relações

hierárquicas e associativas de modo que os usuários possam limitar sua pesquisa a um

nível mais específico ou mais amplo.

CONSIDERAÇÕES FINAIS

O presente trabalho buscou apresentar no que consiste a elaboração de um

tesauro, pôde-se mostrar sua significativa importância para um sistema de informação,

já que este visa atender as demandas informacionais de uma determinada área, ao

possibilitarem (e facilitarem) a organização e disseminação da informação e do

conhecimento.

REFERÊNCIAS

COLEPÍCOLO, Eliane et al. MeSH: de cabeçalho de assunto a tesauro. Disponível

em: <http://www.sbis.org.br> Acesso em 27 maio 2009.

GOMES, Hagar Espanha (coord.). Manual de elaboração de tesauros monolíngues.

Brasília: O Programa, 1990. 78p.

JESUS, Jerocir Botelho Marques de. Tesauro: um instrumento de representação do

conhecimento em sistemas de recuperação da informação. Disponível em

<http://www.ndc.uff.br> Acesso em 27 maio 2009.

Page 6: Tesauro e sua importância para sistemas de recuperação da informação

MOREIRA, Manoel Palhares; Moura, Maria Aparecida. Construindo tesauros a partir

de tesauros inexistentes: a experiência do TCI – Tesauro em Ciência da

Informação. Disponível em < http://www.datagramazero.org.br> Acesso em 27 maio

2009.

ROBREDO, Jaime. Documentação de hoje e de amanhã. Brasília: [s.n], 1978.