Upload
natallie
View
16
Download
0
Embed Size (px)
DESCRIPTION
Artigo elaborado por alunas da turma de Biblioteconomia 2007 da Universidade Federal do Pará (UFPA)
Citation preview
TESAUROS E SUA IMPORTÃNCIA PARA SISTEMAS DE
RECUPERAÇÃO DA INFORMAÇÃO
Cristina Gomes Ferreira
Jislaine Silveira da Silva
Joyce Liliane Silva Araújo
Natallie Nazareth Alcantara Chagas
Rosana do Socorro Corrêa da Igreja
RESUMO
A importância do tesauro para a construção de um sistema de recuperação da
informação, é significante. No presente trabalho, demonstram-se as diferenças entre
tesauros e outros tipos de terminologias, estabelecendo as relações existentes entre os
termos e explicando no que consiste um sistema de recuperação de informação, com o
objetivo de auxiliar o usuário a empreender a busca que necessita.
Palavras-chave: Tesauro. Informação – sistema de recuperação. Usuário.
ABSTRACT
The importance of the thesaurus to build a system of information retrieval is significant.
In this study, the differences between thesaurus and other types of terminologies are
demonstrate, establishing the relationship between the terms and explaining what
system of information retrieval speaks about, with the objective of helping the user to
undertake the search that he needs.
Keywords: Thesaurus. Information – retrieval system. User.
INTRODUÇÃO
O tesauro, junto aos sistemas de classificação bibliográfica, são as
linguagens documentárias mais conhecidas. No presente artigo, estabelece-se sua
definição, expõem-se as diferenças entre tesauros, cabeçalhos de assuntos e
vocabulários controlados, além de demonstrar quais as relações existentes entre os
termos. Em seguida, mostra-se de que forma ocorre a construção de um tesauro. Nos
tópicos seguintes, demonstra-se a função de um sistema de informação e sua definição
para, em seguida explicar qual a importância do tesauro para um sistema de recuperação
da informação.
1 VOCABULÁRIOS CONTROLADOS, CABECALHOS DE ASSUNTOS E
TESAUROS
Vocabulários controlados, cabeçalhos de assuntos e tesauros são os tipos de
terminologias que têm trazido avanços para a área de busca e recuperação da
informação. Os vocabulários controlados são listas de palavras-chave ordenadas em
seqüência ou em ordem alfabética sem nenhum tipo de relação e controle mínimo das
palavras. Os cabeçalhos também são listas de termos.
Porém, os cabeçalhos apresentam controle maior sobre os termos e com
relação maior entre eles. Os tesauros apresentam um controle persistente e várias
relações entre os termos. Segundo Robredo (1978), os tesauros podem ser definidos de
acordo com sua função ou estrutura.
Considerando a sua função, um thesaurus é um instrumento de controle
terminológico que permite traduzir a linguagem natural dos documentos, dos
indexadores ou dos usuários numa “linguagem sistêmica” mais rígida
(linguagem documentária, linguagem de informação).
Levando em consideração a sua estrutura, um thesaurus é um vocabulário
controlado e dinâmico de termos relacionados semântica e genericamente, que
cobre um campo específico de conhecimentos.1
1 ROBREDA, 1978, p. 87.
A diferença entre os tesauros e os cabeçalhos de assuntos está presente nos
tipos de relações entre os termos: relações hierárquicas, de equivalência e associação.
Eis uma definição de tesauro:
Um tesauro pode ser definido como um vocabulário controlado que
representa hierarquias, relações de equivalência, pertinência e associação
entre os termos, com objetivo de auxiliar o usuário potencial a encontrar a
informação de que necessita com a menor margem de erro possível. 2
Os termos de um tesauro, os termos descritores, podem ser compostos por
uma única palavra ou por várias palavras formando um termo composto. As relações
hierárquicas do tesauro são as relações de ordenação entre os termos. As expressões
“BROADER TERM” (termo mais amplo – BT) e “NARROWER TERM” (termo
específico – NT) indicam estas relações.
As relações de equivalência dizem respeito ao estudo e delimitação de
termos diferentes com o mesmo significado e termos idênticos com significados
diferentes. As expressões “USE” (use – U) e “USED FOR” (usado no lugar de – UF)
indicam as relações equivalentes.
Junto à estas relações, estabelecem-se as de pertinência, que envolvem o
estabelecimento de um termo padrão. Por fim, as relações associativas não se
enquadram em nenhuma daquelas citadas acima, mas são importantes para a
recuperação da informação. A expressão que indica sua existência é a “RELATED
TERM” (termo relacionado – RT).
A elaboração de um tesauro requer o conhecimento de documentos
produzidos na área, o entendimento dos termos empregados e a construção de conceitos
para explicar os termos. O profissional precisa saber incorporar as mudanças que a
linguagem sofre, mas sem abandonar os conceitos das palavras.
2 CONSTRUINDO TESAUROS
São variadas as metodologias empregadas para se construir um tesauro. De
modo geral, existem certas etapas que devem ser realizadas, não importando a ordem
em que ocorrem. Precisa-se considerar, porém, a especialização do tesauro. As etapas
são:
2COLEPÍCOLO, sem data, p. 2.
Seleção de termos: realizada a partir de termos que demonstrem alguma
significância, encontradas nos documentos ou nos índices bibliográficos.
Organização dos termos: os termos são agrupados por classes (ex: assuntos),
determinando suas relações.
Estabelecimento das relações: determinam-se as relações hierárquicas e
associativas.
Avaliação crítica e atualização: realiza-se a eliminação de termos inúteis, assim
como incorporam-se novos termos.
Sua estrutura também pode ser modificada com o objetivo de melhorar sua
qualidade. Os tesauros também podem ser classificados em monolíngues ou bilíngües,
em macrotesauros ou microtesauros (de acordo com a especificidade de seus termos).
Os tesauros também podem ser voltados a um assunto (aqueles voltados a uma
disciplina científica) ou a um problema (tesauros multidisciplinares).
3 SISTEMAS DE RECUPERAÇÃO DA INFORMAÇÃO (SRI)
A principal função de um sistema de recuperação da informação consiste em
dar acesso às informações contidas em documentos registrados, organizados e
processados. De modo geral, todos os sistemas se definem em:
Indexar: selecionam-se os tópicos a serem representados pelos termos de
indexação com base no julgamento subjetivo, depois se extraem os termos
atribuídos de um documento e os associam a uma linguagem de indexação,
controlada (lista de termos aprovada) ou não controlada (quaisquer termos que
se julgue adequado).
Armazenar: registram-se os termos atribuídos e compila-se um arquivo
invertido.
Recuperar: localizam-se documentos e itens de informação.
São os sistemas de recuperação da informação que possibilitam a
organização e disseminação da informação e, conseqüentemente, do conhecimento. As
linguagens documentárias são os instrumentos desses sistemas e se apresentam sob duas
maneiras: alfabética e sistemática
O tratamento da informação depende das funções que ocorrem nos sistemas
de informação e recuperação, já que variam de acordo com dois fatores: a) o
detalhamento desejado pelo sistema; b) o instrumental utilizado. Tais questões são
decididas pelo tipo de sistema ou recuperação de informação em que o tratamento
ocorre. O volume e a complexidade de informação existente atualmente requer a
existência de um instrumento preciso, como o tesauro.
4 A IMPORTÃNCIA DO TESAURO PARA O SRI
O tesauro tem como objetivo principal auxiliar o usuário a encontrar
documentos de acordo com sua necessidade. É o mecanismo que surge como alternativa
para resolver certos problemas, como por exemplo, no caso de usuários diferentes que
expressam suas necessidades de informação, ainda que a mesma, utilizando uma
linguagem diferente.
Além disso, o tesauro pode ainda representar a riqueza das relações
hierárquicas e associativas de modo que os usuários possam limitar sua pesquisa a um
nível mais específico ou mais amplo.
CONSIDERAÇÕES FINAIS
O presente trabalho buscou apresentar no que consiste a elaboração de um
tesauro, pôde-se mostrar sua significativa importância para um sistema de informação,
já que este visa atender as demandas informacionais de uma determinada área, ao
possibilitarem (e facilitarem) a organização e disseminação da informação e do
conhecimento.
REFERÊNCIAS
COLEPÍCOLO, Eliane et al. MeSH: de cabeçalho de assunto a tesauro. Disponível
em: <http://www.sbis.org.br> Acesso em 27 maio 2009.
GOMES, Hagar Espanha (coord.). Manual de elaboração de tesauros monolíngues.
Brasília: O Programa, 1990. 78p.
JESUS, Jerocir Botelho Marques de. Tesauro: um instrumento de representação do
conhecimento em sistemas de recuperação da informação. Disponível em
<http://www.ndc.uff.br> Acesso em 27 maio 2009.
MOREIRA, Manoel Palhares; Moura, Maria Aparecida. Construindo tesauros a partir
de tesauros inexistentes: a experiência do TCI – Tesauro em Ciência da
Informação. Disponível em < http://www.datagramazero.org.br> Acesso em 27 maio
2009.
ROBREDO, Jaime. Documentação de hoje e de amanhã. Brasília: [s.n], 1978.