19
REPOSITÓRIOS DIGITAIS: UM ESTUDO DA APLICAÇÃO DO MODELO CONCEITUAL FRBR NA ESTRUTURAÇÃO DESCRITIVA Elisabete Gonçalves de Souza 1 Wellington Freire Cunha Costa 2 Eixo temático: Novos rumos da catalogação Resumo: Descreve as características e vantagens dos repositórios na organização, preservação e disseminação de produções técnico-científicas produzidas em linha (recurso digital) cujos serviços de autoarquivamento têm o produtor/autor como o organizador de seus próprios documentos. Discute a representação descritiva e a recuperação da informação em ambientes digitais e apresenta as vantagens trazidas pelo novo modelo conceitual FRBR na estruturação de metadados descritivos em ambientes digitais. Conclui realizando uma simulação da aplicação do modelo FRBR em repositórios de modo a averiguar os limites e as possibilidades de uso do novo modelo conceitual nesse tipo de ferramenta bibliográfica e de que forma a “modelagem” pode contribuir para o refinamento das buscas liberando o usuário do uso de operadores booleanos, já que a nova estrutura permitirá relacionamentos entre as diferentes entidades de um registro bibliográfico. Palavras-chave: 1. Repositório digital. 2. Representação descritiva. 3. Modelo FRBR. Abstract: Describes the features and advantages of the repositories in the organization, preservation and dissemination of technical and scientific documents produced online (digital resource) whose services self-archiving is done by the creator / author of the documents. Discusses descriptive representation and the retrieval of information in digital environments and presents the advantages brought by the new FRBR conceptual model in the structuring of descriptive data in digital environments. Concludes performing a simulation of the FRBR model in order to determine the limits and possibilities of using the new conceptual model in this type of bibliographic resource. Show with the "modeling" can contribute to the refinement of searches freeing the user of the boolean operators, because the new structure will allow to do relationships between the different entities of a bibliographic record. Keywords: 1. Digital repository. Descriptive representation. 3. FRBR model. Resumen: Describe las características y ventajas de los repositorios de la organización, preservación y difusión de las técnicas y científicas producidas en línea (recurso digital) cuyos servicios se han auto-archivar el productor / autor como el organizador de sus propios documentos. Discute la representación descriptiva y recuperación de información en entornos digitales y presenta las ventajas aportadas por el nuevo modelo conceptual FRBR en la estructuración de los metadatos descriptivos en entornos digitales. Acabados de realizar una simulación de la aplicación de los repositorios de modelos FRBR con el fin de determinar los límites y las posibilidades de utilizar el nuevo modelo conceptual en este tipo de herramienta bibliográfica y la forma de "modelado" puede contribuir al refinamiento de búsquedas liberando al usuario el uso de operadores booleanos, ya que nueva estructura 1 Contato: <[email protected]>. Universidade Federal Fluminense. 2 Contato: <[email protected]>. Universidade Federal Fluminense.

REPOSITÓRIOS DIGITAIS: UM ESTUDO DA · PDF filepelo novo modelo conceitual FRBR na estruturação de metadados descritivos em ... 2 Contato: . Universidade Federal Fluminense. 2

  • Upload
    hadat

  • View
    227

  • Download
    9

Embed Size (px)

Citation preview

REPOSITÓRIOS DIGITAIS: UM ESTUDO DA APLICAÇÃO DO MODELO CONCEITUAL FRBR NA ESTRUTURAÇÃO DESCRITIVA

Elisabete Gonçalves de Souza1 Wellington Freire Cunha Costa2

Eixo temático: Novos rumos da catalogação Resumo: Descreve as características e vantagens dos repositórios na organização, preservação e disseminação de produções técnico-científicas produzidas em linha (recurso digital) cujos serviços de autoarquivamento têm o produtor/autor como o organizador de seus próprios documentos. Discute a representação descritiva e a recuperação da informação em ambientes digitais e apresenta as vantagens trazidas pelo novo modelo conceitual FRBR na estruturação de metadados descritivos em ambientes digitais. Conclui realizando uma simulação da aplicação do modelo FRBR em repositórios de modo a averiguar os limites e as possibilidades de uso do novo modelo conceitual nesse tipo de ferramenta bibliográfica e de que forma a “modelagem” pode contribuir para o refinamento das buscas liberando o usuário do uso de operadores booleanos, já que a nova estrutura permitirá relacionamentos entre as diferentes entidades de um registro bibliográfico. Palavras-chave: 1. Repositório digital. 2. Representação descritiva. 3. Modelo FRBR. Abstract: Describes the features and advantages of the repositories in the organization, preservation and dissemination of technical and scientific documents produced online (digital resource) whose services self-archiving is done by the creator / author of the documents. Discusses descriptive representation and the retrieval of information in digital environments and presents the advantages brought by the new FRBR conceptual model in the structuring of descriptive data in digital environments. Concludes performing a simulation of the FRBR model in order to determine the limits and possibilities of using the new conceptual model in this type of bibliographic resource. Show with the "modeling" can contribute to the refinement of searches freeing the user of the boolean operators, because the new structure will allow to do relationships between the different entities of a bibliographic record. Keywords: 1. Digital repository. Descriptive representation. 3. FRBR model. Resumen: Describe las características y ventajas de los repositorios de la organización, preservación y difusión de las técnicas y científicas producidas en línea (recurso digital) cuyos servicios se han auto-archivar el productor / autor como el organizador de sus propios documentos. Discute la representación descriptiva y recuperación de información en entornos digitales y presenta las ventajas aportadas por el nuevo modelo conceptual FRBR en la estructuración de los metadatos descriptivos en entornos digitales. Acabados de realizar una simulación de la aplicación de los repositorios de modelos FRBR con el fin de determinar los límites y las posibilidades de utilizar el nuevo modelo conceptual en este tipo de herramienta bibliográfica y la forma de "modelado" puede contribuir al refinamiento de búsquedas liberando al usuario el uso de operadores booleanos, ya que nueva estructura

1 Contato: <[email protected]>. Universidade Federal Fluminense. 2 Contato: <[email protected]>. Universidade Federal Fluminense.

2

permitirá que las relaciones entre las diferentes entidades de un registro bibliográfico. Palabras clave: 1. Repositorio Digital. 2. Representación descriptiva. 3. Modelo FRBR.

1 INTRODUÇÃO

O presente artigo relata os resultados da pesquisa “Impactos do novo modelo

conceitual FRBR na arquitetura da informação em repositórios digitais”, realizada

junto ao Programa de Pós-graduação em Ciência da Informação da Universidade

Federal Fluminense. As questões que nortearam o estudo foram: como o novo

modelo conceitual pode contribuir para melhorar o desempenho das bibliografias

digitais? Até que ponto formatos como o Dublin Core suportam a modelagem de

seus metadados? Quais as vantagens proporcionadas pelo novo modelo conceitual

quando aplicado em repositórios?

O trabalho se propõe a relatar os resultados da simulação do uso do modelo

FRBR na estruturação descritiva de registros em repositórios e, até onde vai o nosso

conhecimento, não há na literatura da área estudos sobre a aplicação dos novos

princípios da catalogação em bibliotecas digitais, sendo a maioria das pesquisas

voltadas para modelagem de catálogos em linha estruturados em MARC.

O objeto empírico escolhido para a aplicação do FRBR foi o repositório

“Acervo Digital do INMETRO”. A escolha desta ferramenta bibliográfica se deu

devido à variedade de documentos arrolados em sua base de dados, o que permite

ao usuário encontrar diferentes expressões e manifestações de obras de cunho

científico produzidas por pesquisadores, alunos e parceiros da instituição,

selecionando, assim, aquelas que melhor atendem às suas necessidades

informacionais.

2 REPOSITÓRIOS DIGITAIS

Repositórios representam um novo modelo de comunicação científica:

reúnem, preservam, divulgam e disponibilizam informações de forma dinâmica,

ampliando o acesso a documentos antes restritos às assinaturas de revistas

eletrônicas cujo custo era (e ainda é) muito alto. São bases de dados

3

multidisciplinares que armazenam coleções de documentos digitais disponíveis em

linha por meio da internet o que permite o acesso à distância à obra completa da

qual o pesquisador pode ser produtor, disseminador e usuário. (WEITZEL, 2006).

Um repositório pode ser caracterizado como institucional, quando reúne a

produção científica e intelectual de uma instituição, ou temático, quando reúne a

produção científica e intelectual de uma área. Há autores que conceituam

“repositório institucional” como sinônimo de “repositório digital”, não fazendo

distinção entre eles; outros denominam híbridos os repositórios institucionais cujas

coleções tratam de uma única temática como é o caso do repositório ALICE,

desenvolvido pela EMBRAPA, que reúne documentos sobre agricultura e pecuária.

No entanto, não importa a natureza de um repositório, todos têm as mesmas

características comuns: autoarquivamento da produção científica, acesso livre e

interoperabilidade, podendo ser acessado por qualquer provedor de serviço. De

acordo com Weitzel (2006 p. 61-62), “[...] a interoperabilidade é um fator primordial,

pois possibilita a busca em um só local e a reunião de conteúdos dos diferentes

tipos de publicações online produzidas por diferentes softwares sem conflitos”.

Quanto às coleções, os repositórios guardam uma tipologia de conteúdos e

de formatos documentais diversa, reunindo artigos científicos, livros eletrônicos,

capítulos de livros, preprints, postprints, relatórios, teses, dissertações, trabalhos

apresentados em congressos, palestras, material de ensino (apostilas, slides,

fichamentos, etc.), arquivos multimídia, etc.

Além de promover as instituições, os repositórios dão visibilidade às

produções de seus pesquisadores permitindo a troca de informações e o

compartilhamento de suas coleções com outras instituições sem que haja custos,

sendo o uso e o reuso destas informações um dos dados mais tangíveis para

medirmos a qualidade de uma instituição, pois demonstram sua relevância científica,

aumentando sua credibilidade e o seu reconhecimento junto ao público (CROW,

2002).

O que diferencia o repositório de outras ferramentas bibliográficas é o fato de

ser desenvolvido para atender às necessidades do usuário, que como autor pode

produzir, utilizar e disseminar informações científicas de forma simples e fácil. Isso

acontece porque a ferramenta possui uma arquitetura de informação que permite ao

autor ver e alterar o seu cadastro e atualizar a versão dos documentos de sua

4

autoria a partir de comentários e sugestões recebidas. Mas tudo isso só é possível

porque os repositórios estão inseridos no contexto do movimento internacional que

apoia o livre acesso à informação científica, conforme explicamos a seguir.

Segundo Costa (2006, p. 40), a filosofia aberta é o movimento “[...] em direção

ao uso de ferramentas, estratégias e metodologias que denotam um novo modelo de

representar um novo processo de comunicação científica [...] cujo objetivo é o

acesso amplo e rápido ao conhecimento”.

A Iniciativa dos Arquivos Abertos – Open Archives Initiative (OAI) e o Acesso

Livre/Aberto – Open Acess (OA) são os dois grandes movimentos internacionais que

vem influenciando o surgimento de novas tecnologias de informação e de

comunicação no meio eletrônico pelo fato de reunir e disponibilizar livremente

informações científicas e tecnológicas. De acordo com a Declaração de Bethesda

(2003 apud KURAMOTO, 2006, p. 96) uma publicação de acesso livre deve

satisfazer a duas condições:

1) O(s) autor(es) e o(s) detentor(es) de direitos de reprodução (copyright) concede(m) a todos os usuários o acesso livre, irrevogável, mundial e perpétuo ao trabalho, assim como uma licença de cópia, uso, distribuição, transmissão e exibição pública, e ainda de produzir e distribuir trabalhos dele derivados, em qualquer meio digital, para qualquer finalidade responsável, condicionado à devida atribuição de autoria, e concedem adicionalmente o direito de produção de uma pequena quantidade de cópias impressas para seu uso pessoal. 2) Uma versão integral do trabalho e de todo o material suplementar, incluindo uma cópia da permissão, em um formato eletrônico adequadamente padronizado, é depositada imediatamente após a publicação inicial em um repositório on-line mantido por uma instituição acadêmica, por uma associação científica, por uma agência governamental ou por qualquer outra organização solidamente estabelecida, a qual vise a propiciar o acesso livre, a distribuição irrestrita, a interoperabilidade e o arquivamento de longo prazo.

Existem duas possibilidades de acesso livre à produção científica, a “via

dourada” e a “via verde”. A “via dourada” abriga os artigos que são publicados em

revistas de acesso livre com avaliação dos pares, e a ”via verde” os artigos que são

publicados em revistas que não são de acesso livre, cujos autores ganham um “sinal

verde” das editoras para disponibilizar uma cópia livremente em repositório digital.

No entanto, há casos em que os editores liberam os artigos e os autores não se

interessam em disseminá-lo, cabendo essa tarefa às instituições de pesquisa.

5

A disponibilização e a disseminação de qualquer recurso no ambiente digital

envolvem não somente a inclusão da publicação na Web, mas também questões

tecnológicas que garantam a organização, descrição, preservação e acessibilidade

aos documentos publicados. Dentre essas tecnologias encontra-se o FRBR, modelo

conceitual que possui uma estrutura flexível e simples que muito se assemelha aos

princípios que deram origem ao formato Dublin Core (DC) usado na estruturação

dos metadados descritivos em repositórios institucionais.

De acordo com o documento da IFLA (2009) os FRBR são extensíveis a

qualquer sistema de informação. Daí a necessidade de testá-lo em repositórios,

ferramenta bibliográfica cuja arquitetura muito se aproxima dos fundamentos do

novo modelo: estrutura simples, com sintaxe extensível e próxima da linguagem do

usuário de modo a permitir que o autor/contribuidor ao arquivar um documento

também possa descrevê-lo.

O trabalho de simulação da aplicação do FRBR se fez necessário para

identificarmos as contribuições do novo modelo conceitual no processo de

recuperação da informação em sistemas de acesso aberto, como os repositórios; as

vantagens da modelagem para o usuário e as suas tarefas de encontrar, identificar,

selecionar e obter os recursos, evitando perda de tempo e garantindo-lhe maior

consistência na qualidade das respostas. Em síntese: demonstrar que a descrição

dos metadados quando feita numa estrutura relacional amplia a capacidade de

recuperação da informação além de tornar a atividade de busca uma tarefa simples,

libertando os usuários de ter que refinar suas buscas usando operadores booleanos.

3 O FORMATO DUBLIN CORE

O formato Dublin Core (DC) foi desenvolvido na década de 1990. Diferente

do MARC, que foi criado inspirado nos catálogos das bibliotecas, cujos esquemas de

metadados complexos exigiam treinamentos para ser aplicado, o DC foi pensado

para ser usado por usuários de modo a permitir que estes descrevessem seus

próprios documentos ao depositá-los nos repositórios.

A grande preocupação dos envolvidos na criação deste padrão é que ele não

possuísse muitos elementos para descrição dos recursos em rede de modo que não

se tornasse exaustivo, por isso, chegaram à conclusão que a relação dos elementos

6

não deveria ser extensa, sendo estimulados 15 elementos os quais descrevemos a

seguir tomando por referência o quadro síntese formulado por Mey e Silveira (2009,

p. 135-136). 1. Contribuidor: uma entidade responsável por fazer contribuições ao

recurso. Ex.: uma pessoa, uma organização ou um serviço. 2. Cobertura: tópico

espacial ou temporal do recurso; aplicabilidade espacial do recurso, ou a jurisdição

sob a qual o recurso é relevante; o tópico espacial pode ser um lugar ou uma

localidade especificada em coordenadas geográficas. Um tópico temporal pode ser

um período, data ou datas-limites. Uma jurisdição pode ser uma entidade

administrativa ou um lugar geográfico ao qual o recurso se aplica. 3. Criador:

entidade primariamente responsável por fazer o recurso. Ex.: uma pessoa, uma

organização ou um serviço. 4. Data: ocasião ou período de tempo associados ao

ciclo vital do recurso. 5. Descrição: uma exposição sobre o recurso. A descrição

pode incluir, embora não limitada a tal, um resumo, um sumário, uma representação

gráfica ou um texto livre. 6. Formato: formato do arquivo; o meio físico ou

dimensões do recurso. 7. Identificador: uma referência inequívoca para o recurso

em dado contexto; deve-se identificar o recurso por meio de uma sequência de

caracteres [string] de acordo com um sistema formal de identificação. 8. Idioma: Um

idioma do recurso. Para descrevê-lo deve-se usar um vocabulário controlado para

idiomas. 9. Publicador/Editor: uma entidade responsável por tornar o recurso

disponível. Ex.: um publicador pode ser uma pessoa, uma organização ou um

serviço. 10. Relação: um recurso relacionado; deve-se identificar o recurso

relacionado por meio de uma sequência de caracteres [string] de acordo com um

sistema formal de identificação. 11. Direitos: Informação sobre os direitos existentes

no recurso e sobre o recurso; informação sobre direitos incluem uma declaração

sobre os vários direitos de propriedade associados ao recurso, inclusive de

propriedade intelectual. 12. Fonte: um recurso relacionado do qual se deriva o

recurso descrito. Ressalta-se que um recurso descrito pode derivar, no todo ou em

parte, de um recurso relacionado, por isso deve-se identificar o recurso relacionado

por meio de uma sequência de caracteres [string] de acordo com um sistema formal

de identificação. 13. Assunto: tópico de um recurso. O assunto deve ser

representado por palavras-chave, frases-chave, ou códigos de classificação;

recomenda-se usar um vocabulário controlado. Para descrever tópicos espaciais ou

temporais, usa-se o elemento cobertura. 14. Título: um nome dado ao recurso, ou,

7

nome pelo qual o recurso é conhecido. 15. Tipo: natureza ou gênero do recurso.

Não se aplica a formato. Para descrever o formato do arquivo, o meio físico ou

dimensões do recurso, usa-se o elemento formato

O Dublin Core é o formato mais utilizado para a criação de repositórios e

apresenta as seguintes características: a) flexibilidade – os elementos que o

compõem são opcionais, podendo ser exibidos aleatoriamente e se houver

necessidade podem ser repetidos ou modificados por qualificadores; b) simplicidade

– é de fácil manuseio, sendo autoexplicativo, permitindo que o próprio autor do

documento faça a descrição sem a necessidade de intensos treinamentos; c)

extensibilidade – por ser um modelo simples e flexível, permite que diversas

comunidades em áreas distintas utilizem o padrão trocando informações e obtendo o

acesso a elas; d) interoperabilidade – um modelo comum de descrição utilizado por

diversas áreas o que proporciona aos usuários maior habilidade nas pesquisas; e)

âmbito internacional – embora tenha sido desenvolvido em inglês, já existem

versões em outras línguas (DCMI, 2013).

Em termos institucionais, o DC foi desenvolvido e é mantido pelo Dublin Core

Metadata Initiative (DCMI), uma organização de caráter aberto responsável pela

promoção de padrões e pelo desenvolvimento de vocabulário especializado. Os

membros do DCMI estão distribuídos pelo mundo, realizando worshops e listas de

discussão para troca de experiências e informações. Essa organização tem como

objetivo a interoperabilidade das descrições feitas no DC adaptando suas aplicações

à linguagem XML (Extensible Markup Language) e à semântica da RDF (Resource

Description Framework).

A linguagem XML é importante por fornecer o significado da informação no

documento e pelo fato de não precisar de nenhum programa para fazer sua leitura.

No entanto, descrições em RDF, no contexto da web semântica, precisam de

agentes de softwares capazes de interpretar os metadados de um recurso “de forma

independente, sem ambiguidade, de modo a poder localizá-los, combiná-los com

outros, se for conveniente, e tomar decisões baseadas em conhecimentos que

podem ser inferidos a partir dos significados interpretados” (CAMPOS; CAMPOS;

CAMPOS, 2005, p. 66).

8

De acordo com Marcondes (2005, p. 108) “enquanto a XML é uma linguagem

genérica para a descrição da estruturação de documentos eletrônicos, a RDF é

específica para criar metadados com a finalidade de localizar e identificar recursos.”

São essas especificidades que tornam o DC um padrão de grande

importância para o desenvolvimento da descrição dos recursos em rede, sendo o

mais adequado para o cenário dos repositórios institucionais.

Mas, tal como os formatos, os princípios da catalogação tiveram que se

atualizar dada a diversidade dos recursos que exigem uma nova arquitetura para as

bases de dados de modo que estas possam estruturar seus metadados

disponibilizando suas informações de forma rápida e consistente. Por isso, voltando

à hipótese que deu origem à pesquisa “o uso do modelo conceitual FRBR na

estruturação de metadados descritivos em repositórios institucionais”, na próxima

seção dedicamo-nos a discutir as bases teóricas da catalogação e seus novos

princípios (E-R) de modo a demonstrar os limites e as possibilidades de uso do novo

modelo conceitual na descrição de documentos digitais.

4 MODELO CONCEITUAL FRBR

Desde o final da década de 1990 a representação vem sofrendo mudanças

em seu enfoque. Seu “cerne deslocou-se do item para o usuário, visando permitir-

lhe as tarefas de encontrar, identificar, selecionar e obter uma ‘entidade’ adequada

aos seus propósitos”. (MEY, 2003, p.1). A resposta a essa mudança de paradigma

foi a publicação em 1998 do relatório final do Grupo de estudo da IFLA (Study Group

on the Functional Requirements for Bibliographic Records) contendo a descrição do

modelo conceitual FRBR e as novas diretrizes para a descrição de recursos em

catálogos, repositórios e outras ferramentas bibliográficas.

Essas discussões foram consolidadas na versão final da Declaração de

Princípios publicada em 2009, sendo criado, então, o FRBR Review Group com a

função de cuidar da manutenção da família FRBR de modelos conceituais e

estimular sua aplicação. Como extensões do novo modelo foram criados os

Requisitos Funcionais de Dados de Autoridade (Functional Requeriments for

Authority Data – FRAD), modelo direcionado ao controle de dados de autoridade e

os Requisitos Funcionais de Dados de Autoridade de Assunto (Functional

9

Requeriments for subject Authority Data – FRSAD), modelo ainda em

desenvolvimento e que tem como objetivo o controle de terminologia.

Em síntese: os Requisitos Funcionais para Registros Bibliográficos (FRBR) e

suas extensões são modelos conceituais que reestruturam os registros

bibliográficos, reorganizando os seus elementos através da análise de entidades,

atributos e relacionamentos, proporcionando não só uma nova sintaxe à catalogação

extensível a diferentes tipos de usuários, mas principalmente uma nova semântica.

Para superar as ambiguidades semânticas, o novo modelo aprimorou sua

sintaxe, tornando-a extensível e compreensível aos usuários; identificando para

cada entidade atributos únicos, individualizando-as para depois integrá-las nas

ações de relacionamento durante os processos de busca e recuperação. Para que o

modelo se consolidasse todos os requisitos necessários aos registros bibliográficos

tiveram como base as tarefas genéricas realizadas pelos usuários: encontrar,

identificar, selecionar e obter.

As entidades do Grupo 1 compreendem a realização de um trabalho

intelectual ou artístico, são elas: Obra: entidade abstrata que expressa uma criação

intelectual ou artística. Seu reconhecimento como entidade se dá por meio de suas

expressões (obra literária, musical, científicas, etc.). Os atributos desta entidade

permitem-nos classificar suas expressões e elaborar relações com sua criação

intelectual ou artística. Quando nos referimos a “Dom Casmurro” não estamos nos

referindo a uma edição, mas sim a uma criação intelectual, a uma obra literária,

criada pelo escritor brasileiro, Machado de Assis. Expressão: refere-se à realização

intelectual ou artística de uma obra ao ser elaborada, excluindo-se aí aspectos de

alteração da forma física. Define-se pelo uso de palavra ou frases que especificam o

conteúdo de uma obra; oferece uma distinção no conteúdo (intelectual ou artístico)

entre uma realização e outra da mesma obra. Portanto, diferenças tipográficas não

constituem uma nova expressão, mas qualquer mudança no conteúdo intelectual ou

artístico de uma obra constitui mudança na expressão: uma adaptação ou uma

tradução são apenas expressões de uma obra. Manifestação: é a materialização de

uma expressão de uma obra, ou seja, seu suporte físico, que pode ser livros,

partituras, registros sonoros, etc. Ex. um filme sobre o romance “Dom Casmurro” não

é só uma nova expressão, mas também uma nova manifestação; uma nova leitura

da obra machadiana sob outra forma física. A entidade item traz os atributos que

10

permitem o acesso físico (analógico ou digital) às diferentes expressões e

manifestações de uma obra (MORENO, 2006, SILVEIRA; MEY, 2009).

A entidades do Grupo 2 são uma extensão dos FRBR, chama-se FRAD e

representam os responsáveis pelo conteúdo intelectual ou artístico; pela produção

física e disseminação, ou pela guarda das entidades do primeiro grupo, são

descritas como pessoa ou entidade coletiva”. Pessoa: indivíduo responsável pela

criação ou realização de uma obra, ou aquele que é assunto de uma obra

(biográfico, autobiográfico, histórico, etc.). São definidos como entidade pessoa:

autores, compositores, artistas, editores, tradutores, diretores, intérpretes. Entidade

Coletiva: organizações ou grupos de indivíduos ou organizações, inclusive grupos

temporários (encontros, conferências, reuniões, festivais, etc.) e autoridades

territoriais como uma federação, um estado, uma região, uma municipalidade (ibid).

As entidades do Grupo 3 também são uma extensão do FRBR e chama-se

FRSAD. Representam o conjunto de temas que expressam diferentes acepções

do assunto coberto por uma obra. Inclui as seguintes entidades: Conceito:

abstrações temáticas de uma obra: áreas de conhecimento, disciplinas, escolas de

pensamento, teorias. Ex. Astronomia. Objeto: uma coisa material. Abrange a

categoria de “coisas materiais” que podem ser tema/assunto de uma obra: objetos

animados ou inanimados que ocorrem na natureza, fixos ou móveis; objetos que são

produtos da criação humana ou objetos que já não existam. Ex.: Apollo 11. Evento:

entidade que inclui uma variedade de ações, ocorrências ou acontecimentos:

envolve aspectos históricos, época, período de tempo. Ex.: O século XX. Lugar:

entidade referente a uma série de localizações: terrestres e extraterrestres,

históricas ou contemporâneas, características geográficas e jurisdições geopolíticas.

Ex.: Ilha de Fernando de Noronha. (MODESTO, 2007, p.2)

De modo a entendermos o impacto da aplicação modelo E-R na arquitetura

da informação em bibliotecas digitais, mais precisamente nas operações de

recuperação e acesso às informações armazenadas nos repositórios, realizamos um

estudo empírico no “Acervo digital” do INMETRO, e fizemos uma simulação da

aplicação dos modelos FRBR, FRAD e FRSAD que demonstramos a seguir.

11

4.1 Aplicações do FRBR em repositórios

Com o advento da web e da internet há um crescimento vertiginoso de

diferentes tipos de objetos digitais, o que levou as instituições de pesquisa a

organizarem repositórios de modo a poder administrar esse novo fluxo de

informações. O Brasil não ficou de fora desse movimento e hoje já ocupa o 4o lugar

entre os países que possuem mais repositórios digitais de acesso livre, ficando atrás

somente dos Estados Unidos, Reino Unido e Alemanha (KURAMOTO, 2006, p.

100).

No que diz respeito à arquitetura da informação3, os repositórios estão

estruturados sob o formato Dublin Core, que apesar das inúmeras vantagens ainda

segue os preceitos fundamentados pelas ISBD. No entanto, desde 2009 esse

referencial teórico-metodológico vem se modificando em função do surgimento de

um novo paradigma: a catalogação orientada ao objeto, expressa pelo modelo E-R

(entidade-relacionamento) cuja base para a representação descritiva se encontra no

FRBR.

No campo informacional, a maioria dos estudos sobre a aplicação do FRBR

tem sido feita em catálogos em linha, apesar de a IFLA (International Federation of

Library Associations and Institutions) ressaltar ser o mesmo extensível a outras

ferramentas bibliográficas, conforme explicita o texto da Declaração de Princípios

Internacionais de catalogação:

Os princípios aqui enunciados destinam-se a orientar o desenvolvimento de códigos de catalogação. Aplicam-se a registros bibliográficos e de autoridade e a catálogos correntes de bibliotecas. Os princípios podem também ser aplicados a bibliografias e outros ficheiros (arquivos) de dados criados por bibliotecas, arquivos, museus e outras comunidades. Os princípios pretendem promover uma abordagem consistente à catalogação descritiva e de assunto de recursos bibliográficos de todos os tipos (IFLA, 2009, p. 2).

Para demonstrar a possibilidade de uso do FRBR em repositórios

institucionais, escolhemos como campo empírico para simulação e aplicação do

3 A arquitetura da informação trata não apenas da estrutura de armazenamento de dados, mas este é o seu aspecto primordial, considerando que a estruturação descritiva e temática facilita o resgate do conteúdo informacional aumentando usabilidade do ambiente digital. O que significa dizer que, quanto melhor se descreve os metadados que representam os recursos maior possibilidade de êxito o usuário tem de encontrar o documento desejado. Sobre o assunto ver: LARA FILHO, D. O fio de Ariadne e a arquitetura da informação na WWW. Data Grama Zero – Revista de Ciência da Informação, v. 4, n. 6, dez. 2003.

12

novo modelo conceitual o Acervo Digital do INMETRO, organizado pelo Serviço de

Documentação e Informação (SEDIN). O objetivo da ferramenta é organizar,

preservar e disseminar a produção científica e acadêmica de alunos e

pesquisadores do Instituto, sendo suas coleções compostas dos seguintes

documentos: artigos publicados em periódicos, trabalhos publicados em anais de

eventos, teses e dissertações nas áreas de atuação do Inmetro ou que possuam o

Instituto como objeto de estudo, livros, capítulos de livros e documentos que refletem

a história do INMETRO (SOARES; ARAUJO; GUIA, 2010).

Figura 1. Página inicial do repositório Fonte: INMETRO (2013).

É essa variedade de documentos que dá singularidade ao repositório do

INMETRO. Nele há diferentes expressões de obras (pesquisas científicas) que

nascem como relatórios e que sofrem adequações expressando-se e manifestando-

se como artigos ou papers de eventos; projetos de pesquisa cuja consolidação dos

resultados primeiramente é apresentada na forma de relatório técnico e depois como

folhetos e/ou artigo de periódico; obras que se expressam em outros idiomas

(traduções) e são apresentadas como artigos ou como papers em eventos

internacionais. Enfim, foi essa riqueza bibliográfica que fez do “Acervo digital” a

ferramenta adequada para aplicação do modelo FRBR.

13

Figura 2. Ex. Obras: expressões e manifestações Fonte: INMETRO (2013).

Para desenvolver o repositório, o SEDIN utilizou o software livre DSPACE e o

padrão Dublin Core para a descrição dos metadados dos recursos digitais. A

realização das buscas é feita no display de “busca simples”, sendo permitido ao

usuário navegar por chaves de busca tradicionais (autor, título, assunto e tipo de

documento) ou no display “busca avançada” sendo permitido ao usuário pesquisar

em todo o INMETRO ou escolher uma das coleções de acordo com suas respectivas

áreas temáticas.

Figura 3: busca simples por autor.

Fonte: INMETRO (2013).

14

Figura 4: busca avançada – uso de operadores booleanos. Fonte: INMETRO (2013).

O repositório também possui outros filtros de busca que pode ser por assunto,

título, autor, data de envio do documento e tipologia; artigos em periódicos

indexados, livros científicos, notas técnicas, resumos em anais de congresso,

teses/dissertações, entre outros.

Figura 5: Pesquisa por eixos temáticos. Fonte: INMETRO (2013).

Ao fazer uma busca simples pelo autor “Ribeiro, Leonardo Costa” (ver figura

3) o repositório disponibiliza em ordem alfabética uma lista de autores ordenada sob

15

a forma de cabeçalho. Ao clicar no nome do autor pesquisado, encontramos todas

as expressões e manifestações de suas obras (15 documentos), cabendo ao usuário

realizar as tarefas de identificar e selecionar o recurso de seu interesse. Na atual

arquitetura do repositório, para realizar essas “tarefas” o usuário terá que clicar em

cada título para ter acesso aos metadados descritivos de cada recurso e assim obter

aquele que melhor satisfaz à sua necessidade de pesquisa. Isso ocorre porque na

estrutura Dublin Core a entidade pessoa/autor não mantém uma relação

dialógica/relacional com as outras entidades. Ou seja: a biblioteca é digital, mas o

processo de busca obedece a uma lógica hierárquica (um passo de cada vez), pois

os metadados estão estruturados por campos isolados não por bloco de entidades,

onde as mesmas deveriam aparecer individualizadas por seus atributos e

relacionadas durante o processo de busca e recuperação.

Para vermos as vantagens proporcionadas pelo novo modelo conceitual

FRBR simulou-se uma modelagem na estrutura do repositório tomando como

referência as tarefas de busca e recuperação da informação. Para não tornar o

trabalho cansativo para os leitores foi selecionado para a modelagem apenas um

dos documentos recuperados na busca.

16

Figura 6: aplicação da família FRBR no repositório (arquitetura em Dublin Core) Fonte: Modelagem dos autores a partir de INMETRO (2013).

Numa estrutura FRBR nenhuma informação sobre um recurso fica de fora.

Durante o processo de busca, todas as entidades mantêm algum tipo de

relacionamento como, por exemplo: (obra - formas de expressão e manifestação),

(obra-assunto), (obra- pessoas) sendo a integridade de cada uma destas entidades

garantida pela clareza com que são descritos os seus atributos.

A função do novo modelo conceitual é reunir em uma única busca todos os

registros bibliográficos de uma mesma entidade (obra) relacionando-as com as

17

demais entidades, por isso nesse processo de simulação mostramos as relações

das entidades FRBR-FRAD, FRBR-FRSAD.

O processo de simulação proposto teve como objetivo demonstrar como os

recursos armazenados em repositórios podem ter seus metadados descritivos

estruturados em FRBR, assim como apontar as vantagens dessa modelagem para o

serviço de busca e recuperação da informação. O processo de “modelagem”

reconfigurou a arquitetura do repositório ao distribuir seus 15 elementos descritivos

entre as diferentes entidades e mostrou que o formato Dublin Core suporta a

aplicação do novo modelo conceitual sem que haja perda da integridade do registro

e comprometimento da consistência das respostas.

5 CONSIDERAÇÕES FINAIS

Os repositórios digitais são ferramentas bibliográficas capazes de armazenar

grandes quantidades de dados, por isso seus criadores buscaram um formato mais

flexível: o Dublin Core, que por possuir características simples e ser de fácil

manuseio permite que o próprio autor do documento descreva suas informações

sem precisar de intensos treinamentos como é exigido para aqueles que usam o

formato MARC.

Nesse contexto, o modelo FRBR quando aplicado em repositórios digitais

causa grande impacto na busca e na recuperação da informação. Sua sintaxe

baseada no conceito (E-R) identifica com precisão os recursos digitais, qualifica as

entidades de uma obra e as individualiza através de seus atributos e

concomitantemente as relaciona, o que torna as buscas muito mais dinâmicas e

precisas dando ao usuário a oportunidade de encontrar, identificar, selecionar e

obter as informações de forma simples e rápida,

O processo de simulação mostrou o quanto à aplicação do modelo FRBR

contribuiu para a melhoria das buscas nos repositórios, liberando o usuário de

pesquisas exaustivas, cujo refinamento exige domínio dos recursos de busca ou de

operadores booleanos. Enfim, recursos muito limitados se comparados aos

benefícios do FRBR, cuja resposta de busca apresenta, de uma única vez, todas as

entidades relacionadas à questão de pesquisa, permitindo que num só clique o

usuário conheça todas as expressões e manifestações de uma mesma obra ou as

18

diferentes obras com suas respectivas expressões e manifestações, produzidas por

um mesmo autor.

Durante a simulação ficou provado que o modelo FRBR se ajusta ao formato

Dublin Core sem comprometer a consistência das respostas, sendo todos os

atributos relacionados às respectivas entidades não se perdendo nenhuma

informação acerca das obras. Mas muitos profissionais da informação ainda resistem

em experimentar o novo modelo e isso se dá devido à falta de clareza conceitual

sobre sua aplicação. Por isso antes de adotá-lo, é preciso definir bem seus

conceitos e entender seus fundamentos, pois enquanto houver ambiguidades na

definição de atributos, especialmente aqueles referentes às entidades abstratas

como “obra” e “expressão”, ficaremos sempre num impasse.

Cabe aos profissionais da informação se capacitarem para que tenham

domínio teórico e prático desse novo paradigma, enfrentando com sabedoria os

desafios que se apresentam aos novos rumos da catalogação no século XXI,

colaborando e apontando para as agências normatizadoras os limites e as

possibilidades de aplicação do modelo aos padrões existentes.

REFERÊNCIAS

CAMPOS, M. L. M.; CAMPOS, M. L. A.; CAMPOS, L. M. Web semântica e a gestão de conteúdos informacionais. In: MARCONDES, Carlos Henrique et. al. (Org.). Bibliotecas digitais: saberes e práticas. Salvador, BA: EDUFBA; Brasília; IBICT, 2005. p. 55-74. COSTA, S. M. S. Filosofia aberta, modelos de negócios e agências de fomento: elementos essenciais a uma discussão sobre o acesso aberto à informação científica. Ciência da Informação, Brasília, v. 35, n. 2, p. 30-50, mai./ago. 2006. CROW, R. The case for institutional repositories: a SPARC position paper. Washington, DC, Scholarly Publishing & Academic Resources Coalition, 2002. Disponível em: http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf Acesso em: 15 jun. 2013. DCMI. Dublin Core Qualifiers. Disponível em: <http://dublincore.org/documents/2000/07/11/dcmes-qualifiers/> Acesso em: 25 jul. 2013. ______. Using Dublin Core. Disponível em: <http://www.dublincore.org/documents/2001/04/12/usageguide > Acesso em: 20 jul. 2013.

19

IFLA. Declaração de princípios internacionais de catalogação. 2009. 15f. Disponível em http://www.ifla.org/files/cataloguing/icp/icp_2009-pt.pdf Acesso em: 20 maio 2013 INMETRO. Acervo digital. 2013. Disponível em: http://repositorios.inmetro.gov.br/ Acesso em 20 ago. 2013. KURAMOTO, H. Informação científica: proposta de um novo modelo para o Brasil. Ciência da Informação, Brasília, v. 35, n. 2, p. 91-102, maio/ago. 2006. MARCONDES, C. H. Metadados: descrição e recuperação na Web In: ______ et al. (Org.). Bibliotecas digitais: saberes e práticas. Salvador, BA: EDUFBA; Brasília; IBICT, 2005. p. 77-143 MEY, E. S. A. Não brigue com a catalogação! Brasília: Briquet de Lemos/Livros, 2003. ______; SILVEIRA, N. C. Catalogação no plural. Brasília: Briquet de Lemos/Livros, 2009. MODESTO, F. Da ficha ‘lascada’ aos metadados: os rumos novos da catalogação. 2007. Disponível em: < www.eca.usp.br/prof/fmodesto/textos/> Acesso em: 27 jun. 2013. MORENO, F. P. Requisitos funcionais para registros bibliográficos – FRBR: um estudo no catálogo da Rede Bibliodata. 2006. 199 f. Dissertação (Mestrado em Ciência da Informação) - Universidade de Brasília, Brasília, 2006. SOARES, C. F. S.; ARAÚJO, C. F.; GUIA, B. P. Repositórios institucionais: a experiência do Inmetro. In: CONGRESSO INTERNO DO INMETRO. Trabalhos apresentados, Rio de Janeiro, INMETRO, 2010. WEITZEL, S. R. O papel dos repositórios institucionais e temáticos na estrutura da produção científica. Em Questão, Porto Alegre, v. 12, n. 1, p. 51-71, jan/jun. 2006.