1 Bibliotecas Digitais Centro de Informática Universidade Federal de Pernambuco Almir Moura Glauber...

Preview:

Citation preview

1

Bibliotecas Digitais

Centro de Informática

Universidade Federal de Pernambuco

Almir MouraGlauber AraújoMarcos CardosoMarcos Silva

2

Roteiro Introdução Desenvolvimento de coleções Descrição de conteúdos Consulta e acesso Preservação Aspectos econômicos Conclusões Material de Consulta

3

Introdução

Sociedade da informação marcada pela importância crescente de documentos digitais– Artigos eletrônicos, hipertextos, imagens,…

Grande volume de informação digital:– Computadores pessoais– Avanço da Internet

Ferramentas para atender as necessidades de informação dos usuários– Bibliotecas Digitais

4

Introdução

A biblioteca foi uma das primeiras instituições que fizeram uso de tecnologias da informação e comunicação– Bancos de dados e as redes de computadores– Sistemas de gerenciamento de bibliotecas – Bases de dados catalográficos– OPACs - On-line Public Access Catalogs

Com o barateamento de recursos de memória, versões digitais (eletrônicas) dos próprios conteúdos de informação são disponibilizadas

5

Bibliotecas Digitais

Biblioteca sem um ambiente físico e informação não mais atrelada ao suporte de papel impresso

Interesse impulsionado com o surgimento da Internet na década de 90

Conteúdos de informação estão contidos em formatos digitais diversos – Textos, vídeo, áudio, imagens, hipertextos...

Acessadas pelos usuários a qualquer hora e local

6

Bibliotecas Digitais

Um conjunto de serviços integrados para capturar, catalogar, armazenar, buscar, proteger e recuperar informação;

Em uma biblioteca digital qualquer recurso online pode ser gerenciado e compartilhado, tornando-o muito mais acessível do que antes;

A internet possibilitou o surgimento de bibliotecas com acervos imensos.

7

Bibliotecas Digitais

Desenvolvimento do acervo Descrição dos

conteúdos

Consulta e acesso

PreservaçãoDigital

8

Desenvolvimento do Acervo

Documentos pode ser produzidos originalmente em formatos digitais – Uso de editores de texto, imagens,…– Biblioteca Digital da ACM– Liber com dissertações e teses da UFPE

Documentos podem ser cópias digitalizadas dos documentos originais– Uso de scanner e reconhecimento ótico de

caracteres

9

Biblioteca do Vaticano: com 150 mil manuscritos e 100 mil gravuras e miniaturas

Bibliotecas de Documentos Digitalizados

10

Bibliotecas de Documentos Digitalizados

Projeto Making of America (MoA): cerca de 8500 livros do século 19

11

Internet Archive–Localizada no presidio de São

Francisco, foi fundada por Brewster Kahle, em 1996

–A coleção inclui filmes, audio (em especial de concertos ao vivo), livros e softwares;

–Em 2004 a quantidade de dados chegou a 1 petabyte com média de crescimento mensal de 20 terabytes.

Bibliotecas de destaque na Web

12

Bibliotecas de destaque na Web

Ibiblio– Projeto da Universidade da Carolina do

Norte;– Fundada em 1992 como SunSITE ;– Faz parte do Centro de Domínio Publico

e hospeda o desenvolvimento de projetos open source;

13

Bibliotecas de destaque na Web Library of Congress (LoC)

– É uma das quatro bibliotecas nacionais oficiais dos Estados Unidos;

– A biblioteca física contem cerca de 128 milhões de itens;

– O processo de digitalização já criou 20 terabytes de informação;

– Realiza muitas pesquisas sobre bibliotecas digitais e intercambio de dados.

14

Google Prints Usa o esquema de busca do Google para

encontrar livros, a maioria de domínio publico;

Projeto prevê a digitalização de 16 milhões de livros;

Parcerias com grandes bibliotecas digitais e editoras pode tornar o projeto a maior biblioteca digital do mundo;

Ainda em fase beta.

15

Integração/importação de recursos digitais disponíveis em fontes eletrônicas externas – Outras bibliotecas digitais ou a Internet.

Redes de computadores que permitem transmissão de informação de forma rápida e confiável

Diversos autores apontam uma tendência para a integração de recursos

Desenvolvimento do Acervo

16

As bibliotecas digitais geram novos desafios para descrição de documentos– Formatos digitais heterogêneos– Formatos complexos como hipertextos e arquivos

multimídia

Existem padrões de metadados aceitos internacionalmente– Padrão MARC (Machine Readable Cataloging)– Padrão Dublin-Core

Descrição dos Documentos

17

O registro MARC é dividido em campos identificados por um código de três dígitos numéricos– Código 020: ISBN– Código 100: autor– Código 245: título– Código 260: publicação

Ao todo são cerca de 800 campos com códigos associados

Padrão MARC

18

Padrão MARC – Exemplo de Registro 090   

$a 308 $c R484p $8 1 /  $8 13 /  $8 5 $a 301.2 $c R484p $8 9 

100 1  $a Ribeiro, Darcy, 1922-  245 1 2 $a O povo brasileiro :  $b a formacao e o

sentido do Brasil /  $c Darcy Ribeiro. -  250 $a 2.ed. - 

260 #  $a Sao Paulo :  $b Companhia das Letras,  $c 1995.   $a 476p. :  $b il.    

650 0 3 $a Antropologia - Brasil. $a Cultura - Brasil. $a Etnologia - Brasil. 

901    $a Livro  910    $a BC $a CAC $a FCH $a CE

300

  

19

O significado dos códigos é universal e o conteúdo dos campos segue padrões internacionais como AACR2

Duas bibliotecas usando o formato MARC podem trocar registros entre si

Programas usam códigos e conteúdo dos registros conforme a necessidade– Fazer pesquisa por palavra-chave– Visualizar o registro na tela do computador

Padrão MARC

20

Padrão MARCNúmero de Chamada

308 R484p  Biblioteca Central /   Bib. Filosofia e C. Humanas /   Bib. Artes e Comunicacao 301.2 R484p  Bib. Educação

Autor Principal Ribeiro, Darcy, 1922-  T¡tulo Principal

O povo brasileiro : a formacao e o sentido do Brasil

Edição 2.ed. -  Descrição Física

Sao Paulo :  Companhia das Letras,  1995.

476p. :  il.  Antropologia - Brasil. Cultura - Brasil. Etnologia - Brasil. 

Assuntos

Publicação

21

Padrão MARC que contem mais de 800 elementos de metadados (alguns bastante específicos)

A proposta do padrão DC é definir um conjunto de metadados simples e intuitivo capaz de descrever diferentes documentos digitais

O DC oferece 15 elementos de metadados definidos em cooperação internacional

Padrão Dublin-Core (DC)

22

Descrição de conteúdo (7 elementos)– Título, assunto, descrição, fonte, linguagem,

relacionamentos, cobertura

Propriedade intelectual (4 elementos) – Autor, publicador, colaborador, direitos

Instanciação do documento (4 elementos)– Tipo (texto, imagem, vídeo,...), data, formato,

identificador único

Padrão Dublin-Core (DC)

23

Conjunto mínimo de elementos de metadados compreendidos por qualquer comunidade

Extensões do padrão DC são encorajadas para atender a necessidades específicas– Ex.: elemento “contato” (nome e e-mail da pessoa

ou instituição ao qual o recurso está vinculado)

Conjunto mínimo de elementos devem ser mantido nas extensões

Padrão Dublin-Core (DC)

24

Documentos como hipertexto e multimídia são difíceis de serem descritos– Páginas com inúmeros relacionamentos, com

vídeos, arquivos para download... – Metadados para descrever contexto de

arquivos multimídia

Soluções têm sido propostas, usando normalmente estruturas em hipertexto– XML (eXtensible Markup Language)– RDF (Resource Description Framework)

Descrição dos Documentos

25

Diferentes tipos de ferramentas para recuperação de informação– Pesquisa por palavra-chave, booleana, pesquisa em

linguagem natural, navegação em estruturas hierárquicas, navegação em hipertexto

Catálogos On-Line: OPACs (On-line Public Access Catalogs)

Acesso aos conteúdos de informação:– Download, leitura da tela do computador, pay-per-

view,...

Consulta e Acesso

26

Definição das ferramentas devem levar em conta as especificidades dos usuários– Idade, contexto social, diferentes habilidades no uso de

computadores,... Melhorar o desempenho das ferramentas de

acesso envolve: – Pesquisa nos aspectos cognitivos dos usuários– Modelos individualizados de perfil do usuário– Técnicas de inteligência artificial

Consulta e Acesso

27

Preservação Digital O que seria Preservação?

– Preservar o que não pode ser manuseado

– Tentar garantir a integridade da informação

– Evitar a perda de informação

28

Preservação Digital - Objetivos Auxiliar a preservação dos documentos originais

Tentar garantir que a informação digital esteja disponível para acesso pelas gerações futuras

2225?

29

Preservação Digital Dificuldades:

– Vida útil dos meios físicos de armazenamento

– Obsolescência dos dispositivos computacionais usados

para armazenar e visualizar documentos• Meios físicos• Software

– Mudança de versão, perda de informação

30

Preservação Digital - Estratégias Migração para formatos mais seguros

Migração para meios físicos de armazenamentos mais seguros

31

Preservação Digital - Estratégias Construção de infra-estrutura para preservação

– Software para preservação, dispositivos para armazenamento, pessoal qualificado,...

32

Aspectos Econômicos Gastos com infra-estrutura

– Acesso a internet, softwares de edição, reconhecimento óptico…

33

Aspectos Econômicos

Gastos com pessoal qualificado– Administradores, profissionais da informação,

programadores,…

34

Aspectos Econômicos Custos relacionados ao desenvolvimento das

coleções– processo de digitalização.

Custos relacionados ao acesso às fontes de informação. – Gastos com direitos de acesso

35

Aspectos Econômicos Custos relacionados ao acesso às fontes de

informação. – Gastos com direitos autorais

36

Aspectos Econômicos Preservação dos documentos

– Custos da preservação digital são difíceis de serem estimados a longo prazo

– Como estimar o preço de uma coisa que tem valor• Cultural• Histórico

37

Conclusões

Tendências – Buscar mais informações

• Biblioteca híbrida– Sistema de busca

• Integração de fontes de informações

38

Conclusões

Tendências – Buscar adoção de padrões

• W e b

• Padrões para descrição de documentos para a internet

39

Conclusões

Exigências para o profissional da informação– Lidar com as novas tecnologias de informação e

comunicação

– Lidar com equipes de profissionais de formações heterogêneas

– Constante atualização de seus próprios conhecimentos e competências

40

Conclusões

Interesse crescente nas bibliotecas digitais– Educação, entretenimento, negócios,…

41

Material de Consulta

E. Fox e O. Sornil, “Digital Libraries”, Modern Information Retrieval, Baeza-Yates e Ribeiro-Neto (Eds), 1999

Revista Ciência da Informação– M. B. da Cunha, “Desafios para a construção de uma

biblioteca digital”, Vol. 28(3), 1999– P. Z. Marchiori, “Ciberteca ou biblioteca virtual”,

Vol. 26(2), 1997– M. Levacov, “Bibliotecas virtuais: (r)evolução”,

Vol.26(2), 1997

42

Material de Consulta

E. Fox, R. Akscyn, M., R. Furuta e J. Leggett, “Digital Libraries”, Communications of the ACM, Vol. 38(4), 1995

Universidade de Michigan, Making of America, Humanities Text Initiative, www.hti.umich.edu

ACM Digital Library, www.acm.org

43

Bibliotecas Digitais

Centro de Informática

Universidade Federal de Pernambuco

Almir MouraGlauber AraújoMarcos CardosoMarcos Silva