57
) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Embed Size (px)

Citation preview

Page 1: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

)Otávio Alexandre J. de Oliveira

Coordenadoria de Informação BibliográficaFundação Biblioteca Nacional

Biblioteca Nacional Digital

Page 2: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Introdução

Preservação

Acesso

O que está por vir...

Biblioteca Nacional Digital

Sumário

Page 3: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Biblioteca Nacional Digital

Inaugurada em 2006

Laboratório mais bem equipado do país.

Base de dados com aproximadamente 18.000 itens.

120.000 imagens processadas.

Acesso ao site : 17.000 em Junho e 392.000 ao ano.

Page 4: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Objetivo da digitalização ?

Preservar

Dar acesso

Page 5: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Preservação digital

O foco é preservar os objetos digitais independente do seu uso

Não tem relação com os meios de armazenamento - CD, DVD, fitas magnéticas, etc. (um CD bem guardado pode durar 100 anos, mas haverá aparelho para tocá-lo daqui a 20 anos?)

O objetivo é o acesso contínuo

Page 6: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Preservação digital

Hoje a perda de conhecimento já é um problema.

Estamos gerando muito mais informação, e armazenando-as em meios cada vez mais transitórios.

Tudo está nos discos rígidos, em data centers.

Os discos rígidos nunca foram destinados para longo armazenamento, por essa razão nunca foram testados adequadamente para saber a sua vida útil.

Não há informação precisa sobre o tempo de sua durabilidade. Talvez 20 ou 30 anos.

Page 7: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Preservação digitalOs discos rígidos mais modernos possuem uma densidade de armazenamento bem maior, são velozes e possuem sistemas sofisticados para combater falhas, mas...

Quanto mais dados você armazena num material, mais você perde quando partes dele são degradadas ou danificadas.

Estudos e testes de confiabilidade de mídia digital, mostram que o CD-R (com uma camada reflexiva de ouro e uma camada de tintura ftalocianina) poderia durar uns 100 anos.

Page 8: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Preservação digital

20

13

26

7

27

100

27

10

7

0 20 40 60 80 100 120

Fita analógica

Fita digital

CD de áudio, filme em DVD

CD-R (cianina)

CD-RW, DVD-RW, DVD+RW

CD-R (ftalocianina, camada de prata)

CD-R (ftalocianina, camada de ouro)

DVD-R, DVD+R

Memória flash

Mídias eletrônicas - longevidade (anos)

Fonte: Infoexame, maio 2010

Page 9: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Preservação digital

Atenção: “ As condições em que a mídia é armazenada podem ser muito mais importantes do que sua estabilidade inerente: unidades guardadas em locais secos e frescos vão durar muito mais que aquelas expostas ao calor e à umidade.”

A vasta quantidade de material será um problema para recuperação. O que sobrevive por mais tempo, não necessariamente é o mais importante.

Em um conjunto de dados quanto mais cópias são feitas, maiores as suas chances de sobrevivência, descoberta e recuperação. Alguns dados são muito copiados porque são úteis, como sistemas operacionais, mas na maioria das vezes o critério é a popularidade.

Page 10: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

1 - Captura da imagem master

2 - Controle de qualidade

3 – Armazenamento

Captura digital

Preservação digital

Page 11: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Arquivos RAW :

Captura digital

São representações cristalinas e não comprimidas do que é capturado pelos sensores da câmera . São imagens totalmente não processadas.

É o “negativo da fotografia digital”.

1 - Captura da imagem master

Page 12: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Captura da imagem masterCaptura Digital

Conversão de formato RAW na câmera para outro formato padrão

Transmissão do dado RAW

Edição da imagem em software de edição

Edição do formato RAW em software de edição

Armazenamento da imagem processada

Armazenamento da imagem não processada

Opção de conversão para formato padrãoe armazenamento da imagem processada

Page 13: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

O padrão de captura na Biblioteca Nacional é de 300 dpi,

obedecendo o tamanho original do documento.

O arquivo TIF convertido do Raw é armazenado para

preservação, e posteriormente são gerados os arquivos

derivados para disponibilização na Web.

Captura digital

Page 14: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Resolução

Profundidade da imagem

2 - Controle de qualidade

Page 15: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Resolução concerne o número de pixels ou pontos por polegada (dpi). Quanto mais pixels, mais detalhes são capturados.

Quanto maior a resolução maior o tamanho do arquivo.

Pontos por polegada - DPI (dots-per-inch) ou : Unidade associada à medida de resolução de imagens que leva em conta a quantidade de pontos que existem dentro de uma unidade de área, no caso a polegada quadrada. É uma unidade para densidade de pontos.

Resolução

Page 16: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Resolução de uma imagem não é a sua Definição. A imagem pode ser bem definida, ter boa qualidade, mas que por sua vez pode ou não ter uma alta resolução.

Maior a resolução da imagem = maior o numero de pontos que a compõe = melhor é sua definição

Resolução

Page 17: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Resolução X Qualidade

Dpi - dot per inch – pontos por polegada

1 polegada = 2,54 cm 1 2 3 4 5 6 7

Page 18: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Resolução

300 dpi é o padrão mínimo para utilização de OCR (Optical Character Recognition)

Page 19: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Resolução

Patamar de megapixels

Tamanho típico da imagem

Em 200 dpi Em 300 dpi Em 400 dpi

1 1.280 x 960 16,3 x 12,2cm 10,8 x 8,1cm 8,1 x 6,1cm

2 1.600 x 1.200 20,3 x 15,2cm 13,5 x 10,2cm 10,2 x 7,6cm

3 2.048 x 1.536 26 x 19,5cm 17,3 x 13cm 13 x 9,8cm

4 2.272 x 1.704 28,9 x 21,6cm 19,2 x 14,4cm 14,4 x 10,8cm

5 2.560 x 1.920 32,5 x 24,4cm 21,7 x 16,3cm 16,3 x 12,2cm

6 3.072 x 2.048 39 x 26cm 26 x 17,3cm 19,5 x 13cm

8 3.264 x 2.448 41,5 x 31,1cm 27,6 x 20,7cm 20,7 x 15,5cm

Page 20: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Resolução da imagem

256 x 256 pixels 128 x 128 pixels 64 x 64 pixels

- Com a perda de resolução a uma degradação da imagem- Profundidade é mantida de 256 níveis de cinza (8 bits)

Page 21: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Profundidade

16 níveis de cinza 08 níveis de cinza 02 níveis de cinza

- A resolução é mantida de 256x256 pixels- Detalhes da imagem original (a), aparecem como forma homogêneas na de menor profundidade (c)

Resolução da imagem

Page 22: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Profundidade da imagem

A profundidade em bits faz referência à quantidade de informações sobre a cor que o scanner captura em cada ponto. Uma maior profundidade de bits resultará na exibição de mais gradações de cor e que o documento ou foto digitalizado seja mais parecido com o

original.

Page 23: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

bits (binary digit)

Profundida de cor

Page 24: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

bits (binary digit)

Profundida de cor

Page 25: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

A Nomeação e arquivamento dos arquivos é sistêmico

As pastas dos arquivos tem a mesma estrutura de guarda dos documentos originais

Os arquivos digitais derivados possuem mesma estrutura dos arquivos master

Os arquivos são armazenados em HDs (on line) e DVDs e HDs (off line) em ambientes adeguados.

3 - Armazenamento

acervo_digital

div_iconografia

div_manuscritos

div_musica

Objdigital.bn.br

etc....

Page 26: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Modelo de armazenagem em DVD

Page 27: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

ACESSO

VISUALIZAÇÃO

COMPRESSÃO

Page 28: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Para melhor disponibilidade na web os arquivos digitais são reduzidos.

A escolha do programa de compressão depende do tipo de recurso

Há dois tipos de recursos: Simples : composto de única imagem Multi-parte : composto de várias imagens

Compressão e Visualização

Page 29: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Compactação/Compressão

Som :

• MP3 (MPEG Audio Layer-3) – áudio com pouca perda e redução de arquivo em 90%

• MID (Musical Instrument Digital Interface) – grande vantagem de arquivos bem pequenos

Imagem :

• MP3 (MPEG Audio Layer-3) – áudio com pouca perda e redução de arquivo em 90%

• MID (Musical Instrument Digital Interface) – grande vantagem de arquivos bem pequenos

Page 30: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Recursos simples

Recursos multi-partes

JPG

Zoomify

DjVu

PDF

ContentE

Compactação/Compressão - Imagem

MrSid

Page 31: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

.JPEG (Joint Photographic Experts Group)

O principal esquema de compressão com perda (lossy) é o JPEG

Este esquema permite selecionar o grau de compressão, sendo as mais comuns entre 10:1 e 40:1.

Foi sancionado pela ISO (International Standards Organization)

Compressão e Visualização

Page 32: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Os sistemas com perda, como JPEG, utilizam uma maneira de compensar ou descartar a informação menos importante, baseada em um entendimento da percepção visual.

Na web fica difícil detectar os efeitos da compressão com perda, e a imagem pode considerar-se "sem perda visual".

Compressão e Visualização

Page 33: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

.JPEG (Joint Photographic Experts Group)

Page 34: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Compressão e Visualização

.MrSID (Multi-Resolution Seamless Image Database)

Utiliza-se o software Mr.SID baseado em wavelet.

Permite aos usuários com um browser padrão fazer zoom, obtendo assim mais e mais detalhes.

Comprime imagens sem perda visual da qualidade da imagem original, e ao mesmo tempo mantém a precisão geométrica a nível de pixel

Page 35: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Compressão e Visualização

.PDF (Portable Document Format)

Preserva a aparência e a integridade dos documentos

originais independentemente do aplicativo e da plataforma

que foram usados para criá-lo.

OCR FullText: funcionalidade da tecnologia de

reconhecimento de caracteres (OCR) onde é possível utilizar

a conversão completa da imagem em texto para realizar a

consulta do documento.

Page 36: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

.DJvu (Déjà vu)

Compressão e Visualização

Os arquivos DjVu são 1.000 vezes menores que TIFF e de 10 até 100 vezes menores que JPEG ou PDF, dependendo de como os arquivos JPEG e PDF foram criados

Page 37: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Permite zoom de alta qualidade com rapidez

Integra JPEG, HTML e Flash

Um programa livre (Free), sem custo

Compressão e Visualização

.Zoomify

Page 38: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital
Page 39: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital
Page 40: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Editor de Conteúdos Estruturados

Compressão e Visualização

.ContentE

.Funcionalidades

Processa imagens no formato TIFF, GIF, JPEG, TxT, e PDF Gera cópias de obras em XHTML aplicando estilos Criação de múltiplos índices de visualização de uma obra Exportação e importação de uma obra em XML, seguindo o formato METS Geração de cópias estruturadas em XHTML ou PDF

Page 41: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital
Page 42: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital
Page 43: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital
Page 44: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Vantagens do arquivo digital

Preservação diminuição do acesso aos originais

fidelidade ao original

fidelidade na multiplicação das cópias

Acesso múltiplo acesso simultâneo

distribuição em rede

variedade de arquivos derivados

economia de espaço de armazenagem

Page 45: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Metadados

Page 46: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Metadados

METADADO: um dado, ou um conjunto de dados, que descrevem um objeto ou informação. No contexto de imagem, o metadado pode ser resumido como uma chave de identificação de um documento (imagens) que será utilizado para recuperá-lo.

O termo “Metadado” começou a ser usado em 1994.

Page 47: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

ISO 15836 (2003)

Esquema de metadados utilizado pela Biblioteca Nacional

Page 48: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

O que está por vir...

Rosetta Disk – são discos de níquel gravados com texto que inicia em tamanho normal e depois encolhe para escala microscópica.

Primeiro disco contém textos em 1000 línguas. Num tamanho legível a partir de uma ampliação de 1000 vezes, cada disco suporta 30.000 páginas de texto ou imagens.

Page 49: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Biblioteca Nacional Digital

Page 50: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital
Page 51: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Biblioteca Nacional Digital

Page 52: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Referência:

BETTENCOURT, Ângela Monteiro. Preservação digital. (formato em Power Point) – Arquivo.

BETTENCOURT, Ângela Monteiro. Digitalização e acesso. (formato em Power Point) – Arquivo

InfoExame, maio 2010.

Page 53: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

World Digital Library

Page 54: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital
Page 55: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital
Page 56: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital
Page 57: ) Otávio Alexandre J. de Oliveira Coordenadoria de Informação Bibliográfica Fundação Biblioteca Nacional Biblioteca Nacional Digital

Muito obrigado

[email protected]

http://bndigital.bn.br/