2006-05-05
Universidade do Minho
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
ho
Miguel [email protected]
Preservação Digital
conceitos, estratégias e actuais consensos
Universidade do Minho
2
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoContextualização
• Vivemos na era digital– Grande parte da actual produção
intelectual é criada em formatos digitais
– Facilidades na sua criação e disseminação
– Qualidade dos resultados obtidos
• Rápida obsolescência da tecnologia– Embora um objecto digital possa ser
copiado inúmeras vezes sem perder qualidade
– Depende de um contexto tecnológico para que possa ser interpretado
– Os objectos acabam prisioneiros dos seus próprios suportes e/ou formatos
Universidade do Minho
3
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoPreservação Digital
Webb, C., Bradley, K., Campbell, D., Clifton, G., Corbould, M., O’Connor, M., Phillips, M. and Whiting, J. Guidelines for the Preservation of Digital Heritage, Information Society Division - United Nations Educational, Scientific and Cultural Organization, 2003.
Conjunto de actividades ou processos responsáveis por garantir o acesso continuado a longo-prazo à informação e restante património cultural existente em formatos digitais
Universidade do Minho
4
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoLongo-prazo
Consultative Committee for Space Data Systems Reference Model for an Open Archival Information System (OAIS) - Blue Book. National Aeronautics and Space Administration, Washington, January 2002.
Período de tempo suficientemente longo para que haja preocupação com o impacto da evolução da tecnologia (incluindo o aparecimento de novos suportes e/ou formatos de dados), assim como, com alterações ao nível dos requisitos/exigências impostos pela comunidade de consumidores da informação preservada.
Universidade do Minho
5
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoObjecto, Material ou Recurso Digital
Thibodeau, K., Overview of Thechnological Approaches to Digital Preservation and Challenges in Coming Years. in The State of Digital Preservation: An International Perspective, (Washington D.C., July 2002), Documentation Abstracts, Inc. - Institutes for Information Science.
• e.g. databases, spreadsheets, word processor documents, webpages, video, audio, images, maps, 2 and 3D models, computer software, etc…
Tudo que possa ser representado em formato digital, quer tenha nascido digital, quer tenha sido convertido a partir de formatos analógicos
Universidade do Minho
6
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoAnalógico versos Digital
Universidade do Minho
7
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoAnalógico versus Digital
Universidade do Minho
8
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoA anatomia dum Objecto Digital
• Nível Conceptual– Aquilo com que lidamos no mundo
real; o que reconhecemos como uma unidade significativa de informação
– e.g., jornal, livro, mapa, fotografia
• Nível Lógico– Codificação da informação – Tarefa realizada pelo software– Trata-se do formato do objecto
• Nível Físico– Sinais inscritos em suporte físico – e.g. disco rígido, CD, Pen-drive
Objecto Físico
Objecto Lógico
Objecto Conceptual
Thibodeau, K., Overview of Thechnological Approaches to Digital Preservation and Challenges in Coming Years. in The State of Digital Preservation: An International Perspective, (Washington D.C., July 2002), Documentation Abstracts, Inc. - Institutes for Information Science.
Universidade do Minho
9
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoA anatomia dum Objecto Digital
CD, DVD, Disco Rígido, Tape, memória Flash, etc.
PDFWord
Tese de DoutoramentoObjecto Conceptual
Objecto Lógico
Objecto Físico
Thibodeau, K., Overview of Thechnological Approaches to Digital Preservation and Challenges in Coming Years. in The State of Digital Preservation: An International Perspective, (Washington D.C., July 2002), Documentation Abstracts, Inc. - Institutes for Information Science.
Se um dos níveis se tornar obsoleto o objecto conceptual deixa de estar acessível
Universidade do Minho
10
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
ho
Estratégias de Preservação
Universidade do Minho
11
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoEstratégias de Preservação
• Foco no objecto físico/lógico– Preocupação em preservar a informação nos
seus formatos lógicos e/ou físicos originais– Utilização da tecnologia originalmente
associada a estes objectos para garantir o acesso aos mesmos
– Preservação de tecnologia
• Foco no objecto conceptual– Preocupação em preservar as características
essenciais dos objectos digitais de uma forma independente do hardware e do software
– Preservação de objectos conceptuais
Universidade do Minho
12
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
ho
Preservação de tecnologia(físico/lógico)
Universidade do Minho
13
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoRefrescamento
Transferência de informação de um suporte físico de armazenamento para outro mais estável antes que o primeiro se deteriore ou se torne irremediavelmente obsoleto
Universidade do Minho
14
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoPreservação de tecnologia
• Museus de hardware– Preservação do contexto de
criação/interpretação original em museus de hardware e software obsoleto
• Demasiado dispendioso• Dificuldade em mater o hardware operacional a
longo-prazo• Restrições elevadas no acesso à informação• Dificuldade na reutilização da informação
• Digital tablet– Um computador portátil com um ecrã
sensível ao tacto especializado na interpretação de determinados tipos de material
– Possui as mesmas desvantagens da preservação de hardware
Universidade do Minho
15
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoEmulação
• Vantagens– Recriação do contexto tecnológico original – Preservação do look & feel do objecto
• Desvantagens– Os próprios emuladores estão sujeitos a
obsolescência– Os utilizadores são obrigados a operar sistemas
obsoletos– A construção de emuladores é um processo complexo – Problemas de direitos de autor– Preservar um sistema operativo inteiro apenas para
visualizar um documento parece uma tarefa exageradamente pesada
– Não garante a reutilização da informação.
Software capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software
Universidade do Minho
16
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoEncapsulamento
• Vantagens– Permite adiar as responsabilidades de
preservação– Orientado a objectos que apenas serão acedidos
num futuro longínquo– Desenvolvimento de visualizadores, migradores
ou emuladores apenas no futuro
• Desvantagens– Objectos complexos possuem especificações
complexas– Uma especificação incompleta poderá ter um
efeito desastroso
Preservação do bit stream original juntamente com metainformação capaz de garantir a sua futura interpretação
Universidade do Minho
17
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoUniversal Virtual Computer
• Variante da Emulação e Encapsulamento• Preservação do bit stream original +
parser compilado para uma máquina virtual (e.g. Java)
• A máquina virtual será facilmente reproduzida no futuro
• Simplifica o processo de emulação• Está limitada a um conjunto finito de
operações• Necessita de software de visualização• Estratégia ainda em estudo (interpretação
muito lenta)
Raymond Lorie, IBM
Universidade do Minho
18
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
ho
Preservação do objecto conceptual
Universidade do Minho
19
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoMigração
• Descrição– Transferência periódica de material digital de uma
configuração de hardware/software para outra mais actual
– Concentra-se na preservação das características essenciais do objecto sem se preocupar em manter o bit stream original
• Vantagens– Disseminação dos materiais em formatos
actualizados que os consumidores reconhecem– Sem necessidade de preservar o software original– A estratégia mais aplicada e a única que funcionou
até ao momento
• Desvantagens– Possível perda de informação durante a conversão– Necessidade de diligência continua – Dispendiosa a longo-prazo
Universidade do Minho
20
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoMigração (variantes)
• Print-out– Transferir o objecto digital para um meio
analógico mais persistente (e.g. imprimir em papel)
• Actualização de versões– Actualização dos formatos utilizando software
retro-compatível – e.g. utilização do Word 6 para actualizar um
documento criado com o Word 5
• Migração entre formatos– Conversão para formatos rivais
• Normalização– Migração para um número mais reduzido de
formatos normalizados
Universidade do Minho
21
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoMigration on Request
• Variante da migração com o objecto de fazer diminuir a perda de informação
• Preservação do bit stream original• Manutenção de uma ferramenta capaz de converter
o bit stream original para formatos actuais
Universidade do Minho
22
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoMigração distribuída
t1
t4
t2
t3
t5
t6 t7
<.9, .8, .95, .1>
<.5, .3, .95, .6>
<.5, .3, .95, 1>
<.9, .6, .9, .7>
<.3, .6, .9
5, .1>
<.7, .5, .65, .1>
<.9
, .8, .6
, .1>
Universidade do Minho
23
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
ho
O modelo de referência OAIS
Universidade do Minho
24
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoModelo de referência OAIS
• Define os componentes funcionais básicos presentes num sistema de arquivo com responsabilidade de preservação– Interfaces internas e externas – Caracteriza os objectos digitais manuseados– Determina a terminologia a utilizar no contexto da
preservação
• Desenvolvido pelo Consultative Commitee for Space Data Systems (CCSDS)– Grupo responsável por estabelecer normas para os
dados produzidos por agências espaciais
• Aprovado como uma norma ISO em Janeiro de 2002 (ISO 14721)
Consultative Committee for Space Data Systems Reference Model for an Open Archival Information System (OAIS) - Blue Book. National Aeronautics and Space Administration, Washington, January 2002.
Universidade do Minho
25
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
ho OAIS (Intervenientes)
• Produtor– Responsável pela criação e depósito do material
• Consumidor– Aquele que procura encontrar itens de informação
• Gestão– Responsável pela gestão do arquivo digital
Universidade do Minho
26
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
ho OAIS (Componentes Funcionais)
• Ingestão– Recepção, validação, transformação, descrição da
informação submetida pelos produtores• Armazenamento
– Garante a preservação da informação a nível físico e lógico (e.g. refrescamento, migração, verificação de integridade, disaster recovery, etc.)
• Gestão de metainformação– Responsável pela gestão da metainformação associada aos
objectos custodiados
Universidade do Minho
27
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
ho OAIS (Componentes Funcionais)
• Planeamento de preservação– Monitoriza o ambiente externo quanto a modificações na
tecnologia ou comunidade de utilizadores que poderão afectar a estratégia de preservação
• Acesso– Localização, pedido, transformação e entrega de objectos
digitais aos consumidores– Controlo de acessos
• Administração– Dá suporte às operações do dia-a-dia– Coordena as restantes actividades
Universidade do Minho
28
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
ho OAIS (Information Packages)
• Pacote de submissão (SIP)– Objecto digital fornecido– Metainformação disponibilizada pelo produtor
• Pacote de arquivo (AIP)– Objecto digital a arquivar– Metainformação suficiente para garantir a preservação e o
acesso ao objecto• Pacote de disseminação (DIP)
– Objecto no formato que será entregue ao consumidor– Metainformação relevante
Universidade do Minho
29
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoConclusões
• Emulação versus Migração– Emulação para preservação de software e
objectos complexos/interactivos– Migração para a preservação dos restantes
objectos digitais
• Não existe uma solução única e adequada a todos os tipos de material
• Preservação do bit stream original– Hoje em dia reconhece-se que para garantir a
preservação será necessário alterar o objecto preservado
– Os objectos analógicos (e.g. livros) também são modificados ao longo do tempo (e.g. escurecimento das folhas)
Universidade do Minho
30
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoConclusões
• A decisão sobre que estratégia de preservação adoptar depende de vários factores:– Simplicidade de implementação a curto e
longo-prazo– Custo– Restrições legais– Satisfação da comunidade de interesse
• Avaliação/selecção vs arquivar cegamente– O preço/Mb decresce com o tempo– O preço do homem/mês aumenta com o tempo– “Prefiro ser condenado por algo que fiz do que por
algo que não fiz” (Lesk, Internet Archive)
Universidade do Minho
31
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoDiscussão
Universidade do Minho
32
Mes
trad
o em
Inf
orm
átic
a
Uni
vers
idad
e do
Min
hoQuestões
• Dê exemplos de objectos digitais que gostaria de ver preservados por um longo período de tempo. Justifique.
• Que medidas poderiam ser tomadas para preservar cada uma dos objectos que identificou?