41
Preservação digital em repositórios Preservação digital em repositórios confiáveis confiáveis Miguel Ángel Márdero Arellano MCT/Ibict [email protected]

Preservação 2

Embed Size (px)

Citation preview

Page 1: Preservação 2

Preservação digital em repositórios confiáveisPreservação digital em repositórios confiáveis

Miguel Ángel Márdero Arellano MCT/Ibict [email protected]

Page 2: Preservação 2

121

2

3

4

56

7

8

9

10

11

Page 3: Preservação 2

Repositórios digitais confiáveisRepositórios digitais confiáveis

Metadados de preservaçãoMetadados de preservação

Modelos de referênciaModelos de referência

Leituras recomendadasLeituras recomendadas

Page 4: Preservação 2

A confiança que a comunidade A confiança que a comunidade acadêmica tem depositado em acadêmica tem depositado em certos recursos digitais certos recursos digitais reconhecidos e qualificados reconhecidos e qualificados pelos pares leva à certa pelos pares leva à certa urgência na busca por urgência na busca por estratégias para desenvolver, estratégias para desenvolver, gerenciar e preservar gerenciar e preservar conteúdos digitais.conteúdos digitais.

Page 5: Preservação 2

HOJE já existe....HOJE já existe....

Reconhecimento da importância da Reconhecimento da importância da preservação digital baseada no preservação digital baseada no pressuposto de que é necessário pressuposto de que é necessário desenvolver repositórios digitais desenvolver repositórios digitais confiáveis que assegurem não só as confiáveis que assegurem não só as migrações mas também o contexto, migrações mas também o contexto, estrutura e acessibilidade dos estrutura e acessibilidade dos documentos digitais.documentos digitais.

Page 6: Preservação 2

OAIS OAIS (Reference Model for na Open Archival Information (Reference Model for na Open Archival Information System) System) Norma ISO 14721:2003Norma ISO 14721:2003

SAAI (Sistema Aberto de Arquivamento de Informação)SAAI (Sistema Aberto de Arquivamento de Informação)NBR 15472NBR 15472

Desenvolvido para os repositórios de dados das agências espaciais Desenvolvido para os repositórios de dados das agências espaciais dos Estados Unidos pelo Consultative Committee for Space Data dos Estados Unidos pelo Consultative Committee for Space Data Systems (CCSDS) e avaliado por grupos de trabalho internacionais Systems (CCSDS) e avaliado por grupos de trabalho internacionais (1995-2003).(1995-2003).

Não é um plano de implementação, mas prove um esquema para a Não é um plano de implementação, mas prove um esquema para a arquitetura e operacionalidade de um repositório digital e definição arquitetura e operacionalidade de um repositório digital e definição dos seus metadados.dos seus metadados.

Page 7: Preservação 2

Sistemas de preservação digital que seguem o modelo OAIS:Sistemas de preservação digital que seguem o modelo OAIS:

• CDPP (Centre de Données de la Physique des Plasmas) ;CDPP (Centre de Données de la Physique des Plasmas) ;• DIAS (DIAS (Digital Information Archival System)Digital Information Archival System);;• DIOnAS (DIOnAS (Data Ingest and Online Access Sub-SystemData Ingest and Online Access Sub-System););• DiVA Project (DiVA Project (DigitalaDigitala VetenskapligaVetenskapliga ArkivetArkivet););• IMAGE project (IMAGE project (Imager for Magnetopause-to-Aurora Global Imager for Magnetopause-to-Aurora Global

ExplorationExploration););• Iniciativa DSpace do MIT Iniciativa DSpace do MIT ((Massachusetts Institute of Massachusetts Institute of

Technology)Technology)• JSTOR (JSTOR (Journal StorageJournal Storage););• LOCKSS (LOCKSS (Lots of Copies Keep Stuff SafeLots of Copies Keep Stuff Safe););• LOTAR (LOTAR (Long Term Archiving and Retrieval and Product Data Long Term Archiving and Retrieval and Product Data

within the Aerospace Industrywithin the Aerospace Industry).).• MoReq (MoReq (Model Requirements for the Management of Model Requirements for the Management of

Electronic RecordsElectronic Records))• Digital Archive (OCLC)Digital Archive (OCLC)• PANDORA (National Library of Australia)PANDORA (National Library of Australia)

Page 8: Preservação 2

Em 1996, a Commission on Preservation and Em 1996, a Commission on Preservation and Access e o RLG publicaram o relatório Access e o RLG publicaram o relatório Preserving Digital Information: Report of the Task Preserving Digital Information: Report of the Task Force on Archiving of Digital InformationForce on Archiving of Digital Information..

Contribuição:Contribuição:Proveu uma visão da realidade a ser avaliada e Proveu uma visão da realidade a ser avaliada e uma base arquivística para o desenvolvimento do uma base arquivística para o desenvolvimento do OAIS; introduziu conceitos como: Conteúdo, OAIS; introduziu conceitos como: Conteúdo, Contexto, Permanência, Referência e Contexto, Permanência, Referência e Proveniência.Proveniência.

Page 9: Preservação 2
Page 10: Preservação 2

CERTIFICAÇÃOCERTIFICAÇÃO

Em 1999 a NARA realizou um Em 1999 a NARA realizou um workshopworkshop (AWIICS) (AWIICS) onde foi sugerido o desenvolvimento de um onde foi sugerido o desenvolvimento de um processo de certificação para repositórios processo de certificação para repositórios digitais.digitais.

Objetivo:Objetivo:Servir como método pelo qual os usuários de Servir como método pelo qual os usuários de arquivos podem obter confiança na arquivos podem obter confiança na autenticidade, qualidade e utilidade dos materiais autenticidade, qualidade e utilidade dos materiais digitais arquivados.digitais arquivados.

Page 11: Preservação 2

No mesmo ano em que foi publicado o Modelo de No mesmo ano em que foi publicado o Modelo de Referência OAIS (2002), o Research Library Referência OAIS (2002), o Research Library Group (RLG) e a OCLC lançaram o relatório Group (RLG) e a OCLC lançaram o relatório Trusted Digital Repositories: Attributes and Trusted Digital Repositories: Attributes and ResponsabilitiesResponsabilities..

Objetivo:Objetivo:Prover uma visão do contexto organizacional Prover uma visão do contexto organizacional para um programa de preservação digital e para um programa de preservação digital e chamar a atenção para o desenvolvimento de um chamar a atenção para o desenvolvimento de um programa de certificação digital.programa de certificação digital.

Page 12: Preservação 2

Em 2003 o RLG e a NARA estabeleceram o Em 2003 o RLG e a NARA estabeleceram o Digital Digital Repository Certification Task ForceRepository Certification Task Force, com , com representantes de arquivos, bibliotecas, centros de representantes de arquivos, bibliotecas, centros de pesquisa públicos e privados, dos Estados Unidos, pesquisa públicos e privados, dos Estados Unidos, Inglaterra, França e da Holanda.Inglaterra, França e da Holanda.

Objetivo:Objetivo:Desenvolver uma versão piloto de uma Lista de Desenvolver uma versão piloto de uma Lista de requisitos de auditoria (Audit Checklist). Foram requisitos de auditoria (Audit Checklist). Foram identificadas quatro áreas de certificação: identificadas quatro áreas de certificação: individual, programa, processos e dados.individual, programa, processos e dados.

Page 13: Preservação 2

Em 2005 o Research Library Group (RLG) e a U.S. Em 2005 o Research Library Group (RLG) e a U.S. National Archives and Records Administration National Archives and Records Administration (NARA) publicaram o (NARA) publicaram o Audit Checklist for the Audit Checklist for the Certification of Trusted Digital RepositoriesCertification of Trusted Digital Repositories..

Objetivo:Objetivo:Discutir (até 2006), critérios para identificar Discutir (até 2006), critérios para identificar repositórios digitais capazes de confiavelmente repositórios digitais capazes de confiavelmente armazenar, migrar e prover acesso a coleções armazenar, migrar e prover acesso a coleções digitais.digitais.

Page 14: Preservação 2

PROPOSTA DE CERTIFICAÇÃO PARA PROPOSTA DE CERTIFICAÇÃO PARA REPOSITÓRIOSREPOSITÓRIOS

Para permitir maior confiança nos criadores de dados, Para permitir maior confiança nos criadores de dados, nos donos dos recursos de informação e nos usuários nos donos dos recursos de informação e nos usuários de que o repositório segue padrões reconhecidos e de que o repositório segue padrões reconhecidos e cumpre a sua missão de preservar e dar acesso por cumpre a sua missão de preservar e dar acesso por longo prazo.longo prazo.

Page 15: Preservação 2

PROPOSTA DE CERTIFICAÇÃO PROPOSTA DE CERTIFICAÇÃO

Para repositórios em:Para repositórios em:

Arquivos:Arquivos: documentos oficiais sob custódia, únicos e documentos oficiais sob custódia, únicos e com direitos autorais outorgados.com direitos autorais outorgados.

Bibliotecas:Bibliotecas: variedade de conteúdos, cópias de dados, variedade de conteúdos, cópias de dados, com acordos de depósito e direitos de uso restrito.com acordos de depósito e direitos de uso restrito.

Centros de informação:Centros de informação: variedade de materiais, variedade de materiais, colaborações, dados coletados anonimamente.colaborações, dados coletados anonimamente.

Page 16: Preservação 2

Criar um programa de certificação para Criar um programa de certificação para repositórios com base no repositórios com base no Audit ChecklistAudit Checklist

Para:Para:

• Definir prioridades e estabelecer metasDefinir prioridades e estabelecer metas• Comparar com outros programasComparar com outros programas• Publicar os resultados das auditoriasPublicar os resultados das auditorias

Page 17: Preservação 2

Seções daSeções da Audit Checklist Audit Checklist

1)1) OrganizaçãoOrganização2)2) ProgramaPrograma3)3) Comunidade alvoComunidade alvo4)4) Infra-estrutura tecnológicaInfra-estrutura tecnológica

Page 18: Preservação 2

Seções daSeções da Audit Checklist Audit Checklist

1)1) Organização:Organização:

governança, equipes, políticas e governança, equipes, políticas e procedimentos, sustentabilidade econômica, procedimentos, sustentabilidade econômica, contratos e obrigações.contratos e obrigações.

Page 19: Preservação 2

Seções daSeções da Audit Checklist Audit Checklist

2) Programa:2) Programa:

inserção de dados, armazenamento, descrição, inserção de dados, armazenamento, descrição, metadados, acesso e estratégias de metadados, acesso e estratégias de preservação.preservação.

Page 20: Preservação 2

Seções daSeções da Audit Checklist Audit Checklist

3) Comunidade alvo:3) Comunidade alvo:

Criadores dos registros, usuários, habilidade Criadores dos registros, usuários, habilidade de atender a demanda.de atender a demanda.

Page 21: Preservação 2

Seções daSeções da Audit Checklist Audit Checklist

4) Infra-estrutura tecnológica:4) Infra-estrutura tecnológica:

segurança, segurança, software software e e hardwarehardware..

Page 22: Preservação 2

Certificação peloCertificação pelo Audit Checklist Audit Checklist

• Infra-estrutura para ser uma norma de certificação Infra-estrutura para ser uma norma de certificação ISOISO

• Não é alcançada no primeiro testeNão é alcançada no primeiro teste• Evidências do cumprimento dos indicadoresEvidências do cumprimento dos indicadores• Plano de sucessãoPlano de sucessão• Sustentabilidade econômicaSustentabilidade econômica• Contratos, declarações de obrigações e Contratos, declarações de obrigações e

responsabilidadesresponsabilidades• Perda de dadosPerda de dados• Plano de desastre adequadoPlano de desastre adequado• Avaliação externaAvaliação externa

Page 23: Preservação 2

2006: o Nestor Working Group on Trusted Repositories Certification lançou o Catalogue of Criteria for Trusted Digital Repositories.

2007: o Digital Curation Centre (DCC) e o Digital Preservation Europe (DPE) publicaram o Digital Repository Audit Method Based on Risk Assessment (DRAMBORA).

Page 24: Preservação 2
Page 25: Preservação 2

2007: o CRL lançou o Trustworthy Repositories Audit & Certification: Criteria and Checklist (TRAC).

2007-2008: Existe um esforço em desenvolvimento do padrão ISO que vai integrar várias iniciativas e requisitos relevantes das áreas de tecnologias da informação e segurança.

2008 – Pesquisas e atividades em desenvolvimento:

Capacidade e eficiênciaIntegração de ferramentasAuditoria e certificação

Page 26: Preservação 2

Trustworthy Repositories Audit & Certification: Criteria andChecklist

Page 27: Preservação 2
Page 28: Preservação 2

O princípio fundamental dos metadados é integrar coleções digitais, heterogêneas, em múltiplos formatos e de várias instituições, permitindo que elas sejam acessíveis a qualquer pessoa, em qualquer lugar ou hora.

Os metadados são expressos em grupos de elementos e atributos, sendo que o agrupamento de elementos depende das suas relações. Os elementos e atributos podem ser mandatórios ou opcionais. Estruturados em esquemas de metadados eles especificam e descrevem o conjunto padrão de elementos de metadados e suas inter-relações Os esquemas provêem uma sintaxe formal (ou estrutura) e semântica (ou definições) para os elementos de metadados

Page 29: Preservação 2
Page 30: Preservação 2

NEDLIB OCLC/RLG NLNZ

RKMS

CEDARS NLA METS

Z39.87 PROVERSPITT DCMI

MPEG7 DC GILS VRA EAD ESMS

RMS ISAD MODS ISO_MR CSDGM

Page 31: Preservação 2
Page 32: Preservação 2

ENTITY 4 - METADATA MODIFICATION

4.1 Object identifier4.2 Metadata record modifier4.3 Date and time4.4 Field modified4.5 Data modified

ENTITY 3 – FILE (cont.)

3.14 VIDEO:3.14.1 Frame dimensions3.14.2 Duration3.14.3 Number of frames3.14.4 Frame rate3.14.5 Codec method3.14.6 Aspect ratio3.14.7 Scan mode3.14.8 Sound indicator

3.15 TEXT:3.15.1 Character set3.15.2 Mark up language

3.16 DATASETS:Use common elements only

3.17 SYSTEM FILES:Use common elements only

ENTITY 1 - OBJECT

1.1 Name of object1.2 Reference number1.3 Object identifier 1.4 Group Identifier1.5 Persistent identifier 1.6 Preservation Master Creation Date1.7 Logical composition1.8 Is part of group1.9 Structural type1.10 Hardware environment1.11 Software environment1.12 Installation requirements1.13 Access inhibitors1.14 Access facilitators1.15 Quirks1.16 Metadata record creator1.17 Date of metadata record creation1.18 Structural composition1.19 Comments

ENTITY 2 - PROCESS

2.1 Object identifier2.2 Original identifier2.3 Process type2.4 Purpose 2.5 Person/agency performing process 2.6 Permission2.7 Permission date2.8 Hardware used2.9 Software used2.10 Steps2.11 Result2.12 Guidelines2.13 Completion date and time2.14 Comments

OBJECT

METADATAMODIFICATION

FILEPROCESS

ENTITY 3 - FILE

3.1 Object identifier3.2 File identifier3.3 File path3.4 Filename and extension 3.5 Former filename3.6 File size3.7 File date and time3.8 MIME type3.9 File format3.10 File format version3.11 Target indicator

3.12 IMAGE:3.12.1 Resolution3.12.2 Dimensions3.12.3 Bits per sample3.12.4 Colour space3.12.5 ICC Profile Name3.12.6 Colour map reference3.12.7 Orientation3.12.8 Compression

3.13 AUDIO:3.13.1 Resolution3.13.2 Duration3.13.3 Bit rate3.13.4 Compression3.13.5 Encapsulation3.13.6 Channels

Esquema de metadados da NZNL

Page 33: Preservação 2

Atributos especiais de dados ou documentos, geralmente descritivos.

Os metadados de preservação são aqueles relacionados com o conteúdo do documento, seu contexto e estrutura no momento da sua criação, assim como das mudanças acontecidas em todo seu ciclo de vida. Essa perspectiva inclui sua estrutura física, técnica e lógica (a relação entre registros).

Page 34: Preservação 2

A descrição em metadados de todos os A descrição em metadados de todos os detalhes que expressem a história de criação detalhes que expressem a história de criação de um objeto digital está sendo considerada de um objeto digital está sendo considerada uma metodologia que pode garantir a uma metodologia que pode garantir a autenticidade de um registro eletrônico. autenticidade de um registro eletrônico.

Page 35: Preservação 2

Metadados para a identificação, validação e extração de dados

Page 36: Preservação 2

Softwares para Repositórios digitais

Page 37: Preservação 2

Softwares para Repositórios digitais

Institucionais Temáticos Centrais Preservação

Archimede Greenstone Greenstone LOCKSS

ARNO DAITSS

CDSware

DSpace DSpace DSpace DSpace

Driver

Eprints Eprints Eprints

Fedora Fedora Fedora

i-Tor

MyCoRe

OPUS

Page 38: Preservação 2

Ferramentas e serviços para repositórios digitais

Formatos Metadados Serviços Arquivamento Web

DROID Metadata Extraction

Tool

GDFR WCT

PUID ContentE

JHOVE PRONOM

XENA OCLC Digital Archive Service

ContentE PLANET Testbed

PORTICO

Page 39: Preservação 2

Progressos

Progressos alcançados desde a publicação do relatório da Task Force on Digital Archiving:

– consolidou-se o modelo de referência para sistemas de preservação digital (OAIS) também chamado em português de Sistema de Arquivamento Aberto de Informação (SAAI),

– estabeleceu-se o conjunto de atributos para repositórios digitais confiáveis (TDR), que delimita o contexto organizacional da preservação digital,

– publicaram-se dicionários de dados para metadados de preservação (PREMIS) e,

– surgiram os repositórios institucionais facilitados pelo aparecimento de novos softwares, como o Dspace.

Page 40: Preservação 2

Repositório digital confiávelRepositório digital confiável

Responsabilidades:Responsabilidades:

a) negociar com os produtores de informação a aceitação dos critérios relacionados às características dos documentos (tipo, assunto, fonte, originalidade, singularidade, mídia, formatos, etc.) e a conformação com padrões e políticas;

b) obter controle das informações que garantem a preservação de longo prazo (propriedades e direitos autorais);

c) determinar as comunidades de usuários potenciais;

d) garantir a compreensão da informação fornecida;

e) seguir políticas de documentação de procedimentos para auxiliar na localização dos originais;

f) definir as condições de acesso, distribuição e preservação do acesso.

Page 41: Preservação 2

Preservação digital em repositórios confiáveisPreservação digital em repositórios confiáveis

Miguel Ángel Márdero ArellanoMCT/Ibict

[email protected]

Miguel Ángel Márdero Arellano MCT/Ibict [email protected]