22
2006-11- 11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados José Carlos Ramalho jcr@di . uminho . pt

2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho [email protected]

Embed Size (px)

Citation preview

Page 1: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

2006-11-11

Universidade do Minho

Sem

inár

io M

ICE

I200

7 DBPreserve:Preservação de Bases de Dados

José Carlos [email protected]

Page 2: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

2

Sem

inár

io M

ICE

I200

7História

Tra

tam

ento

de

Fu

nd

os

AD

Bra

ga

19902007

Dig

itA

rq2

2006

CR

AV

+ R

OD

A

1998In

tern

atio

nal

Wo

rksh

op

:

“Arc

hiv

es a

nd

Info

rmat

ics

Met

amed

ia

19992003

Dig

itA

rq

Reu

niã

o e

m B

rag

a

2000

Page 3: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

3

Sem

inár

io M

ICE

I200

7Projectos em curso

Page 4: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

4

Sem

inár

io M

ICE

I200

7Projectos em curso

• DigitArq 2.0: criação e manutenção de arquivos digitais

• CRAV: criação dum balcão electrónico para arquivos

• RODA: repositório de objectos digitais autênticos

Page 5: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

5

Sem

inár

io M

ICE

I200

7Enquadramento dos projectos

Access Word

Guias de transferência

Excel

Listagens Catálogos

Inventários

XML

Índices

1001001011010100100101

Arquivista

Utente

Page 6: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

6

Sem

inár

io M

ICE

I200

7Objectivos dos projectos

• Eliminação do papel• Centralização da informação• Utilização de normas internacionais

– International Standard Archival Description - ISAD(g)

– Encoded Archival Description - EAD/XML

• Gestão de descrições arquivísticas• Gestão de objectos digitais• Permitir o acesso via Web ao acervo

do arquivo• Preservação Digital

Page 7: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

7

Sem

inár

io M

ICE

I200

7Open Archival Information

System

Ingestão:

• Descrição• Aquisição• Construtor de SIPs

Disseminação:

• Motor de pesquisa• Balcão electrónico• Visualizador de ODs

Gestão:

• GOD: gestão de ODs• POD: publicação de ODs• “Everyone Information System”• Controlo de acessos

Preservação Digital: RODA

RepositórioCentral

Page 8: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

8

Sem

inár

io M

ICE

I200

7DigitArq2

QuickTime™ and aTIFF (LZW) decompressor

are needed to see this picture.

Normas envolvidas:

• EAD - descriçaõ arquivística

• METS - descrição estrutural

• NISO MIX - descrição técnica

• PREMIS - descrição de intervenções de preservação

Page 9: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

9

Sem

inár

io M

ICE

I200

7Organização da metainformação - EAD

• Estrutura hierárquica• Descrição do mais geral

para o mais específico• Diferentes níveis

descritivos• Elementos descritivos:

– Referência – título – datas extremas – condições de acesso– âmbito e conteúdo– …

Fundo

SecçãoSecção

Série Série

DocumentoDocumento

Page 10: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

2006-11-11

Universidade do Minho

Sem

inár

io M

ICE

I200

7

Page 11: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

11

Sem

inár

io M

ICE

I200

7RODA

• Preservação de objectos digitais:– Documentos simples– Documentos com tabelas e imagens– Imagens– Bases de Dados Relacionais

• Requisitos de Autenticidade

Page 12: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

12

Sem

inár

io M

ICE

I200

7Preservação de Bases de Dados

RepositórioCentral

AIP

Ingestão Disseminação

AIP

DIPSIP

Gestão

PolíticasPreservação

Page 13: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

13

Sem

inár

io M

ICE

I200

7Construtor de SIPs

Construtor de

SIPs

Ficheiro ZIP

XMLMETS

binários

XMLBase de Dados

XMLNISO

Z39.87

Access

SQL Server

Oracle

Page 14: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

14

Sem

inár

io M

ICE

I200

7Extracção das BDs para XML

• Uma BD tem duas partes:– Estrutura– Dados

• É necessário preservar as duas• Para os dados há várias

linguagens• Para a estrutura muito poucas

Page 15: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

15

Sem

inár

io M

ICE

I200

7DBML - Database Markup Language

<?xml version="1.0" encoding="ISO-8859-1"?> <DB name="XXX" date="today"> <STRUCTURE> ... </STRUCTURE> <DATA> ... </DATA> </DB>

<TABLE NAME="PRODUTOS"> ... </TABLE>

<COLUMNS> <COLUMN NAME="CÓDIGO" TYPE="int" NULL="no"/> ... </COLUMNS>

Page 16: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

16

Sem

inár

io M

ICE

I200

7Exemplo: Produtos e

Fornecedores

CódigoDescriçãoQuantidadePreço

Produtos

CódigoNomeMorada...

Fornecedores

Código-PCódigo-F

P2F

1:N

1:N

Page 17: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

17

Sem

inár

io M

ICE

I200

7Resultado: DBML

<?xml version="1.0" ?> <DB> <STRUCTURE> <TABLE NAME="PRODUTOS"> <COLUMNS> <COLUMN NAME="CÓDIGO" TYPE="nvarchar" SIZE="10" NULL="no"/> <COLUMN NAME="DESCRIÇÃO" TYPE="nvarchar" SIZE="50" NULL="no"/> ... </COLUMNS> <KEYS> <PKEY TYPE="simple"> <FIELD NAME=" CÓDIGO "/> </PKEY> </KEYS> </TABLE> <TABLE NAME="P2F"> <COLUMNS> <COLUMN NAME="COD-P" TYPE="nvarchar" SIZE="10" NULL="no"/> <COLUMN NAME="COD-F" TYPE="nvarchar" SIZE="10" NULL="no"/> </COLUMNS> <KEYS> <PKEY TYPE="composite"> <FIELD NAME="COD-P"/> <FIELD NAME="COD-F"/> </PKEY> <FKEY NAME="COD-P" IN="PRODUTOS" REF="CÓDIGO"/> <FKEY NAME="COD-F" IN="FORNECEDORES" REF="CÓDIGO"/> </KEYS> </TABLE> <TABLE NAME="FORNECEDORES"> <COLUMNS> <COLUMN NAME="CÓDIGO" TYPE="nvarchar" SIZE="10" NULL="no"/> <COLUMN NAME="NOME" TYPE="nvarchar" SIZE="60" NULL="no"/> ... </COLUMNS> <KEYS> <PKEY TYPE="simple"> <FIELD NAME="CÓDIGO"/> </PKEY> </KEYS> </TABLE> </STRUCTURE> <DATA>

Page 18: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

18

Sem

inár

io M

ICE

I200

7Dados: DBML

... <DATA> <PRODUTOS> <PRODUTOS-REG> <CÓDIGO> a122 </CÓDIGO> <DESCRIÇÃO> leite </DESCRIÇÃO> ... </PRODUTOS-REG> <PRODUTOS-REG> ... </PRODUTOS-REG> </PRODUTOS> ... </DATA> ...

Page 19: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

19

Sem

inár

io M

ICE

I200

7Construtor de SIPs

Construtor de

SIPs

Ficheiro ZIP

XMLMETS

binários

XMLBase de Dados

XMLNISO

Z39.87

Access

SQL Server

Oracle

Page 20: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

20

Sem

inár

io M

ICE

I200

7Modelo relacional do Repositório

IdDBIdTableIdFieldIdReg

Data

REGISTERS

IdDBnameDBdateInitnTables

SGBD

DB

IdRelationIdDBSourceTableTargetTableSourceFieldTargetField

RELATIONS

IdTableIdDBnameTablenFields

TABLES

IdDBIdTableIdFieldnameFieldIsPKeyIsFKeyType

FIELDS

1:N 1:N

1:N1:N

1:N

1:N

Page 21: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

Universidade do Minho

21

Sem

inár

io M

ICE

I200

7Preservação de Bases de Dados

RepositórioCentral

AIP

Ingestão Disseminação

AIP

DIPSIP

Gestão

PolíticasPreservação

Browser

Page 22: 2006-11-11 Universidade do Minho Seminário MICEI2007 DBPreserve: Preservação de Bases de Dados Jos é Carlos Ramalho jcr@di.uminho.pt

2006-11-11

Universidade do Minho

Sem

inár

io M

ICE

I200

7

Questões?

QuickTime™ and aMPEG-4 Video decompressor

are needed to see this picture.

Demonstração de um arquivo em exploração: www.adporto.org

Desenvolvimento, manutenção e suporte: [email protected] ; [email protected]