50
Meta-Informação e a EAD e EAC Ana Luisa Veiga lci05001 Filipa Ramalho lci05020 Faculdade de Letras da Universidade do Porto Licenciatura em Ciência da Informação Via Panorâmica, s/n, 4150-564 Porto PORTUGAL Dezembro 2007

Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Meta-Informação e a EAD e EAC

Ana Luisa Veiga lci05001

Filipa Ramalho lci05020

Faculdade de Letras da Universidade do Porto

Licenciatura em Ciência da Informação Via Panorâmica, s/n, 4150-564 Porto PORTUGAL

Dezembro

2007

Page 2: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.2/50

Meta-Informação e a EAD e EAC

Ana Luisa Veiga lci05001

Filipa Ramalho lci05020

Trabalho realizado no âmbito da disciplina de Preservação e Conservação, do 1º semestre,

do 3º ano, leccionada por Maria Manuela Pinto.

Faculdade de Letras da Universidade do Porto Licenciatura em Ciência da Informação

Via Panorâmica, s/n, 4150-564 Porto PORTUGAL

Dezembro de 2007

Page 3: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.3/50

Sumário

SUMÁRIO ________________________________________________________________________ 3 1. INTRODUÇÃO _______________________________________________________________ 4

1.1. ENQUADRAMENTO ________________________________________________________________ 4 1.2. MOTIVAÇÃO _____________________________________________________________________ 5 1.3. OBJECTIVOS _____________________________________________________________________ 5 1.4. METODOLOGIA UTILIZADA __________________________________________________________ 6 1.5. ESTRUTURA DO RELATÓRIO _________________________________________________________ 6

2. META-INFORMAÇÃO ________________________________________________________ 8 2.1. TIPOS __________________________________________________________________________ 9 2.2. CARACTERÍSTICAS _______________________________________________________________ 10 2.3. IMPORTÂNCIA ___________________________________________________________________ 11

3. XML (EXTENSIBLE MARKUP LANGUAGE) ____________________________________ 13 3.1. FORMATO DE UM DOCUMENTO XML _________________________________________________ 14 3.2. APLICAÇÕES DO XML ____________________________________________________________ 15 3.3. POSICIONAMENTO DO XML NA EVOLUÇÃO DA WEB _____________________________________ 16

4. EAD ________________________________________________________________________ 17 4.1. DA ISAD(G) PARA A EAD _________________________________________________________ 18 4.2. CONTEXTO _____________________________________________________________________ 19 4.3. ELEMENTOS ____________________________________________________________________ 20 4.4. ATRIBUTOS _____________________________________________________________________ 21 4.5. VANTAGENS ____________________________________________________________________ 22 4.6. ONDE? ________________________________________________________________________ 23

5. A EAD, OUTRAS ESTRUTURAS E OUTROS PROJECTOS ________________________ 25 5.1. DUBLIN CORE _________________________________________________________________ 25 5.2. METS _________________________________________________________________________ 27 5.3. DIGITARQ ______________________________________________________________________ 29 5.4. RODA ________________________________________________________________________ 30

6. EAC ________________________________________________________________________ 34 6.1. DA ISAAR(CPF) PARA A EAC ______________________________________________________ 34 6.2. CONTEXTO _____________________________________________________________________ 36 6.3. ELEMENTOS ____________________________________________________________________ 36 6.4. VANTAGENS ____________________________________________________________________ 36

7. CONCLUSÕES ______________________________________________________________ 38 8. REFERÊNCIAS BIBLIOGRÁFICAS ____________________________________________ 40 9. ANEXOS _______________________________________________________________________ 42

9.1. ANEXO 1 _______________________________________________________________________ 42 9.2. ANEXO 2 _______________________________________________________________________ 43 9.3. ANEXO 3 _______________________________________________________________________ 44 9.4. ANEXO 4 _______________________________________________________________________ 46 9.5. ANEXO 5 _______________________________________________________________________ 47 9.6. ANEXO 6 _______________________________________________________________________ 49

Page 4: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.4/50

1. Introdução

1.1. Enquadramento

Este trabalho foi realizado no âmbito da disciplina de Preservação e Conservação

do 1º semestre do 3º ano do Curso de Ciência da Informação da Faculdade de Letras da

Universidade do Porto, sob orientação da Doutora Maria Manuela Pinto. Neste trabalho,

vai estar tratada, principalmente, a relação entre a meta-informação e a EAD e EAC dado

que são apresentados vários exemplos de modelos de projectos da EAD e EAC que já por

si são meta-informação.

A chegada do documento electrónico revolucionou toda uma prática e teoria de

informação existentes durante séculos. O documento electrónico trouxe novos e grandes

problemas ao sector da preservação e conservação, sendo difícil trabalhar com informação

registada num suporte tão sujeito à obsolescência e tão fácil de ser esvaziado como é o

digital (devido às suas condicionantes e dependência de hardware e software).

Apesar dos problemas serem logo visíveis, o suporte electrónico trouxe também

novas soluções e novas perspectivas para a informação: a transferência de suporte, a

migração e a rapidez com que se troca e disponibiliza informação a nível mundial fazem da

era digital, uma era, apesar de trabalhosa e difícil, muito atractiva.

Ao nível dos arquivos, nível para que a EAD e a EAC estão vocacionadas, a

crescente utilização de computadores e tecnologias de rede para criar e manter informação

fundamental e relevante em arquivos, exige uma maneira sensata de assegurar que a

informação criada está em segurança e preservada das rápidas mudanças de hardware e

software; se não se tiver isto em atenção, a informação criada ontem pode já não ser

“usável” hoje.

O formato xml é independente de hardware e software, por isso a informação

registada nesse formato é sempre perceptível e entendida por qualquer máquina, não

havendo requisitos de software para leitura. Por ser um standard, permite a

Page 5: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.5/50

interoperabilidade, pois possibilita que a informação contida seja trocada e usada por

vários sistemas na sua forma original sem que a informação tenha de ser transformada

durante a troca.

Para explorar totalmente a descrição arquivística no ambiente computacional, os

arquivistas têm de representar fielmente e cuidadosamente o seu conteúdo e natureza

intelectual.

Os componentes lógicos da descrição arquivística e as suas relações de uns para os

outros precisam de ser cuidadosamente reconhecidos numa forma de máquina de leitura

para suportar indexação sofisticada, navegação e exposição que determina completo e

cuidado acesso a materiais arquivísticos, assim como descrição e controlo desses mesmos

materiais.

Uma estrutura normalizada (standard) que codifique independente de hardware e

software parece oferecer a única segurança razoável de preservar informação. É neste

sentido que nasce a EAD (Encoded Archival Description) sendo seguida e completada pela

EAC (Encoded Archival Context), um standard em xml para promover a interoperabilidade

da descrição arquivística.

1.2. Motivação

Dos vários temas de trabalho propostos pela professora escolhemos este por se

tratar de um tema que está intimamente ligado com a linguagem XML, uma linguagem de

marcação utilizada para páginas na WEB e indicada para a meta-informação descritiva.

Um dos factores que nos motivou foi exactamente descobrir de que maneira é o que a

linguagem XML, a qual aprendemos numa cadeira no ano passado, estava ligada com

normas e com a meta-informação descritiva.

1.3. Objectivos

Este trabalho tem como objectivo explicar e analisar a relação entre meta-

informação e a EAD e EAC. Assim sendo, pretendemos com este trabalho aprofundar os

Page 6: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.6/50

nossos conhecimentos sobre meta-informação, conhecer as normas EAD e EAC e, por fim,

conhecer e explicar alguns exemplos de modelos e projectos destas duas normas.

1.4. Metodologia utilizada

Inicialmente, para a realização deste trabalho, acedemos aos sites oficiais da EAD e

da EAC e lemos a introdução explicativa de cada um para ficarmos com uma ideia básica

sobre o que era cada norma. Depois disso, dividimos o trabalho de pesquisa de informação

entre as duas: uma procurou trabalhos e textos relativos a EAD e a outra EAC.

Entretanto, procuramos definir uma estrutura de trabalho e só depois reunimos toda

a informação que obtivemos e começamos a recolher informação não só das fontes que

pesquisamos como também das referências facultadas pela professora.

Para além de pesquisa de outras fontes de informação, procedemos a uma recolha e

tratamento dessa mesma informação e seguimos uma estrutura de trabalho predefinida para

conseguirmos responder a todos os pontos do trabalho. Por fim, revemos, cada uma, o

trabalho concluído a fim de detectar possíveis erros e falhas.

1.5. Estrutura do relatório

Após apresentada a introdução deste relatório (capítulo um), passamos a indicar

como ele é constituído, ou seja, qual a estrutura que optamos para que o trabalho fosse

melhor desenvolvido e percebido.

Assim, no segundo capítulo é introduzido o tema da meta-informação encontrando-

se este dividido em sub-capítulos (Tipos, Características e Importância). Este é o ponto

inicial deste trabalho,

No capítulo três, abordamos um pouco o formato XML, pois sendo uma linguagem

extremamente ligada às estruturas EAD e EAC merece ser falada e explicada inicialmente

para a sua melhor compreensão ao longo do relatório.

De seguida, os capítulos quatro, cinco e seis, ficam da responsabilidade da EAD e

EAC, o núcleo deste trabalho. É apresentado o contexto das mesmas, as vantagens, os

elementos e atributos (estes últimos, no caso da EAD). É relacionada a ISAD(G) à EAD,

Page 7: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.7/50

assim como a ISAAR(CPF) à EAC. No capítulo cinco, são ainda apresentados algumas

estruturas (Dublin Core e Mets) e alguns projectos (DigitArq e Roda) que se associam à

EAD. Em relação à EAC não há muita informação disponível pois ainda se encontra em

versão beta.

No final do trabalho são apresentadas as nossas conclusões / considerações teóricas,

as referências bibliográficas e os anexos.

Page 8: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.8/50

2. Meta-Informação

É essencialmente Informação acerca de Informação e serve o intento de manter

sistemas de informação eficazes, autorizados, flexíveis, escaláveis, robustos e inter

operáveis, inserindo-se na preservação.

“Em geral “dados sobre os dados”; funcionalmente “dados estruturados

sobre dados”. Informação sobre um recurso de informação. Exemplo: Cartão de

um catálogo de uma biblioteca, que contém dados sobre o conteúdo de um livro:

são dados sobre os dados no livro referido pelo cartão.”

(definição de Metadados – glossário da Sociedade da Informação)

A meta-informação certifica a autenticidade, a fiabilidade, o uso e a integridade da

informação ao longo do tempo, permitindo a gestão e a compreensão dos objectos

informacionais (físicos, analógicos ou digitais).

Tem-se verificado um aumento da necessidade e do uso da meta-informação pois

esta tem-se apoiado nos recursos em rede que visam a pesquisa e uso da informação, a

comprovação de autenticidade e a preservação a longo termo.

As estruturas EAD e EAC são estruturas de meta-informação descritiva (ver ponto

2.1) para arquivos online.

Page 9: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.9/50

“No contexto dos “records management”, define-se META-INFORMAÇÃO como a informação que descreve o contexto, o conteúdo e a estrutura dos “records” e a sua gestão ao longo do tempo”

ISO 15489-1 :2001, 3.12

2.1. Tipos

Podem-se distinguir cinco tipos de meta-informação:

• Administrativa – Meta-informação usada na gestão e na administração de

recursos:

- Informação de aquisição/produção

- Registo de direitos e de reproduções

- Documentação dos requisitos legais de acesso

- Informação de localização

- Critérios de selecção para digitalização

- Controlo de versões

• Descritiva – Meta-informação que descreve e/ou identifica recursos:

- Registos de catalogação/descrição

- Auxiliares de pesquisa

- Índices especializados

- Relações de hiper-ligação entre recursos

- Anotações dos utilizadores

• Preservação – Meta-informação que se relaciona com a preservação dos

recursos:

- Documentação da condição física dos recursos

- Documentação das acções realizadas para preservar versões físicas e

digitais dos recursos (Refrescamento e Migração)

Page 10: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.10/50

- Documentação das estratégias para a manutenção e preservação dos

recursos

• Técnica – Meta-informação que se relaciona com o funcionamento do sistema ou

da própria meta-informação:

- Documentação de hardware e software

- Informação de digitalização (formatos, taxas de compressão e rotinas de

escalamento)

- Registo dos tempos de resposta do sistema

- Dados de autenticação e segurança (encriptação e chave e senhas de

acesso)

- Informação sobre os formatos, estruturas e ligações dos documentos

• Uso – Meta-informação que se relaciona com o uso dos recursos:

- Registos de exibição/visualização

- Registo de utilização e de utilizadores

- Reutilização de conteúdos e informação de versões

2.2. Características

Relativamente às características que a meta-informação apresenta, podem

distinguir-se sete: Fonte, Método de criação, Natureza, Estatuto, Estrutura, Semântica e

Nível.

A Fonte da meta-informação pode ser interna ou externa. Se for interna, é gerada

pelo agente que cria a informação. Se for externa, é criada mais tarde e possivelmente não

será pelo criador da informação.

O Método de criação da meta-informação pode ser automático ou manual.

Automático se for criado por um computador, manual se for criado por pessoas.

Quanto à Natureza da meta-informação, distingue-se a leiga da especializada. A

leiga é criada por pessoas que não são especialistas de informação nem do domínio da

Page 11: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.11/50

informação. A especializada é criada por especialistas da informação ou por peritos da área

da informação.

O Estatuto diz-nos que a meta-informação pode ser estática/dinâmica, a longo

prazo ou a curto prazo. É estática/dinâmica se não muda/muda após a sua criação, é a

longo prazo se for necessário garantir a sua acessibilidade e é a curto prazo se for

transaccional.

Em relação à Estrutura, a meta-informação pode ser estruturada ou não estruturada.

O primeiro caso ocorre caso siga o formato normalizado e o segundo caso não esteja de

acordo com a estrutura previsível.

A semântica da meta-informação pode ser controlada ou não controlada.

Controlada se for conforme uma norma, não controlada se não seguir nenhuma norma.

Por último, a meta-informação pode caracterizar-se em relação ao Nível, que pode

ser de colecção ou de item. De colecção se for um registo a nível do acervo, de item se for

um registo para um objecto individual.

Para além das referidas, a meta-informação pode apresentar outras características

também muito próprias. Não precisa de ser digital (é anterior à existência de sistemas de

informação e cada vez mais gerida por sistemas automatizados), é mais do que a descrição

de um objecto (a gestão, a preservação e o uso são igualmente importantes), provém de

muitas fontes (pode ser criada por um ser humano, pode ser criada por uma máquina ou até

deduzida a partir de outra) e aumenta no decorrer da vida do objecto ou sistema (no ciclo

de vida da informação, a meta-informação pode ser criada, modificada ou até destruída).

2.3. Importância

A meta-informação tem obtido uma grande importância em vários aspectos ao

longo dos tempos. Adquiriu importância:

• Na acessibilidade (houve um progresso na eficiência da pesquisa e possibilita a

criação de acervos virtuais)

• Na retenção do contexto (os objectos têm relações complexas entre si,

associando-se a pessoas, lugares e eventos)

Page 12: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.12/50

• No alargamento do uso (as versões digitais podem ser divulgadas)

• Na existência de várias versões (a preservação é em alta definição, enquanto

que a divulgação é em baixa)

• Nos aspectos legais (os repositórios podem manter os registos das camadas de

meta-informação de direitos)

• Na preservação (os processos de migração exigem meta-informação para caracterizar o objecto, independentemente do sistema que o abriga)

Page 13: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.13/50

3. XML (EXtensible Markup Language) O formato XML (Extensible Markup Language) foi criado em 1998 pela World

Wide Web Consortium (W3C) e é um perfil, um subconjunto do SGML, o qual é

optimizado para distribuição através da web, assegurando que a nformação estruturada será

uniforme e independente de aplicações e fornecedores.

O XML é uma linguagem de marcação de informação (meta markup language) que

fornece um formato para descrever informação estruturada, por outras palavras, que

descreve o conteúdo de um documento. Possibilitou o aparecimento de uma nova geração

de aplicações de manipulação e visualização de dados através da Internet.

Os documentos XML são arquivos texto pois facilitam que os programadores ou

“desenvolvedores” trabalhem mais facilmente nas aplicações, para que um simples editor

de texto possa ser utilizado para corrigir um erro num arquivo XML. Contudo, as regras de

formatação para documentos XML são muito mais rígidas do que para documentos

HTML. Uma tag esquecida ou um atributo sem aspas torna o documento inutilizável.

No XML as regras que definem um documento são ditadas por DTD’s (document

type definition)1 que ajudam a validar a informação quando a aplicação que a recebe não

possui internamente uma descrição da informação que está a receber. As DTD’s são

opcionais e a informação enviada com um DTD é conhecida como informação XML

válida. A informação enviada sem DTD é chamada de informação bem formatada. Com a

informação XML válida e com a bem formatada, o documento XML torna-se auto-

descritivo pois as tags dão a ideia de conteúdo estando misturadas com a informação.

Devido ao formato do documento ser aberto e flexível, ele pode ser usado em qualquer

lugar onde a troca ou transferência de informação é necessária.

Um exemplo de DTD:

<!DOCTYPE recipecollection [ ... <!ELEMENT recipe (title,author?,date?,description,ingredients,preparation,related)> <!ATTLIST recipe id ID

1 Uma dtd estabelece elementos e atributos a conter no documento como obrigatórios ou não e a forma do seu conteúdo, em texto simples, em forma de data, em algarismos, entre outros.

Page 14: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.14/50

#REQUIRED category (breakfast|lunch|dinner|dessert|unknown) #IMPLIED> <!ELEMENT title (#PCDATA)> <!ELEMENT author ANY> ... ]>

O XML tem como principal objectivo trazer flexibilidade e poder às aplicações

Web. De entre os vários benefícios para quem desenvolve e para quem usa, destaca-se:

• Pesquisas mais eficientes

• Desenvolvimento de aplicações Web mais flexíveis

• Distribuição da informação via Internet de forma mais comprimida e escalável

• Padrões abertos

3.1. Formato de um documento XML

• Qualquer documento XML pode e deve iniciar com uma declaração XML

<?xml version="1.0“?>

• Todos os elementos, à excepção do elemento raiz, têm de estar incluídos no

inicial

<?xml version="1.0“> <patrimonio> <casas>...</ casas> <carros>...</ carros> </ patrimonio>

• O XML não define marcas mas sim a estrutura e o formato das mesmas

• Todas as marcas têm de ser fechadas

<codigopostal> 4990-125 </ codigopostal>

• As marcas vazias têm de ser assinaladas <tel n=“256888888”/ >

• O valor dos atributos tem de ser definido entre aspas

<casa name="gaio" nq="4">

Page 15: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.15/50

• As marcas têm de estar correctamente encaixadas

<morada> <codigopostal> 4990-125 </ codigopostal> </morada>

• O nome das marcas deve começar com uma letra ou um “underscore”

• As marcas são sensíveis ao uso de maiúsculas

No Anexo 1, pode-se encontrar um exemplo simples de utilização do XML.

• A declaração XML tem os seguintes atributos:

- Version: é obrigatório e indica qual a versão XML que o

processador de XML deve suportar;

- Standalone: é opcional e serve para indicar se o documento é composto

por mais documentos externos ou não;

- Encoding: é opcional e permite assinalar, para o processador XML, qual o

conjunto de caracteres que é usado pelo documento (para os portugueses, o iso-8859-

1 é o mais adequado);

• Após a declaração XML e antes do elemento raiz, é possível definir:

- Zero ou mais instruções de processamento;

- Uma declaração do tipo documento (identifica uma DTD que define a

gramática a que deve obedecer o presente documento);

No Anexo 2, encontra-se mais um exemplo de utilização XML.

3.2. Aplicações do XML

• XHTML

• CML (Chemical Markup Language)

• MML (Mathematical Markup Language)

• CDF (Channel Definition Format)

Page 16: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.16/50

• RDF (Resource Description Framework)

• MusicXML

• SVG (Scalable Vect or Graphics)

• OSD (Open Software Description)

• SOAP (Simple Object Access Protocol)

• WSDL (Web Service Description Language)

• UDDI (Universal Description Discovery and Integration)

3.3. Posicionamento do XML na evolução da Web

Page 17: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.17/50

4. EAD

Uma estrutura normalizada usada para codificar instrumentos de pesquisa que

reflecte a natureza hierárquica das colecções arquivísticas e que providencia uma

estrutura para a descrição do todo de uma colecção assim como dos seus componentes.

Pearce-Moses, Richard – A Glossary of Archival and Records Terminology

Uma “definição de tipo documento” (DTD), conforme à norma ISAD(G), assente

sobre a linguagem de marcação XML (Extensible Markup Language) e destinada à

produção de instrumentos de descrição disponíveis na Internet.

MARIZ, José – Encoded Archival Description e XML

A Encoded Archival Description é uma dtd correspondente à norma ISAD(G) e

operável nos formatos SGML e XML. É um formato de meta-informação descritiva.

O formato SGML é uma ISO (ISO 8879: 1986 Information processing - Text and

office systems -Standard Generalized Markup Language [SGML]) e é uma metalinguagem

para se definir linguagens de marcação para documentos. Tem as aplicações DSSL e

Hytime. No entanto é um formato muito complexo trazendo dificuldades no

desenvolvimento de software.

O formato XML é um subconjunto específico do SGML projectado para ser mais

simples de se analisar gramaticalmente e de se processar, do que o SGML. Para que se

entenda, HTML é um tipo de SGML enquanto que XML é a versão simplifcada de SGML.

Tem as aplicações XSL e XLink.

A EAD funciona com os dois tipos de formato, por uma questão de aproveitar

recursos mas também, principalmente, devido à aplicação Hytime do SGML: a EAD traz

problemas associados à língua uma vez que é um standard orientado para o inglês. Não se

Page 18: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.18/50

pode exigir que alguém que não tenha como língua materna a língua inglesa consiga operar

com este formato, havendo assim necessidade de criar versões da dtd e da documentação

subjacente noutras línguas. O Hytime é uma “enabling architecture”: antes de definir tipos

de elementos que se pode usar directamente na DTD, providencia uma série de tipos de

meta-elementos que servem como templates, indica as relações entre elementos, explica o

que esses elementos têm de conter e permite ao utilizador criar elementos e atributos

próprios com nomes próprios na própria língua. Permite então mapear a versão inglesa da

EAD como uma forma canónica para a comunicação e intercâmbio possibilitando a

internacionalização do formato.

4.1. Da ISAD(G) para a EAD

Sendo a EAD uma estrutura com base na ISAD(G) [Norma Geral Internacional de

Descrição Arquivística], é ponto obrigatório a comparação entre os termos utilizados e os

momentos em que estes se cruzam. A tabela apresentada a seguir2 expõe os pontos de

ligação entre as duas estruturas.

2 In: THE LIBRARY OF CONGRESS, Encoded Archival Description: version 2002 official site

Page 19: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.19/50

4.2. Contexto3

A Encoded Archival Description começou com um projecto da Biblioteca da

Universidade da California direccionado por Daniel Pitti em 1993, um ano após a

aprovação da norma ISAD (G): Projecto Berkeley. Tinha por objectivo investigar o êxito

de desenvolver uma codificação standard legível por máquina para ferramentas de

pesquisa; os requisitos pretendidos para a estrutura prendiam-se em conseguir apresentar

nas ferramentas de pesquisa de arquivos (extensivas e interligadas) descrições de acervos,

conseguir preservar as relações hierárquicas existentes entre os níveis de descrição,

representar a informação descritiva que é herdada de um nível hierárquico superior por

outro inferior, conseguir percorrer a informação numa estrutura hierarquizada e suportar os

elementos específicos de indexação e recuperação.

Foram muitos os avanços dados4 até ao lançamento da versão 1.0 da EAD em 1998

(versão alpha e beta lançadas em 1996). Em 2002 foi lançada uma nova versão mas que

ainda se encontra no estado beta.

Actualmente a EAD é administrada por várias organizações: a Biblioteca do

Congresso está responsável pela manutenção física da estrutura, a Sociedade dos

Arquivistas Americanos (SAA) é responsável pela supervisão da parte política e intelectual

3 In: THE LIBRARY OF CONGRESS, Encoded Archival Description: version 2002 official site [Em linha]

[Consult. 18, Nov. 2007]. Disponível em http://www.loc.gov/ead/ 4 A este propósito consultar a página oficial da EAD em http://www.loc.gov/ead/

Page 20: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.20/50

e o Grupo de Trabalho da EAD (composto por representantes da SAA, da Biblioteca do

Congresso, do Research Libraries Group, do On-line Computer Library Center e do CIA,

tendo este, além dos representantes americanos, representantes do Canadá e do Reino

Unido) responsabiliza-se pelos desenvolvimentos da própria EAD.

4.3. Elementos

Assim como a norma ISAD (G)5, a EAD baseia-se numa descrição arquivísitica

multi-nível; conta com diversos elementos de descrição que podem ser usados em todos os

níveis hierárquicos da mesma. A informação contida num nível superior nunca é repetida

nos seus níveis inferiores, pois já lhe é inerente.

Descrevendo brevemente os principais elementos da dtd EAD, esta tem três grandes

níveis superiores:6

• <eadheader> - documenta a descrição arquivística ou a ferramenta de

pesquisa, fornecendo informações tais como o título da ferramenta de pesquisa,

a sua data de criação, o nome do autor, etc.;

• <frontmatter> - apresenta a informação de edição, como o título da página e

um texto de prefácio;

• <archdesc> - inicia a descrição arquivística propriamente dita, contendo o

atributo “level”, o nível hierárquico, que pode ser “file”, “series”, entre outros.

Conta também com vários elementos de categoria descritiva superiores, entre os

quais os elementos:

• <did> (descriptive identification) - dá a informação essencial para

identificação das espécies e para julgar a sua relevância (título, data de criação,

produtor, dimensão, extensão conteúdo das espécies, biografia, historial do

5 Pode consultar a tradução portuguesa da 2ª edição da ISAD (G) em http://www.iantt.pt/downloads/ISADG.pdf 6 O nome dos elementos é disposto entre <> por ser esta a forma de apresentação dos elementos na dtd e no xml ou sgml.

Page 21: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.21/50

criador), assim como a informação administrativa (copyright, o acesso

controlado, …);

• <dsc> (description of subordinate components) – faz a descrição dos

componentes;

• <c> - é o componente; tem os mesmos elementos descritivos do <archdesc>.

No Anexo 3, encontra-se completa a lista original dos elementos que compõe a

dtd EAD. Lá, estão assinalados os elementos acima mencionados e ainda o elemento

<origination>, que se verá mais à frente que corresponde, na ISAD (G), ao nome do

produtor.

4.4. Atributos7

Além de elementos, uma dtd tem atributos. Estes são aplicáveis aos elementos e

podem adquirir valores.

A EAD tem três tipos de atributos: os gerais, os de ligação e os de disposição tabular.

Os atributos de disposição tabular servem para fazer tabelas com os elementos; os atributos

de ligação são os que permitem os hiperlinks, a ligação ou para outras páginas (dentro ou

fora do arquivo), ou para outros elementos ou para outras partes dentro da mesma página.

Os atributos gerais são aqueles realmente referentes à descrição arquivística. Uma pequena

referência a dois atributos:

• O atributo <level> é aplicável aos elementos <archdesc> e <c>, e pode ter os

valores collection, fonds, class, recordgrp, series, subfonds, subgrp,

subseries, file, item e otherlevel (no caso de nenhuma das nominações se

demonstrar apropriada). Mostra em que nível da hierarquia do arquivo se

encontra a espécie que está a ser descrita.

7 A lista completa dos atributos da dtd EAD em http://www.loc.gov/ead/tglib/att_gen.html

Page 22: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.22/50

• Outro atributo que merece destaque é o atributo <audience>; este atributo

tem a função de controlar o acesso à informação, tornando a informação

contida nos elementos visível por todos os utilizadores ou apenas pelos

responsáveis do acervo. Tem os valores external (valor por omissão) ou

internal.

No Anexo 4 encontra-se uma estrutura (retirada da página oficial da EAD) que

apresenta os elementos indicados como os mínimos necessários para a criação de uma

estrutura EAD básica. A ordem dos elementos é a aconselhável e não a obrigatória.

4.5. Vantagens8

A estrutura EAD é operável no formato xml (formato independente de hardware e

software), não sofre da obsolescência de ambos, tem uma característica de durabilidade e

pode ser usada e trocada por diferentes sistemas, o que lhe confere características de

usabilidade e interoperabilidade.

É uma estrutura que representa facilmente a natureza complexa e hierárquica da

informação em arquivo (sendo uma estrutura normalizada e unificada facilita a pronta

identificação e compreensão dos componentes essenciais da descrição arquivística)

detendo as características da utilidade e inteligibilidade.

Representa fiel e cuidadosamente o conteúdo e natureza intelectual da descrição

arquivística com elementos identificados numa forma de leitura por máquina para suportar

indexação sofisticada, navegação, e exposição que providencia completo e cuidado acesso,

descrição e controlo de materiais arquivísticos, o que lhe confere fiabilidade e integridade.

8 Baseadas em: PITTI, Daniel V. – Encoded Archival Description: an introduction and overview [Em linha]

[Consult. 18, Nov. 2007]. Disponível em <http://www.dlib.org/dlib/november99/11pitti.html> e MARIZ,

José – Encoded Archival Description e XML [Em linha] [Consult. 18, Nov. 2007]. Disponível em

<http://www.iantt.pt/content.html?menu=closed&conteudo_nome=Encoded%20Archival%20Description%2

0e%20XML&conteudo=ead>

Page 23: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.23/50

Permite troca de dados entre instituições de arquivo diferentes podendo constituir a

base de um sistema nacional de informação arquivística, detendo a ideia de integração, e

facilita a conversão de instrumentos de descrição existentes mas não informatizados e a sua

consequente disponibilização em linha, contribuindo para um acesso continuado.

A EAD providencia ainda um acesso unificado às fontes primárias a partir de

qualquer local e a qualquer hora, permitindo que bibliotecas e arquivos partilhem

informação sobre acervos relacionados e haja uma reintegração virtual desses mesmos

acervos em proveniência mas dispersos em diferentes repositórios – contendo as noções de

integração, inter operação e intercomunicação.

4.6. Onde?

O uso da EAD expandiu-se de forma considerável, tendo triunfado na sua intenção de

internacionalização. Serão apresentados alguns locais e projectos onde a EAD é usada

actualmente:

Page 24: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.24/50

Estados Unidos da América: A EAD foi usada para criar o Online Archive of

Califórnia, um arquivo on-line que reúne mais de 30 acervos. No seu seguimento, os

estados do Texas (Novo México e Virgínia) também criaram um sistema estatal de

informação arquivística tendo por base a estrutura EAD. Outros organismos que usam a

EAD são, por exemplo, a Biblioteca do Congresso, Universidades (Harvard, Yale, Duke,

Michigan, Virgínia e Carolina do Norte) e a Sociedade Histórica de Minnesota.

Canadá: Neste país servem como exemplo de uso da EAD os Arquivos Britânicos da

Colômbia, as Universidades de York e de New Brunswick e os Arquivos on-line de

Saskatchewan, Manitoba e Ontário.

Reino Unido: O exemplo mais visível do Reino Unido é o Public Record Office, um

arquivo composto por 45000 páginas com descrição de 150km de espécies9. A EAD é

também usada, por exemplo, nas Universidades de Oxford, Glasgow, Warwick e Durham

entre outras.

Portugal: Também em Portugal se usa a estrutura EAD. O Instituto de Arquivos

Nacional/Torre do Tombo usa na sua base de dados (que serve a pesquisa de descrições em

linha de "Fundos e Colecções") e está actualmente a desenvolver um projecto de utilização

e difusão da estrutura. Na Biblioteca Nacional Digital a EAD é usada como complemento

do METS e no Projecto DigitArq10 dos arquivos municipais da Câmara do Porto, é usada

juntamente com a ISAD (G), a ISAAR (CPF) e a EAC.

A EAD é ainda usada um pouco por toda a Europa, na Austrália e na América-Latina.

9 Informação de 1999. 10Acerca do Projecto DigitArq consultar: http://wiki.di.uminho.pt/wiki/bin/view/Digitarq/WebHome

Page 25: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.25/50

5. A EAD, outras Estruturas e outros Projectos

5.1. DUBLIN CORE

A Dublin Core, estrutura criada pela Dublin Core Metadata Initiative11 em 1995,

não tendo sido mais alterada desde 1996, é uma estrutura de meta-informação descritiva,

(assim como a EAD) operável nos formatos HTML, XML e RDF. Originalmente era

vocacionada apenas para recursos electrónicos mas pode ser usado para uma vasta gama de

recursos.

É composta por apenas quinze elementos, todos eles opcionais e repetitíveis,

contendo também um pequeno leque de atributos que podem ser opcionalmente usados.

Com esta estrutura, a Dublin Core pretende a simplicidade da criação de um registo

segundo a sua estrutura e simplicidade da sua manutenção, assim como ter uma semântica

facilmente entendida permitindo a sua internalização.

Registos feitos a partir da Dublin Core podem descrever “items” ou uma

“colecção”. Embora uma descrição bibliográfica detalhada seja apenas permitida para um

nível, o elemento “relação” assegura atributos como “é parte de” e “faz parte” que tornam

possível a referência ao título.

A Dublin Core não inclui meta-informação estrutural e está a trabalhar na introdução

de elementos de meta-informação administrativa12.

Fazendo a comparação com a EAD, a Dublin Core é uma estrutura bastante mais

simplista e principalmente vocacionada para qualquer tipo de acervo, contrariamente à

EAD que apenas serve à descrição de acervos arquivísticos.

11 A DCMI nasceu de um workshop de meta-informação realizado em Dublin, Ohio em 1995, por representantes da OCLC e da NCSA - National Center for Supercomputing Applications 12 Informação retirada de: NORTHWESTERN UNIVERSITY LIBRARY [Em linha] [Consult. 5, Jan. 2007].

Disponível em <http://staffweb.library.northwestern.edu/dl/metadata/standardsinventory/

dublincoresummary.html>

Page 26: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.26/50

Na tabela apresentada de seguida13 pode-se observar os pontos de ligação entre a

Dublin Core e a EAD:

13 In: THE LIBRARY OF CONGRESS, Encoded Archival Description: version 2002 official site

Page 27: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.27/50

5.2. METS

O Metadata Encoding and Transmission Standard – METS - é um formato de meta-

informação estrutural, criado em 2001 e que foi definido pela Digital Library Federation.

Tem sete secções principais, usando a EAD na secção de meta-informação descritiva. Uma

breve descrição da estrutura do METS mostra a interligação de diferentes estruturas

caminhando no sentido da unificação:

“Cabeçalho: O cabeçalho contém metadados descrevendo o documento METS em

si, incluindo informação como o criador, editor, etc.

Metadados Descritivos: Esta secção pode referenciar metadados externos ao

documento METS (como um registo UNIMARC ou EAD acessíveis num servidor na

Internet), conter metadados embebidos, ou ambos. Múltiplas instâncias de metadados,

internas ou externas, podem ser incluídas nesta secção.

Metadados Administrativos: Esta secção oferece informação sobre como os

ficheiros foram criados e armazenados, direitos de propriedade intelectual, metadados

sobre o objecto original a partir do qual o objecto digital foi derivado, etc. Tal como os

metadados descritivos, os metadados administrativos podem ser tanto externos ao

documento METS como codificados internamente.

Secção de Ficheiros: Esta secção lista todos os ficheiros que compõem o objecto.

Elementos <file> podem ser agrupados em elementos de grupos de ficheiros <fileGrp>,

para permitir a subdivisão de ficheiros por versão do objecto.

Mapa Estrutural: Este mapa é o coração do documento METS. Ele esboça uma

estrutura hierárquica para o objecto, e liga os elementos dessa estrutura a ficheiros com

conteúdos e metadados referentes a cada elemento.

Ligações Estruturais: Esta secção permite registar referências entre nós na

hierarquia esboçada no Mapa Estrutural. Esta secção tem um valor particular na utilização

do METS para arquivar sítios da Internet.

Page 28: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.28/50

Comportamento: Estas secções podem ser usadas para associar comportamentos

para os conteúdos dos objectos METS. Cada comportamento é composto de uma definição

abstracta e ainda de uma referência para o módulo de código executável que o concretiza.

O esquema METS oferece uma norma útil para a troca de objectos digitais entre

repositórios. Adicionalmente, o METS oferece a possibilidade de associar um objecto

digital com comportamentos ou serviços. A discussão anterior descreve o esquema, mas

uma examinação mais detalhada da sua documentação é necessária para compreender todo

o alcance das suas capacidades.

No contexto do modelo de referência do OAIS – Open Archival Information System,

e dependendo da sua utilização, um documento METS pode ser usado como Pacote de

Informação de Submissão, um Pacote de Informação de Arquivo (AIP) ou um Pacote de

Informação de Disseminação (DIP).” 14

14 In: BORBINHA, José Luís [et al.] – A gestão de obras digitalizadas na BND [Em linha] [Consult. 22, Nov.

2007]. Disponível em <http://vecpar.fe.up.pt/xata2005/papersfinal/43.pdf>

Page 29: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.29/50

5.3. DigitArq

O Serviço de referência do Arquivo Distrital do Porto apresentava variados índices,

livros de listagens, inventários, catálogos e guias de transferência multiformes e sem

uniformidade. Perante esta situação, foi desenvolvida uma ferramenta informática que

apoiava o trabalho de descrição arquivística desempenhado no Arquivo do Porto. Assim

nasceu, em 2003, o Projecto DigitArq. Teve três actores principais no seu surgimento: o

Arquivo Nacional da Torre do Tombo (IAN/TT – hoje, Direcção-Geral de Arquivos

[DGARQ]), o Arquivo Distrital do Porto (ADP) e a Universidade do Minho (UM).

O desenvolvimento deste projecto possibilitou que fosse corrigido e gerido o

processo de produção de auxiliares de pesquisa no seio do Arquivo, centralizar os

resultados da actividade de produção num único repositório de dados e que todos os

utentes e funcionários da instituição pudessem aceder à informação do arquivo.

Teve como principal objectivo o desenvolvimento de uma ferramenta de descrição

arquivística, seguindo-se por normas internacionais para a produção de auxiliares de

pesquisa. Exemplos dessas normas são a Norma Internacional de Descrição Arquivística

[ISAD(G)] e a Encoded Archival Description (EAD).

Em 2004 tornou-se possível aceder ao acervo documental (devidamente tratado e

classificado) do Arquivo Distrital do Porto disponível na Internet (cerca de 500 mil

registos de meta-informação). Aquando do funcionamento da plataforma DigitArq, foram

descobertas certas fragilidades assim como uma catalisação de ideias e produtos

inovadores no âmbito da Administração Pública. Isto levou ao surgimento de duas novas

candidaturas a projectos que permitiram dar continuidade ao trabalho já realizado: Projecto

CRAV15 e Projecto RODA.

15 Tem como objectivo a implementação de um balcão electrónico para os arquivos digitais de modo a possibilitar o acesso ao conjunto de serviços, a qualquer utente, através da Internet

Page 30: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.30/50

5.4. RODA

O projecto RODA - Repositório de Objectos Digitais Autênticos foi criado em 2004

mas só em 2006 entrou em funcionamento. É uma iniciativa do IAN/TT para suportar os

processos de incorporação e gestão de informação de arquivo electrónico produzida no

contexto da Administração Pública, que conta cada vez mais com o crescimento de

produção de “objectos digitais” que necessitam de ver assegurada a sua autenticidade. O

projecto desenvolveu uma solução para as necessidades de preservação desses objectos que

justificam a preservação a longo termo e um protótipo da mesma com a intenção de se

poder escalar conforme as necessidades das organizações no que respeita à transferência de

“objectos digitais” de preservação a longo termo.

O RODA faz o “restauro digital” dos vários acervos a ser integrados no repositório

de modo a migrá-los para os formatos usados no repositório de forma a uniformizar o

conteúdo do mesmo. O “restauro digital” tem as seguintes fases:

1. Análise – Análise das unidades de instalação fornecidas, dos dados e dos

metadados.

2. Validação – Validação do formato dos dados e do conteúdo dos metadados.

3. Correcção – Fase extra de correcção dos erros detectados nos metadados.

4. Migração – Migração dos metadados para os esquemas definidos no esboço do

repositório, e migração dos dados segundo as políticas definidas.

5. Refrescamento – Refrescamento do fundo resultado das fases anteriores para um

novo conjunto de unidades de instalação. ”16

16 In: INSTITUTO DOS ARQUIVOS NACIONAIS/TORRE DO TOMBO – RODA: Repositório de Objectos Digitais Autênticos [Em linha] [Consult. 11, Jan. 2007]. Disponível em <http://roda.iantt.pt/.>

Page 31: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.31/50

O RODA distingue três tipos de objectos. Os objectos de Descrição (OD) que

guardam a informação descritiva (EAD), os objectos de Representação (OR) que contêm a

representação de um objecto descrito num objecto de Descrição e por fim, os objectos de

Preservação (OP) que são utilizados para guardar meta-informação de preservação

(PREMIS17).

Um repositório digital com as características do RODA tem necessariamente de ser

suportado por um conjunto de esquemas de meta-informação capazes de assegurar a

realização de actividades elementares como a gestão de objectos digitais, facilitar a sua

localização ou garantir a conservação do valor probatório:18

• Meta-informação descritiva - Norma Internacional de Descrição Arquivistica – ISAD(G) - Encoded Archival Description – EAD - Dublin Core Metadata Initiative - Recomendações para catalogação de colecções fotográficas – SEPIADES • Meta-informação de preservação - PREMIS – PREservation Metadata Implementation Strategies • Meta-informação técnica - NISO Z39.87 – Technical Metadata for Digital Still Images • Meta-informação estrutural - METS – Metadata Encoding and Transmission Standard

17 Define um esquema de meta-informação que está organizado segundo um modelo simples que identifica 5 entidades envolvidas nas actividades de preservação digital 18 Pode ser consultado em http://roda.iantt.pt/?q=pt/system/files/BAD-1.1.pdf

Esquema da meta-informação de suporte ao repositório

Page 32: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.32/50

Sendo que, os esquemas EAD e PREMIS são os formatos sempre usados e os

formatos NISO Z39.87 e METS são substituídos por esquemas do mesmo tipo mas

apropriados dependendo do tipo de formato dos “objectos digitais”. Neste caso eram os

apropriados aos formatos TIFF e CSV.

A organização do conjunto de esquemas de meta-informação é baseada no PREMIS

Data Model:

Em que a EAD toma o lugar da descrição da Entidade Intelectual e o NISO Z39.87

estende o PREMIS na descrição do Objecto. O METS estrutura os ficheiros, formando

uma representação da Entidade Intelectual:

Page 33: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.33/50

Na migração do conteúdo dos acervos para estas estruturas, há transformações

necessárias para se uniformizar a informação pelas estruturas e políticas definidas. É

preciso interpretar e separar os vários tipos de meta-informação diferentes existentes em

cada objecto digital e passá-los para os esquemas escolhidos, transformar também a

informação, por exemplo, retirando a compressão, entre outras transformações a fazer.

Page 34: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.34/50

6. EAC A EAC é uma dtd com base na norma ISAAR (CPF) [Norma Internacional para os

Registos de Autoridade Arquivística Relativos a Instituições, Pessoas Singulares e

Famílias], operável nos formatos SGML e XML.

Uma estrutura normalizada usada para codificar informação referente às

circunstâncias de criação e uso dos arquivos, incluindo a identificação, as

características e inter-relações das organizações, pessoas e famílias que

criaram, usaram ou foram o assunto dos arquivos.

Pearce-Moses, Richard – A Glossary of Archival and Records Terminology

6.1. Da ISAAR(CPF) para a EAC

Seguindo a estrutura apresentada na EAD, também aqui a consideração acerca dos

pontos de ligação da EAC para a ISAAR (CPF) é um ponto a guardar. A tabela

seguinte apresenta os pontos de ligação entre as duas estruturas:

Page 35: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.35/50

Page 36: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.36/50

6.2. Contexto

Daniel Pitti, em 1999, expõe a ideia de criar uma DTD baseada na ISAAR (CPF)

compatível com a EAD que facilitasse a criação de uma base de dados internacional. Esta

base de dados seria biográfica e historial, documentando pessoas singulares, pessoas

colectivas e famílias, que servisse de entrada para as fontes e descrições arquivísticas.

Facilitar a descrição de acervos complexos e dispersos era o objectivo principal da criação

desta DTD e base de dados.

Presentemente, a única versão da EAC ainda se encontra em versão Beta.

6.3. Elementos

Numa primeira análise, a EAC tem dois elementos superiores e principais: o

eacheader> e o <condesc>.

Passamos a explicar melhor:

• <eacheader> - elemento que contém informação usada no controlo da

descrição do produtor; contém dois principais sub-elementos:

• <eacid> - identificador • <mainhist> - historial de manutenção

• <condesc> - elemento de descrição do produtor; contém:

• <identity> - estrutura complexa contendo o nome ou usado pela entidade no curso da sua existência

6.4. Vantagens

As principais vantagens de uma estrutura como a EAC prendem-se com o facto de a

descrição dos criadores dos arquivos ser uma componente importante para a preservação

da evidência documental da actividade humana. Ainda, uma estrutura destas facilita o

acesso e a interpretação do acervo, pondo termo a um grande entrave de interpretação do

mesmo causado pela não normalização dos nomes dos responsáveis: o uso de

pseudónimos, as mudanças nos nomes das organizações como passagens para sociedades

anónimas, vários exemplos clarifica esta questão. A EAC permite normalizar o nome de

Page 37: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.37/50

um responsável, assim como juntar, permitir e reunir sob esse nome todas as suas obras

produzidas. Como pode ser visto como exemplo no Anexo 5 (na linguagem XML) e no

Anexo 6 (Visto pelo utilizador).19

19 Exemplos retirados de: UNIVERSITY OF VIRGINIA, Institute for Advanced Technology in the

Humanities - Encoded Archival Context [Em linha] [Consult. 11, Out. 2006]. Disponível em

<http://www.iath.virginia.edu/eac/>

Page 38: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.38/50

7. Conclusões

Podemos dizer desde já que este trabalho foi bastante proveitoso para ambas já que

nos alargou imenso os nossos horizontes pois o tema era vasto e obrigou-nos a perceber

outros assuntos que se interligavam com o tema central. Seguidamente apresentamos

algumas conclusões ou considerações finais que mais destacamos no final da realização

deste trabalho.

A primeira conclusão e que é também uma “crítica” foca-se na existência de uma

grande quantidade de normas e estruturas existentes para a descrição arquivística,

relativamente simplistas, que são por si um obstáculo à tão apelada normalização,

principalmente porque nenhuma norma ou estrutura de descrição reune tudo o que é

necessário. Desta maneira, as normas necessitam de se complementar entre si, acabando

assim por demorar. Ou seja, este seria um processo muito mais simples e bem conseguido

se por exemplo cada país e cada organização ligada à informação, ao invés de fazer

esforços em criar a sua norma, se preocupasse em reunir esforços com o objectivo de um

consenso internacional que levasse à criação de uma única norma de descrição arquivística

que fosse constituida por todos os requisitos necessários à boa descrição e que realmente

atingisse os objectivos da normalização.

Concluimos também que existe uma crescente necessidade de normalizar os

conceitos usados na descrição arquivística, isto é, face a esta normalização não existiria a

necessidade de, sempre que se cria uma nova norma ou estrutura, se criarem tabelas para

fazer a ponte entre os conceitos de uma norma para outra. No entanto, a criação de uma

estrutura e de conceitos, tem de ser constituída por simplicidade e simplificação, para

poder ser aceite internacionalmente e poder ser normalizada.

Nos dias de hoje existe uma maior preocupação com a organicidade da informação

consoante a instituição que a agrega do que com o seu conteúdo intelectual. A

normalização poderá ser geral, ser informacional em pleno, independentemente do tipo de

instituição, ou deve continuar numa descrição que é apenas arquivística? Não seria mais

vantajoso mudar e criar uma norma, não de apenas descrição arquivística, mas de descrição

Page 39: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.39/50

informacional? Seria possivel com uma união de esforços? Ficam as nossas questões, uma

vez que concordamos que sim, que seria possível e mais vantajoso também.

Page 40: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.40/50

8. Referências Bibliográficas

- DGARQ: Direcção Geral de Arquivos [Consult. em 20 Nov. 2007]. Disponível em

<http://www.dgarq.gov.pt/>.

- EAC: Encoded Archival Context [Consult. em 31 Out. 2007]. Disponível em

<http://jefferson.village.virginia.edu/eac/>.

- EAD: Encoded Archival Description [Consult. em 30 Out. 2007]. Disponível em

<http://www.loc.gov/ead/>.

- Glossário da Sociedade da Informação [Consult. em 09 Nov. 2007]. Disponível em

<http://www.ait.pt/pdf/bibliografia/glossario_sociedade_informacao.pdf>.

- PINTO, Maria Manuela Gomes de Azevedo – Do “efémero” ao “sistema de

informação”: a preservação na era digital [Consult. em 18 Nov. 2007]. Disponível em

<http://ler.letras.up.pt/uploads/ficheiros/3083.pdf>.

- RIBEIRO, Cristina – Meta-Informação [Consult. em 25 Set. 2007]. Disponível em

<http://paginas.fe.up.pt/~mcr/adoc/Metadata02Arch.pdf>.

- RODA: Repositório de Objectos Digitais Autênticos – Projectos Associados

[Consult. em 13 de Dez. 2007]. Disponível em

<http://roda.iantt.pt/?q=pt/projectos_associados>.

- RODA: Repositório de Objectos Digitais Autênticos – Restauro Digital [Consult.

em 13 de Dez. 2007]. Disponível em <http://roda.iantt.pt/pt/node/32>.

Page 41: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.41/50

- The Library of Congress [Consult. em 21 Nov. 2007]. Disponível em

<http://www.loc.gov/index.html>.

- Tutorial XML [Consult. em 03 Jan. 2008]. Disponível em

<http://www.gta.ufrj.br/grad/00_1/miguel/index.html>.

- Verde, Isidro Vila – XML: Extensible Markup Language [Consult. em 03 Jan.

2008]. Disponível em

<http://paginas.fe.up.pt/~jvv/Assuntos/XML/xml_ficheiros/v3_document.html>.

Page 42: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.42/50

9. Anexos

9.1. Anexo 1

<?xml version="1.0" encoding="iso-8859-1" standalone="no"?> <?xml-stylesheet type="text / css" href ="estiloxml.css"?> <!DOCTYPE casas SYSTEM "./ ex2.dtd"> <casas> <casa name="gaio" nq="4"> <contacto> <tel num="256888888"/> <morada> Lugar do Cerquido Estorãos <codigopostal> 4990-125 </ codigopostal> </morada> </contacto> <descricao> Casa de aldeia, situada numa encosta da serra de Arga, virada a nascente, a 12Km de Ponte de Lima </descricao> </casa> </casas>

VOLTAR

Page 43: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.43/50

9.2. Anexo 2

<?xml version="1.0" encoding="iso-8859-1" standalone="no"?> <?xml-stylesheet type="text / css" href ="estiloxml.css"?> <!DOCTYPE casas SYSTEM "./ ex2.dtd"> <casas> <casa name="gaio" nq="4"> <contacto> <tel num="256888888"/> <morada> Lugar do Cerquido Estorãos <codigopostal> 4990-125 </codigopostal> </morada> </contacto> <descricao> Casa de aldeia, situada numa encosta da serra de Arga, virada a nascente, a 12Km de Ponte de Lima </descricao> </casa> </casas>

VOLTAR

casas{ background-color: # ffffee; color: # 008000; } descricao { font-size: 150%; margin: 1cm; float: left; }

Page 44: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.44/50

9.3. Anexo 3

Page 45: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.45/50

VOLTAR

Page 46: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.46/50

9.4. Anexo 4

VOLTAR

Page 47: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.47/50

9.5. Anexo 5

Page 48: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.48/50

VOLTAR

Page 49: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.49/50

9.6. Anexo 6

Entity Description

Identity Section

Used: Shakespeare, William, 1564-1616

Not used:

Sek`spiri, Uiliam

Saixper, Gouilliam

Shakspere, William

Shikisbir, Wilyam

Szekspir, Wiliam

Sekspyras

Shekspir, Vil'iam

Sekspir, Viljem

Tsikinya-chaka

Sha-shih-pi-ya

Shashibiya

Shekspir, Vilyam

Shakspir, Vilyam

Syeiksup`io

Shekspir, V. (Vil'iam)

Szekspir, William

Shakespeare, Guglielmo

Page 50: Relatório Meta-Informação e a EAD e EAC- Pre.Con.- Ana ...paginas.fe.up.pt/~ci05020/trabalhos/LCI_PreCon_AnaLuisaVeiga... · que são apresentados vários exemplos de modelos de

Pág.50/50

Shake-speare, William

Sha-o

Sekspir

Shekspir, Uiliam

Shekspir, U. (Uiliam)

Sekspir, Vilijam

Record Control Information

Record type: personal name

Editorial status: draft

Language encoding standard: iso639-2b

Script encoding standard: iso15924

Date encoding standard: iso8601

Country encoding standard: iso3166-1

Owner encoding standard: iso15511

Record identifier: US::VaU::Example01

Maintenance history:

Name Date Event

Daniel Pitti

May 9, 2001

Record created using LCNAF record found on the Internet. Incomplete source data available.

Language/Script of description: English in Latin Script.

Descriptive rules: Anglo-American Cataloging Rules, Second Edition.

Source: Library of Congress Name Authority File, record id: One of these for each 670 VOLTAR