A PRESERVAÇÃO DE DADOS DE PESQUISA
Aula aberta da disciplina Políticas e gestão em preservação do Mestrado
Profissional em Preservação de Acervos de Ciência e Tecnologia –
PPACT/MAST
PRESERVAÇÃO DA REVISTA DO MAST
Periódico / Conteúdo
Base de dados
Crawler
Unidade de Arquivamento (UA)
Metadados
Outros dados
Ciencia da Informação
Coleta / Harvest
LOCKSS Plugin
BIBLIOTECA DIGITAL
Um ambiente onde se juntam coleções, serviços e pessoal que dão apoio ao ciclo completo da criação, disseminação, uso e preservação dos dados, da informação e do conhecimento.
Uma biblioteca digital consiste em conteúdos textuais ou não, interconexões e software.
REPOSITÓRIO DIGITAL
Um serviço de armazenamento de objetos digitais que tem a capacidade de manter e gerenciar materiais por longos períodos de tempo e prover o seu acesso apropriado. Conjunto de ferramentas necessárias para os produtores, disseminadores e usuários de documentos digitais.
A GESTÃO DE DOCUMENTOS, DA INFORMAÇÃO, DOS DADOS DE PESQUISA E DA PRESERVAÇÃO DIGITAL
http://carniana.ibict.br
DESAFIOS DO CONHECIMENTO...
A investigação científica
moderna depende da
disponibilidade de grandes
volumes de dados,
organizados em bases de
dados, públicas ou privadas,
assim como da capacidade
de descobrir, recuperar,
recombinar e processar
dados de pesquisa.
GESTÃO DE DADOS DE PESQUISA
As universidades e instituições de
pesquisa precisam de um Plano de
Gestão de Dados de Pesquisa para
fazer um uso adequado da atual
revolução na Ciência.
As organizações dedicadas à
pesquisa estão respondendo às
diretrizes nacionais sobre políticas
de dados, requerendo agora políticas
institucionais de gestão de dados.
GESTÃO DE DADOS DE PESQUISA
A tecnologia favorece a capacidade de serviço das bibliotecas. O modelo digital foi assumido primeiro pelas bibliotecas
universitárias.
PESQUISAS REALIZADAS
DATAVERSE
É um repositório de dados, onde os pesquisadores podem depositar
todo o material e conteúdo de suas pesquisas fazendo com que os
usuários ao acessarem possam visualizar todo o processo por detrás
daquela pesquisa específica.
Permite o intercambio de dados para o sistema LOCKSS para possível
preservação de dados científicos.
Configuração
Customização
Criação de usuários
Suporte técnico
O QUE É O PROJETO DATAVERSE
UMA ARQUITETURA DE SOFTWARE LIVRE PARA DADOS DE PESQUISA:
PUBLICAR
CITAR
ANALISAR
PRESERVAR
PROPORCIONA INCENTIVOS PARA QUE OS PESQUISADORES POSSAM COMPARTILHAR:
RECONHECIMENTO E CREDITO VIA DADOS DE CITAÇÕES
CONTROLE S DOS DADOS
PRENCHIMENTO DE REQUISITOS PARA PUBLICAÇÃO E FINANCIAMENTO
http://www.dlib.org/dlib/january11/crosas/01crosas.html
O SERVIÇO DE PRESERVAÇÃO DE DADOS DE PESQUISA
PLUGIN
POR QUE USAR DATAVERSE?
Preservação e acesso a longo prazo. Uma identificação persistente que garante que os estudos protegidos com mecanismos que preveem a obsolescência dos dados. Organização e compatibilidade. Cria um arquivo de dados pessoal seguindo padrões de metadados que maximizam sua compatibiliade e recuperação. Atende requisitos para finanaciamento Muitas agências de financiamento exigem que os pesquisadores depositem seus dados em arquivos virtuais de dados para fins de verificação de dados de projetos.
A REDE DATAVERSE
O projeto da Rede DATAVERSE esta sediado no Institute for Quantitative Social Science (IQSS) da Harvard University.
Os primeiros testes com o software foram em 2006 beneficiados pela experiência com o projeto Virtual Data Center (VDS) (1999-2006), uma colaboração da Harvard University e o MIT.
Anterior ao VDC, em 1987, já se trabalhava com a preparação de um guia para um software unico que armazenaria os dados locais usando ferramentas para transferência de informação de catálogos via FTP, para sites dentro dos campus de forma automatizada e em horários marcados.
PRESERVAÇÃO DE DADOS DE PESQUISA
PLUGIN
O DATAVERSE DE HARVARD Esta aberto a todos os pesquisadores atendendo à comunidade como um
repositório geral
O DATAVERSE DE HARVARD
Esta aberto a todos os pesquisadores atendendo à comunidade como um repositório geral
http://datascience.iq.harvard.edu/blog/dataverse-40-next-week
AMEAÇAS
Falha ou perda da mídia
Perda do Hardware
Perda do Software
Erros na comunicação
Falhas nos serviços da Internet
Obsolescência da mídia e do hardware
Obsolescência do software e do formato
Erros por parte dos operadores
Desastres naturais
Ataques externos
Ataques internos
Problemas econômicos
Problemas institucionais
A PRESERVAÇÃO DIGITAL
Estratégias tecnológicas +
Gerenciamento digital
“entendida como um componente de um conjunto agregado de serviços, políticas e especialistas que constituem o contexto do ciclo de vida da informação digital.”
(LAVOIE e DEMPSEY, 2004)
A PRESERVAÇÃO DIGITAL ENGLOBA:
۞ Mecanismos de armazenamento
۞ Gerenciamento de objetos digitais
۞ Estratégias metodológicas
۞ Parâmetros de arquivamento
MODELO DISTRIBUÍDO
Os dados persistem em diversos locais geograficamente distribuídos.
CARACTERÍSTICAS DO MODELO
DISTRIBUÍDO
constituído por múltiplos
computadores (processos);
Ligados por uma rede(Internet);
Não partilham de memória;
Comunicam apenas por mensagens;
Coordenam ações e cooperam entre si.
CARACTERÍSTICAS
Lot of Copies Keep Stuff Safe (LOCKSS)
Desenvolvido na Universidade de
Stanford
Código aberto
Baixo custo
Arquitetura distribuída
Fácil integração com outros softwares
Segue o modelo OAIS
Verificação da integridade P2P
ARQUITETURA DISTRIBUÍDA –
NÓ CENTRAL
PRESERVAÇÃO – TESTE DE INTEGRIDADE
Teste de integridade
Ingestão
PARCERIAS
Convites oficial (USP, UNICAMP,
UFSM, UFPB e UEMA)
Comitês Técnicos
Reuniões via vídeo conferência e
presenciais
Encontros Nacionais
INSTITUIÇÕES PARCEIRAS
Instituições que participam de algum projeto ligado à
preservação digital e possuem documentos digitais em
formatos adequados para preservação digital.
CRESCIMENTO
PRAZO
SUBREDES - PLNS
ACERVOS ARQUIVÍSTICOS REPOSITÓRIOS DIGITAIS
DATAVERSE E A CARINIANA
Compartilhamento efetivo. Dataverse é uma forma conveniente de disseminar dados. A equipe de pesquisa pode trabalhar unidos em um espaço para acompanhamento dos processos e das mudanças nos projetos no correr do tempo. Gerenciamento de dados seguro. Dataverse dá suporte à criação de termos de uso e restrições para limitar o uso e acesso aos dados, além de arquivamento a longo prazo.
Iª ETAPA DO TESTE PILOTO: DATAVERSE
Iª ETAPA DO TESTE PILOTO: DATAVERSE
Possui 50 estudos.
162 arquivos disponibilizados.
43 downloads realizados no
portal:
http://repositoriopesquisas.ibict.br
Iª ETAPA DO TESTE PILOTO: DATAVERSE
Possui 50 estudos.
162 arquivos disponibilizados.
43 downloads realizados no
portal:
http://repositoriopesquisas.ibict.br
Iª ETAPA DO TESTE PILOTO: DATAVERSE
Possui 50 estudos.
162 arquivos disponibilizados.
43 downloads realizados no
portal:
http://repositoriopesquisas.ibict.br
Iª ETAPA DO TESTE PILOTO: DATAVERSE
Possui 50 estudos.
162 arquivos disponibilizados.
43 downloads realizados no
portal:
http://repositoriopesquisas.ibict.br
http://carniana.ibict.br [email protected]
VISITE A CARINIANA!!
http://carniana.ibict.br [email protected]
DESAFIOS DO CONHECIMENTO...
http://carniana.ibict.br [email protected]