IISimpósioInternacionalNetworkScience 2018–RiodeJaneiro
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL
CaterinaGroposoPavão1;EduardoNunesBorges2;LuisAlbertoBarbosaAzambuja2;RafaelPortdaRocha1;ReneFaustinoGabrielJunior1;SamileA.de
SouzaVanz1;SôniaElisaCaregnato11UFRGS;2FURG;
A expressão ciência aberta(CA) geralmente se refereaosesforçosparatornarosresultados das pesquisas,financiadas com recursospúblicos, mais acessívelp a r a a c om u n i d a d ecientí f ica, o setor denegócios e a sociedade emgeral.
A CA é ummarco geral depressupostos sobre comodeveria ser a disseminaçãodoconhecimentoeabrangeáreas como ciência cidadã,dados científicos, revisãopor pares, novas métricasalternativas,etc.
2
Dadosgovernamentaisabertosvisamcolocardadosdogovernoemumaformaacessívelatodososcidadãos.
Dadoscientíficosabertospossuemcomplexidadesespeciais,devidoànecessidadedepadrõesdemetadados,privacidade,interoperabilidade,identificadorespersistentes,reprodutibilidadeepreservação.
3
IWorkshopinstitucionalsobreCiênciaAberta
Dainfraestrutura(quelidacomaarquiteturatecnológica)
Daspolíticaspúblicas(quelidam
comoacessoaoconhecimento)
Damensuração(impactoemétricas
alternativas)
Ademocrática(queserefereaoacessoaoconhecimento)
Apragmática(pesquisa
colaborativa)
4
As estratégias e linhas detrabalho, em CA, têmcomo princípio básico aconv i c ção de que oconhecimento é um bempúblicoequegrandepartede seus resultados tems ido f i nanc iada comrecursospúblicos.
O compartilhamentode dados é o ato dedisponibilizá-los parasuareutilização.
5
Os dados da pesquisa abrangem todas as disciplinas e, portanto, adefinição pode variar em relação às abordagens dos diferentes atores(pesquisadores, instituições, órgão de fomento, etc.) e aos diferentescontextosnacionais.
Dadosdepesquisasãoasinformaçõesregistradasouproduzidasporqualquerformaoumeioduranteoprocessodeinvestigação.
Atéentãoospesquisadoresprecisamlocalizardocumentosemdiferentesfontes,comorepositóriosebasesdedados.
Hoje cresce a demanda pordados de investigação, ospesquisadoreseasinstituiçõesquerem ter acesso aos dadosemsi.
6
E m t o d o o m u n d o , h ádeclarações de apoio ao AA adados de pesquisa, desde oGlobal Research Council, o G8ScienceMinisters e a ComissãoEuropéia.
Ao mesmo tempo, as agênciasde fomento, de diversos países,declaram explicitamente comocondição de financiamento queseus resultados devem serpublicadosemAA.
O Horizonte 2020 da UniãoEuropeiaexigequeosresultadose dados científicos resultantesde pesqu i sas f inanc iadasestejam disponíveis para todososcidadãos.
A Agencia Estatal ConsejoSuperior de lnvestigacionesCientíficas da Espanha (2019)so l i c i t a que o s datase t sassociados às publicações sejamdivulgadosemAAeorientaqueosdadosdevemserFAIR.
7
IWorkshopinstitucionalsobreCiênciaAberta
Reproduzirevalidarosresultados
Gerarnovaspesquisase
conhecimento
Maiortransparêncianaaplicaçãodosrecursos
Preservaraintegridadedainvestigação
Evitaraduplicaçãode
esforços
8
NoBrasiloIBICTlançou,em2016,oManifestodeDadosAbertos.Em2011,aFAPESPpublicouoCódigodeBoasPráticas,queestabelecequeos pesquisadores devem disponibilizar osregistrosresultantesdesuaspesquisas.
AslegislaçõesnacionaisdeAA,doMéxico(2014),doPeru(2015)edaArgentina(2016)incluemdadoscientíficoscomopartedapolítica.AColômbia,emdez.de2018,publicouintençõesnacionaisparaaCiênciaAberta.
9
*https://www.re3data.org/browse/by-country/Acessoem:09/04/2019
*https://www.re3data.org/browse/by-country/em:09/04/2019
País Númeroderepositórios*
Argentina 1
Brasil 8
Chile 1
Colômbia 2
México 11
Panamá 2
Peru 2
10
Oprojeto RDP-Brasil foi selecionado pela RedeNacional de Ensino e
Pesquisa (RNP),emparceriacomo InstitutoBrasileirode Informação
emCiênciaeTecnologia(IBICT),poratenderacarta-conviteRNP/IBICT
de01/2017,quebuscouaseleçãodeumGrupodeTrabalho(GT)para
atuar, em parceria, na identificação de práticas de Acesso Aberto a
Dados de Pesquisa no Brasil e no desenvolvimento de experimentos
tecnológicosvisandoumfuturoserviçodeAADP.
11
O projeto foi desenvolvido por pesquisadores ligados ao Centro de
DocumentaçãoeAcervoDigitaldaPesquisa(CEDAP/FABICO/UFRGS)e
aoCentrodeCiênciasComputacionais(C3)daFURG.
Teve como objetivo geral realizar um levantamento de informações
quesubsidiassemasprimeirasaçõesnoâmbitodoAcessoAbertoa
DadosdePesquisa(AADP)nopaís,visandoàidentificaçãodepráticas
deAADPeparaodesenvolvimentodeumfuturoserviçodeAA.
12
Objetivos e Metodologia
1) IdentificarasiniciativasbrasileirasnodiretóriointernacionalResearchDataRepositoriesInformation(Re3data);
2) aplicar questionário “Práticas e percepções sobre acessoabertoadadosdepesquisanoBrasil”;
3) identificarassoluçõestecnológicasmaisutilizadas,pormeiodos dados coletados no Re3data e nas respostas doquestionárioe
4) desenvolver um protótipo de solução tecnológica paraatenderaumconjuntodeusuáriosselecionados.
13
Objetivo 1 – Resultados (15repositórios)
a) Quatrorepositóriosdeabrangênciainternacional;b) Onzenacionais,sendocincomulti-institucionais;c) predominam as áreas de geociências e ciências
biológicaseagrárias;d) cincodivulgampolíticas;e) quadroinformamospadrõesde
metadadosusadosef) doisutilizamoDSpaceeumoDataverse.
IWorkshopinstitucionalsobreCiênciaAberta14
Objetivo 2 – Resultados (4.735respostas)
68%
compartilharamdadosdealgumamaneira
utilizaramdadosabertoscompartilhadospor
outrosgrupos
39,5%
utilizaramalgumrepositórioparaacessardados
31,7%
31,9% apontamafaltadeinfraestruturacomodificuldadeparacompartilhamentoe21,4%indicamafaltadepadronizaçãodosdados
47,7% apontamqueainstituiçãodopesquisadordeveoferecerserviçosdeapoioàgestãodosdadosdepesquisa
25,0% jáelaboraramumplanodegestãodedados15
Objetivo 3 - ResultadosPrincipais atributos
Ferramentas estudadas DSpace Dataverse CKAN
Código aberto
Ambiente web
Desenvolvimento Java
Interface multilíngue
Princípios OAIS
Desenvolvimento específico para dados de pesquisa
Inclusão de qualquer tipo de material digital
Hierarquização de conteúdos
Organização dos dados em datasets
Registro e autenticação de usuários
Políticas específicas por comunidade, usuários, submissão e acesso
Data Research and Information Management (DRIM)
Busca e a interoperabilidade semântica
Protocolo OAI-PMH
Princípios FAIR
Metadados de citação
Versionamento de dados de pesquisa
Identificador persistente (DOI, Handle)
Esquemas de metadados específicos (Perfil de Aplicação)
Application programming interface (API) para facilitar: pesquisa, depósito, acesso e visualização dos dados armazenados
Comunidade no Re3data (no. de repositórios) 61 69 51
Objetivo 4 - Resultados (Protótipo-https://dadosabertos.rnp.br/)
IWorkshopinstitucionalsobreCiênciaAberta17
Para prover ações de Acesso Aberto a Dados de Pesquisa(AADP)deve-se:
Identificaraspráticasinstitucionais
Identificarpotenciaisusuários
Levantareexperimentarserviçosesoluçõestecnológicas
18
O desenvolvimento de repositório deve seguir uma série demodelos de referência e princípios, para manter o máximo decompatibilidadeepadronizaçãocomo,porexemplo:
IISimpósioInternacionalNetworkSicence,RiodeJaneiro2018
ModelodeReferênciaOAIS-OpenArchivalInformationSystem(ISO1472:2003)
Identificadorespersistentes,comooDigitalObjectIdentifier(DOI)ouHandle
CertificaçãoCoreTrustSealDataRepository
PrincípiosFAIR
19
OsprincípiosFAIRindicamqueosdadosdevem:
IISimpósioInternacionalNetworkSicence,RiodeJaneiro2018
Localizáveis(Findable)
Acessíveis(Accessible)
Interoperáveis(Interoperable)
Reusáveis(Reusable)
Possuir identificadores únicos, persistentes e globais. Ser descritos por metadados indexáveis e ricos.
Ser recuperáveis pelo seu identificador, por meio de protocolo de comunicação padronizado, aberto e gratuito.
Ser representados em linguagens formais. Usar vocabulários controlados que sigam princípios FAIR. Ligar (meta)dados.
Ser aceitos pela comunidade. Conter atributos relevantes, precisos e úteis, Incluir metadados de proveniência. Conter licenças claras e acessíveis.
20
IISimpósioInternacionalNetworkSicence,RiodeJaneiro2018
ACAéoencontrodaantigatradiçãodeaberturanaciênciaeasferramentasdas tecnologiasde informaçãoecomunicação (TICs)que reformularam o fazer ciência e exigem um olhar crítico dosresponsáveispelaelaboraçãodepolíticasquebuscampromoverapesquisaalongoprazoetambémainovação.
Governos, comunidades e instituições nacionais e regionaispassarão a identificar o valor estratégico do compartilhamento,fomentando o desenvolvimento de infraestruturas e tecnologiasqueestimulemadisponibilizaçãodosdados.
21
IISimpósioInternacionalNetworkSicence,RiodeJaneiro2018
Está claro que a CA não é uma questão tecnológica, mas umamudança cultural na qual os dados científicos devem serreconhecidos como um resultado significativo no processo dapesquisa.
22
IISimpósioInternacionalNetworkSicence,RiodeJaneiro2018
Relatórios do projeto:
23
IISimpósioInternacionalNetworkSicence,RiodeJaneiro2018
“Os dados são preciosos e durarão mais que os próprios
sistemas”
Obrigada Tim Berners-Lee (2006). Disponível em : https://www.bcs.org/content/ConWebDoc/3337. Acesso em: 09/04/2019. 24