26
Prof. Dr. Pedro Luiz Pizzigatti Corrêa [email protected] Departamento de Engenharia de Computação e Sistemas Digitais Escola Politécnica da Universidade de São Paulo Gestão de dados científicos: desafios e perspectivas Workshop de Produção Científica para Equipes do SIBiUSP 28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

Workshop de Produção Científica para equipes do SIBiUSP - 1ª parte

Embed Size (px)

Citation preview

Prof. Dr. Pedro Luiz Pizzigatti Corrêa [email protected]

Departamento de Engenharia de Computação e Sistemas Digitais

Escola Politécnica da Universidade de São Paulo

Gestão de dados científicos: desafios e

perspectivas

Workshop de Produção Científica para Equipes do SIBiUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

2 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

Agenda

1. INTRODUÇÃO;

2. POR QUE FAZER GESTÃO DE DADOS CIENTÍFICOS;

3. DESAFIOS PARA A GESTÃO DE DADOS;

4. MODELO DE GESTÃO DE DADOS CIENTÍFICOS;

5. CONCLUSÕES.

3 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

1.Introdução

CONCEITO DADOS, INFORMAÇÃO E CONHECIMENTO

1. DADOS: FLUXOS DE FATOS COLETADOS (BRUTOS) QUE REPRESENTAM

EVENTOS DO DOMÍNIO (EX: UMIDADE, TEMPERATURA, PRECIPITAÇÃO,

OBSERVAÇÃO, COLETA, ETC);

2. INFORMAÇÃO: CONJUNTOS DE DADOS SIGNIFICATIVOS E ÚTEIS A SERES

HUMANOS EM PROCESSOS COMO O DE TOMADA DE DECISÕES;

3. CONHECIMENTO: INFORMAÇÕES INTER-RELACIONADAS NÃO ESTRUTURADAS

DE REGRAS QUE DIRECIONAM AS TOMADAS DE DECISÕES.

Fonte: Laudon & Laudon, 2011

4 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

1. Introdução: Exemplo de Fluxo de dados

do monitoramento da biodiversidade em

Unidades de Conservação

Fonte: Autor.

5 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

Agenda

1. INTRODUÇÃO;

2. POR QUE FAZER GESTÃO DE DADOS CIENTÍFICOS;

3. DESAFIOS PARA A GESTÃO DE DADOS;

4. MODELO DE GESTÃO DE DADOS CIENTÍFICOS;

5. CONCLUSÕES.

6 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

2. Por que a gestão de dados?

PORQUE APLICAR AS TÉCNICAS E CONCEITOS DE GESTÃO DE

DADOS?

7 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

2. Por que a gestão de dados?

1. PARA CAPTURAR, ARMAZENAR, PROTEGER E GARANTIR A INTEGRIDADE

DOS ATIVOS DE DADOS CIENTÍFICOS;

2. GARANTIR A UTILIZAÇÃO ADEQUADA DOS DADOS E INFORMAÇÕES;

3. MAXIMIZAR O USO EFICAZ DOS DADOS E AGREGAR VALOR AOS ATIVOS

DA INSTITUIÇÃO.

Fonte: DAMA International, The DAMA Guide to the Data

Management Body of Knowledge

8 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

2. Por que a gestão de dados?

Fonte: http://news.bbc.co.uk/1/hi/uk/8332445.stm

SE SEUS DADOS CAIREM EM MÃOS

ERRADAS?

9 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

2. Por que a gestão de dados?

Fonte: The Telegraph

SE FOR NECESSÁRIA REPRODUZIR AS

ANÁLISES?

10 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

2. Por que a gestão de dados?

Fonte: http://g1.globo.com/sao-paulo/noticia/2010/05/incendio-no-instituto-butantan-destroi-maior-acervo-de-

cobras-do-pais.html

SE ESTE FOR O SEU INSTITUTO DE

PESQUISA?

11 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

2. Por que a gestão de dados?

Fonte: http://blogs.ch.cam.ac.uk/pmr/

2011/08/01/why-you-need-a-

data-management-plan

SE ESTA FOR A SUA

MOCHILA?

“O HD EXTERNO É MUITO

IMPORTANTE, POIS CONTÉM 5

ANOS DE DADOS DE

PESQUISAS…”

12 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

2. Gestão de dados

“GESTÃO DE DADOS É A DISCIPLINA RESPONSÁVEL POR DEFINIR,

PLANEJAR, IMPLANTAR E EXECUTAR: ESTRATÉGIAS, PROCEDIMENTOS

E PRÁTICAS NECESSÁRIAS PARA GERENCIAR DE FORMA EFETIVA OS

RECURSOS DE DADOS E INFORMAÇÕES DAS ORGANIZAÇÕES,

INCLUINDO PLANOS PARA SUA DEFINIÇÃO, PADRONIZAÇÃO,

ORGANIZAÇÃO, PROTEÇÃO E UTILIZAÇÃO.”

A GESTÃO DE DADOS É UM CONCEITO BASTANTE AMPLO, ELA ATUA

NOS NÍVEIS: OPERACIONAL, GERENCIAL (TÁTICA) E ESTRATÉGICO.

Fonte: DAMA-DMBOK

13 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

Agenda

1. INTRODUÇÃO;

2. POR QUE FAZER GESTÃO DE DADOS CIENTÍFICOS;

3. DESAFIOS PARA A GESTÃO DE DADOS;

4. MODELO DE GESTÃO DE DADOS CIENTÍFICOS;

5. CONCLUSÕES.

14 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

3. Desafios: Dados órfãos

• INFORMAÇÃO QUE SE TORNOU IRRECUPERÁVEL POR ESTAR LOCALIZADA

EM DISPOSITIVOS NÃO MAIS ACESSÍVEIS, COMO NOTEBOOKS, E QUE

NUNCA FORAM TRANSFERIDAS PARA SERVIDORES COMPUTACIONAIS;

• INFORMAÇÕES PERDIDAS APÓS O DESLIGAMENTO DE

PESQUISADORES/FUNCIONÁRIOS DA INSTITUIÇÃO;

• DADOS DE PESQUISADORES NÃO ASSOCIADOS A NENHUMA REDE DE

DADOS.

?

??

15 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

3.Desafios: “Dilúvio” dos

Dados

Fo

nte

: w

ww

.ca

rbo

afr

ica

.ne

t

Redes, Sensores, Sensoriamento

Remoto, Experimentos, Coletas…

16 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

3. Desafios: “The Long tail” da

Gestão dos Dados

VO

LU

ME

VARIEDADES DE DADOS

Repositórios Especializados

Dados órfãos

“A maioria dos bytes

estão no topo, mas na

medida em que aumenta

a variabilidade dos dados

diminui o volume.” – Jim

Gray, Microsoft research

Fonte: DataONE

17 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

3. Desafios/Questões sobre a

Gestão de Dados Científicos

Como eu

mantenho meus

dados?

Quais são as

ferramentas

de QA/QC?

O que é um

plano de gestão

de dados?

O que são

metadados?

Como

preservo

meus dados?

Planejar

Coletar

Assegurar

Descrever

Preservar

Descobrir

Integrar

Analisar Como devo

organizar

meus dados?

Como posso

visualizar e

analisar os

dados?

Que

ferramentas

eu posso

utilizar?

Que outros

dados

existem?

Fonte:

DataONE

18 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

Agenda

1. INTRODUÇÃO;

2. POR QUE FAZER GESTÃO DE DADOS CIENTÍFICOS;

3. DESAFIOS PARA A GESTÃO DE DADOS;

4. MODELO DE GESTÃO DE DADOS CIENTÍFICOS;

5. CONCLUSÕES.

19 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

4 - Exemplo do Ministério do Meio

Ambiente – Modelo Conceitual

Framework de

Dados do

Monitoramento

da

Biodiversidade

do Ministério

do Meio

Ambiente

Barr

am

en

to d

e S

erv

iço

s p

ara

ac

ess

o

a d

ad

os d

e B

iod

ive

rsid

ad

e

Formuladores

de Políticas

Públicas

Cientistas e

Pesquisadores

Funcionários

de governos

Educadores e

estudantes

Público em

Geral

ICMBio

IBAMA

Serviço

Florestal

Brasileiro

Jardim

Botânico do

Rio de

Janeiro

ANA

Iniciativas

Complementares

ex: SIBBr, GBIF

e DataONE

Fornecedores

de Dados

Biológicos

Consumidores

de Informação

Biológica

Figura. Sistema de informação para

integração de dados do Ministério do

Meio Ambiente (Corrêa, 2012) B

arr

am

en

to d

e S

erv

iço

s d

e I

nte

gra

çã

o d

e

da

do

s d

e

Bio

div

ers

ida

de

20 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

A Política de Dados Científicos endereça questões como:

A. Quais são os objetivos e as prioridades ? Exemplo:

– Estimular a colaboração entre as instituições e grupos

de pesquisa;

– Apoiar o desenvolvimento da Nova Ciência baseada em

dados abertos.

B. Quais são os instrumentos necessários ? Exemplo:

– Modelo organizacional adotado: Baseado em federação

de nós de dados.

– Avaliar demandas em termos de regulamentações

necessárias para estímulo a publicação e valorização da

citação de dados científicos.

4 - Política Institucional para a

Gestão de Dados Científicos

21 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

B. Quais são os instrumentos necessários ?

(Continuação)

– Apoiar as Instituições no planejamento e gestão de

dados científicos;

– Estimular a formação de recursos humanos:

treinamento de profissionais e pesquisadores

(extensão/capacitação e pós-graduação);

– Cyberinfrastructure: quais são as etapas do ciclo de

vida dos dados a serem consideradas ? Utilizar

ferramentas computacionais voltadas para um

domínio específico da ciência ? Ferramentas

genéricas para todos os dados científicos ? Definir

padrões de metadados e protocolos para a

interoperabilidade ?

4 - Política Institucional para a

Gestão de Dados Científicos

22 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

4 - Diretrizes para um plano de

gestão dos dados científicos

C. Planejamento da gestão dos dados, definindo metas de

curto, médio e longo prazo. Exemplo de Metas de Curto

Prazo:

– Dignóstico/caracterização da situação atual da gestão

dos dados científicos;

– Estimular a capacitação e difusão de conhecimento

em gestão de dados científicos: apoio a plano de

dados em projeto de pesquisa.

– Disponibilizar serviços já existentes em outros países

como: DOI de Dados, Ferramentas de Planejamento

de Dados.

23 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

Agenda

1. INTRODUÇÃO;

2. POR QUE FAZER GESTÃO DE DADOS CIENTÍFICOS;

3. DESAFIOS PARA A GESTÃO DE DADOS;

4. MODELO DE GESTÃO DE DADOS CIENTÍFICOS;

5. CONCLUSÕES.

24 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

DADOS POSSUEM UMA VIDA ÚTIL MAIS LONGA QUE

O PROJETO DE PESQUISA OU SEU PESQUISADOR...

Foto de @Moyan_Brenn

http://www.flickr.com/photos/ai

gle_dore/6225529941/ 24

PESQUISADORES CONTINUAM TRABALHANDO COM

OS DADOS APÓS O FIM DE PROJETOS...

OS DADOS PODEM SER REUTILIZADOS POR

OUTROS PESQUISADORES OU PROJETOS...

5 – CONCLUSÕES

25 WORKSHOP DE PRODUÇÃO CIENTÍFICA PARA EQUIPES DO SIBIUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP

DADOS CIENTÍFICOS ORGANIZADOS,

DOCUMENTADOS, PRESERVADOS E

COMPARTILHADOS (INFORMAÇÃO) POSSUEM UM

VALOR INESTIMÁVEL PARA VIABILIZAR A NOVA

CIÊNCIA BASEADA EM DADOS ABERTOS.

Foto de @Moyan_Brenn

http://www.flickr.com/photos/ai

gle_dore/6225529941/ 25

FERRAMENTAS COMPUTACIONAIS INTEROPERÁVEIS

E REUTILIZÁVEIS SÃO FUNDAMENTAIS PARA A

GESTÃO DO CICLO DE VIDA DOS DADOS

CIENTÍFICOS.

5 - CONCLUSÕES

AS INSTITUIÇÕES DE PESQUISA SÃO

RESPONSÁVEIS POR ESTABELECER UM MODELO DE

GESTÃO DE DADOS CIENTÍFICOS.

Prof. Dr. Pedro Luiz Pizzigatti Corrêa [email protected]

Departamento de Engenharia de Computação e Sistemas Digitais

Escola Politécnica da Universidade de São Paulo

Gestão de dados científicos: desafios e

perspectivas

Workshop de Produção Científica para Equipes do SIBiUSP

28/06/2016, Auditório da Escola de Educação Física e Esporte da USP, São Paulo, SP