Upload
internet
View
106
Download
3
Embed Size (px)
Citation preview
Projeto speciesLink
Objetivos originais e resultados alcançados
Objetivo (Fase 1) – Concepção 1999
resolver o problema da integração dos dados históricos contidos nas coleções biológicas, tornando-os amplamente disponíveis para a comunidade científica e educacional.
desenvolver aplicativos que façam uso dos dados integrados, visando criar ferramentas acessíveis a um público mais amplo.
Objetivos principais
(1) Implementar uma rede distribuída de informação sobre biodiversidade para o Estado de São Paulo, explorando as novas tecnologias e melhor conectividade (Internet 2) para a integração de bases de dados heterogêneas e independentes. As bases de dados a serem integradas incluirão 12 coleções biológicas do Estado de São Paulo, a rede Species Analyst e o SinBiota;
A proposta previa a repatriação de dados de subcoleções específicas fora do estado de São Paulo (no Brasil e no exterior)
Objetivos principais
(2) Integrar ferramentas de modelagem de nicho ecológico e de previsão de distribuição geográfica de espécies ao sistema, utilizando dados da rede distribuída descrita no item (1)
Objetivos principais
(3) Desenvolver aplicativos que façam uso dos dados integrados na rede de informação distribuída descrita no item (1) e dos modelos matemáticos de distribuição no item (2) para dar suporte à comunidade científica, educacional, tomadores de decisão e formuladores de políticas ambientais.
Requisitos esperados da rede
Disponibilidade: a rede deve estar disponível, em funcionamento sempre;
Tolerância a falhas: a rede deve ser capaz de operar quando alguns nós não estiverem funcionando;
Desempenho e Robustez: a rede deve ser capaz de processar e responder em um tempo razoável um grande número de solicitações simultâneas;
Descoberta de novos nós: a rede deve ter mecanismos automáticos ou manuais para inclusão de novos nós;
Independência de plataforma: o software deve operar em ambientes computacionais heterogêneos; e,
Escalabilidade: a rede deve ter capacidade para aumentar o número de nós, sem que seja necessário desenvolver novos componentes de software.
Estratégia adotada
software: livre e/ou de código aberto hardware: intel based protocolo de comunicação: participar do
desenvolvimento do DiGIR modelo de dados: adotar e participar da discussão
do modelo DarwinCore sistema on-line de acesso livre e aberto autonomia plena às coleções com relação à escolha
do software de gerenciamento e à disponibilização dos dados (entrada, correção, saída e controle de dados sensíveis feitos pela coleção)
Estratégia Coleções:
Pressuposto Inicial: cada coleção dispunha de um software de gerenciamento e o papel do CRIA seria o de entender o sistema e, com a mínima interferência possível, conectá-lo à rede.
Constatação: a grande maioria das coleções não tinha sistema de gerenciamento implementado e nem equipe de apoio para dar suporte a esse trabalho.
Resultado: foi necessário oferecer suporte com relação à escolha do software de gerenciamento do acervo e serviços como importação dos dados, configuração do computador, etc.
Estratégia repatriação de dados
A proposta original previa a implementação de bolsas para a digitalização de acervos no exterior, de interesse do país.
No entanto as grandes coleções no exterior passaram a digitalizar e disponibilizar seus dados na Internet
Optamos por investir mais no desenvolvimento de tecnologia de integração de dados ao invés de "trazer" esses dados para um servidor central.
Deu-se prioridade a bolsas para auxiliar as coleções na digitalização de seus acervos
Modelagem
desenvolvimento do GARP (Genetic Algorithm for Rule-set Production)em colaboração com a Universidade de Kansas
vinda do Town Peterson e Arthur Chapman produção de alguns trabalhos colaborativosCom a experiência adquirida durante o projeto a
equipe do CRIA concluiu que para tornar a ferramenta de modelagem mais útil e principalmente mais acessível aos pesquisadores, seria necessário o desenvolvimento de um ambiente que automatizasse partes do processo - openModeller
Resultado Fase 1
Coleção Nome Sigla Acervo Total On-line
HERBÁRIO Herbário do Departamento de Ciências Biológicas - LCB/ESALQ
ESA 80.000 730
Herbário do Estado "Maria Eneyda P. Kaufmann Fidalgo" - Instituto de Botânica (IBt)
SP 350.000 192
Coleção de Algas do Herbário do Estado "Maria Eneyda P. Kaufmann Fidalgo" - Instituto de Botânica (IBt)
SP 15.000 11.088
Herbário do Instituto Agronômico, Campinas
IAC 45.000 24.330
Herbário do Departamento de Botânica - IB/USP
SPF 133.500 20.962
Herbário da Universidade Estadual de Campinas - IB/UNICAMP
UEC 130.000 12.860
Subtotal 753.500 70.162
Coleção Nome Sigla Acervo Total On-line*
PEIXES Coleção de Peixes do Departamento de Zoologia e Botânica - IBILCE/UNESP
DZSJRP 23.000 5.714
Coleção de Peixes do Laboratório de Ictiologia de Ribeirão Preto - FFCLRP/USP
LIRP 30.000 4.314
Coleção de Peixes do Museu da USP MZUSP 82.000
Subtotal 135.000 10.028
ÁCAROS Coleção de Ácaros do Departamento de Zoologia e Botânica - IBILCE/UNESP
AcariDZSJRP 7.000 4.734
Coleção de Ácaros do Departamento de Entomologia, Fitopatologia e Zoologia - LEF/ESALQ
AcariESALQ 15.000 12.392
Subtotal 22.000 17.126
MICROGANISMOS Coleção Brasileira de Microrganismos de Ambiente e Indústria - CPQBA/UNICAMP
CBMAI 700 110
Coleção de Culturas de Fitobactérias do Laboratório de Bacteriologia Vegetal - Instituto Biológico de Campinas
IBSBF 2.000 929
Subtotal 2.700 1.039
Total Acervo 913.200 98.355
SinBiota Dados de observação de campo dos projetos do Programa Biota/Fapesp (flora, fauna e microbiota)
37.814 37.814
TOTAL GERAL 951.014 136.169
Proposta para a Fase 2
Ampliação da rede para 33 coleções biológicas do Estado de São Paulo.
revisão do esquema de metadados do portal DiGIR; desenvolvimento de ferramentas para o monitoramento da rede; desenvolvimento de interface para visualização geoespacial dos
resultados; desenvolvimento de ferramentas de apoio à limpeza e correção
de dados; e, disponibilização on-line de dicionários de nomes e bancos de
dados de localidade e coletores.
Nota: o desenvolvimento de um ambiente computacional para modelagem não foi aprovado
Padronização
ferramentas de data cleaning trabalho com coletores (botânica) houve uma breve discussão sobre
padronização de nomes de estados na lista
Resultados
Monitoramento
Data Cleaning
Perfil das Coleções
Informação on-line
Resultados
Grupo Tax.Média
reg. / mês
Média reg. /
Bolsista /mês
Total Acervo
Reg. on-line
% on-line
registros georef.
% de registros georef.
Ácaros 226 195 31.959 24.554 77% 4.472 18%
Aranhas 0 3.500 2.626 75% 0 0%
Entomologia 0 0 303.000 3.519 1% 0 0%
Abelhas 4.913 3.480 203.715 93.696 46% 76.204 81%
Mamíferos 548 913 34.063 22.955 67% 815 4%
Aves 3.271 2450 112.224 22.710 20% 8.967 39%
Peixes 81 166 128.023 97.040 76% 59.902 62%
Repteis e Anfíbios 193 544 109.389 91.936
84%7.124 8%
Herbários 694 948 1.370.885 238.997 17% 78.972 33%
Algas 109 34.776 33.809 97% 0 0%
Xilotecas 407 222 23.500 10.679 45% 80 1%
Microrganismos 26 233 2.688 1.938
72%0 0%
Totais 2.357.722 644.459 27% 236.536 37%
Sinbiota 63.588 63.588 100% 63.588 100%
Total 2.421.310 708.047 29% 300.124 42%
Fase 1 Fase 2 Aumento
Ácaros 2 3 50%
Registros 17.774 24.554 38%
Aranhas 1
Registros 2.626
Entomologia 2
Registros 3.519
Abelhas 2
Registros 93.696
Mamíferos 3
Registros 22.955
Aves 2
Registros 22.710
Peixes 3 4 33%
Registros 10.179 97.040 853%
Fase 1 Fase 2 Aumento
Répteis e Anfíbios 5
Registros 91.936
Herbários 6 12 100%
Registros 74.556 238.997
Algas 2
Registros 33.809
Xilotecas 2
Registros 10.679
Microrganismos 2 2 0%
Registros 1.039 1.938 87%
Coleções 12 40 233%
Registros 103.548 644.459 522%
SinBiota 39.402 63.586 61%
TOTAL 142.950 708.045 395%
Respostas ao questionário - Ácaros
Software: Biota (1), Excel (1), Excel-Biota (1)Plano digitalização:
(1) espécimes já identificados (2) organismos em estudo (pós) na conclusão dos trabalhos
1o. Organização em fichários 1o. Material já organizado
Sugestões: associação parasito – hospedeiro treinamento biota
Respostas ao questionário - Aranhas
Software: Excel (1)
Plano digitalização:Não, tendência organização dos lotes por família
Sugestões: erros na digitação por falta de treinamento, sem uma
noção da estrutura de dados = erros (p.ex. falta de padronização dos nomes das localidades)
Bolsista é bom mas o ideal é a existência de um técnico no quadro funcional
Respostas ao questionário - Entomológica
Software: Access, ExcelPlano digitalização:
Não, sim
Problema apontado: não existe na universidade a função de curador
Sugestões: ferramenta para gerenciar referências bibliográficas ferramenta que permitisse pesquisar organismos relacionados a
determinadas espécies ferramentas de distribuição temporal dos espécimes elaboração de um manual explicando passo-a-passo como
configurar o programa que filtra Estudar junto à Fapesp a possibilidade da criação de bolsas para
digitação de acervos para dar continuidade aos trabalhos
Respostas ao questionário - Abelhas
Software: Excel-Access
Plano digitalização: sim: esquema inicial dos campos,vinculação das
tabelas, relacionamento dos campos
Sugestões: CRIA tivesse uma participação mais efetiva na
escolha do softwareElaboração de um programa ‘único’ pelo CRIA minicurso pré início digitaçãoMaior flexibilidade para inclusão de novos campos
Respostas ao questionário – Mamíferos, aves, ...
Software: Biota, AccessPlano digitalização:
inclusão seguindo a ordem crescente da numeração criação de 2 bancos de dados (roedores, aves),
definição de prioridades por ‘grupo’ (roedores, peles taxidermizadas, ...
Sugestões: treinamento Access extensão do prazo para a digitalização do acervo cursos temas relacionados ao CRIA e coleções para
crescimento profissional dos bolsistas treinamento bolsistas software de gerenciamento
Respostas ao questionário - Peixes
Software: Biota
Plano digitalização: sim: plano geral elaborado em 2000 auxílio
pesquisa Fapesp
Sugestões: treinamento prévio do bolsista na rotina da
coleção (responsabilidade da coleção)
Respostas ao questionário – Anfíbios e Répteis
Software: Access, Excel-BiotaPlano digitalização:
digitalização do acervo já tombado, correção e refinamento, tombamento de outra coleção, digitalização, ...
reorganização da coleção, substituição de etiquetas apagadas, conferência dos livros de registro, inserção de novos exemplares, digitação, disponibilização no speciesLink
Sugestões: CRIA poderia contribuir mais com a escolha do software desenvolvimento de um banco de dados brasileiro, em português trabalhar mais para aprimorar o gazetteer Falta visibilidade ao projeto (comunidade científica e sociedade) ferramenta que organize os dados em gráficos (no. de exemplares e
táxons, listas de espécies por tipo de habitat) Treinamento programa Biota
Respostas ao questionário - HerbáriosSoftware: Excel-Brahms (2), Excel, BrahmsPlano digitalização:
(1) digitalização campos mínimos; (2) imagens digitais de cada espécime; (3) digitação de todos os campos
Banco em dbase para Excel, padronização formato e campos, inclusão de novos campos (coordenadas geográficas)
Digitalização por famílias Digitalização seguindo a ordem alfabética por famílias com verificação de
“ruídos”. Durante o processo a planilha foi simplificada. Os dados serão completados em uma segunda etapa.
Sugestões: continuar com o suporte CRIA via extensão do projeto ou realização de
outro projeto Ampliar a divulgação da rede speciesLink Mais treinamento no uso do software de gerenciamento (Brahms) Ter listas de referência (atualização de nomes e autores de espécies) Desenvolver outros layers no speciesMapper (hidrografia, vegetação, ...) Na busca ‘grupo taxonômico’ não está claro – exemplos explicativos
poderiam auxiliar o usuário. Gênero é um grupo taxonômico mas tem que ser buscado em nome científico...
Incluir um sistema de ‘help’ e exemplos nas ferramentas
Respostas ao questionário - Herbários
Software: proprietárioPlano digitalização:
Prioridade a materiais recém incluídos e daqueles solicitados para empréstimo (informatização antes de sair do acervo)
Sugestões: treinamento: uso das ferramentas speciesLink, programa de
gerenciamento das coleções, divulgação das experiências na implantação de experiências de informatização com modelos de construção de planilhas, programas para inserção de dados, etc.
ferramenta infoxy: problema de precisão das bases (país, estado, município)
Enriquecer o geoLoc com informações sobre a localização dos rios, serras e outros acidentes geográficos
Treinamento ferramentas speciesLink (openModeller) Previsão de mais equipamentos de informática para as coleções em
projetos futuros
Respostas ao questionário – Herbários, Algas
Software: proprietário, Brahms (2), Lantana-Brahms, AccessPlano digitalização:
contratação de empresa de digitação escolha de famílias com boa confiabilidade na identificação das espécies designação de um funcionário para digitação junto com alunos e
bolsistas para assegurar uma continuidade mínimaSugestões:
elaboração de um manual à Fapesp: a bolsa deveria ser concedida ao orientador ou coordenador e
não ao candidato – cada substituição é um processo novo Treinamento Brahms Seria importante contar com pessoas fixas e não bolsistas Problema da bolsa TT onde o tempo é descontado caso o aluno faça pós O CRIA não deveria ‘esquivar’ do papel de sugerir o melhor software a
ser utilizado Curso software de gerenciamento
Respostas ao questionário - xilotecas
Software: Excel
Plano digitalização:sim
Problema:IPT: os projetos que não trazem receita não estão
sendo priorizados por causa da necessidade de cumprir metas de desempenho financeiro
Sugestões: treinamento Brahms
Respostas ao questionário - microrganismos
Software: Excel, proprietário
Plano digitalização: digitalização de acordo com o número de
entrada do microrganismo
Sugestões: treinamento nas ferramentas speciesLink
Uso de ferramentas
24 coleções responderam o questionário
11 não responderamdata cleaning: 20speciesMapper: 15geoLoc: 13spOutlier: 13Conversor: 10openModeller:0Banco de coletores e infoxy: 1 resposta espontânea
(não foi incluída nas opções)