24
Nota Técnica HERBÁRIOS VIRTUAIS: CONCEITOS, ESTADO DA ARTE, USOS E RECOMENDAÇÕES. Mike Hopkins 1 1 Universidade Federal Rural de Amazônia, Belém, Pará Introdução: Conceitos e funções Um herbário é uma coleção de plantas secas, e “virtual” significa algo que existe em forma não material. Juntando os dois termos, um “herbário virtual” deveria ser usado para designar uma coleção de imagens de plantas secas, disponibilizada por meios eletrônicos. De fato, o termo herbário virtual está sendo usado principalmente para providenciar informaçoes sobre plantas, com ou sem imagens, provenientes do herbário ou não, disponibilizado na internet. Neste documento, utiliza-se o conceito de disponibilização de imagens digitais de exsicatas herborizadas, e não necessariamente disponíveis na internet. Devido à associação geralmente de “virtual” com a internet, é importante esclarecer que o conceito de herbário virtual não está restrito à internet. Pelo contrário, como uma ferramenta de pesquisa e curadoria, muitas das suas funções e utilidades são melhor aproveitadas fora da internet. Para exemplificar este fato, devem ser considerados os usos e utilidades de virtualização de herbários em três cenários: intra, inter e extra. Usos intra-herbário: consulta de imagens do próprio herbário em terminais locais. Neste caso, os dados são restritos à instituição hospedeira, tendo sido gerados na própria instituição.

Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Embed Size (px)

Citation preview

Page 1: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Nota Técnica

HERBÁRIOS VIRTUAIS: CONCEITOS, ESTADO DA ARTE, USOS E RECOMENDAÇÕES.

Mike Hopkins1

1Universidade Federal Rural de Amazônia, Belém, Pará

Introdução: Conceitos e funções

Um herbário é uma coleção de plantas secas, e “virtual” significa algo que existe em forma não material. Juntando os dois termos, um “herbário virtual” deveria ser usado para designar uma coleção de imagens de plantas secas, disponibilizada por meios eletrônicos. De fato, o termo herbário virtual está sendo usado principalmente para providenciar informaçoes sobre plantas, com ou sem imagens, provenientes do herbário ou não, disponibilizado na internet. Neste documento, utiliza-se o conceito de disponibilização de imagens digitais de exsicatas herborizadas, e não necessariamente disponíveis na internet.

Devido à associação geralmente de “virtual” com a internet, é importante esclarecer que o conceito de herbário virtual não está restrito à internet. Pelo contrário, como uma ferramenta de pesquisa e curadoria, muitas das suas funções e utilidades são melhor aproveitadas fora da internet.

Para exemplificar este fato, devem ser considerados os usos e utilidades de virtualização de herbários em três cenários: intra, inter e extra.

Usos intra-herbário: consulta de imagens do próprio herbário em terminais locais.Neste caso, os dados são restritos à instituição hospedeira, tendo sido gerados na própria instituição.

A utilidade do acesso virtual à propria coleção é principalmente para facilitar a rotina da curadoria do herbário. Tais usos incluem: verificação dos dados no registro ou dos dados informatizados, checagem de erros datilográficos, checagem de identificações e consultas rápidas. A grande vantagen da virtualização é permitir ao curador organizar as imagens das amostras em diferentes ordens, por exemplo, por coletor, ou local de coleta, reduzindo bastante o tempo envolvido na busca de informaçoes e os danos que ocorrem durante uma consulta física. Uma outra importante vantagem é o envio de imagens, em vez de amostras, para especialistas e alunos distantes geograficamente. Apesar de uma foto não substituir uma exsicata, o receptor pode decidir quais amostras lhes são interessantes, assim, resuzindo consideravelmente os gastos com postagem.

Usos inter-herbário: consulta de imagens disponibilizados por outros herbários.Neste caso, um usuário em uma instituição consulta imagens de amostras em outras instituições.

Page 2: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Aqui o objetivo é melhorar a curadoraria local através da consulta de dados numa base mais ampla da que está disponivel na instituição. As vantagens desse sistema incluem: melhorar as informações sobre a distribuição de uma determinada planta a partir da consulta de um número maior de coleções; busca de duplicatas do material consultado em outras instituições para encontrar, por exemplo, novas identificações ou dados de tipificação. Os herbários que disponibilizam dados para outras instituições podem se beneficiar através de correções ou atualizações de pessoas que não têm visitado o herbário. Apesar da possibilidade de consultas via internet, na prática, a lenta conexão dos sistemas em geral disponíveis aos pesquisadores limita bastante a troca de informação. Uma solução seria a transferência de imagens digitais entre instituições para consultas em servidores locais, assim, diminuindo o tempo de cada consulta e garantindo flexibilidade ao pesquisador para consultar e gerenciar as amostras.

Usos extra-herbário: consulta de imagens em vários herbários para acumular informações com fins diversos além de curadoria.

Exemplos incluem: coleta de informações de diversas fontes sobre grupos taxonômicos, atividades de coletores, check-lists regionais etc. Uma maneira de trabalhar que seja aberta pelo uso de herbários virtuais neste sentido é o da “curadoria remota”, em que as pessoas que consultam um determinado banco de dados ou grupo de bancos de dados podem contatar os herbários quando forem descobertos erros, efetuadas novas identificações etc.

Da mesma forma, o acesso pela internet é geralmente lento, limitando a eficiencia do sistema extra-herbário. Por outro lado, a quantidade de informações geradas por herbários virtuais é potencialmente tão grande que se torna inviável o armazenamento de todas as informações em um único herbário. Ainda não há consenso sobre a melhor maneira de acessar a informação, seja localmente ou através da internet.

O Estado da Arte: Herbários virtuais existentes.

Vários herbários têm amostras do seu acervo fotografadas, e alguns têm imagens disponibilizadas na internet (ver sumário seletivo de exemplos, tabela 1). Poucos têm seu acervo completamente fotografado (por exemplo, herbários do CAYM, IAN, JARI e possivelmente alguns herbários na África do Sul (SABONET). A maioria das imagens apresentadas pelos herbários na internet referem-se aos tipos (por exemplo, NY, U, SP, INB, MAK), às coleções temáticas (BM, S, M, e-FTG) ou às amostras do herbário para fins de identificação (vTGG). Uns poucos disponibilizam fotos de coletas gerais além dos tipos (CAY, MO, NY, Brahmsonline). Poucos sites mostram fotos com origens em herbários diferentes (e-VTG, brahmsonline), geralmente é necessário visitar vários sites para consultar duplicatas da mesma coleta em herbários diferentes. Geralmente os sites providenciam uma tela de busca, na qual o pesquisador preenche campos taxonômicos, geográficos ou do coletor para isolar a coleta relevante. Com menos

Page 3: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

freqüência é possível encontrar uma tabela de informação e clicar para ver a imagem requisitada (Brahmsonline). Nenhum site atualmente providencia uma maneira simples de fazer um download de imagens selecionadas, sendo necesário baixar imagens uma a uma. As plataformas para disponibilizar imagens são várias, incluindo HTML (e-FTG), Brahmsonline (FHO, U, etc.), splink (CRIA), KemXX (NY, MAK), ePIC (K), e Hispid (herbários australianos). Adicionalmente, no Brasil, o INPA (através de PPBio) e o Jardim Botânico do Rio de Janeiro (através da PUC – Potifícia Universidade Católica) estão desenvolvendo novos softwares para servir como plataformas entre as coleções.

A maior coleção de imagens digitais de exsicatas é provavalmente a do SABONET, um grupo de herbários na parte sul da África com cerca de 700.000 fotos, mas que não estão disponíveis na internet. O herbário do IAN (Embrapa Amazônia Oriental) está finalizando o registro fotográfico do herbário que engloba mais de 300.000 imagens de cerca de 150.000 exsicatas, mas também sem disponibilização na internet.

Na internet, o NY disponibiliza ca. 100.000 imagens de exsicatas e MO e os herbários da Holanda (U, L, WAG) também apresentam milhares, principalmente de tipos. No Brasil, o maior acervo na internet é o do Instituto de Botânica de São Paulo (SP) com ca. 2.000 imagens.

A grande maioria de imagens disponíveis refere-se à exsicata inteira enquanto mais raramente sâo disponibilizadas imagens da etiqueta (S-LINN, BR). Raramente as imagens apresentam partes mais detalhadas da amostra. No IAN, M e e-FTG, são tiradas fotos padronizadas da exsicata e da etiqueta, disponibilizadas independentemente.

O tamanho dos arquivos variam consideravelmente. Alguns herbários disponibilizam imagens pequenas (por exemplo, ca. 25 kbytes no caso do CAYM) ou bastante grandes (até 144 Mbytes dos tipos no caso do e-FTG). Às vezes, é possível selecionar a resolução específica das imagens usando o software Mr Sid. Ou as imagens disponibilizadas na internet poderiam ser de menor resolução do que as originalmente tiradas e usadas localmente.

O registro fotográfico dos acervos das coleções é uma tendência que cresce rapidamente e o software para integrar dados digitalizados e imagens está ficando cada vez mais sofisticado.

Tabela 1. Exemplos de herbário virtuais

No Brasil

Instituição: Herbário Virtual de Fitopatologia, Universidade Federal de Pelotas (PEL)Endereço: http://www.ufpel.tche.br/faem/dfs/herbario/Quantidade: ca. 55 páginas, com uma imagem por página

Page 4: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Tipo de informação: Imagens e texto sobre doenças de plantas (não herborizadas)Tamanho das imagens: 26 - 40 kbytesNomes: arroz_falsocarvao.jpg

Instituição: Laboratório de Ensino de Ciências e Tecnologia – Escola do Futuro, USPEndereço: www.darwin.futuro.usp.br/dandelions/herbario.htmQuantidade: 7 imagens de AsteraceaeTamanho das imagens: 11-40 kbytes

Instituição: Instituto de Botânica São PauloEndereço: http://www.ibot.sp.gov.br/Herbario/herbario.htmQuantidade: “Os tipos do Instituto de Botânica somam atualmente mais de 2000 coleções, cuja digitalização está em andamento.” (retirado do website, seção (?) A-Gesneriaceae, maio 2005)Tamanho das imagens: 50-60 kbytesNomes: SP_56522_004057 (sigla_registro_número de foto)

Instituição: Centro de Referência em Informação Ambiental (CRIA)Endereço: http://splink.cria.org.br/Quantidade: Dados de vários herbários; em construção; sem imagens.

No exterior

Instituição: Fairchild Tropical Gardens Virtual Herbarium (e-FTG)Endereço: http://www.virtualherbarium.org/Tamanho das imagens: ca. 250-400 kbytes, incluindo algumas de etiquetas, ca. 25 kbytes em gif.Quantidade: ca. 35.000 (meta é ca. 100.000)Nomes: registro no herbário: 8139.jpgObservação: Fairchild também hospeda vários projetos, incluindo:

tipos do FTG, ca. 30 disponiveis em alta resolução (ca. 150 Mbytes);coleção de Convolvulaceae: ca. 8.000 imagens em alta resolução;herbário completo de Grã Caymen (CAYM): 1392 imagens, ca. 250 kbytes.

Instituição: Royal Botanical Gardens, Kew (K)Endereço: http://www.rbgkew.org.uk/data/herb_digitisation.htmlTamanho das imagens: scan at 600 DPI = tif de ca. 110 MbytesQuantidade: “a dedicated HerbCat website that will eventually link to specimen images”. Observação: Imagens podem ser encomendadas por pesquisadores, entregues em CD.

Instituição: Herbário de Cayene, Guiana Francesa (CAY)Endereço: http://www.cayenne.ird.fr/aublet2/Referentiel.htmlTamanho das imagens: ca. 150 kbytesQuantidade: desconhecida.

Page 5: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Nomes: ARECA25A.JPG (nome com código particular)Observação: Imagens achadas por busca taxonômica e escolha de coleta.

Instituição: Nationaal Herbarium Netherland (U, L e WAG)Endereço: http://www.nationaalherbarium.nl/virtual/Tamanho das imagens: 150-180 kbytes no web (por uso interno: ca. 1 Mbyte)Quantidade: ca. 7000 de tipos.Nomes: U0003411.jpg (sigla+código de barra).Observação: Estão começando um projeto para fotografar o acervo inteiro, facilitando a consulta através da digitalização das etiquetas.

Instituição: University of Utrecht, Virtual Tree Guide of the Guianas (vTGG)Endereço: http://www.bio.uu.nl/~herba/Guyana/VTGG/Main.htmTamanho das imagens: 25-40 kbytesQuantidade: mais de 4000Nomes: Lacunaria%20crenata% (por nome de espécie).Observação: Disponibilizado para ajudar na identificação de plantas lenhosas (>10 cm DAP). Informação da etiqueta removida para reduzir o arquivo em jpg.

Instituição: New York Botanical Garden (NY)Endereço: http://sciweb.nybg.org/science2/VirtualHerbarium.aspTamanho das imagens: 70-250 kbytes (na web, maior por uso interno?? Web ou intranet??)Quantidade: ca. 100.000 imagens, 700.000 registros informatizados (de um acervo de ca. 7 milhões)Nomes: NY0003411.jpg (sigla+código de barra)Observação: 2 CDs de tipos brasileiros têm sido distribuídos aos herbários brasileiros.

Instituição: Instituto Nacional de Biodiversidade, Costa Rica (INB)Endereço: http://www.inbio.ac.cr/tipos/herbario/tipos.htmlTamanho das imagens: ca. 150-200 kbytesQuantidade: ca. 120Nomes: Lstevensii.jpg (abreviação de gênero+espécie)

Instituição: Missouri Botanical Gardens (MO)Endereço: http://mobot.mobot.org/W3T/Search/image/imagefr.htmlTamanho das imagens: variável; o usuário pode selecionarQuantidade: 50.000, incluindo fotos de plantas vivasNomes: 06600178_001.jpeg (código por número de imagem; aparentemente não é o número do registro)Observação: disponibiliza um programa de instalação local para acessar as imagens da web.

Instituição: British Museum, Londres (BM)Endereço: http://www.nhm.ac.uk/botany/databases/Tamanho das imagens: ca. 5 Mbytes em BMP, 25 Mbytes em TIF

Page 6: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Quantidade: ca. 10.000 de coleções históricas, e de SolanaceaeNomes: BM000557501.JPG (sigla+código de barra)

Instituição: Swedish Museum of Natural History (S-LINN)Endereço: http://linnaeus.nrm.se/botany/fbo/welcome.html.enTamanho das imagens: 70-100 kbytesQuantidade: 3658Nomes: ficuper1.jpg (código por gênero e espécie)Observação: fotos da amostra inteira, detalhes, etiquetas etc.

Instituição: Makino Herbario, Japão (MAK)Endereço: http://taxa.soken.ac.jp/MakinoDB/makino/html_e/index.htmlTamanho das imagens: ca. 75 kbytesQuantidade: 728 (tipos)Nomes: DCP0005/B/142.jpg (código de número e pasta, sem uso do registro)

Instituição: National Botanic Garden of Belgium (BR)Endereço: http://www.br.fgov.be/research/collections/herbariums/sp/ Tamanho das imagens: ca. 50 – 250 kbytes.Quantidade: 240 (scan de exsicatas) + 450 (detalhes)Nomes: 837817_p.jpg (código de barra_suffix; detalhes em outro sistema)

Instituição: Department of Plant Sciences, Oxford University (FHO)Endereço: http://www.brahmsonline.comTamanho das imagens: ca. 50-150 kbytesQuantidade: desconhecida Nomes: varia entre herbáriosObservação: Site hospedeiro para vários herbários e estudos sobre certos gêneros. No momento, poucas imagens estão disponíveis.

Instituição: The Virtual Field Herbarium (vFH), Department of Plant Sciences, Oxford University (FHO)Endereço: http://herbarium.literal.si/images/Tamanho das imagens: ca. 50-150 kbytesQuantidade: 2000Nomes: números individuais, agrupados taxonomicamente por diretório.Observação: São imagens tiradas de plantas vivas e ilustrações do tipo usado em guias de campo.

Instituição: Consórcio de herbários sul-africanos (SABONET)Endereço: http://www.sabonet.orgTamanho das imagens: desconhecidoQuantidade: ca. 700.000Nomes: desconhecido.Observação: Imagens tiradas de amostras (e provavelmente etiquetas) principalmente para uso informatizado. Não está disponível na web.

Page 7: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Instituição: Australia´s Virtual Herbarium (AVH). Consórcio de herbários australianos.Endereço: http://www.chah.gov.au/avh/avh.htmlTamanho das imagens: desconhecidoQuantidade: desconhecida (sem informação no site)Nomes: desconhecido.Observação: 40% das amostras nos herbários australianos incluídos no banco de dados. “A growing resource of images (line drawings, colour photographs) is available, with only a small portion currently in digital form”.

Instituição: Universitat de les Illes Balears, Herbário Virtual de les Illes Balears (UIB)Endereço: http://herbarivirtual.uib.es/eng/index.htmlTamanho dasimagens: 150 -1.000 kbytesQuantidade: 1368 spp. 2-3 imagens de cadaNomes: 12345.jpg (número)Observação: Imagens de plantas vivas, mas que não são das amostras no herbário.

Instituição: Embrapa Amazônia Oriental (IAN)Endereço: http://www.cpatu.embrapa.brTamanho imagens: ca. 500 kbytesQuantidade: 300.000 (escicatas e etiquetas).Nomes: sigla_número de registro_código da foto.Observação: Não disponível na web. Toda a virtualização do herbário deve ser finalizada em 2005)

Instituição: ORSA Florestal, Jari, Pará (JARI)Endereço: -Tamanho imagens: ca. 500 kbytesQuantidade: 11000 (exsicatas, etiquetas e amostras de madeira)Nomes: sigla_número de registro_código da foto.Notas: Não disponível na web.

A Metadologia de virtualização

O discurso sobre metodologia e usos na prática a seguir se deve muito ao desenvolvimento de um herbário virtual no herbario IAN, usando o software BRAHMS. Ainda que não seja o único software para a virtualização, usa-se este exemplo para indicar lições aprendidas e as utilidades encontradas durante o processo.

- Tipo, formato e qualidade das fotos.

É necessário, logo no início do processo, decidir quais tipos de fotos serão tiradas, em qual resolução, com qual máquina e qual tipo de iluminação. Estas decisões

Page 8: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

devem ser baseadas nos usos finais das imagens e numa análise de custo e benefício em termos de rapidez e custos financeiros.

A digitalização pode ser feita através de fotos usando máquinas digitais relativamente baratas,com máquinas caras de alta resolução ou através de scanners.

Scanners produzem melhor qualidade e resolução da imagem, resultando em arquivos muito grandes. Por exemplo, os scanners podem produzir imagens maiores que 100 Mbyte sem compactação ou ca. de 10 Mbytes com compactação. Apesar destas imagens serem de alta qualidade, são custosas em dinheiro e tempo e impraticáveis para consulta rápida, especialmente através da internet. Imagens deste tipo têm sidos feitas principalmente para tipos e material de grande valor científico. Em muitos casos uma foto desta qualidade pode substituir consulta rotineiras da exsicata, mas ainda não permite o exame de detalhes microscópicos. O uso de scanners tradicionais, em que as imagens devem ser viradas contra a bandeja de digitalização, pode causar danos às amostras e não é recomendado. Alguns herbários têm investido em scanners que permitem a digitalização sem virar a amostra.

Equipamentos digitais com alta resolução (6 a 18+ Mb) estão disponíveis comercialmente, mas o preço (1.500-5.000 US$) continua alto para o acesso de curadores no Brasil. Instituições como FTG, NY e MO estão usando esses equipamentos de alta qualidade e um estúdio com iluminação especial. Máquinas digitais com resoluções e especificações mais modestas estão disponiveis por preços entre US$ 300 e 800. Novos modelos com novos preços e especificações surgem mensalmente no mercado tecnológico.

As imagens podem ser usadas para fins de taxonomia, na qual é importante ver os detalhes da amostra ou para registrar sua presenca, ler a etiqueta e ver a morfologia da planta de forma mais geral. Se o objetivo é providenciar imagens de tipos para taxonomistas, a resolucao deve ser alta. Se for necessário evidenciar amostras (por exemplo, ilustrar uma amostra que se acredita ser o tipo), uma imagem de baixa resolução seria suficiente. Para virtualizar completamente um herbário, imagens grandes não são práticas. Por exemplo, um herbário com 200.000 amostras precisará de um único disco rígido de 160 Gbytes para armazenar todas as suas fotos em baixa resolução (uma foto em jpg de 500 kbytes cada), enquanto que seriam necessários 2.000 Gbytes para armazenar sua coleção na resolução de scans no estilo do Kew. (K precisaria perto de 100.000 Gbytes para armazenar seu herbário inteiro nesta resolução). Além disso, se as imagens preciam ser disponibilizadas na internet, a demora para baixá-las, especialmente em países de lento acesso, torna impraticável a obtenção das mesmas em alta resolução. Deve-se considerar também que muitas amostras nos herbários são de baixa qualidade, sendo pouco útil para fins de identificação.

Page 9: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

No herbário IAN foram usados equipamentos de qualidade média, com um setting de média resolução (1 Mbyte). Os equipamentos eram da marca Fuji (S-602Z e 7000).

Para a iluminação, pode-se utilizar luz natural, luzes artificiais ou flash. Com luz natural é dificil ter uma iluminação padronizada entre as fotos ou suficiente para dar uma boa profundidade de campo e, assim, boa nitidez da imagem. A luz artificial implica a existência de um estúdio para tirar as fotos, sendo excelente para tirar fotos com a máquina em posição fixa, mas causando dificuldades caso seja necessário tirar fotos sucessivas com profundidades de campo e tamanhos diferentes, por exemplo, ao fotografar uma exsicata junto com a sua etiqueta, geralmente é recomendando. O flash (mais conveniente e integral na propria máquina) fornece uma iluminação forte e homogênea, permitindo flexibilidade de posicionamento. Observe que algumas máquinas digitais não são capazes de tirar fotos com flash bem ajustados em modo macro.

Apesar da maioria dos herbários tirar fotos da exsicata inteira, na verdade, grande parte dos usuários das imagens precisam somente da informação na etiqueta. Esta é obviamente disponibilizada no canto da foto da exsicata, mas quase sempre é necessário aproximar a imagem através de um zoom para fazer a leitura. Se, por um lado, a aproximação da imagem absorve ainda mais tempo na internet, e se a imagem é de baixa resolução a leitura é ainda mais prejudicada.

Para gerar um herbário virtual, recomenda-se tirar fotos da exsicata inteira e também da etiqueta, ambas numa resolução intermediária. Vale ainda lembrar que as fotos tiradas sequencialmente, apesar de facilitar renomeação, dificulta a padronização exata entre as fotos (não dá pra entender o que é essa padronização exata), com um resultado menos satisfatório esteticamente.

- Renomeação de imagens e ligação com registros

O processo de ligação de imagens com registros é puramente eletrônico, sendo possível ligar qualquer imagem a qualquer registro, independentemente do nome, inclusive através daquele dado pela máquina digital. Na prática, seria melhor ter um sistema universal que identifica individualmente qualquer exsicata em qualquer herbário, sem ambiguidade. Não é bom usar o nome científico da coleta, já que as identificações podem mudar com o tempo ou entre os herbários. Os nomes e números dos coletores tampouco funcionam devido à falta de padronização. O sistema adotado pelo herbário IAN e, subseqüentemente incorporado à programação do BRAHMS, utiliza um código único identificando o herbário (sigla em Index Herboriarum), a duplicata no herbário (registro) e o tipo de foto (código padrão). As três partes são separadas por travessões.

Por exemplo:

IAN_12345 foto da exsicata com registro de número 12345IAN_12345_e foto da etiqueta da mesma coleta

Page 10: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

IAN_12345_e1 foto de uma segunda etiqueta ou anotação na exsicataIAN_12345_1 foto de uma segunda duplicata montada no herbário

Usando este sistema, todas as fotos das excicatas em todos os herbários no mundo podem ser codificadas individualmente, usando nomes com 9-12 digitos. Já que os sistemas de informatização sempre usam algum campo com um número único no herbário (registro e, se não houver, código de barras), tornar-se muito fácil ligar as imagens renomeadas aos registros. O BRAHMS tem subprogramas que facilita a renomeação rápida de imagens e a ligação automática.

Se o herbário não possuir registros, este deve implementar um novo sistema, preferencialmente usando códigos de barras. Outros herbários também têm desenvolvidos sistemas parecidos ao do IAN (p.e., BM, SP, K, U, etc), enquanto outros usam o número de registro, ou código de barra, sem a sigla do herbário (p.e., v-FTG, RB). Há ainda aqueles que utilizam sistems locais, como um nome único por foto (p.e., MO, MAK) ou através de códigos baseados no nome da espécie (p.e., CAY, vTGG, INB, S-LINN). Sistemas que não usam uma numeração única ligada à uma duplicata dificultam o processo de exportação para outros sistemas e também são mais dificeis de gerenciar por causa de mudanças em identificações e conceitos taxonômicos.

Justificações e exemplos de uso prático de herbários virtuais

- Correção e padronização de bancos de dados

Projetos de informatização em acervos grandes inevitavelmente resultam em vários problemas de padronização, incluindo, por exemplo, variações ortográficas em nomes de lugares (Manaus; Manaos; Manáus etc.), em maneiras de escrever nomes pessoais (C.A. Cid; C.A. Cid-Ferreira; C.A.C. Ferreira etc), falta de padronização de nomes (C.A. Cid; CA Cid; C. A. Cid; Cid, C.A., Cid, C. A. etc), erros tipográficos (Manus; C.a. Cid etc.) e dificuldades de ler as etiquetas. Além disso, erros numéricos são freqüentes (p.e., 99982 por 9982).

Uma vez que os dados são informatizados, é geralmente necessário checar os dados na etiqueta durante a verificação. Ao achar novamente uma amostra no herbário com dados aparentemente errados, pode-se gastar muito tempo, prejudicando a amostra e as outras próximas a esta. Com as imagens das etiquetas, é possível ver rapidamente a etiqueta original na tela, junto com os dados digitados, e imediatamente corrigir os erros. Por exemplo, ordenando o banco de dados por coletor e número, é facil isolar as amostras que mostram numeração repetitida, examinar na tela as duas etiquetas e corrigir a errada. Inconsistências em datas de coleta e outros poroblemas podem ser identificados e consertados da mesma maneira. Já que coletas feitas no mesmo dia pelo mesmo coletor geralmente apresentam dados geográficos iguais, é muito mais fácil padronizar a digitalização dos dados se for possível ver as etiquetas originais para confirmar que seus conteúdos.

Page 11: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Com o grande número de coletores com nomes parecidos, torna-se arriscado padronizar certos nomes sem uma checagem rigorosa. Por exemplo, existem muitos coletores que podem ser “M. da Silva”, e observando-se os estilos das etiquetas ajuda na padronização dos nomes dos vários M. da Silvas (M.G. da Silva; M.F. da Silva.; M.F.F. da Silva; Milton da Silva, Márcio da Silva etc.).

Pode-se pensar em muitas outras maneiras além da checagem imediata de uma etiqueta. A comparação com o registro, por exemplo, pode ajudar a resolver problemas da informatização.

- Uso de herbários virtuais para melhorar a qualidade de identificação

Por natureza, coletas botânicas são freqüentemente duplicadas em herbários múltiplos. Mas, ao longo do tempo, as duplicatas podem ganhar identificações diferentes, dependendo quem tem vistado cada herbário. Hamada (2004) mostrou que os herbários têm geralmente 20-40% do material de Hymenaea identificado erradamente, apesar do gênero ter sido recém-revisado. Através de consultas em outros herbários, é possível melhorar as identificações localmente. No entanto, as consultas pela internet, uma por uma, usando formulários de busca, torna-se pouco práticas numa grande escala. Com a informatização, acervos inteiros poderiam teoricamente ser comparados, e as duplicatas com identificações diferentes poderiam ser atualizadas. Além deste processo melhorar bastante a qualidade de identificações em todos os herbários, não é necesário que o herbário seja virtualizado, somente informatizado. Mas, um grande problema é assegurar que as coletas sejam as mesmas, já que podem haver erros na numeração ou no nome de coletor etc. Também, coletas do tipo “s.n.” são quase impossíveis de se comparar. Com a possibilidade de se comparar imagens de duas exsicatas numa inspecção visual, isso pode ser rapidamente resolvido observando se o material botânico é parecido e se o estilo da etiqueta é igual. A informatização possibilita a melhoria das identificações através da comparação, enquanto que a virtualização garante que novos erros não serão introduzidos.

- Uso de herbários para completar informatização

Projetos de informatização de acervos grandes inevitávelmente ocupam anos de trabalho de muitas pessoas, digitadores e curadores. Inevitavelmente algumas amostras do herbário acabam se perdendo acidentalmente no banco de dados. No IAN, o processo de fotografia feito após a informatização acabou sendo uma maneira bastante eficiente para localizar amostras não digitadas (ca. 5% do total), já que a ligação das imagens digitais renomeadas ao registro falhava. Ainda, foi útil para achar erros de digitação dos números de registro, pois as imagens se ligaram com registros de outras famílias. Erros assim são muito dificeis de se encontrar através de outras metodologias. Imagens encontradas dessa forma foram separadas para serem digitadas novamente.

Page 12: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

- Uso de herbários virtuais no processo de informatização

Até o momento, a informatização tem sido feita a partir de um digitador que insere os dados das duplicatas em um programa específico no computador. Com as fotos, o digitador pode ver as imagens da etiqueta na tela e não precisaria manusear a amostra. Assim, é possível contratar digitadores experientes que estejam em qualquer lugar no mundo, garantindo maior qualidade na entrada de dados.. Outra grande vantagem é o tempo poupado quando certos procedimentos são adotados. Por exemplo, se no momento de renomeação das imagens digitais for inserido também no registro o nome e número do coletor, é possível organizar as imagens usadas na digitação por ordem de coleta e não por ordem taxonômica, assim, facilitando a cópia da informação repetida entre etiquetas, como os campos geográficos, coletores adicionais etc. Isso também reduz significamente o número de erros ortográficos. Além disso, com muitos herbários já informatizados, os herbários que estejam iniciando o processo acabam, de fato, redigitando exatamente a mesma informação já digitada das etiquetas das duplicatas em outros herbários. Se o sistema puder fazer uma buscar nos bancos de dados de outros herbários para ver se já existem dados lá (por exemplo usando os campos de coletor e número), os dados poderiam ser copiados para o sistema local. Ainda assim, o ideal é poder ter acesso a uma imagem da duplicata do outro herbário para ter certeza que as duas duplicatas são realmente da mesma coleta. Se isso for feito, o herbário informatizando pode poupar bastante o tempo dos digitadores, além de poder agir como um verificador dos dados dos herbários externos, contribuindo para a qualidade geral da informatização. Cada herbário pode ser atualizado para reconhecer a existência de duplicatas em outros acervos, o que será muito útil futuramente caso, por exemplo, um especialista mude a identificação em um herbário. Neste caso, a nova informação poderá ser divulgada a todos os herbários com duplicatas. Finalmente, a informação de georeferenciamento poderia ser transmitido entre herbários, diminuindo o volume de trabalho repetido.

Recomenda se que os herbários que estejam iniciando sua informatização a façam através de imagens de etiquetas, digitando inicialmente somente os campos básicos de cada coleta (coletor, número, identificação). O restante dos dados poderia ser preenchido após a organização por coletor, ou por importação de bancos de dados existentes. Estes processos têm sido incluídos em versões recentes do BRAHMS. O herbário de Leiden (L) recentemente iniciou sua informatização desta maneira, sendo que imagens são usadas para informatizar somente o sistema de SABONET.

- Uso de imagens na internet para identificação

Atualmente, instituições têm produzido guias de campo e livros didáticos voltados para a identificação botânica. Através da internet e com o aperfeiçoamento de imagens digitais, surgiu a idéia de se produzir guias de identificação virtuais. Os dois exemplos apresentados aqui, ambos de websites europeus, usam imagens para facilitar a identificação de plantas tropicais.

Page 13: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

O virtual tree guide of the guianas (vTGG) disponibiliza fotos de amostras do herbário de todas as espécies de árvores da Guyana. O acesso às fotos é através de menus taxonômicos, uma página para selecionar a família, uma para selecionar o gênero e finalmente uma para selecionar a espécie, na qual são apresentadas de uma a cinco fotos de amostras herborizadas. As fotos são nomeadas pelo nome da espécie e as etiquetas têm sido excluídas para reduzir o tamanho das imagens. O sistema também está disponível em CD. Os autores recomendam seu uso para identificar plantas vivas, mas aconselham a visita ao herbário para identificar amostras secas.

A Universidade de Oxford (http://www.herbarium.literal.si) lançou recentemente um website com cerca de 2000 imagens provenientes de um guia de campo de algumas ilhas no Caribbe (Hawthorne et al. 2004). O autor do site (Hawthorne, 2005) considera que este recurso está sendo e será “cada vez mais acessível a pessoas pobres em países ricos em biodiversidade e certamente disponibilizado a botânicos até mesmo em um cybercafé.” As imagens digitais mostram as plantas vivas inteiras e os detalhas de suas partes. O usuário pode seleçionar as imagens para visualizá-las através de filtros, usando a taxonomia ou características como o tipo de folha, tronco etc.

O principal objetivo de uma coleção de imagens de partes de plantas vivas é fornecer um meio de identificar plantas,através da comparação de amostras locais com imagens remotas das amostras nos herbários. Por enquanto, porém, o uso da internet para identificar plantas no campo continua inviável. Alunos e pesquisadores nos países em desenvolvimento raramente têm condições de usar um computador no campo, pois o preço de um lap-top é muito alto para o alcance da maioria, além da falta de condições adequadas no campo para o uso de um lap-top, como falta de energia elétrica, por exemplo. Ainda que haja meios para o uso de um computador no campo, não haveria acesso à internet, sendo necessário a disponibilização da informação em CD. Também vale lembrar que, mesmo com acesso à internet, o tempo necessário para o download de imagens seria bastante longo, tornando-se inviável a usuários comuns.

Um outro aspecto que pode ser questionado é a aplicabilidade de imagens digitais na tela para identificação, ou de plantas vivas ou de plantas herborizadas. Fotos não transmitem características importantes com a textura, o odor etc., não permitem o aumento na resolução, como através do uso de uma lupa, e restringe o acesso às partes fornecidas pelo autor. Embora seja interessante a idéia de acesso a uma vasta quantidade de imagens digitais para facilitar a identificação, é preciso reconhecer que ainda estamos longe de alcançar um sistema realmente útil e eficiente. Há sérias dúvidas de que um pesquisador, aluno ou técnico com recursos limitados possa levar um computador à mata tropical e conseguir em tempo hábil imagens remotas de outros lugares da região ou do mundo.

Os dois sistemas apresentados acima são “sistemas inteligentes”, em que o usuário acessa uma estrutura fornecida pelo autor. Sugiro que sistemas deste tipo

Page 14: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

sejam considerados “Guias Virtuais”, evitando, neste caso, o uso da terminologia “Herbario Virtual”.

Outras vantagens da virtualização

Os vantagens adicionais de um acervo botânico digitilizado incluem:

Ligação de outras fontes de informação com registros no herbário, por exemplo:

Imagens de livros de registro ligado automaticamente com referência ao número de registro.

Imagens de páginas dos cadernos de campo dos coletores, ligados por nome e número da coleta.

Imagens de plantas vivas tiradas no momento de coleta, ligadas por registro ou nome e número do coletor ou com o nome da espécie.

Imagens de páginas de publicações sobre espécies, coletores ou locais de coleta.

Imagens de mapas de local de coletaGerenciamento de empréstimos.

Envio de imagens de amostras para especialistas a fim de selecionar quais são de seu interesse para envio por correio.

Pode ser tiradas fotos adicionais de partes-chaves das amostras e enviadas ao especialista para confirmar identificações sem necessidade de deslocar a amostra do herbário.

Geração de herbários virtuais temáticos.Através de downloads de imagens asociadas com registros filtrados por

critérios taxonômicos ou geográficos, tornando possível gerar um herbário virtual de, por exemplo, Sapotaceaes da Amazônia ou de qualquer município.

Georeferenciamento.Organização das imagens por coletor e número, ligando-as com imagens de

mapas e, assim, possibilitando calcular as coordenadas de coletas com maior consistência e muito menos esforço que fazendo taxon por taxon, e com muito mais confiança que fazendo através de uso de programas de georeferência automaticos usando gazetteers.

Disponibização de imagens em outros aplicativos.Imagens de exemplos de taxa pode ser exportadas para programas como

Lucid para ser usado em identificação.

Propostas de curto, médio e longo prazo de definição de diretrizes e estratégias visando a virtualização das coletas botânicas feitas no país:

Meta 1. Implementar ou continuar projetos de informatização em herbários brasileiros.

Page 15: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Estratégias e ações:3 anos: Planejar e buscar financiamento de um programa de virtualização nos herbários brasileiros:Os desafios principais são:

Cada herbário deve ter seu próprio projeto ou é preciso ter uma equipe espécifica encarregada?

Definição de um padrão para a resolução de fotos sobre as partes da exsicata, e sobre sua renomeação.

Definição de um software padrão.Seleção de amostras prioritárias para virtualização, por exemplo, os tipos.

Em três anos o projeto poderá resolver estas questões e completar a virtualização dos herbários já em fase inicial, começando novos projetos de virtualização em alguns dos herbários maiores e completando a virtualização de alguns herbários de pequeno porte.5 anos: Ter um projeto de virtualização em progresso em todos os herbários brasileiros10 anos: Ter todas as amostras em todos os herbários brasileiros fotografadas, além de outros materiais (cadernos de campo etc.)

Meta 2. Resgatar e distribuir informações em forma de imagem de herbários internacionais.

Estratégias e ações:3 anos: A participação de herbários estrangeiros é esencial para ter uma amostragem completa e para obter informação não disponível localmente (novas identificações etc.)Os desafios principais são:

Participação dos herbários estrangeiros no projeto com as mesmas soluções aos desafios da meta 1, assim, ajudando o projeto brasileiro sem gastos locais, ou envio de equipes de fotógrafos para estes herbários.

Enquanto o interesse brasileiro é com o material coletado no Brasil, possivelmente é de interesse do herbário estrangeiro fotografar todo o seu material e não somente o do Brasil.

Existem vários projetos de informatização de iniciativas locais ou globais (p.e., através de GBIF). É preciso definir se o presente projeto seguirá uma destas iniciativas ou se seguirá um padrão brasileiro. Neste caso, será preciso identificar como aproveitar as imagens produzidas por outros projetos.

Em três anos, deverá ser feito contato com os herbários estrangeiros principais para planejar a distribuição da informação e realizadas visitas preliminares nos herbários selecionados para divulgar o projeto e iniciar projetos pilotos.5 anos: Herbários estrangeiros que possuam bastante material com projetos ativos para mandar acervos de fotos para o Brasil, disponibilizando os bancos de dados atualizados e permitindo a integração destas imagens aos bancos de dados locais (ver meta 3).10 anos: A maioria do material coletado no Brasil depositada em herbários estrangeiros e disponível para consulta através de um sistema integrado ao Brasil.

Page 16: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Meta 3. Implementar um sistema de troca de imagens entre instituições.

Estratégias e ações:3 anos: A manutenção do sistema, que deverá gerar muitos tetrabytes de informação digital, deverá ser bem planejada. O sistema deverá ser capaz de acessar imagens de todos os herbários participantes e de gerenciar o fluxo de informação gerada por comparação e atualização de identificações. Também deverá efetuar correções e pardonizações dos dados digitados, resultando em um melhoramento da informação em cada herbário.Os desafios principais a serem resolvidos são:

Definir se as imagens serão disponibilizadas independentemente por cada herbário e acessadas por outros usuários através da internet, ou se serião trocadas entre instituições por meio eletrônico (p.e., CD, DVD, fita etc.).

Definir se haverá um website ou uma instituição designada especificamente para gerenciar a organização dos dados. Centralização ou decentralização?

Em três anos, será possível ter os primeiros herbários virtualizados e disponíveis eletronicamente, com a possibilidade de efetuar download da informação disponível para gerenciamento local ou para integração em um banco de dados universal.5 anos: A maioria dos herbários brasileiros deverá ter acesso a imagens de amostras nos outros herbários brasileiros e o iniciada a integração em um sistema mundial.10 anos: Todos os herbários brasileiros capacitados para acessar e usar um herbário virtual deverá disponibilizar as imagens da maioria das coletas feitas no Brasil.

Custos estimados:

A resolução dos desafios implica: termos um grupo central dedicado à virtualização, mas que cada herbário receba apoio para produzir seu próprio acervo de imagens]

Salários da coordenaçãoServiços de terceiros (fotografia e renomeação)Consultoria (principalmente Denis Filer, BRAHMS)Máquinas digitaisMemóriaComputadoresDiscos rígidosViagens e diárias no exterior

Page 17: Herbários Virtuais: Conceitos, Estado-da-Arte, Usos e

Bibliografia