47
Biblioteca Digital Brasileira de Teses e Dissertações: Modelo e Tecnologias (Versão Preliminar de 16/09/030) Silvia Barcellos Southwick i

bdtd_documentosilvia

Embed Size (px)

Citation preview

Biblioteca Digital Brasileira de Teses e Dissertaes:

Biblioteca Digital Brasileira de Teses e Dissertaes:

Modelo e Tecnologias

(Verso Preliminar de 16/09/030)

Silvia Barcellos Southwick

Braslia, setembro de 2003.

Sumrio

11Introduo

32Modelo e tecnologias utilizadas pela BDTD

32.1Conceitos

32.2Modelo da BDTD

42.3Padres de metadados

52.3.1Dublin Core

62.3.2Etd-ms

62.3.3Mtd-br

72.4Tecnologias adotadas pelo Sistema da BDTD

92.4.1BDTD Local

112.4.2Tecnologias usadas pela BDTD Nacional

112.4.3Tecnologias para integrao com a NDLTD

123Sistema TEDE

123.1Viso geral do sistema TEDE

133.2Projetos piloto

133.2.1Observaes gerais

143.2.2Sistema de Publicao Eletrnica de Teses e Dissertaes

143.2.3Situao dos provedores de dados

143.3Mdulos a serem aperfeioados

143.3.1Mdulo de busca

153.4Mdulos a serem desenvolvidos

153.4.1Mdulo de exportao de metadados para OPACs

163.4.2Mdulo Gerencial

163.4.3Mdulo de internacionalizao

163.4.4Mdulo integrao com os sistemas da Capes e CNPq

163.4.5Mdulo de registro de acervo retrospectivo

173.4.6Verso multi-institucional do sistema

173.5Plano de distribuio nacional do pacote de teses e dissertaes

184Sistema Teses Brasileiras e sua integrao BDTD

184.1Viso geral do sistema Teses Brasileiras

184.2Procedimentos de integrao BDTD

184.3A ser desenvolvido ou aperfeioado

205Produtos e servios da BDTD

205.1Viso geral

205.2Aperfeioamento do mdulo de busca

215.3Servios e produtos a serem desenvolvidos

215.3.1Indicadores

215.3.2Outros servios e produtos

236Protocolo OAI-PMH

236.1Viso geral sobre a coleta automtica de metadados na BDTD

246.2Processo de absoro das tecnologias relacionadas com o protocolo OAI-PMH

256.3Tecnologias relacionadas com o protocolo atualmente disponveis

256.3.1Coletor de metadados

256.3.2Camadas do protocolo OAI-PMH para provedor de dados

276.4Tecnologias relacionadas com o protocolo a serem desenvolvidas ou aperfeioadas

276.5Suporte tcnico na implementao do protocolo

287Equipe e Grupos de trabalho da BDTD

287.1Coordenao geral

287.2Grupos de trabalho

Lista de Figuras4Figura 1: Integrao dos nveis de abrangncia da BDTD

5Figura 2: Relao ente os trs padres de metadados usados pelo sistema da BDTD

8Figura 3: Relao das tecnologias utilizadas pelo sistema da BDTD

10Figura 4: Soluo simplificada

13Figura 5: Fluxo de operao do sistema TEDE

24Figura 6: Processo de coleta automtica de metadados

Biblioteca Digital Brasileira de Teses e Dissertaes

1 Introduo

A Biblioteca Digital de Teses e Dissertaes BDTD tem como objetivo principal a integrao das iniciativas brasileiras de publicao eletrnica e registro bibliogrfico de teses e dissertaes, fornecendo aos usurios finais uma viso integrada dessas iniciativas por meio de servios e produtos de informao de valor agregado. O principal servio atualmente disponvel na BDTD o de busca e recuperao de documentos de teses e dissertaes produzidos no Brasil ou produzidos por brasileiros no exterior. Usurios interessados em encontrar teses e dissertaes relevantes aos seus problemas de informao podero, a partir de um portal nico, realizar buscas nessas diversas iniciativas sem que para tal tenham que visitar cada uma delas individualmente e realizar buscas nos repositrios locais dessas instituies provedoras de dados.

Alm do servio de busca, a BDTD oferecer outros produtos e servios para atender diferentes tipos pblicos e suas demandas por informao. Em particular, o projeto da BDTD visa a atender demandas de informao de gestores de C&T. Neste sentido, a equipe de projeto e desenvolvimento da BDTD vem estudando a gerao de produtos tais como indicadores de uso e produo da teses e dissertaes (eletrnicas ou no) no Brasil, servios de alerta de acordo com perfis do usurio etc.

A concepo da BDTD teve incio em princpio de 2001, quando foi criado um grupo de trabalho contando com representantes da comunidade e de universidades que, poca, j possuam experincia no desenvolvimento de bibliotecas digitais de teses e dissertaes. Entretanto, somente em abril de 2002 foi apresentado para os potenciais parceiros do IBICT nesta iniciativa o modelo final da BDTD, no qual se integram duas iniciativas: e a de registro bibliogrfico e a de publicao eletrnica de teses e dissertaes existentes nos acervos das IES brasileiras.

Com relao ao registro bibliogrfico, O IBICT, em 1995, implantou um sistema cooperativo, integrando dados bibliogrficos de teses e dissertaes originrios dos catlogos (OPASCs) de 17 universidades brasileiras. Esse sistema (veja seo 4), que atualmente conta com 142.000 registros, incorporou-se BDTD no princpio de 2003.

Enquanto o registro bibliogrfico de teses e dissertaes nos OPACS uma prtica j consolidada, a publicao eletrnica de teses e dissertaes (td) est em seu estgio inicial. Atualmente poucas universidades possuem bibliotecas digitais de teses e dissertaes. O IBICT, ao integrar essas duas iniciativas, amplia a abrangncia da BDTD com vistas criao de um catlogo coletivo nacional de teses e dissertaes. Do ponto de vista do usurio, este passa a ter uma forma nica de busca ao documento de td. Caso a td de seu interesse esteja em meio magntico, o usurio poder acess-la diretamente, caso contrrio, este poder solicitar cpia da mesma, via o servio de comutao bibliogrfica COMUT, integrado BDTD.

Como princpio bsico, a incorporao da BDTD no requer que as IES faam uso de sistemas especficos para o desenvolvimento de suas bibliotecas digitais locais. Essas instituies devem buscar utilizar sistemas que melhor satisfaam s suas necessidades. Para a integrao BDTD, no entanto, faz-se necessrio a utilizao de padres de metadados e de transferncia desses metadados para sua integrao BDTD. Quando da concepo da BDTD, no existia ainda um padro nacional de metadados para a descrio de teses e dissertaes. A iniciativa de criao da BDTD nacional teve, ento, as seguintes linhas principais de atuao:

(1) Estudar experincias existentes no Brasil e no exterior de desenvolvimento de bibliotecas digitais de teses e dissertaes;

(2) Desenvolver, em cooperao com membros da comunidade, o modelo para o sistema da BDTD;

(3) Definir padres de metadados e tecnologias a serem utilizadas pelo sistema da BDTD;

(4) Absorver e adaptar as tecnologias a serem utilizadas na implementao do modelo;

(5) Desenvolver um sistema de publicao eletrnica de teses e dissertaes para atender quelas IES que no possuem sistema automatizado para implantar suas bibliotecas digitais;

(6) Desenvolver procedimento automatizado para permitir a integrao dos OPACs com as bibliotecas digitais locais e com a BDTD nacional;

(7) Difundir os padres e tecnologias adotadas na BDTD e dar assistncia tcnica aos potenciais parceiros na implantao das mesmas.

semelhana do modelo adotado pela NDLTD (Networked Digital Library of Thesis and Dissertation) uma iniciativa internacional na construo de biblioteca digital de teses e dissertaes, liderada pela Virginia Tech o modelo adotado pela BDTD distribudo, onde as IES brasileiras so responsveis pelos dados e o IBICT pela integrao dos mesmos. Este modelo, apresentado na seo 2.2, vem sendo implantado pelo IBICT em parceria com IES e especialistas da rea de informao.

O projeto da BDTD vem sendo desenvolvido no mbito do programa da Biblioteca Digital Brasileira, o qual financiado pela Financiadora de Estudos e Pesquisas FINEP. A BDTD conta com um comit tcnico-consultivo (ctc), instalado em abril de 2002, constitudo por representantes do IBICT, CNPq, MEC (Capes e Sesu), FINEP e trs universidades: USP, Puc-Rio e UFSC. O ctc um colegiado que tem por objetivo referendar o desenvolvimento da BDTD assim como atuar na especificao de padres a serem adotados no mbito do sistema da BDTD. Em particular, o ctc apoiou e aprovou o padro nacional de metadados para teses e dissertaes (mtd-br).

O presente documento apresenta o modelo e estgio de desenvolvimento do sistema da BDTD, enfatizando aspectos relacionados com as tecnologias de informao adotadas por este sistema e possveis aperfeioamentos ou sugestes de novos mdulos a serem implementados.

2 Modelo e tecnologias utilizadas pela BDTD

Esta seo apresenta uma viso geral do modelo da BDTD e as tecnologias desenvolvidas ou adaptadas para a implementao desse modelo. Para melhor entendimento do modelo adotado para a BDTD, so apresentados a seguir alguns conceitos bsicos.

2.1 Conceitos

Metadados a definio usual de metadados dado sobre dado. No mbito do sistema BDTD utiliza-se trs padres de metadados relacionados com teses e dissertaes. O foco principal desses metadados a descrio do objeto digital (tese ou dissertao) e sua localizao na Internet.

Provedor de dados entidade que administra sistemas que mantm repositrio de dados e suportam o Protocolo OAI-PMH como meio de expor metadados para serem coletados por provedores de servio ou agregadores.

Provedor de servio entidade que usa metadados coletados automaticamente dos provedores de dados, via o protocolo OAI-PMH, como base para oferecer produtos e servios de valor agregado;

Agregador entidade que coleta metadados, construindo repositrios centralizados com os mesmos e atua como provedor de dados para outros provedores de servio. Agregador, portanto, exerce tanto o papel de provedor de dados como de provedor de servio.

Coleta automtica de metadados (metadata harvesting) um processo automatizado no qual provedores de servios ou agregadores coletam metadados dos repositrios dos provedores de dados, por meio do uso do protocolo OAI-PMH.

Protocolo OAI-PMH -- Open Archives Iniciative Protocol for Metadata Harvesting -- Esse protocolo opera sobre o protocolo http. Os provedores de servio enviam solicitaes de metadados aos provedores de dados. Estes respondem com metadados estruturados em registros XML, obedecendo a um padro de metadados. O protocolo OAI-PMH prov um modelo de interoperabilidade baseado no processo de coleta automtica de metadados (metadata harvesting).2.2 Modelo da BDTD

A BDTD adota um modelo distribudo utilizando-se das tecnologias de arquivos abertos. As instituies de ensino superior (IES) so provedores de dados e o IBICT opera nessa rede como agregador, coletando metadados de teses e dissertaes dos provedores de dados, provendo servios de informao sobre esses metadados e expondo esses metadados para serem coletados por outros provedores de servios. Em especial a BDTD expe metadados para serem coletados pelo provedor de servios internacional NDLTD (Networked Digital Library of Thesis and Dissertation).Esquematicamente, podemos representar a BDTD com trs nveis de abrangncia: local, nacional e internacional (veja Figura 1).

Figura 1: Integrao dos nveis de abrangncia da BDTDA integrao desse trs nveis se faz por meio da transferncia de metadados a qual ocorre entre as IES (provedores de dados) e o IBICT (agregador/ provedor de servio) e entre o IBICT (agregador/ provedor de dados) e a NDLTD (provedor de servios). Como se pode observar na figura, essas transferncias utilizam diferentes padres de metadados: etd-ms e mtd-br. Esses padres so apresentados na prxima seo.

2.3 Padres de metadados

Na BDTD so adotados trs padres de metadados:

DC -- Dublin Core

Mtd-br -- padro Brasileiro de Metadados para Teses e Dissertaes

Etd-ms -- Electronic Thesis and Dissertation Metadata Standard, padro adotado pela NDLTD.

O padro de metadados Dublin Core exigido pela Iniciativa de Arquivos Abertos como o conjunto mnimo de metadados a ser exposto pelos repositrios aderentes essa iniciativa. Os elementos do padro de metadados Dublin Core so comuns aos dois outros padres usados pela BDTD. O padro etd-ms, por sua vez, um subconjunto do padro mtd-br.

A relao entre esses padres est representada na Figura 2.

Figura 2: Relao ente os trs padres de metadados usados pelo sistema da BDTD

2.3.1 Dublin Core

O conjunto de metadados Dublin Core foi projetado para ser o conjunto mnimo de elementos necessrios para a descrio de objetos digitais existentes na rede Internet. Este padro constitudo de 15 elementos, quais sejam:

Ttulo nome dado ao recurso de informao que est sendo descrito;

Criador responsvel pela produo do contedo do recurso;

Assunto assunto do contedo do objeto digital;

Descrio descrio do contedo do objeto digital;

Publicador a entidade responsvel por disponibilizar o objeto digital na rede (biblioteca digital responsvel pela publicao da tese ou dissertao)

Contribuidor entidade que contriburam para o contedo do objeto digital;

Data data associada com a criao ou disponibilizao do objeto digital;

Tipo de objeto digital inclui termos descrevendo as categorias gerias, funes, ou nveis de agregao do contedo. Recomenda-se o uso da tabela de tipos desenvolvida no mbito da Iniciativa Dublin Core.

Formato formato fsico do objeto digital;

Identificador referncia no-ambgua do objeto digital num dado contexto;

Fonte referncia a uma fonte da qual o objeto digital originrio;

Idioma idioma do contedo intelectual do objeto digital;

Relao referncia a recursos de informao relacionados;

Cobertura extenso ou escopo do contedo;

Direitos direitos de uso do objeto digital.

2.3.2 Etd-ms

O padro etd-ms inclui todos os elementos do padro Dublin Core e, adicionalmente, inclui elementos especfico para teses e dissertaes. Esses elementos adicionais so:

Titulao nome do grau associado com a tese ou dissertao, com aparece no documento. Pr exemplo, Mestre em Pesquisa Operacional.

Grau nvel de educao associado com o documento. Por exemplo, mestre, doutor.

Disciplina rea de estudo do contedo intelectual do documento usualmente indica-se o nome do programa de ps-graduao ou departamento.

Instituio que abriga o programa de ps-graduao.

2.3.3 Mtd-br

O padro mtd-br foi desenvolvido no mbito do projeto da BDTD. Este compatvel com os padres etd-ms e Dublin Core. Tanto o padro mtd-br como o etd-ms so padres de metadados especficos para teses e dissertaes, enquanto que o Dublin Core usado para a descrio de qualquer tipo de objeto digital.

O padro mtd-br possui alm dos elementos do etd-ms, metadados que possibilitam a integrao dos registros de teses e dissertaes com registros de outros repositrios brasileiros, como por exemplo, o banco de currculos da Plataforma Lattes.

O padro mtd-br composto pelas seguintes classes de metadados:

a) Metadados de gesto do registro

Nesta classe so includos metadados para a identificao nica do registro, identificao da instituio cooperante provedora do registro de metadados, especificao do tipo de contedo do registro e metadados relacionados com restries de uso do objeto digital sendo descrito.

b) Metadados de descrio da tese ou dissertao

Estes metadados servem para descrever a tese ou dissertao so os metadados de descrio bibliogrfica para teses e dissertaes, tais como ttulo, autor, resumo etc.

c) Metadados para a identificao de pessoas

Para pessoas, tais como autor e contribuidores (membros da banca) so especificados metadados que as identifique, sempre que possvel, unicamente no Brasil por meio do metadado CPF. Para estrangeiros, este metadado opcional.

d) Metadados para a identificao de instituies.

Vrias instituies podem estar direta ou indiretamente relacionadas com uma tese ou dissertao. As instituies identificadas no mtd-br so:

Instituio que abriga o programa de ps-graduao;

Afiliaes de autor e contribuidores (membros da banca);

Agncia de fomento que financiou integral ou parcialmente o trabalho de pesquisa que deu origem tese ou dissertao.

Similarmente a pessoas, metadados de instituies identificam unicamente as instituies brasileiras e, para tanto, includo o metadado CNPJ. Para instituies estrangeiras, esse metadado opcional a identificao feita por meio do nome da instituio.

e) Metadados de ligao

Estes metadados servem para referenciar, por meio de endereos eletrnicos, objetos digitais ou pginas web relacionadas com a tese ou dissertao sendo descrita.

A especificao completa do padro mtd-br encontra-se publicada em uma pgina dentro do site do IBICT. Uma representao grfica do mtd-br encontra-se no anexo 1.

2.4 Tecnologias adotadas pelo Sistema da BDTD

As principais ferramentas de software utilizadas no sistema da BDTD esto representadas na Figura 3. Essas tecnologias esto disponveis no IBICT para serem utilizadas pelo instituto ou repassadas aos novos parceiros. So tecnologias desenvolvidas ou adaptadas por tcnicos do IBICT. Estas so apresentadas no grfico da figura 1 em trs grupos: (1) tecnologias utilizadas pela BDTD nacional; (2) tecnologias usadas pelas BDTDs locais; (3) tecnologias usadas para a integrao da BDTD nacional com a iniciativa internacional (NDLTD).

As nomenclaturas Protocolo PD e PS adotada na figura 3 refere-se s implementaes do Protocolo OAI-PMH para provedor de dados e provedor de servio, respectivamente. Uma descrio sucinta de cada uma dessas tecnologias e seus estgios de desenvolvimento so apresentados nas sees que se seguem.

Figura 3: Relao das tecnologias utilizadas pelo sistema da BDTD

2.4.1 BDTD Local

So identificadas trs situaes de provedores de dados:

Adotam o sistema repassado pelo IBICT sistema TEDE;

Possuem bibliotecas digitais utilizando tecnologias prprias;

Implementam apontador para o texto completo da tese ou dissertao no sistema do OPAC.

Para cada uma dessas situaes so apresentadas as tecnologias disponveis no IBICT para que os provedores de dados se integrem BDTD.

2.4.1.1 Provedores de dados que adotam o Sistema TEDE

Como forma de apoio s IES que ainda no implementaram suas bibliotecas digitais de teses e dissertaes, o IBICT desenvolveu o sistema TEDE (veja seo 3). Esse sistema automatiza os procedimentos de publicao eletrnica de teses e dissertaes, onde autor, curso de ps-graduao e biblioteca participam desse processo. O sistema gera bibliotecas digitais de teses e dissertaes nas IES.

Esse sistema distribudo pelo IBICT s IES em um pacote contendo:

Sistema TEDE;

Camada do protocolo OAI-PMH para expor metadados referentes s teses e dissertaes publicadas nas IES;

Plano de implantao da biblioteca digital local;

Manuais operacionais;

Especificao do padro mtd-br.

Duas tecnologias so repassadas no pacote: sistema TEDE e camada do Protocolo OAI-PMH pra provedor de dados. Observar que a adoo do sistema TEDE e da camada do protocolo que o acompanha disponibiliza para a instituio receptora do pacote os padres e tecnologias necessrias para a sua imediata integrao BDTD nacional e, conseqentemente, NDLTD.

O sistema TEDE foi desenvolvido para ser compatvel com os OPACS, uma vez que as instituies podero efetuar a publicao eletrnica de teses e dissertaes correntes pelo sistema TEDE e, por meio de um mdulo especfico desse sistema, exportar os metadados para o OPAC.

2.4.1.2 Provedores de dados que j possuem bibliotecas digitais

Para as instituies que j implantaram suas bibliotecas digitais de teses e dissertaes utilizando-se de tecnologias diferentes do sistema TEDE, a integrao BDTD nacional pode ser feita por meio da implementao da camada do protocolo OAI-PMH em seus repositrios de dados, expondo metadados no padro mtd-br.

Para este fim, existem implementaes do protocolo disponveis gratuitamente na Internet (veja www.openarchives.org). Essas implementaes devem ser adaptadas no s para operarem sobre os repositrios locais como tambm para gerarem registros de metadados em XML/mtd-br. O IBICT disponibiliza no site da BDTD camadas de protocolo implementadas em Perl e PHP, os quais geram registros XML/mtd-br. Estas adotadas pelas IES que tero que proceder a adaptao das mesmas aos repositrios locais.

Uma possvel alternativa implementao do protocolo nos repositrios a adoo de uma soluo simplificada, como descrito a seguir.

Soluo simplificada para a implantao do protocolo em provedores de dados

Essa soluo visa a criao de um banco MySQL para conter os dados em formato XML/mtd-br. O banco MySQL proposto nessa soluo tem uma estrutura simples cujo contedo principal so os registros de teses e dissertaes em XML/mtd-br. Alm da estrutura desse banco, o IBICT repassa um programa que implementa a camada do protocolo OAI-PMH que opera sobre esse banco. Dessa forma, os registros inseridos no banco MySQL podem ser coletados automaticamente pelo IBICT, por meio do protocolo OAI-PMH.

Para adotar esta soluo, a IES dever desenvolver um conversor dos metadados do seu repositrio para o padro XML/mtd-br. Os registros do repositrio devem ser exportado para o banco MySQL e, conseqentemente, disponibilizados para coleta automtica.

Esquematicamente, podemos representar essa soluo simplificada na Figura 4.

Figura 4: Soluo simplificada

2.4.1.3 Provedores de dados que implementam ponteiros a textos completos nos OPACs

Como a maioria das IES possuem sistemas de gerncia dos OPACs capazes de exportar dados em ISO 2709 / Marc21, possvel a converso dos registros de teses e dissertaes a partir desse formato para o padro mtd-br. Este conversor est em fase de implementao. A disponibilizao desse conversor para as IES viabiliza a ampliao da abrangncia da BDTD a curto e mdio prazo, uma vez que um maior nmero de universidades tero as ferramentas necessrias para contriburem com seus metadados para a BDTD, principalmente metadados de descrio bibliogrfica da ... importante ressaltar, no entanto, que o formato Marc21 no contempla metadados que viabilizem a interligao com repositrios nacionais. Portanto, nosso entendimento que esta soluo adequada para a integrao de dados bibliogrficos, originrios dos OPACS, BDTD. No entanto, aconselhvel que as IES trabalhassem no sentido de criarem suas bibliotecas digitais de forma a inclurem todos os metadados especificados no padro mtd-br.

Uma vez que os metadados so convertidos de Marc21 para mtd-br, pode-se adotar a soluo simplificada, apresentada na seo anterior, para que esses metadados possam ser coletados automaticamente (veja Figura 4) pelo IBICT.

2.4.2 Tecnologias usadas pela BDTD Nacional

O IBICT, em sua funo de agregador, exerce dois papis:

provedor de servios em nvel nacional,

provedor de dados em nvel internacional.

Como provedor de servios, o IBICT oferece aos usurios o servio de busca integrada s bibliotecas digitais de teses e dissertaes das IES cooperantes da BDTD, alm de outros servios. Essa busca efetuada sobre o repositrio central dos metadados coletados automaticamente das IES, via o protocolo OAI-PMH. O IBICT atuando como provedor de dados explicado na prxima seo.

2.4.3 Tecnologias para integrao com a NDLTD

Sobre o repositrio centralizado de metadados, mencionado na seo anterior, foi instalada uma camada do protocolo OAI-PMH (Protocolo PD), para expor os metadados para serem coletados automtica por outros provedores de servio, tal como a NDLTD (BDTD internacional).

Apesar dos metadados coletados das IES serem armazenados no repositrio centralizado de metadados no padro mtd-br, a exposio dos mesmos se faz por meio dos padres DC e etd-ms. A camada do protocolo responsvel por executar o procedimento de converso de mtd-br para etd-ms ou dc, de acordo com a demanda do provedor de servios solicitante.

3 Sistema TEDE

3.1 Viso geral do sistema TEDE

O Sistema TEDE automatiza os procedimentos de publicao eletrnica de teses e dissertaes. Esse sistema tem como premissa bsica que a publicao deve ser efetuada de forma cooperativa envolvendo autor, curso de ps-graduao e biblioteca.

O sistema na atual verso composto pelos seguintes mdulos principais:

Administrao

Ps-Graduao

Autor

Biblioteca

Busca

O sistema deve ser inicialmente customizado para a instituio receptora do sistema por meio do mdulo de Administrao. A customizao envolve o cadastro dos dados especficos da instituio receptora do sistema assim como de suas unidades, tais como, programas de ps-graduao, das bibliotecas depositrias, dos operadores do sistema etc. A customizao tambm envolve escolha de interfaces para o sistema local bem como incluso do logo da instituio.

Aps a customizao, o sistema est preparado para a publicao das teses e dissertaes das IES. A publicao de uma TDE deve ser iniciada no mdulo da Ps-Graduao. Neste mdulo, o operador habilitado para tal, inclui dados do autor, ttulo da tese, membros da banca, papel dos contribuidores, etc.

Terminada esta fase, este operador cria uma conta para o autor. Somente aps executar esse procedimento que o autor tem acesso ao sistema para entrar ou alterar os dados de sua TDE e tambm para anexar os arquivos de texto, imagem, animao, etc. que compem sua tese ou dissertao.

Ao final deste processo, o autor submete a TDE ps-graduao para reviso. Caso seja detectado algum erro nos dados ou arquivos inseridos pelo autor, o operador do mdulo de ps-graduao insere um texto no campo especificado para tal, indicando o erro detectado. Esta observao encaminhada via e-mail para o autor para as devidas correes. O autor volta a operar o sistema, efetua as correes e novamente submete a tese ps-graduao novamente.

Esse fluxo entre ps-graduao e autor ocorre at que a ps-graduao considere os dados e arquivos da TDE corretos. Neste ponto, a ps-graduao libera a TDE para a Biblioteca.

O operador do mdulo Biblioteca insere metadados bibliogrficos para complementar a catalogao e faz uma reviso geral dos metadados da TDE, inseridos pela ps-graduao ou pelo autor. Caso ainda detecte erros, poder re-encaminhar a TDE ps-graduao para as devidas correes. Caso o registro de TDE seja considerado correto, a TDE ser disponibilizada para acesso pblico. A figura abaixo uma representao desse fluxo.

Figura 5: Fluxo de operao do sistema TEDENo momento em que uma TDE publicada, esta passa a estar disponvel para busca, por meio do mdulo correspondente.

Embora o sistema TEDE j inclua os mdulos bsicos que permitem a criao de uma biblioteca digital local, h necessidade de se aperfeioar alguns dos mdulos j existentes e desenvolver novos, conforme especificado nas prximas sees.

3.2 Projetos piloto

Em abril de 2003 foi concluda uma verso preliminar do sistema TEDE. O IBICT, ento instalou quatro projetos piloto que tinham por objetivo no s avaliar o sistema bem como avaliar os procedimentos de repasse do mesmo.

Quatro universidades participaram dos projetos-piloto: UFF, UCB, UnB e UFC. A seguir so apresentadas observaes realizadas na implantao dos projetos-piloto que parecem ser relevantes para subsidiar as aes de implantao do pacote em nvel nacional. 3.2.1 Observaes gerais

A implantao da BDTD requer a sensibilizao dos nveis gerenciais da universidade cooperante (reitor, pr-reitor de pesquisa, coordenadores de curso, biblioteca etc)

A presena do IBICT fundamental no processo de convencimento da importncia desse projeto em nvel nacional e internacional.

fundamental a atuao do comit de implantao;

H a necessidade de coordenadores locais atuantes e com fora poltica;

At o momento, h um baixssimo uso das listas de discusso, indicando a necessidade de se buscar mecanismos mais efetivos de comunicao entre o IBICT e as instituies cooperantes;

Na maioria dos casos as universidades no possuem fluxos definidos e operantes para o controle de qualidade, registro e depsito de teses e dissertaes, o que dificulta a implantao da biblioteca digital. H que se fazer um trabalho preparatrio antes da implantao definitiva do sistema.

3.2.2 Sistema de Publicao Eletrnica de Teses e Dissertaes

Sistema de fcil operao, ainda passvel de apresentar problemas de implementao -- varias situaes novas apareceram a cada nova implantao de projeto-piloto;

Sistema baseado no princpio de interao entre ps-graduao, biblioteca e aluno em geral essa interao no existe.

Necessidade de melhorias ou implementao de outros mdulos:

Busca;

Publicao de teses e dissertaes retrospectivas;

Estatstica;

Habilidade de registrar teses e dissertaes publicadas em outras instituies que no a IES receptora do pacote.

3.2.3 Situao dos provedores de dados

Conceitos relacionados com bibliotecas digitais pouco difundidos. Maior conhecimento dos conceitos pelos tcnicos que participaram dos cursos de bibliotecas digitais ministrados pela professora Ana Pavani;

Falta de organizao nos fluxos operacionais relativos ao registro e controle de informaes de teses e dissertaes;

Nem sempre a biblioteca -- nosso principal interlocutor -- tem poder poltico para a implantao de um sistema dessa abrangncia, envolvendo ps-graduao e alunos.

O fluxo operacional implementado no sistema causa impacto nas IES em funo da necessidade de se estabelecer interao prxima entre biblioteca, ps-graduao e alunos.

Necessidade de enfatizar o treinamento dos secretrios de ps-graduao com relao a operao de sistemas de informao -- especialmente no que se refere ao cumprimento de padres de entrada de dados.

3.3 Mdulos a serem aperfeioados

3.3.1 Mdulo de busca

Apesar do sistema TEDE j possuir um mdulo de busca, este simplificado no possibilitando ao usurio a especificao dos campos onde deseja realizar busca. H, portanto, necessidade de se aperfeioar o mdulo de busca com as seguintes caractersticas:

Possibilitar a especificao de expresses de busca utilizando operadores booleanos (and, or, andnot) sobre um conjunto de metadados a ser especificado pelo IBICT;

Apresentar o nmero de registros recuperados;

Produzir dois tipos de telas de resultados:

Resumida (contendo um subconjunto resumido de metadados)

Detalhada (contendo subconjunto amplo de metadados, entre os quais link para o documento completo);

Possibilitar a especificao do nmero de registros do resultado a ser apresentado na tela;

Gerenciar paginao de resultados, ou seja, o usurio poder tanto ver o resultado na ordem da recuperao como poder selecionar a pgina do resultado que deseja ver.

Incluir botes de ajuda;

Manter um histrico das buscas realizadas para que o usurio possa reutiliz-las.

A interface de busca est sendo especificada por um grupo de trabalho. Esta deve seguir, na medida do possvel, a formatao da pgina de acesso BDTD (http://bdtd.ibict.br ), que atualmente encontra-se tambm em processo de reavaliao.

3.4 Mdulos a serem desenvolvidos

3.4.1 Mdulo de exportao de metadados para OPACs

Na publicao de uma tese ou dissertao utilizando-se o sistema TEDE, so informados vrios metadados que so comuns aos metadados dos OPACs. Com vistas integrar o sistema TEDE com os OPACs faz-se necessrio o desenvolvimento de um mdulo de exportao de metadados. Como a maioria dos sistemas de gerncia de OPACs capaz de importar dados em formato ISO2709 Marc21, o sistema TEDE deve ser capaz de exportar metadados nesse formato.

O mdulo de exportao deve:

Extrair do banco de dados (MySQL) do sistema TEDE um subconjunto de metadados de teses/dissertaes e convert-los em formato ISSO 2709 Marc21, gerando um arquivo de entrada para os OPACs.

Permitir a exportao de:

apenas os registros novos, entrados a partir da ltima exportao;

Registros dentro de uma faixa de datas;

Registros selecionados a partir de uma lista de identificadores de registros fornecida pelo usurio.

Como o formato Marc21 no especfico para teses e dissertaes, as universidades utilizam campos livres para inclurem metadados especficos de teses e dissertaes (por exemplo, campo para conter o nome do orientador). H, no entanto, um subconjunto desses metadados que utilizam campos definidos do Marc21 (por exemplo, autor sempre inserido no campo Marc21 nmero 100, sub-campo $a). Assim sendo, o mdulo de exportao deve ser flexvel para que a universidade usuria do mdulo possa especificar a correspondncia do metadado com o campo Marc21 que utilizado, para aqueles metadados que no possuem campos especficos no Marc21.

O grupo de trabalho do IBICT que trata da converso Marc21 para o mtd-br est elaborando uma tabela contendo uma lista de metadados a ser extrada do banco de dados, especificando quais desses tem correspondncia direta com o Marc21 e quais tero a correspondncia com o Marc21 especificado pela instituio usuria do mdulo.

3.4.2 Mdulo Gerencial

Este mdulo deve fornecer informaes gerenciais e de uso do sistema. As informaes gerenciais a serem produzidas nesse mdulo envolvem:

Identificao de gargalos nos procedimentos de publicao eletrnica das teses e dissertaes;

Estatsticas de tempo gasto na publicao de tde;

Nmero de tde publicadas por programa de ps-graduao;

Quantidade de tde por grau;

Numero de tde por rea do conhecimento;

Participao dos contribuidores (orientador, membro de banca) nas tdes;

Tdes mais acessadas (download);

Distribuio das tdes por agencia de fomento;

Srie histrica do crescimento do nmero de tdes.

Etc.

3.4.3 Mdulo de internacionalizao

Este mdulo tem por objetivo possibilitar a mudana de idioma dos textos das interfaces do sistema. O desenvolvimento desse mdulo envolve:

Identificao e extrao dos textos das interfaces;

a criao de arquivo contendo todos os textos utilizados nas interfaces com base no padro I18N;

Incluso das chamadas de apresentao dos textos a partir desse arquivo;

O IBICT j definiu um padro de nomenclatura de arquivos a ser seguido.

3.4.4 Mdulo integrao com os sistemas da Capes e CNPq

necessrio promover reunies com a Capes e CNPq para se identificar os metadados de interesse para os sistemas mantidos por esses rgos.

A partir da identificao dessa demanda:

Avaliar a necessidade de se incluir metadados no sistema TEDE e mtd-br;

Avaliar a necessidade de criar mdulos especficos no Sistema TEDE para a captao de novos metadados (por exemplo, necessidade de se incluir no mdulo da ps-graduao procedimentos para a marcao de defesa de teses)

Implementar mdulo de exportao dos metadados de interesse para Capes e CNPq;

Estudar a possibilidade de se implantar mecanismos de harvesting nestes rgos para que os mesmos faam coleta automtica dos metadados de interesse.

3.4.5 Mdulo de registro de acervo retrospectivo

Apesar do sistema TEDE ter sido desenvolvido com vistas publicao eletrnica das teses e dissertaes correntes, vrias universidades j expressaram interessem em incorporarem em suas bibliotecas digitais td defendidas no passado. Neste caso, o fluxo de publicao diferente do implementado no sistema TEDE porque os autores podero no estar mais disponveis para exercerem seu papel na publicao de sua tese ou dissertao. H, portanto, a necessidade de se projetar e desenvolver um mdulo que simplifique o fluxo de publicao, removendo o autor do mesmo. Deve-se estudar as alternativas (1)reduzir esse fluxo para que uma nica unidade da universidade se responsabilize pelo processo de publicao; (2)implementar o fluxo de publicao envolvendo ps-graduao e biblioteca.

3.4.6 Verso multi-institucional do sistema

O sistema TEDE pressupe que as teses e dissertaes publicadas nas bibliotecas digitais locais pertencem instituio receptora do sistema.Portanto, o sistema preparado para cadastrar apenas uma instituio de defesa e suas unidades (cursos de ps-graduao e bibliotecas depositrias).

No entanto, j h demanda para que o sistema TEDE possa tambm publicar eletronicamente teses e dissertaes produzidas em outras instituies. Esse o caso, por exemplo, de instituies que desejem publicar as teses e dissertaes de seus professores os quais defenderam suas teses ou dissertaes em outras universidades. Esse mesmo mdulo tambm necessrio para que o IBICT possa publicar teses e dissertaes de brasileiros no exterior.

Ao planejar este mdulo importante se levar em considerao as diferenas de metadados para o registro de instituies estrangeiras versus instituies nacionais. Uma conseqncia na implementao de uma verso multi-institucional a adequao do protocolo OAI-PMH que o acompanha. Por exemplo, o processo de coleta automtica BDTD deve selecionar apenas as td produzidas nas IES, portanto, a camada do protocolo deve estar preparada para fazer coleta seletiva a partir de sets. Por outro lado, no caso do IBICT como provedor de dados para a BDTD, a coleta deve ser de todas as tdes produzidas por brasileiros no exterior.

3.5 Plano de distribuio nacional do pacote de teses e dissertaes

O IBICT iniciou em agosto de 2003 aes que visam distribuio do pacote de teses e dissertaes em nvel nacional. A primeiro passo foi enviar aos reitores das universidades uma carta-convite oferecendo o repasse do pacote para que a universidade criasse sua biblioteca digital local de teses e dissertaes e se integrasse iniciativa nacional (BDTD/IBICT) e iniciativa internacional.

As IES candidatas a receberem o pacote devem enviar alguns dados solicitados na carta-convite. Para essas instituies interessadas, o IBICT oferecer um workshop para repasse do pacote e treinamento de tcnicos dessas instituies.

Embora a carta-convite tenha atingido um grande nmero de universidades, o IBICT dever ampliar a abrangncia dessa ao buscando incluir os institutos de pesquisa do MCT e outras instituies no includas na primeira remessa das cartas-convite.

4 Sistema Teses Brasileiras e sua integrao BDTD

4.1 Viso geral do sistema Teses Brasileiras

O sistema Teses Brasileiras, implantado pelo IBICT em 1995, tem por objetivo a integrao dos dados referenciais de teses e dissertaes produzidas por instituies de ensino superior brasileiras. O sistema conta atualmente com 17 universidades cooperantes e integra 142.000 referncias bibliogrficas de teses e dissertaes originrias dessas universidades.

O sistema alimentado por meio do envio, pelas instituies cooperantes, de arquivos contendo as referncias bibliogrficas das teses e dissertaes produzidas na instituio. Os registros enviados seguem um padro definido para o sistema (Formato de Intercmbio de dados de teses e dissertaes). Os arquivos podem ser para substituio total dos registros existentes na base mantida pelo IBICT (carga total) ou apenas para substituir os registros atualizados e incluir os registros novos (carga parcial). O sistema tambm aceita a alimentao em formato ISO2709. Apenas a USP envia dados neste formato.

O sistema Teses Brasileiras est implementado em um banco Oracle. Esse sistema tem uma estrutura relacional, onde a tabela de bibliotecas depositrias alimentada por procedimento parte dos registros bibliogrficos.

O sistema possui procedimentos que verificam a validade de alguns metadados. Ao se realizar os procedimentos de alimentao da base, o sistema emite relatrio de crtica que enviado para as instituies cooperantes para que os dados sejam corrigidos.

A integrao do sistema Teses Brasileiras com a BDTD, atualmente, ocorre de forma assncrona, dependente de um tcnico que ative o procedimento de converso e transferncia de dados para a BDTD, o que pode causar inconsistncias e falta de sincronismos entre esses dois repositrios.

4.2 Procedimentos de integrao BDTD

Para a integrao da base Teses Brasileiras BDTD foi desenvolvido um conversor dos dados existentes no banco Oracle para o padro mtd-br. Os registros em formato mtd-br so ento includos em um banco MySQL, a partir do qual so transferidos para a BDTD usando o mesmo procedimento de alimentao da BDTD utilizado para os metadados coletados automaticamente.

4.3 A ser desenvolvido ou aperfeioado

Apesar dos dados da base Teses Brasileiras poder migrar para a BDTD, o procedimento de transferncia pode gerar erros. necessrio criar procedimentos para que a alimentao dos dados bibliogrficos seja realizada diretamente na BDTD, unificando o sistema de Teses Brasileiras BDTD.

Ao projetar as formas de alimentao da BDTD necessrio considerar:

Alimentao da BDTD a partir de metadados em registros Marc21/XML j existe um grupo de trabalho analisando e desenvolvendo conversor Marc21 XML para mtd-br. Esta alternativa poder ampliar significativamente a abrangncia da BDTD, uma vez que a maioria dos sistemas de gerncia dos OPACS capaz de gerar esse formato.

Devido s diferenas quanto a completeza dos dados bibliogrficos em relao aos dados de teses e dissertaes em texto completo, provavelmente ser necessrio criar dois schemas distintos para a validao dos metadados e implementar os mecanismos de validao.

Reavaliar o formato de intercmbio, com vistas a elimin-lo ou ampli-lo para comportar os metadados do mtd-br.

5 Produtos e servios da BDTD

5.1 Viso geral

Sobre o repositrio centralizado de metadados criado por meio da coleta automtica de metadados das bibliotecas digitais de teses e dissertaes das IES, so oferecidos servios e produtos. Atualmente a BDTD nacional oferece apenas a busca integrada a essas iniciativas, porm j esto em fase de planejamento outros servios e produtos. A seguir so apresentadas propostas de melhoramento do mdulo de busca e desenvolvimento de novos mdulos para a gerao de outros produtos e servios.

5.2 Aperfeioamento do mdulo de busca

O servio de busca oferece duas alternativas para os usurios:

Busca simples, onde as buscas so realizadas sobre todos os campos definidos como de busca o usurio no tem a opo de especificar os campos em que quer realizar as buscas e nem a opo de usar operadores de busca.

Busca avanada, onde o usurio especifica uma expresso de busca complexa, combinando campos de busca com operadores booleanos (e, ou, e-no), indicando os campos onde quer realizar buscar os termos especificados na expresso..

Como resultado da busca, o sistema informa quantos registros foram recuperados e apresenta uma verso simplificada dos metadados correspondentes aos registros recuperados. O usurio tem a opo de detalhar esses metadados para decidir a relevncia do documento para sua pesquisa. A apresentao de um cone de um livro, junto aos metadados, indica que o documento em questo possui texto completo em meio eletrnico. Neste caso, o usurio poder acess-lo por meio de seu endereo eletrnico apresentado na tela. Ao ativar o link, o usurio estar sendo direcionado, via browser, para o repositrio local da IES onde se encontra o texto completo do documento.

O mdulo de busca atualmente existente na BDTD, portanto, j incorpora as funes essenciais para recuperao de informaes, tais como, uso de operadores booleanos. No entanto, necessrio aperfeioar os procedimentos de buscas para melhor atender as demandas dos usurios, sejam esses iniciantes ou especializados.

As novas facilidades identificadas para serem incorporadas ao servio de busca so:

Melhoria na interface de busca de modo a facilitar o uso da mesma por usurios iniciantes e usurios especializados;

Separao em telas distintas a busca simples e a busca avanada;

Implementao de filtros, tais como:

tipo do objeto digital, Pas

Idioma

Grau

rea do conhecimento da tese ou dissertao.

Manuteno do histrico das buscas realizadas por um usurio para que possam ser re-utilizadas em refinamentos posteriores;

Aumento do escopo da busca com a incluso de campos de busca, tais como, local de defesa, perodo de defesa da tese ou dissertao;

Implementao da opo de envio dos resultados da busca por e-mail.

5.3 Servios e produtos a serem desenvolvidos

5.3.1 Indicadores

Foi inicialmente planejada a gerao de dois tipos de indicadores:

Indicadores de uso das teses e dissertaes;

Indicadores nacionais de produo de teses e dissertaes.

Proposta inicial para os indicadores de produo:

Srie histrica da quantidade de teses includa na BDTD ao longo do tempo;

Orientador quantidade de teses orientadas por um determinado professor;

Grau da tese quantidade de teses produzidas por grau (mestrado, doutorado);

Programa de ps-graduao produo cientfica por programa;

Instituio de defesa Produo cientfica por instituio;

rea do conhecimento Produo de teses ou dissertaes por rea do conhecimento;

No que se refere ao acesso, duas medidas so possveis de serem usadas: nmero de acessos (hits) e nmero de cpias (download) talvez se opte pelo uso de ambas medidas.

A proposta inicial para indicadores de uso das teses e dissertaes mede a quantidade de acessos por:

Autor

Orientador

Tese ou dissertao

Grau

Programa de ps-graduao;

Instituio de defesa

rea do conhecimento

Etc

Para qualquer dos indicadores propostos, podero ser utilizados os seguintes filtros:

Instituio de defesa;

Regio;

Estado;

Pas;

Grau;

rea do conhecimento;

Ano de defesa;

Agncia de fomento.

5.3.2 Outros servios e produtos

Outros servios e produtos, alm do servio de busca e indicadores devem ser implantados na BDTD. Ainda no houve uma discusso ampla sobre quais servios sero implantados, porm j se planeja a criao de um servio de alerta das novas teses e dissertaes em conformidade com os perfis dos usurios.

6 Protocolo OAI-PMH

A implantao do processo de coleta automtica de metadados requer que tanto provedores de dados e como provedores de servios implementem uma camada do protocolo OAI-PMH. Essas camadas servem a diferentes propsitos. Enquanto a camada do protocolo para provedores de dados expe os metadados para serem coletados, a camada do protocolo para provedores de servio responsvel por solicitar os metadados, segundo um determinado padro.

A camada do protocolo para provedores de dados dependente da estrutura do repositrio de dados. Embora implementadores disponibilizem programas livres que implementam a camada do protocolo para provedores de dados, estes programas tm que ser ajustados ao banco de dados ao qual faro acesso para gerar o registro de metadados solicitado. Um outro aspecto a ser adaptado nesses programas a gerao do padro de metadados que se quer expor os metadados. Em geral, as implementaes disponveis geram apenas o padro Dublin Core. Embora este seja sempre necessrio porque requerido pelo protocolo OAI-PMH, a grande maioria dos sistemas opera com padres de metadados mais completos, como o caso da BDTD que utiliza o padro mtd-br. Desta forma, alm de adequar o programa para operar sobre o banco de dados especfico do repositrio local, deve-se tambm implementar o padro de metadados no qual se deseje expor os metadados.

Ao contrrio da camada do protocolo para provedores de dados, a camada do protocolo para provedor de servios independente das caractersticas dos repositrios dos quais est coletando metadados. O programa que executa a coleta automtica possui uma camada do protocolo que envia as requisies de metadados aos provedores de dados. Estes respondem com registros em formato XML, seguindo o padro de metadados solicitado. Os registros coletados so ento armazenados em um repositrio centralizado de metadados.

6.1 Viso geral sobre a coleta automtica de metadados na BDTD

O programa coletor de metadados periodicamente visita todos os repositrios das IES cooperantes coletando registros novos de teses e dissertaes ou registros que foram atualizados desde a ltima visita. A periodicidade dessa coleta foi inicialmente definida pelo IBICT como sendo diria. Essa periodicidade ser ajustada em funo do volume de novas teses e dissertaes e da eventual sobrecarga que esse procedimento vier a causar na rede.

Para viabilizar a coleta de metadados, tanto o IBICT como as IES implementam o protocolo OAI-PMH. Os metadados coletados so integrados em um s repositrio no IBICT. Esse repositrio est organizado em sets, cada set contendo os metadados relativos a cada universidade cooperante, possibilitando, dessa forma, a coleta seletiva de metadados por outros provedores de servios.

A integrao entre IBICT e NDLTD, de forma similar integrao entre IES e IBICT, ocorre por meio da coleta automtica de metadados. Para essa integrao, no entanto, o padro de metadados utilizado o etd-ms. Apesar da BDTD, como um todo, conter metadados de teses e dissertaes, independentemente se estas esto em meio eletrnico ou no, so disponibilizados para coleta automtica pela NDLTD apenas metadados de teses e dissertaes que possuem texto completo em meio eletrnico.

A figura a seguir apresenta um esquema simplificado do processo de coleta automtica, identificando os repositrios envolvidos, as camadas do protocolo OAI-PMH e os padres de metadados utilizados.

Figura 6: Processo de coleta automtica de metadados

6.2 Processo de absoro das tecnologias relacionadas com o protocolo OAI-PMH

O processo de absoro das tecnologias para a implementao e implantao do protocolo OAI-PMH no mbito da BDTD iniciou em julho de 2002 com a visita do consultor Marcos Andr Gonalves, Virginia Tech. Anterior a esta vista foi criado um grupo de trabalho no IBICT para o estudo do protocolo. Quando da chegada do consultor, os tcnicos do IBICT j possuam um conhecimento bsico do protocolo.

Durante a visita do consultor, iniciou-se a implementao de camada do protocolo para um banco de dados fictcio. Como a verso 2.0 do protocolo havia sido publicada cerca de um ms antes da visita, apenas uma verso em Perl de camada do protocolo para provedor de dados estava disponvel no site da OAI. Embora os membros do grupo de trabalho no tivessem profundo conhecimento da linguagem Perl, optou-se por utilizar esse programa como forma de acelerar o processo de absoro da tecnologia. A implementao completa do protocolo requeriria um tempo maior de desenvolvimento. Durante quatro dias de trabalho o grupo implementou uma verso preliminar do protocolo, incluindo todos os verbos de requisio de metadados previstos no protocolo.

Esse exerccio foi extremamente til para ampliar a compreenso do funcionamento do protocolo e identificar os pontos que necessitariam de adaptao a diferentes estruturas de bancos de dados. A partir dessa experincia, tcnicos de informtica do IBICT iniciaram a implementao do protocolo para o banco MySQL implementado no mbito do sistema TEDE.

6.3 Tecnologias relacionadas com o protocolo atualmente disponveis

6.3.1 Coletor de metadados

O coletor de metadados DBUNION, distribudo pela Virginia Tech, gera um repositrio centralizado de metadados em um banco MySQL. O DBUNION foi atualizado para se tornar compatvel com a verso 2.0 do protocolo. Como o IBICT um agregador, sobre esse repositrio foi implementada uma camada do protocolo para expor os metadados coletados das IES. Essa camada do protocolo, escrita na linguagem PHP, foi implementada a partir da adaptao do programa ?PKP?.

Este mesmo programa est sendo adaptado para expor os metadados dos repositrios gerados a partir do sistema TEDE. A escolha por ter uma camada em PHP, ao invs da camada j implementada em Perl, tornar mais fcil a absoro do pacote de teses e dissertaes pelas IES, uma vez que o prprio sistema TEDE est desenvolvido em PHP. Desta forma, o ambiente computacional para abrigar o sistema TEDE no mais requerer a instalao da linguagem Perl e suas bibliotecas de programas. Adicionalmente, tem-se indicao de que a linguagem PHP mais conhecida nos ambientes universitrios brasileiros do que a linguagem Perl, e portanto, facilita o desenvolvimento de novas rotinas para o programa, caso necessrio.

O programa de coleta automtica de metadados adotado o DBUNION. O processo de coleta automtica gera um banco de metadados em MySQL, onde os registros so armazenados em XML/mtd-br. Esses registros de metadados so posteriormente exportados para um banco Oracle, sobre o qual so operados os servios e gerados produtos da BDTD.

A estrutura do banco MySQL gerada pelo DBUNION a seguinte:

Cabealho formado por..

6.3.2 Camadas do protocolo OAI-PMH para provedor de dados

Existem duas implementaes para camadas do protocolo OAI-PMH adaptadas pelo IBICT e disponveis para repasse:

(a) Programa em Perl

Esse programa, obtido originalmente no site OAI, foi adaptado nos seguintes aspectos:

Incluso de rotinas para acesso a banco de dados;

Implementao do padro mtd-br;

Implementao do padro etd-ms.

Esse programa foi repassado USP e Puc-Rio que fizeram as adaptaes necessrias aos seus repositrios. Observar, no entanto, que a verso absorvida por essas instituies ainda no inclua a implementao do padro etd-ms. Esse fato, no entatno, no se constitui em um problema no mbito da BDTD porque o padro etd-ms somente usado para exposio de metadados para a NDLTD e essa exposio feita pelo IBICT. O IBICT coleta os metadados em mtd-br e, a camada do protocolo que expe esses metadados os converte para o padro etd-ms, usando ferramentas XSL.

Para a camada de protocolo Perl, adaptada por tcnicos do IBICT, foram implementados os trs padres de metadados: DC, etd-ms e mtd-br. Essa camada do protocolo foi ento repassada para os provedores de dados que j possuam bibliotecas digitais (USP, PUC-Rio e UFSC) para que fossem feitas as devidas adaptaes aos seus respectivos repositrios. A USP adaptou essa camada para operar sobre o sistema ETD-DB (distribudo pela NDLTD), a Puc-Rio adaptou o programa para operar sobre um sistema em DB2 e a UFSC terminou por adotar a soluo simplificada, descrita na seo 2.4.1.2.

(b) Programa em PHP

Verso para agregador

Esse programa opera sobre o repositrio centralizado de metadados mantido pelo IBICT. Recupera registros em formato XML/mtd-br e os expe seguindo o padro etd-ms. Para essa converso a camada do protocolo utiliza a ferramenta XSL.

Para esta camada do protocolo foi adaptado um programa disponibilizado na Internet, desenvolvido em linguagem PHP. A verso adaptada deste programa tambm distribuda pelo IBICT para a implantao da soluo simplificada apresentada na seo 2.4.1.2.Verso para a soluo simplificada

A soluo simplificada utiliza a estrutura de banco de dados MySQL gerada a partir do coletor de metadados DBUNION. Como os metadados nessa estrutura j esto armazenados em XML/mtd-br, a camada do protocolo que possibilita sua exposio simples expe os metadados no padro em que foram armazenados. importante observar que esses repositrios no so reconhecidos pela iniciativa de arquivos abertos porque no expem metadados em DC.

Essa soluo aplicvel queles provedores de dados que querem operar com o protocolo mas no querem ter o nus de implementar uma camada do protocolo em seus repositrios. Por outro lado, esses provedores tm apenas que gerar os registros no padro mtd-br e inclu-los na estrutura de banco MySQL, conforme especificado no item 6.3.1.

6.4 Tecnologias relacionadas com o protocolo a serem desenvolvidas ou aperfeioadas

Novos desenvolvimentos

Foram identificadas duas necessidades:

Camada do protocolo, em PHP, para o banco de dados gerado pelo sistema TEDE;

Camada do protocolo como provedor de dados a ser instalada sobre o banco de dados da BDTD em Oracle.

Aperfeioamentos

O programa coletor de metadados deve ser adaptado para alimentar diretamente o banco Oracle, eliminando eventual falta de sincronismo entre o processo de coleta automtica de metadados e o servio de busca.

6.5 Suporte tcnico na implementao do protocolo

O IBICT atualmente mantm uma lista de discusso para apoiar implementadores do protocolo OAI. Alm dessa lista, so fornecidas orientaes individuais por chat ou telefone.

Sugere-se ampliar o servio de apoio implementao do protocolo OAI para incluir:

Site contendo informaes sobre o protocolo; tecnologias disponveis, FAQs etc.

Realizao de workshops ou videoconferncias peridicas para melhor difundir as tecnologias;

Etc.

7 Equipe e Grupos de trabalho da BDTD

7.1 Coordenao geral

Slvia Barcellos Southwick (at outubro de 2003)

7.2 Grupos de trabalho

Interface de busca

Eliana Rocha

Eny Marcelino

Elza Barboza

Ramon Martins

Zairton Bastos

Edson Pereira

Milton Shitako

Diagnstico da base Teses Brasileiras

Elza Barboza

Eliana Rocha

Maria Bicalho

Mnica Pinheiro

Estrutura da BDTD no Oracle

Zairton BastosEdson Pereira

Milton Shitako

Gabriel Mathias

Eustquio Mendes

Eliana Rocha

Produtos e servios

Lgia Caf

Sueli Maffia

Ricardo Rodrigues

Eliana Rocha

Anaiza Gaspar

Helia Chaves

Bianca Amaro

Milton ShitakoZairton BastosSistema TEDE

Sueli Maffia

Mrcio Henrique

Maria Ins

Ramon Martins

Reviso do sistema TEDE

Sueli Maffia

Bianca Amaro

Jane Gadelha

Eliana Rocha

Eny MarcelinoMaria Ins

Distribuio nacional do pacote

Sueli Maffia

Bianca Amaro

Slvia Barcellos

Protocolo OAI-PMH

Slvia Barcellos

Gabriel Mathias

Milton Shitako

ANEXO I

Representao grfica do padro mtd-br

Internacional

Nacional

Local

BDTD Internacional - NDLTD Virginia Tech

BDTD Nacional

IBICT

BDTD Local

Instituies de Ensino Superior

Provedor de servios

Agregador

. Provedor de servios

. Provedor de dados

Provedores

de dados

Componentes da rede

Metadados

(etd-ms)

Nveis

Metadados

(mtd-br)

Papis

Etd-ms

DC

Mtd-br

Sistema

BDTD

BDTD local

(IES)

BDTD Nacional

(IBICT)

Integrao NDLTD (IBICT)

Tec. TEDE

Tec. prpria

Opac

Protocolo PD

Sistema TEDE

Protocolo PD

Soluo simplificada para protocolo PD

Conversor

Marc21 ( mtd-br

Soluo simplificada para protocolo PD

Protocolo PS

Coletor de metadados

Produtos e Servios

Protocolo PD

Conversores:

Mtd-br( etd-ms

Mtdbr ( OAIDC

T

E

C

N

O

L

O

G

I

A

S

IBICT

NDLTD

BDTD

Nacional

Nacional

IBICT

Protocolo

OAI-PMH

Conversor para XML/mtd-br

Banco

MySQL

BDTD

Local

Protocolo OAI-PMH

Metadados: mtd-br

Protocolo OAI-PMH

Metadados: mtd-br

Biblioteca

Autor

Ps

BDTD

Local

Incio

IES

HYPERLINK "http://www.openarchives.org/OAI/openarchivesprotocol.html" http://www.openarchives.org/OAI/openarchivesprotocol.html

HYPERLINK "http://www.openarchives.org" http://www.openarchives.org

HYPERLINK "http://www.ndltd.org/" http://www.ndltd.org/

HYPERLINK "http://www.dublincore.org" www.dublincore.org

HYPERLINK "http://www.ibict.br/schema" www.ibict.br/schema

HYPERLINK "http://www.ndltd.org/standards/metadata/current.html" http://www.ndltd.org/standards/metadata/current.html

HYPERLINK "http://dublincore.org/documents/dcmi-type-vocabulary/" http://dublincore.org/documents/dcmi-type-vocabulary/

HYPERLINK "http://www.ibict.br/schema" http://www.ibict.br/schema

HYPERLINK "http://physnet.uni-oldenburg.de/oai/"http://physnet.uni-oldenburg.de/oai/

PAGE 30