30
Fábio Mascarenhas e Silva [email protected] 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de Ciência da Informação Tópicos Especiais em TI 2 http://toti2.wordpress.com

Fábio Mascarenhas e Silva [email protected] 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Embed Size (px)

Citation preview

Page 1: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Fábio Mascarenhas e [email protected]

04outubro2007

Universidade Federal de PernambucoCentro de Artes e Comunicação

Departamento de Ciência da Informação

Tópicos Especiais em TI 2

http://toti2.wordpress.com

Page 2: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Assunto de hojeBases de dados

Na próxima aula entregar um ensaio sobre Bases de Dados!- Uma página tamanho A4, Fonte Arial 12, Espaçamento simples.

Aula 04out2007

Page 3: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

• Em sentido amplo, as Bases de Dados são produtos resultantes de dados estruturados (organizados) armazenados em meios específicos.• Uma coleção de registros similares entre si e que contém determinadas relações entre esses registros. • Qualquer coleção de informações agrupadas segundo um interesse comum e mantidas eletronicamente (em computadores.• Fontes de informação automatizada que podem ser pesquisadas de diversos modos.

Aula 04out2007

Page 4: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

EVOLUÇÃO1951 - Bases de dados numéricos 1960 - Bases de dados bibliográficos 1970 - 10 Bases disponíveis (acesso online) 1986 - Bases em suporte de CD-ROM 1990 - 3.200 Bases hospedadas 2000 - Milhões de computadores ligados em rede.

Aula 04out2007

Page 5: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Aula 04out2007

CRIAÇÃO/ALIMENTAÇÃO

USO

Page 6: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Aula 04out2007

USO

Page 7: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

CLASSIFICAÇÃO DAS BASES DE DADOS

Bases de dados referenciaisremetem às fontes primáriasBases de dados de fontescontém os dados originais e textos completos; constituem um tipo de documento eletrônico.

Aula 04out2007

REFERENCIAIS

• Bibliográficas - Incluem citações bibliográficas acompanhadas ou não dos resumos dos trabalhos publicados. Ex.: LICI/IBICT; MEDLINE; ERIC • Catalográficas - Representam o acervo de uma biblioteca ou de uma rede de bibliotecas, sem indicação do conteúdo dos documentos. Ex.: UNIBIBLI; OPACS (Online Public Access Catalogs) • Diretórios - informações ou dados sobre pessoas, instituições e outros dados característicos de guias e cadastros.Ex.: Plataforma Lattes, Diretório de Grupos de Pesquisa

Page 8: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

CLASSIFICAÇÃO DAS BASES DE DADOS

Bases de dados referenciaisremetem às fontes primáriasBases de dados de fontescontém os dados originais e textos completos; constituem um tipo de documento eletrônico.

Aula 04out2007

FONTESContém os dados originais e textos completos; constituem um tipo de documento eletrônico.• Numéricos - Incluem dados numéricos e estatísticos. Ex.: SIDRA/Fundação IBGE •Texto Completo - contém notícias de jornal, especificações técnicas, artigos de periódicos, dicionários. •Ex.: Portal da pesquisa•Textuais e Numéricos - mistura de dados textuais e numéricos. Ex.: Relatórios Anuais de Empresas.• Gráficos - apresentam fórmulas químicas, imagens, logotipos. Ex.: INPI (marcas comerciais)

Page 9: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Aula 04out2007

TIPOS MÍDIA CARACTERÍSTICAS

Cadastros; Abstracts; Index; Diretórios; Anuários; Bibliografias; Balanços; Pesquisas.

Produtos desenvolvidos e impressos em papel.

Falta normalização e padrões; pouca cooperação entre instituições; difícil distribuição; Alto custo; Demora no acesso.

Cadastros; Abstracts; Index; Diretórios; Anuários; Bibliografias; Balanços; Pesquisas.

Produtos desenvolvidos e impressos em papel;cooperação via fitas magnéticas.

Início de normalização e padrões e cooperações; Melhor distribuição e acesso; Alto custo.

Bases de dados eletrônicas do tipo: Bibliográficas; Referenciais; Cadastrais; Numéricas.

Algumas bases são impressas e eletrônicas, outras apenas eletrônicas; cooperação online.

Normalização e padrões internacionais; Cooperação institucional; Alto custo na impressão e telecomunicação.

TRAJETÓRIA

Page 10: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Aula 04out2007

TIPOS MÍDIA CARACTERÍSTICAS

Bases de dados eletrônicas e óticas do tipo: Bibliográficas; Referenciais; Cadastrais; Numéricas.

Algumas bases são impressas e eletrônicas, outras apenas eletrônicas e algumas em formato ótico.Cooperação online.

Normalização e padrões internacionais; Cooperação institucional; Alto custo na impressão e telecomunicação e baixo custo no ótico.Acesso em tempo real.

Bases de dados eletrônicas e óticas do tipo: Bibliográficas; Referenciais; Cadastrais; Numéricas; Fontes (texto completo.

Bases impressas, eletrônicas, em formato ótico, e via Internet; Modelos de metadados.

Normalização e padrões internacionais; Cooperação institucional; Baixo custo em formato ótico e Internet subsidiado.

TRAJETÓRIA

Page 11: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

RECUPERAÇÃO DA INFORMAÇÃO EM BASE DE DADOS

Linguagem de busca: controlada, natural, livre Lógica de busca (booleana): combinação de termos enunciados com operadores: AND, OR, NOT.. Passos da recuperação: definir os termos; relacionar os termos; mostrar estratégias Recursos de recuperação: básicos (help, janelas, comandos); seleção de termos de busca (índice de palavras); entrada de termos de busca (vocabulário controlado); combinação de termos; escolha de campos; truncamentos; expressões de proximidade; limitações de amplitude; opções avançadas de exibição (texto completo); busca de múltiplos arquivos; exibição de tesauro; hipertextos (links com outros registros).

Aula 04out2007

Page 12: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

É IMPORTANTE PARA UMA BASE..Não ser redundante, ou seja, possuir o mínimo de duplicidade de dados idênticos, de preferência nenhuma. Essa duplicidade dificulta o mantenimento da consistência de dados e acarreta desperdício de espaço no armazenamento.Ser independente de determinado software, de modo que os dados possam ser transferidos ou reestruturados sem a necessidade de fazer alterações radicais nos programas;Incluir o maior número possível de inter-relações de dados;Possuir um método comum de recuperação, inserção e correção de dados.

Aula 04out2007

Page 13: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Aula 04out2007

CRIAÇÃO/MANUTENÇÃO

Page 14: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

O sucesso das Bases de Dados se deve em parte à adoção de padrões (protocolos) de comunicação e organização de dados em sistemas de gerenciamento de informações. O Z39.50 e SR são normas relativas a recuperação da informação, sendo a primeira um protocolo nacional norte-americano desenvolvido pelo ANSI (American Nacional Standards Institute), enquanto a SR é internacional, oriunda da ISO(International Standards Organisation) por isso também chamada de ISO 10162/3.Ambas são compatíveis, mas a Z39.50 é utilizada com mais freqüência devido à sua maior funcionalidade. Vamos conhecê-la melhor.

Aula 04out2007

Page 15: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Z39.50• Permite a usuários de diferentes produtos de software se comunicarem entre si e intercambiar dados.• É utilizada em vários sistemas de gerenciamento de bibliotecas (inclusive recomendado pelo MEC) e nos serviços de buscas online oferecidos pelo Mead data Central, Dialog, SilverPlatter.

Aula 04out2007

Page 16: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Z39.50

Aula 04out2007

Mantido pela Library of Congress que trabalha de forma estreita com o ZIG (Z39.50 Internet Group), grupo de companhias e organizações que usam o protocolo em seus sistemas e aplicações.

Define uma forma de comunicação entre computadores em um ambiente cliente/servidor distribuído com o propósito de recuperação de informações.

Permite que a informação possa ser pesquisada e recuperada independentemente de qual servidor que opera a base de dados, qual o gerenciador de base de dados ou de qual programa de interface do cliente.

Page 17: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Aula 04out2007

O protocolo apenas descreve como a informação é intercambiada e organizada, deixando o resto com os implementadores;

Envolve um servidor (local onde estão armazenados os registros), uma ou mais bases de dados, e um cliente (a máquina do usuário).

Quando uma conexão é feita entre um cliente e um servidor, são trocadas algumas informações, relacionadas com tamanho de registro, número de versão, e características suportadas pelo sistema.

O servidor não está pronto para receber buscas do cliente. O usuário monta a expressão no formato nativo do programa cliente que a transforma no padrão do Z39.50, antes de enviá-la para o servidor.

Z39.50

Page 18: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Aula 04out2007

A expressão recebida pelo servidor é processada e o resultado é convertido no padrão Z39.50 antes de ser enviado para o cliente. O cliente mostra na tela o resultado ao usuário que, se desejar ver os registros, indica ao cliente um comando que será enviado ao servidor.

O servidor por sua vez envia as informações ao cliente no padrão definido pelo Z39.50.

Para que serve:- Possibilitar a criação de sistemas de busca multi-base- OPACs- Empréstimo entre Bibliotecas

Z39.50

Page 19: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

METADADOS (dados que descrevem dados)

Antes havia a dificuldade para organizar e disseminar informações coletadas de diferentes fontes, por isso surgiu o Common Communication Format (CCF). Depois surgiram outros como o do UNISIST proposto pela UNESCO voltado a Informação Científica e Tecnológica. Atualmente os metadados se destacam na compatibilização de sistemas na Web.

Aula 04out2007

Page 20: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Entre algumas vantagens dos metadados destacam-se:Estabelecimento de padrões de dados diante da heterogeneidade de informações na rede;Facilidade e maior precisão na recuperação das informações desejadas;Troca de informações entre aplicações e entre organizações.

Aula 04out2007

METADADOS (dados que descrevem dados)

Page 21: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Vejamos dois formatos bem conhecidos:MARC – Um dos primeiros projetos de intercâmbio bibliográfico, era baseado na AACR e originou outros formatos, todos baseados na ISO 2709. O USMARC, desenvolvido pela Online CCOmputer Library Center’s (OCLC) direcionou-se mais a cooperação de dados via Internet.Dublin Core – Surgiu em 1995 e conta com boa aceitação mundial (inclui o Brasil) e no seu desenvolvimento, baseado no protocolo Z39.50, estabeleceram 15 elementos de descrição para metadados

Aula 04out2007

METADADOS (dados que descrevem dados)

Page 22: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Formato MARC Machine Readable Cataloguing Record

(registro catalográfico legível por computador)

LCMARC, USMARC, UKMARC, CanMARK Adota:

ISO2709 para estruturar o arquivo AACR2R para descrever dados

Aula 04out2007

Page 23: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Catalogação Cooperativa - união de bibliotecas que visa o aproveitamento dos registros de material bibliográfico para diminuir custos e tempo de processamento por meio da adoção de padrões de registro e intercâmbio de dados.

Aula 04out2007

Formato MARC

Page 24: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Catalogação Cooperativa

RegistroOriginal

Registro Copiado

Registro Copiado

Registro Copiado

Registro Copiado

Aula 04out2007

Page 25: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

MARC - Uso

Catalogação Coletiva: Os catálogos coletivos indicam onde

existem exemplares de cada referência nos locais cobertos pelo catálogo.

Referências são transferidas das bases locais para base central.

Aula 04out2007

Page 26: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Catalogação Coletiva

RegistroCentral

Registro Local

Registro Local

Registro Local

Registro LocalProdutos

Coletivos

Aula 04out2007

Page 27: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

Padrão Dublin-Core

ELEMENTOS DESCRITORES PARA CONTEÚDO Título

Nome dado ao documento Palavras-chave

Assuntos de que se trata o documento Descrição

Resumo do documento Tipo

Definir categoria como texto, imagem, som,... Fonte

Documento do qual o presente documento foi derivado

Cobertura Delimitação espacial ou temporal do recurso

Aula 04out2007

Page 28: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

ELEMENTOS DESCRITORES PARA PROPRIEDADE INTELECTUAL Autor ou Criador

Pessoa ou instituição responsável pela criação do conteúdo intelectual do documento

Publicador Responsável pela publicação do documento na

presente forma Colaborador

Responsável por parte significativa do conteúdo Direitos autorais

Definição dos direitos de propriedade sobre o recurso

Aula 04out2007

Padrão Dublin-Core

Page 29: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

ELEMENTOS DESCRITORES PARA INSTANCIAÇÃO DO DOCUMENTO Data

Data no qual o presente recurso se tornou disponível Identificador

Referência, código ou número que identifica o documento de forma única

Formato Formato do documento (ex.: doc, pdf,...)

Idioma Principal idioma do conteúdo do documento

Relação Documentos relacionados

Aula 04out2007

Padrão Dublin-Core

Page 30: Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 04outubro2007 Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de

O que vem depois...

08 Práticas (No laboratório)11 Bibliotecas Digitais

15 Protocolos

18 Práticas (lab.)

22 Arquivos Abertos

25 WEB 2, Blogs

29 Práticas (lab)

OUTUBRO

Aula 01out2007