Aula 1 - Cobertura e indexação das bases de dados

Preview:

Citation preview

Aula 1Recuperação da Informação 1: Realização de Pesquisas Bibliográficas

Letícia Strehl – Biblioteca Central

Conteúdos da Aula 1

Apresentação do curso Recuperação da informação: definição,

contexto, paradigmas e componentes Pesquisas biblioGRÁFICAS & biblioMÉTRICAS

Componente do processo de RI (1/6) : conjunto de documentos

Componente do processo de RI (2/6) : método de acesso

Recuperação da Informação: uma definição

Recuperação da Informação (RI) é um processo em que conjuntos de registros ou documentos são pesquisados para encontrar itens que possam ajudar a satisfazer uma necessidade de informação ou um interesse individual ou coletivo.

TAGUE-SUTCLIFFE, J. M. Some perspectives on the evaluation of information retrieval systems. Journal of the American Society for Information Science , v. 47, n. 1, p. 1-3, 1996.

Esquema elaborado por Letícia StrehlReferências: MACIEL, A.C.; MENDONÇA, M.A.R. Bibliotecas como organizações. Rio de Janeiro: Interciência, 2000.MUELLER, S.P.M. Perfil do bibliotecário, serviços e responsabilidades na área de informação e formação profissional. Revista de Biblioteconomia de Brasília, v. 17, n. 1, 1989.

Componentes do processo de RI

1. o conjunto de registros ou documentos (conjunto de documentos)

2. o método de indexação ou acesso ao conjunto de documentos (método de acesso)

3. a necessidade de informação do usuário (necessidade do usuário)

4. a verbalização desta necessidade em uma seqüência de expressões de busca (estratégia de busca)

5. a seqüência dos itens apresentados como um resultado da estratégia de busca (conjunto de itens recuperados ou seqüência)

6. a medida em que os registros recuperados satisfazem a necessidade de informação do usuário (avaliação da relevância)

TAGUE-SUTCLIFFE, J. M. Some perspectives on the evaluation of information retrieval systems. Journal of the American Society for Information Science , v. 47, n. 1, p. 1-3, 1996.

Paradigmas dos estudos sobre RI

Orientação das pesquisas

Sistemas X Usuários

Orientação das pesquisas para o SISTEMA: concepções

Informação: entidade externa, objetiva , que tem uma realidade própria, baseada no conteúdo, independente dos usuários ou dos sistemas sociais

Objetivo: desenvolver instrumentos e serviços para simplificar o acesso à informação e fomentar a partilha de informações

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Orientação das pesquisas para o USUÁRIO: concepções

Informação: construção subjetiva criada dentro da mente dos usuários. A utilidade da informação só se configura quando o usuário lhe atribui significado

Objetivo: Reconhecer as preferências e necessidades cognitivas e psicológicas do indivíduo, e como elas afetam a busca e os padrões de comunicação da informação

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Comparação das abordagens

HERT, C. A. Understanding information retrieval interactions : theoretical and practical implications. Greenwich, Conn.: Ablex Pub. Corp., 1997. (Contemporary studies in information management, policy, and services).

Finalidade das pesquisas

Tarefas X Integrativos

Objetivo da pesquisa dirigida às TAREFAS

Ênfase: comportamentos e atividades que constituem o processo de busca de informação propriamente dito

Objetos de estudo: descoberta de fatos, busca de literatura, uso de banco de dados, etc.

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Objetivo da pesquisa INTEGRATIVA

Ênfase: processo de busca e uso da informação como um todo, visando o desenvolvimento de teorias mais completas

Objetos de estudo: motivos que geram a necessidade de informação e formas pelas quais essas necessidades são percebidas, representadas, definidas e vivenciadas. Avaliação do próprio usuário a respeito dos impactos do uso da informação

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Componente do processo de RI (1/6)

O conjunto de registros ou documentos

O conjunto de registros ou documentos: Escopo

O escopo de um sistema de RI é definido por sua composição e pela cobertura das fontes.

A composição e a cobertura podem ser avaliadas de forma quantitativa e qualitativa

JACSO, P. Content evaluation of databases. Annual Review of Information Science and Technology, v. 32, p. 231-267, 1997.

Composição e cobertura:critérios quantitativos (exemplos)

Número de registros: Total Por tipo de documento (artigos de revistas,

trabalhos em eventos, teses, livros, etc.) Por tipo de fonte (instituições públicas e

privadas, associações nacionais e estrangeiras, etc.)

Por idioma Por país responsável pela publicação das fontes

Período de cobertura das fontes Periodicidade de atualização

JACSO, P. Content evaluation of databases. Annual Review of Information Science and Technology, v. 32, p. 231-267, 1997.

Composição e cobertura:critérios qualitativos (exemplos)

Compreensão dos principais títulos de periódicos e de outras fontes

JACSO, P. Content evaluation of databases. Annual Review of Information Science and Technology, v. 32, p. 231-267, 1997.

Análise quantitativa da composição de bases de dados: um exemplo

Bustos-González, Atilio. Edición de revistas científicas con visibilidad ficas internacional: criterios para ser incluidos en bases de datos comprensivas. Apresentação realizada no "Seminário de Comunicação Científica, São Paulo, 13 de junho de 2008". ELSEVIER. About Scopus. 2011. THOMSON REUTERS. Web of Science. 2011.

Periódicos arbitrados ≈30

mil

Scopus≈18 mil

Web os Science≈10 mil

A importância do período de cobertura

LARIVIERE, V.; ARCHAMBAULT, E.; GINGRAS, Y. Long-term patterns in the aging of the scientific literature, 1900–2004. 2007. Trabalho apresentado no 11th International Conference on Scientometrics and Informetrics, 2007, Madrid.

Componente do processo de RI (2/6)

O método de indexação ou acesso ao conjunto de documentos

Os pontos de acesso

O ponto de acesso pode ser definido como o meio pelo qual um item bibliográfico é recuperado no momento da realização de uma busca.

Depende-se da qualidade dos pontos de acesso para maximizar: a identificação dos itens úteis a omissão dos itens inúteis

LANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.

O “bom” ponto de acesso

Termo que representa inequivocamente um conceito e, no contexto de um sistema específico, é expresso vocabularmente de modo coerente.

ELLIS, D. Progress and problems in information retrieval. 2nd. ed. London: Library Association Pub., 1996. (fonte da figura)STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

A representação de conceitos e a identificação de documentos tematicamente afins com diferentes recursos

Linguagens documentária versus natural

Citações Folksonomias

STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Esquema da representação de conceitos com uso de linguagens de indexação

Documentária Natural

STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Inspec: indexação com termos controlados

WoS: indexação apenas com linguagem natural

Indexação WoS X Inspec:

Qual é a mais eficiente?

Princípio dos índices de citação

Os índices de citações foram desenvolvidos a partir do princípio de que as referências citadas por um autor identificam de maneira mais precisa o relacionamento entre documentos que tratam do mesmo assunto.

GARFIELD, Eugene. Citation indexes for science: a new dimension in documentation through association of ideas. Science, Washington, v. 122, n. 3159, p. 108-111, July 1955.

Um história interessante relatada por Meadows

“Há alguns anos a revista Nature recebeu, simultaneamente, mas de modo independente, dois originais para avaliação (um dos EUA e outro do Reino Unido) sobre um tema idêntico: a identificação de certos organismos veiculados pelo ar. Nos artigos, 7 das 8 referências citadas eram idênticas.

MEADOWS, A.J. A comunicação científica. Brasília: Briquet de Lemos, 1999. viii, 268p.

Esquema de representação de conceitos a partir das referências citadas nos artigos

STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Índices de Citação (1)

Têm a função de recuperação da informação; Mostram o que foi publicado sobre determinado

assunto; Listam documentos citados em outras fontes; São publicações periódicas; São designadas no meio bibliotecário como obras

de referência;

Slide Profa. Jussara Pereira Santos

Índices de Citação (2)

Permitem identificar quem citou quem formando uma cadeia infinita fontes citadas;

Permitem observar o impacto que determinado trabalho teve na literatura científica (estudos bibliométricos);

Evidenciam o status do cientista.

Slide Profa. Jussara Pereira Santos

Índices de Citação: histórico

1860 - A Table of Cases in California ...(Henry J. Labatt)

1872 - A Table of Cases Affirmed, Reversed or Cited in Any of the volumes of tehe Reports of the State of New York (William Wait)

1873 - Shepard´s Citations (Frank Shepard): compilação das citações dos casos da Corte do Tribunal Superior Americano.

Slide Profa. Jussara Pereira Santos

Entretanto, o grande marco do desenvolvimentos dos índices de citações foi a publicação do Science Citation Index (SCI)

A origem do Science Citation Index

Participação de Eugene Garfield no Projeto John Hopkins University Medical Indexing (início da década de 50)

Uso das citações bibliográficas como recurso para representar os assuntos dos documentos por meio de procedimentos completamente automáticos

CRONIN, B. ; ATKINS, H.B. Introduction : the scholar’s spoor. In: CRONIN, B. ; ATKINS, H.B. (Eds.). The web of knowledge : a festschrift in honor of Eugene Garfield. Medford: Information Today, 2000. (ASIS monograph series).

Fundação do ISI e publicação do SCI

Depois desligar-se do Projeto e aproveitando a experiência adquirida, Garfield:

Fundou, em 1958, o Institute for Scientific Information (ISI)

Publicou, em 1963, a primeira edição do SCI

YANCEY, R. Fifty years of citation indexing and analysis. KnowledgeLink, Sept. 2005

A recuperação de documentos por citações

Tenho um documento muito importante para o desenvolvimento de meu tema: Que trabalhos foram nele citados? Quem citou este trabalho?

Bases de dados como a Web of Science, Scopus e Google Acadêmico respondem estas questões

WoS - Busca Geral

Referências citadas (References) Citações recebidas (Cited by) Registros relacionados (Related

records):identificação de outros artigos de acordo

com o número de referências compartilhadas

Para ver uma apresentação mais abrangente sobre a WoS visite o Link.

Operacionalização da premissa de que a similaridade existente entre dois documentos pode ser medida pelo número de artigos que ambos citam.

KORFHAGE, Robert R. Information storage and retrieval. New York: John Wilwy & Sons, 1997.

WoS - Busca por Referências Citadas

Vantagem da “busca por referências” em relação à recuperação de citações da “busca geral”

Recuperação de artigos que citaram um trabalho ou autor de interesse, mesmo que a citação tenha sido feita de forma incorreta ou que o material não seja indexado na WoS

Google Acadêmico e Scopus

O Google Acadêmico e a Scopus são outras duas bases de dados abrangentes que se utilizam da indexação das citações como recurso de identificação de artigos tematicamente semelhantes

A recuperação de artigos tematicamente afins na Scopus:

Referências citadas (References) Citações recebidas (Cited by) Documentos relacionados (Related

records): número de referências compartilhadas autores palavras-chave

Para ver uma apresentação mais abrangente sobre a Scopus visite o Link.

A recuperação de artigos tematicamente afins no Google Acadêmico

Algumas ressalvas para o uso do Google Acadêmico

Nem todos os periódicos importantes indexados pelas bases de dados tradicionais estão indexados pelo GA;

as citação a documentos recentes são mais comuns no GA uma vez que documentos mais antigos estão disponíveis em menor quantidade na Web;

algumas áreas estão melhor representadas por contarem tradicionalmente com repositórios mais antigos e exaustivos, um exemplo é a física como a pioneira base de pré-prints arXiv.org.

Folksonomias: origem

Surgimento em 2004, com o desenvolvimento das tecnologias baseadas em Web 2.0

Web 2.0 segunda geração de serviços online potencializa as formas de publicação,

compartilhamento e organização de informações amplia os espaços para a interação entre os

participantes do processo combinação de técnicas informáticas (serviços

Web, linguagem Ajax, Web syndication, etc.) com a intrínseca “arquitetura de participação”

PRIMO, Alex. Fases do desenvolvimento tecnológico e suas implicações nas formas de ser, conhecer, comunicar e produzir em sociedade. In: Pretto, Nelson De Luca; Silveira, Sérgio Amadeu da. Além das redes de colaboração: internet, diversidade cultural e tecnologias do poder. Salvador: UFBA, 2008.

Folksonomia: definição (1)

O termo folksonomia é derivado de taxonomia. Taxonomias são geralmente controladas por especialistas e são estáticas, tendendo para o uso de terminologia oficial, em vez de frases vernaculares. Ao contrário, as folksonomias são sistemas de classificação distribuídos, criados por usuários individuais

GUY, M.; TONKIN, E. Folksonomies: Tidying Up Tags? D-Lib Magazine, v. 12, n. 1, 2006.

Folksonomia: definição (2)

A coleção do sistema é formada com contribuições de usuários

Os usuários participam na classificação ou avaliação

A adição, classificação ou avaliação de itens se realiza por intermédio de uma rede social

MORRISON, P Jason. Tagging and searching: Search retrieval effectiveness of folksonomies on the World Wide Web. Information Processing and Management, v. 44, p. 1562-1579, 2008.

As redes sociais com recurso de RI

Premissa: pessoas com interesses comuns apresentam comportamentos semelhantes de busca e uso da informação Tenho um documento como favorito, quem

mais o tem? Uso este marcador (antigas palavras-

chave) para organizar meu “acervo” quem mais o usa? Ferramentar de socialização de favoritos como

Delicious , Connotea, CiteULike etc. respondem estas questões

Esquema de uso de marcadores em folksonomias

STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Favoritos socializados e as folksonomias:um exemplo com o Delicious

Comparação entre a folksonomia e a linguagem natural

Semelhança: autorizam a existência de formas variadas de

representação para um único conceito Diferenças:

A linguagem é natural dos usuários, não necessariamente dos autores

A diversidade vocabular resulta não apenas da diversidade de formas de expressão permitidas pela linguagem, mas também da imensidão de sentidos que podem ser atribuídos a um documento por diferentes indivíduos

Comparação entre a folksonomia e a indexação das citações

Semelhança Produzem ligações entre pessoas com

interesses comuns Diferença

Os atores envolvidos no processo de comunicação desempenham papéis distintos

Usuários Autores/Trabalhos

Usuários Usuários

IC

F

STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Fim

Recommended