57
Aula 1 Recuperação da Informação 1: Realização de Pesquisas Bibliográficas Letícia Strehl – Biblioteca Central

Aula 1 - Cobertura e indexação das bases de dados

Embed Size (px)

Citation preview

Page 1: Aula 1 - Cobertura e indexação das bases de dados

Aula 1Recuperação da Informação 1: Realização de Pesquisas Bibliográficas

Letícia Strehl – Biblioteca Central

Page 2: Aula 1 - Cobertura e indexação das bases de dados

Conteúdos da Aula 1

Apresentação do curso Recuperação da informação: definição,

contexto, paradigmas e componentes Pesquisas biblioGRÁFICAS & biblioMÉTRICAS

Componente do processo de RI (1/6) : conjunto de documentos

Componente do processo de RI (2/6) : método de acesso

Page 3: Aula 1 - Cobertura e indexação das bases de dados

Recuperação da Informação: uma definição

Recuperação da Informação (RI) é um processo em que conjuntos de registros ou documentos são pesquisados para encontrar itens que possam ajudar a satisfazer uma necessidade de informação ou um interesse individual ou coletivo.

TAGUE-SUTCLIFFE, J. M. Some perspectives on the evaluation of information retrieval systems. Journal of the American Society for Information Science , v. 47, n. 1, p. 1-3, 1996.

Page 4: Aula 1 - Cobertura e indexação das bases de dados

Esquema elaborado por Letícia StrehlReferências: MACIEL, A.C.; MENDONÇA, M.A.R. Bibliotecas como organizações. Rio de Janeiro: Interciência, 2000.MUELLER, S.P.M. Perfil do bibliotecário, serviços e responsabilidades na área de informação e formação profissional. Revista de Biblioteconomia de Brasília, v. 17, n. 1, 1989.

Page 5: Aula 1 - Cobertura e indexação das bases de dados

Componentes do processo de RI

1. o conjunto de registros ou documentos (conjunto de documentos)

2. o método de indexação ou acesso ao conjunto de documentos (método de acesso)

3. a necessidade de informação do usuário (necessidade do usuário)

4. a verbalização desta necessidade em uma seqüência de expressões de busca (estratégia de busca)

5. a seqüência dos itens apresentados como um resultado da estratégia de busca (conjunto de itens recuperados ou seqüência)

6. a medida em que os registros recuperados satisfazem a necessidade de informação do usuário (avaliação da relevância)

TAGUE-SUTCLIFFE, J. M. Some perspectives on the evaluation of information retrieval systems. Journal of the American Society for Information Science , v. 47, n. 1, p. 1-3, 1996.

Page 6: Aula 1 - Cobertura e indexação das bases de dados

Paradigmas dos estudos sobre RI

Page 7: Aula 1 - Cobertura e indexação das bases de dados

Orientação das pesquisas

Sistemas X Usuários

Page 8: Aula 1 - Cobertura e indexação das bases de dados

Orientação das pesquisas para o SISTEMA: concepções

Informação: entidade externa, objetiva , que tem uma realidade própria, baseada no conteúdo, independente dos usuários ou dos sistemas sociais

Objetivo: desenvolver instrumentos e serviços para simplificar o acesso à informação e fomentar a partilha de informações

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Page 9: Aula 1 - Cobertura e indexação das bases de dados

Orientação das pesquisas para o USUÁRIO: concepções

Informação: construção subjetiva criada dentro da mente dos usuários. A utilidade da informação só se configura quando o usuário lhe atribui significado

Objetivo: Reconhecer as preferências e necessidades cognitivas e psicológicas do indivíduo, e como elas afetam a busca e os padrões de comunicação da informação

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Page 10: Aula 1 - Cobertura e indexação das bases de dados

Comparação das abordagens

HERT, C. A. Understanding information retrieval interactions : theoretical and practical implications. Greenwich, Conn.: Ablex Pub. Corp., 1997. (Contemporary studies in information management, policy, and services).

Page 11: Aula 1 - Cobertura e indexação das bases de dados

Finalidade das pesquisas

Tarefas X Integrativos

Page 12: Aula 1 - Cobertura e indexação das bases de dados

Objetivo da pesquisa dirigida às TAREFAS

Ênfase: comportamentos e atividades que constituem o processo de busca de informação propriamente dito

Objetos de estudo: descoberta de fatos, busca de literatura, uso de banco de dados, etc.

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Page 13: Aula 1 - Cobertura e indexação das bases de dados

Objetivo da pesquisa INTEGRATIVA

Ênfase: processo de busca e uso da informação como um todo, visando o desenvolvimento de teorias mais completas

Objetos de estudo: motivos que geram a necessidade de informação e formas pelas quais essas necessidades são percebidas, representadas, definidas e vivenciadas. Avaliação do próprio usuário a respeito dos impactos do uso da informação

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Page 14: Aula 1 - Cobertura e indexação das bases de dados

Componente do processo de RI (1/6)

O conjunto de registros ou documentos

Page 15: Aula 1 - Cobertura e indexação das bases de dados

O conjunto de registros ou documentos: Escopo

O escopo de um sistema de RI é definido por sua composição e pela cobertura das fontes.

A composição e a cobertura podem ser avaliadas de forma quantitativa e qualitativa

JACSO, P. Content evaluation of databases. Annual Review of Information Science and Technology, v. 32, p. 231-267, 1997.

Page 16: Aula 1 - Cobertura e indexação das bases de dados

Composição e cobertura:critérios quantitativos (exemplos)

Número de registros: Total Por tipo de documento (artigos de revistas,

trabalhos em eventos, teses, livros, etc.) Por tipo de fonte (instituições públicas e

privadas, associações nacionais e estrangeiras, etc.)

Por idioma Por país responsável pela publicação das fontes

Período de cobertura das fontes Periodicidade de atualização

JACSO, P. Content evaluation of databases. Annual Review of Information Science and Technology, v. 32, p. 231-267, 1997.

Page 17: Aula 1 - Cobertura e indexação das bases de dados

Composição e cobertura:critérios qualitativos (exemplos)

Compreensão dos principais títulos de periódicos e de outras fontes

JACSO, P. Content evaluation of databases. Annual Review of Information Science and Technology, v. 32, p. 231-267, 1997.

Page 18: Aula 1 - Cobertura e indexação das bases de dados

Análise quantitativa da composição de bases de dados: um exemplo

Bustos-González, Atilio. Edición de revistas científicas con visibilidad ficas internacional: criterios para ser incluidos en bases de datos comprensivas. Apresentação realizada no "Seminário de Comunicação Científica, São Paulo, 13 de junho de 2008". ELSEVIER. About Scopus. 2011. THOMSON REUTERS. Web of Science. 2011.

Periódicos arbitrados ≈30

mil

Scopus≈18 mil

Web os Science≈10 mil

Page 19: Aula 1 - Cobertura e indexação das bases de dados

A importância do período de cobertura

LARIVIERE, V.; ARCHAMBAULT, E.; GINGRAS, Y. Long-term patterns in the aging of the scientific literature, 1900–2004. 2007. Trabalho apresentado no 11th International Conference on Scientometrics and Informetrics, 2007, Madrid.

Page 20: Aula 1 - Cobertura e indexação das bases de dados

Componente do processo de RI (2/6)

O método de indexação ou acesso ao conjunto de documentos

Page 21: Aula 1 - Cobertura e indexação das bases de dados

Os pontos de acesso

O ponto de acesso pode ser definido como o meio pelo qual um item bibliográfico é recuperado no momento da realização de uma busca.

Depende-se da qualidade dos pontos de acesso para maximizar: a identificação dos itens úteis a omissão dos itens inúteis

LANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.

Page 22: Aula 1 - Cobertura e indexação das bases de dados

O “bom” ponto de acesso

Termo que representa inequivocamente um conceito e, no contexto de um sistema específico, é expresso vocabularmente de modo coerente.

ELLIS, D. Progress and problems in information retrieval. 2nd. ed. London: Library Association Pub., 1996. (fonte da figura)STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Page 23: Aula 1 - Cobertura e indexação das bases de dados

A representação de conceitos e a identificação de documentos tematicamente afins com diferentes recursos

Linguagens documentária versus natural

Citações Folksonomias

STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Page 24: Aula 1 - Cobertura e indexação das bases de dados

Esquema da representação de conceitos com uso de linguagens de indexação

Documentária Natural

STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Page 25: Aula 1 - Cobertura e indexação das bases de dados

Inspec: indexação com termos controlados

Page 26: Aula 1 - Cobertura e indexação das bases de dados

WoS: indexação apenas com linguagem natural

Page 27: Aula 1 - Cobertura e indexação das bases de dados

Indexação WoS X Inspec:

Qual é a mais eficiente?

Page 28: Aula 1 - Cobertura e indexação das bases de dados

Princípio dos índices de citação

Os índices de citações foram desenvolvidos a partir do princípio de que as referências citadas por um autor identificam de maneira mais precisa o relacionamento entre documentos que tratam do mesmo assunto.

GARFIELD, Eugene. Citation indexes for science: a new dimension in documentation through association of ideas. Science, Washington, v. 122, n. 3159, p. 108-111, July 1955.

Page 29: Aula 1 - Cobertura e indexação das bases de dados

Um história interessante relatada por Meadows

“Há alguns anos a revista Nature recebeu, simultaneamente, mas de modo independente, dois originais para avaliação (um dos EUA e outro do Reino Unido) sobre um tema idêntico: a identificação de certos organismos veiculados pelo ar. Nos artigos, 7 das 8 referências citadas eram idênticas.

MEADOWS, A.J. A comunicação científica. Brasília: Briquet de Lemos, 1999. viii, 268p.

Page 30: Aula 1 - Cobertura e indexação das bases de dados
Page 31: Aula 1 - Cobertura e indexação das bases de dados
Page 32: Aula 1 - Cobertura e indexação das bases de dados

Esquema de representação de conceitos a partir das referências citadas nos artigos

STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Page 33: Aula 1 - Cobertura e indexação das bases de dados

Índices de Citação (1)

Têm a função de recuperação da informação; Mostram o que foi publicado sobre determinado

assunto; Listam documentos citados em outras fontes; São publicações periódicas; São designadas no meio bibliotecário como obras

de referência;

Slide Profa. Jussara Pereira Santos

Page 34: Aula 1 - Cobertura e indexação das bases de dados

Índices de Citação (2)

Permitem identificar quem citou quem formando uma cadeia infinita fontes citadas;

Permitem observar o impacto que determinado trabalho teve na literatura científica (estudos bibliométricos);

Evidenciam o status do cientista.

Slide Profa. Jussara Pereira Santos

Page 35: Aula 1 - Cobertura e indexação das bases de dados

Índices de Citação: histórico

1860 - A Table of Cases in California ...(Henry J. Labatt)

1872 - A Table of Cases Affirmed, Reversed or Cited in Any of the volumes of tehe Reports of the State of New York (William Wait)

1873 - Shepard´s Citations (Frank Shepard): compilação das citações dos casos da Corte do Tribunal Superior Americano.

Slide Profa. Jussara Pereira Santos

Page 36: Aula 1 - Cobertura e indexação das bases de dados

Entretanto, o grande marco do desenvolvimentos dos índices de citações foi a publicação do Science Citation Index (SCI)

Page 37: Aula 1 - Cobertura e indexação das bases de dados

A origem do Science Citation Index

Participação de Eugene Garfield no Projeto John Hopkins University Medical Indexing (início da década de 50)

Uso das citações bibliográficas como recurso para representar os assuntos dos documentos por meio de procedimentos completamente automáticos

CRONIN, B. ; ATKINS, H.B. Introduction : the scholar’s spoor. In: CRONIN, B. ; ATKINS, H.B. (Eds.). The web of knowledge : a festschrift in honor of Eugene Garfield. Medford: Information Today, 2000. (ASIS monograph series).

Page 38: Aula 1 - Cobertura e indexação das bases de dados

Fundação do ISI e publicação do SCI

Depois desligar-se do Projeto e aproveitando a experiência adquirida, Garfield:

Fundou, em 1958, o Institute for Scientific Information (ISI)

Publicou, em 1963, a primeira edição do SCI

YANCEY, R. Fifty years of citation indexing and analysis. KnowledgeLink, Sept. 2005

Page 39: Aula 1 - Cobertura e indexação das bases de dados

A recuperação de documentos por citações

Tenho um documento muito importante para o desenvolvimento de meu tema: Que trabalhos foram nele citados? Quem citou este trabalho?

Bases de dados como a Web of Science, Scopus e Google Acadêmico respondem estas questões

Page 40: Aula 1 - Cobertura e indexação das bases de dados

WoS - Busca Geral

Referências citadas (References) Citações recebidas (Cited by) Registros relacionados (Related

records):identificação de outros artigos de acordo

com o número de referências compartilhadas

Para ver uma apresentação mais abrangente sobre a WoS visite o Link.

Page 41: Aula 1 - Cobertura e indexação das bases de dados

Operacionalização da premissa de que a similaridade existente entre dois documentos pode ser medida pelo número de artigos que ambos citam.

KORFHAGE, Robert R. Information storage and retrieval. New York: John Wilwy & Sons, 1997.

Page 42: Aula 1 - Cobertura e indexação das bases de dados

WoS - Busca por Referências Citadas

Page 43: Aula 1 - Cobertura e indexação das bases de dados

Vantagem da “busca por referências” em relação à recuperação de citações da “busca geral”

Recuperação de artigos que citaram um trabalho ou autor de interesse, mesmo que a citação tenha sido feita de forma incorreta ou que o material não seja indexado na WoS

Page 44: Aula 1 - Cobertura e indexação das bases de dados

Google Acadêmico e Scopus

O Google Acadêmico e a Scopus são outras duas bases de dados abrangentes que se utilizam da indexação das citações como recurso de identificação de artigos tematicamente semelhantes

Page 45: Aula 1 - Cobertura e indexação das bases de dados

A recuperação de artigos tematicamente afins na Scopus:

Referências citadas (References) Citações recebidas (Cited by) Documentos relacionados (Related

records): número de referências compartilhadas autores palavras-chave

Para ver uma apresentação mais abrangente sobre a Scopus visite o Link.

Page 46: Aula 1 - Cobertura e indexação das bases de dados
Page 47: Aula 1 - Cobertura e indexação das bases de dados

A recuperação de artigos tematicamente afins no Google Acadêmico

Page 48: Aula 1 - Cobertura e indexação das bases de dados

Algumas ressalvas para o uso do Google Acadêmico

Nem todos os periódicos importantes indexados pelas bases de dados tradicionais estão indexados pelo GA;

as citação a documentos recentes são mais comuns no GA uma vez que documentos mais antigos estão disponíveis em menor quantidade na Web;

algumas áreas estão melhor representadas por contarem tradicionalmente com repositórios mais antigos e exaustivos, um exemplo é a física como a pioneira base de pré-prints arXiv.org.

Page 49: Aula 1 - Cobertura e indexação das bases de dados

Folksonomias: origem

Surgimento em 2004, com o desenvolvimento das tecnologias baseadas em Web 2.0

Web 2.0 segunda geração de serviços online potencializa as formas de publicação,

compartilhamento e organização de informações amplia os espaços para a interação entre os

participantes do processo combinação de técnicas informáticas (serviços

Web, linguagem Ajax, Web syndication, etc.) com a intrínseca “arquitetura de participação”

PRIMO, Alex. Fases do desenvolvimento tecnológico e suas implicações nas formas de ser, conhecer, comunicar e produzir em sociedade. In: Pretto, Nelson De Luca; Silveira, Sérgio Amadeu da. Além das redes de colaboração: internet, diversidade cultural e tecnologias do poder. Salvador: UFBA, 2008.

Page 50: Aula 1 - Cobertura e indexação das bases de dados

Folksonomia: definição (1)

O termo folksonomia é derivado de taxonomia. Taxonomias são geralmente controladas por especialistas e são estáticas, tendendo para o uso de terminologia oficial, em vez de frases vernaculares. Ao contrário, as folksonomias são sistemas de classificação distribuídos, criados por usuários individuais

GUY, M.; TONKIN, E. Folksonomies: Tidying Up Tags? D-Lib Magazine, v. 12, n. 1, 2006.

Page 51: Aula 1 - Cobertura e indexação das bases de dados

Folksonomia: definição (2)

A coleção do sistema é formada com contribuições de usuários

Os usuários participam na classificação ou avaliação

A adição, classificação ou avaliação de itens se realiza por intermédio de uma rede social

MORRISON, P Jason. Tagging and searching: Search retrieval effectiveness of folksonomies on the World Wide Web. Information Processing and Management, v. 44, p. 1562-1579, 2008.

Page 52: Aula 1 - Cobertura e indexação das bases de dados

As redes sociais com recurso de RI

Premissa: pessoas com interesses comuns apresentam comportamentos semelhantes de busca e uso da informação Tenho um documento como favorito, quem

mais o tem? Uso este marcador (antigas palavras-

chave) para organizar meu “acervo” quem mais o usa? Ferramentar de socialização de favoritos como

Delicious , Connotea, CiteULike etc. respondem estas questões

Page 53: Aula 1 - Cobertura e indexação das bases de dados

Esquema de uso de marcadores em folksonomias

STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Page 54: Aula 1 - Cobertura e indexação das bases de dados

Favoritos socializados e as folksonomias:um exemplo com o Delicious

Page 55: Aula 1 - Cobertura e indexação das bases de dados

Comparação entre a folksonomia e a linguagem natural

Semelhança: autorizam a existência de formas variadas de

representação para um único conceito Diferenças:

A linguagem é natural dos usuários, não necessariamente dos autores

A diversidade vocabular resulta não apenas da diversidade de formas de expressão permitidas pela linguagem, mas também da imensidão de sentidos que podem ser atribuídos a um documento por diferentes indivíduos

Page 56: Aula 1 - Cobertura e indexação das bases de dados

Comparação entre a folksonomia e a indexação das citações

Semelhança Produzem ligações entre pessoas com

interesses comuns Diferença

Os atores envolvidos no processo de comunicação desempenham papéis distintos

Usuários Autores/Trabalhos

Usuários Usuários

IC

F

STREHL, L. As folksonomias entre os conceitos e os pontos de acesso: as funções de descritores, citações e marcadores nos sistemas de recuperação da informação. Perspectivas em Ciência da Informação, Belo Horizonte, v. 16, n. 2, p. 101-114, 2011.

Page 57: Aula 1 - Cobertura e indexação das bases de dados

Fim