20
DCI-UFPE 1 Recuperação da Informação Renato Fernandes Corrêa Recuperação da Informação - Introdução 2010.2

Aula 01 - Recuperação da Informação

Embed Size (px)

DESCRIPTION

Aula 01 - Recuperação da Informação UFPE/BRA Prof.: Renato Fernandes Corrêa

Citation preview

Page 1: Aula 01 - Recuperação da Informação

DCI-UFPE 1

Recuperação da Informação

Renato Fernandes Corrêa

Recuperação da Informação -Introdução

2010.2

Page 2: Aula 01 - Recuperação da Informação

2

Roteiro

Motivação/Introdução

Definição

Sistema de Recuperação de Informação

Exemplos de SRI

Page 3: Aula 01 - Recuperação da Informação

3

Motivação/Introdução

O problema: "a tarefa massiva de tornar mais acessível, um acervo crescente de conhecimento“. VANNEVAR BUSH (1945)� Explosão informacional� Importância estratégica da informação

Page 4: Aula 01 - Recuperação da Informação

4

Motivação/Introdução

A solução: Calvin MOOERS (1951) cunhou o termo recuperação de informação, destacando que ele "engloba os aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação.“

“Certamente, a recuperação da informação não foi a única responsável pelo desenvolvimento da CI [Ciência daInformação], mas pode ser considerada como principal; ao longo do tempo, a CI ultrapassou a recuperação da informação, mas os problemas principais tiveram sua origem aí e ainda constituem seu núcleo.” SARACEVIC (1991)

Page 5: Aula 01 - Recuperação da Informação

5

Recuperação de InformaçãoDefinição

Área de pesquisa e desenvolvimento que � investiga métodos e técnicas� para a representação, a organização, o armazenamento, a busca e a recuperação de itens de informação

Objetivo principal� facilitar o acesso a documentos (itens de informação) relevantes à necessidade de informação do usuário�Geralmente representada através de consultasbaseadas em palavras-chaves

Page 6: Aula 01 - Recuperação da Informação

6Tarefa típica de Recuperação de Informação (RI)

Dados� Um corpus de documentos e� Uma consulta do usuário

Encontrar � Um conjunto (ordenados) de documentos que são relevantes para a consulta

Page 7: Aula 01 - Recuperação da Informação

7

Elementos de um Sistemas de RI

Sistema de RIConsulta

Corpus de

documentos

Documentos

ordenados

1. Doc1

2. Doc2

3. Doc3

.

.

Usuário

Page 8: Aula 01 - Recuperação da Informação

Indexação

8

Como funciona?

Usuário

Necessidade de

Informação

RecuperaçãoRecuperação

Documentos

Indexação

RepresentaçãoRepresentação

Consulta

Recuperação de Informação

Sistema de

Recuperação da Informação

Resultado

Armazenamento

Casamento, Ordenação

Page 9: Aula 01 - Recuperação da Informação

Modelos de Recuperação de Informação

Existe uma distinção entre:� A tarefa do usuário

� Recuperação ou Navegação

� A visão lógica dos documentos � sua representação no sistema

� O modelo de recuperação de informação� Clássico ou estruturado ou navegação

Page 10: Aula 01 - Recuperação da Informação

Navegação

Embrapa - Infoteca

Page 11: Aula 01 - Recuperação da Informação

Recuperação

Page 12: Aula 01 - Recuperação da Informação

12

Sistemas de RI

Um sistema automático para RI pode ser visto como� a parte do sistema de informação responsável pelo armazenamento ordenado dos documentos em um banco de dados,

� e sua posterior recuperação� para responder a consulta do usuário.

Etapas principais na construção:� Aquisição (seleção) dos documentos� Preparação dos documentos� Indexação dos documentos� Armazenamento� Recuperação

� Busca (casamento com a consulta do usuário)� Ordenação dos documentos recuperados

Page 13: Aula 01 - Recuperação da Informação

13Exemplos de sistemas de recuperação de informação

Sistemas de RI em DVD e Cederrom

Catálogo em linha de acesso público

Engenhos de busca

Serviços de busca em linha

Sistemas de gerenciamento de documentos

Sistemas de Filtragem de Informação

Sistemas de Extração de Informação

Page 14: Aula 01 - Recuperação da Informação

Catálogo em linha de acesso público(OPAC)

Sistemas que recuperam informação em bases de dados catalográficos de bibliotecas.

Exemplo:

Page 15: Aula 01 - Recuperação da Informação

15

Engenhos de Busca

WebWeb

Consulta

Resposta

Base deÍndices

Engenho de Busca

Usuário

Spider

Indexador

Representação dos Docs

Servidor de Consultas

Aquisição

Pré-ProcessadorDocs

Recuperador

Ordenador

21

34

Motor deIndexação

Browser

Page 16: Aula 01 - Recuperação da Informação

Serviços de busca em linha

Sistemas que recuperam informação em bases de dados bibliográficos.

Exemplos:

Page 17: Aula 01 - Recuperação da Informação

Sistemas de gerenciamento de documentos

Sistemas que gerenciam versões e recuperam informação em um corpus de documentos digitais.

Exemplos:� Softwares Proprietários da IBM, Xerox, Oracle e Microsoft

� Softwares Livres� Alfresco� KnowledgeTree� Main//Pyrus DMS� Nuxeo� OpenKM� Archivista

Page 18: Aula 01 - Recuperação da Informação

Sistemas de Filtragem de Informação

Sistemas que filtram a informação recuperada de acordo com o interesse do usuário

Servidor News

ArtigosIndexados

Usuário

Perfil dousuário

Engenho de Busca InternetInternet

Page 19: Aula 01 - Recuperação da Informação

19

Sistemas de Extração de Informação

Sistemas capazes de extrair de documentos relevantes apenas a informação requerida

A informação extraída pode ser apresentada ao usuário e/ou armazenada em BDs.

Sistema de EI

BD

Nome:End.:Fone:Fax:Preços:

TemplatePágina de Hotel

Page 20: Aula 01 - Recuperação da Informação

20

Referências

BAYEZA-YATES, RIBEIRO-NETO. Modern Information Retrieval. Addison Wesley: 1999.

ROWLEY, J. A Biblioteca Eletrônica. 2 ed. Brasília: Brinquet Lemos Livros, 2002.

SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996