Aula 01 - Recuperação da Informação

Preview:

DESCRIPTION

Aula 01 - Recuperação da Informação UFPE/BRA Prof.: Renato Fernandes Corrêa

Citation preview

DCI-UFPE 1

Recuperação da Informação

Renato Fernandes Corrêa

Recuperação da Informação -Introdução

2010.2

2

Roteiro

Motivação/Introdução

Definição

Sistema de Recuperação de Informação

Exemplos de SRI

3

Motivação/Introdução

O problema: "a tarefa massiva de tornar mais acessível, um acervo crescente de conhecimento“. VANNEVAR BUSH (1945)� Explosão informacional� Importância estratégica da informação

4

Motivação/Introdução

A solução: Calvin MOOERS (1951) cunhou o termo recuperação de informação, destacando que ele "engloba os aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação.“

“Certamente, a recuperação da informação não foi a única responsável pelo desenvolvimento da CI [Ciência daInformação], mas pode ser considerada como principal; ao longo do tempo, a CI ultrapassou a recuperação da informação, mas os problemas principais tiveram sua origem aí e ainda constituem seu núcleo.” SARACEVIC (1991)

5

Recuperação de InformaçãoDefinição

Área de pesquisa e desenvolvimento que � investiga métodos e técnicas� para a representação, a organização, o armazenamento, a busca e a recuperação de itens de informação

Objetivo principal� facilitar o acesso a documentos (itens de informação) relevantes à necessidade de informação do usuário�Geralmente representada através de consultasbaseadas em palavras-chaves

6Tarefa típica de Recuperação de Informação (RI)

Dados� Um corpus de documentos e� Uma consulta do usuário

Encontrar � Um conjunto (ordenados) de documentos que são relevantes para a consulta

7

Elementos de um Sistemas de RI

Sistema de RIConsulta

Corpus de

documentos

Documentos

ordenados

1. Doc1

2. Doc2

3. Doc3

.

.

Usuário

Indexação

8

Como funciona?

Usuário

Necessidade de

Informação

RecuperaçãoRecuperação

Documentos

Indexação

RepresentaçãoRepresentação

Consulta

Recuperação de Informação

Sistema de

Recuperação da Informação

Resultado

Armazenamento

Casamento, Ordenação

Modelos de Recuperação de Informação

Existe uma distinção entre:� A tarefa do usuário

� Recuperação ou Navegação

� A visão lógica dos documentos � sua representação no sistema

� O modelo de recuperação de informação� Clássico ou estruturado ou navegação

Navegação

Embrapa - Infoteca

Recuperação

12

Sistemas de RI

Um sistema automático para RI pode ser visto como� a parte do sistema de informação responsável pelo armazenamento ordenado dos documentos em um banco de dados,

� e sua posterior recuperação� para responder a consulta do usuário.

Etapas principais na construção:� Aquisição (seleção) dos documentos� Preparação dos documentos� Indexação dos documentos� Armazenamento� Recuperação

� Busca (casamento com a consulta do usuário)� Ordenação dos documentos recuperados

13Exemplos de sistemas de recuperação de informação

Sistemas de RI em DVD e Cederrom

Catálogo em linha de acesso público

Engenhos de busca

Serviços de busca em linha

Sistemas de gerenciamento de documentos

Sistemas de Filtragem de Informação

Sistemas de Extração de Informação

Catálogo em linha de acesso público(OPAC)

Sistemas que recuperam informação em bases de dados catalográficos de bibliotecas.

Exemplo:

15

Engenhos de Busca

WebWeb

Consulta

Resposta

Base deÍndices

Engenho de Busca

Usuário

Spider

Indexador

Representação dos Docs

Servidor de Consultas

Aquisição

Pré-ProcessadorDocs

Recuperador

Ordenador

21

34

Motor deIndexação

Browser

Serviços de busca em linha

Sistemas que recuperam informação em bases de dados bibliográficos.

Exemplos:

Sistemas de gerenciamento de documentos

Sistemas que gerenciam versões e recuperam informação em um corpus de documentos digitais.

Exemplos:� Softwares Proprietários da IBM, Xerox, Oracle e Microsoft

� Softwares Livres� Alfresco� KnowledgeTree� Main//Pyrus DMS� Nuxeo� OpenKM� Archivista

Sistemas de Filtragem de Informação

Sistemas que filtram a informação recuperada de acordo com o interesse do usuário

Servidor News

ArtigosIndexados

Usuário

Perfil dousuário

Engenho de Busca InternetInternet

19

Sistemas de Extração de Informação

Sistemas capazes de extrair de documentos relevantes apenas a informação requerida

A informação extraída pode ser apresentada ao usuário e/ou armazenada em BDs.

Sistema de EI

BD

Nome:End.:Fone:Fax:Preços:

TemplatePágina de Hotel

20

Referências

BAYEZA-YATES, RIBEIRO-NETO. Modern Information Retrieval. Addison Wesley: 1999.

ROWLEY, J. A Biblioteca Eletrônica. 2 ed. Brasília: Brinquet Lemos Livros, 2002.

SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996

Recommended