58
Agentes em Recuperação da Informação

Agentes em Recuperação da Informação

  • Upload
    rimona

  • View
    22

  • Download
    2

Embed Size (px)

DESCRIPTION

Agentes em Recuperação da Informação. Equipe. Daniel Penaforte (dap4) Daniel Julião (dvsj) Davi Pires (dpr) Ernani Azevedo (ema3) Everton Marques (egm2) Farley Millano ( XXXXXXXXXX ) Guilherme Carvalho (ggc) Guilherme Moura (gsm) Nitai Bezerra (nbs) Pedro Montenegro (pmr). Roteiro. - PowerPoint PPT Presentation

Citation preview

Page 1: Agentes em Recuperação da Informação

Agentes em Recuperação da Informação

Page 2: Agentes em Recuperação da Informação

Equipe

Daniel Penaforte (dap4) Daniel Julião (dvsj) Davi Pires (dpr) Ernani Azevedo (ema3) Everton Marques (egm2) Farley Millano (XXXXXXXXXX) Guilherme Carvalho (ggc) Guilherme Moura (gsm) Nitai Bezerra (nbs) Pedro Montenegro (pmr)

Page 3: Agentes em Recuperação da Informação

Roteiro

Introdução a RI Papel dos Agentes em RI Agentes na WEB

Recomendação Filtragem Notificadores E-commerce Chatterbots

Page 4: Agentes em Recuperação da Informação

“Morrendo ignorante num mar de informações”

- Dificuldade de localizar documentos relevantes !!

Como funciona?

Web Pages 1870 found.

Usuário

Necessidade deInformação

CasamentoCasamento

Documento

s

IndexaçãoConsultaRepresentação

Formulação

Recuperação de Informação Motivação

Page 5: Agentes em Recuperação da Informação

Tarefa típica de Recuperação de Informação (RI)

Dados Um corpus de documentos (itens de

dados) & Uma consulta do usuário (representada por

palavras-chave) Encontrar

Um conjunto ordenados de documentos que são relevantes para a consulta

Page 6: Agentes em Recuperação da Informação

Sistemas de RI

Sistema de RIConsulta

Corpus de documentos

Documentos ordenados

1. Doc12. Doc23. Doc3 . .

Usuário

Page 7: Agentes em Recuperação da Informação

Recuperação de InformaçãoDefinição

Área de pesquisa e desenvolvimento que investiga métodos e técnicas para a representação, a organização, o

armazenamento, a busca e a recuperação de itens de informação

Objetivo principal facilitar o acesso a documentos (itens de

informação) relevantes à necessidade de informação do usuário

Geralmente representada através de consultas baseadas em palavras-chaves

Page 8: Agentes em Recuperação da Informação

Papel dos Agentes em RI(A Internet)

Informações diversificadas Usuários diversificados Desafios

informação aos usuários não-técnicos; libertar os usuários das tarefas

repetitivas da WEB; envio de informações relevantes aos

usuários. Formato, Conteúdo.

Page 9: Agentes em Recuperação da Informação

Papel dos Agentes em RI(Motivação)

Rápido crescimento do volume de informações disponível na Internet

Velocidade em encontrar informação é diferencial competitivo

Dificuldade em localizar documentos relevantes Alto consumo de tempo Síndrome da Nau perdida

TOO MUCH INFORMATION = NO INFORMATION

Page 10: Agentes em Recuperação da Informação

Agentes na Web

Objetivos: Obter uma quantidade de informações

razoável ao usuário. Trazer as informações que

correspondam ao perfil e necessidade do usuário.

Fazer com que estas informações sejam de qualidade.

Page 11: Agentes em Recuperação da Informação

Agentes em Sistemas de Recomendação

Recomendam itens de informação ao usuário de acordo com o seu perfil

Exemplos WebMate Letizia InfoAgent

Page 12: Agentes em Recuperação da Informação

Agente de busca pessoal (assistente digital).

Acompanha o usuário enquanto ele navega na Internet: Recomenda novas URLs; Oferece os documentos web mais relevantes; Responde ao feedback do usuário; Compila um jornal pessoal diário com links

para documentos de interesse do usuário.

WebMate 1/5

Page 13: Agentes em Recuperação da Informação

A arquitetura do WebMate consiste em: um proxy autônomo que monitora as ações

do usuário; um controlador applet que interage com o

usuário.

WebMate 2/5

Page 14: Agentes em Recuperação da Informação

WebMate 3/5

Page 15: Agentes em Recuperação da Informação

WebMate 4/5

Page 16: Agentes em Recuperação da Informação

WebMate 5/5

Page 17: Agentes em Recuperação da Informação

H.Lieberman-MIT. Imita o comportamento do usuário,

baseado em preferência, não em relevância.

Segue o usuário e tenta antecipar o que é de interesse, com heurísticas simples e metas.

HP dinâmica e acessível, com sugestões. Aproveita o tempo inútil e é ético.

Letizia 1/3

Page 18: Agentes em Recuperação da Informação

Behavior-BR - justificativas Interesse: seguir um link ou revisitá-lo, ou

acessar muitas páginas sobre um assunto.

Desinteresse: desprezar um link ou retornar.

Persistência de interesse e “esquecimento”.

Achados ao acaso: tenta descobrir interesses não-óbvios.

Letizia 2/3

Page 19: Agentes em Recuperação da Informação

Letizia 3/3

Page 20: Agentes em Recuperação da Informação

Info Agent 1/4

Info Agent é composto de 3 componentes principais: Webwatcher SearchEngine UI Bookmark Manager

Page 21: Agentes em Recuperação da Informação

Info Agent 2/4

Webwatcher Procura por alterações em páginas web Avisa ao usuário sobre tais alterações Pode ser configurado da maneira

desejada.

Page 22: Agentes em Recuperação da Informação

SearchEngine UI SearchEngine Dmoz searchAndBrowse:

'Squeak‘ SearchEngine Dmoz searchAndManage:

'Squeak‘ Varre os resultados da Busca por URLs

e insere no Bookmark Manager

Info Agent 3/4

Page 23: Agentes em Recuperação da Informação

Info Agent 4/4

Bookmark Manager Documentos do WebWatcher:

“Webwatched Documents” Documentos resultantes de buscas:

“Search Results”

Page 24: Agentes em Recuperação da Informação

Agentes em Sistemas de Filtragem Motivações

Crescimento do volume de informações em ambientes distribuídos Dificuldade em localizar documentos relevantes Consumo de tempo

Ferramentas que automatizam a recuperação de informações

Page 25: Agentes em Recuperação da Informação

Introdução

Definição

Agentes que filtram colhem informações de várias fontes e selecionam documentos baseados em determinados critérios

Existem vários exemplos de filtragem de informações Foco em Informações na Internet

Mail News

Filtragem

BIndex ...

Page 26: Agentes em Recuperação da Informação

Técnica de Representação de Textos

Extração de conceitos importantes em documentos Heurística de frequência de palavras EX: Term Frequency-Inverse Document

Frequency (TFIDF)Fórmula:

TFIDF(W) = TF(W) * log |D|/ DF(W)onde |D| é o número total de documentos do conjunto

Maior frequência no documento e rara presença nos outros indica maior relevância

Palavras com maiores pesos são selecionadas formando um vetor de representação do documento

Page 27: Agentes em Recuperação da Informação

EXEMPLOS

BORGES ( A . F. SMEATON , 1996 ) Usuário especifica palavras ou frases

Destaca palavras polisemânticas, mostrando significados alternativos, para que o usuário escolha

O sistema expande o perfil do usuário, incluindo termos relacionados

Page 28: Agentes em Recuperação da Informação

EXEMPLOS

WebWatcher (http://cs.cmu.edu/afs/Web/People/webwatcher) Usuário especifica palavras-chaves

Duas páginas estão relacionadas, se alguma terceira página apontar para ambas

O algoritmo usa “informação mútua” como uma medida de similaridade para comparar links

Page 29: Agentes em Recuperação da Informação

EXEMPLOS

LAW (D. Bayer, 1995) Monitora ações do usuário (bookmarking,

impressão de páginas, etc...)

Características dos documentos Modelar o perfil do usuário

Um robô autônomo busca páginas relevantes, de acordo com este perfil

Page 30: Agentes em Recuperação da Informação

EXEMPLOS SAMURAI (H. Leong, S. Kapur, O de Vel, 1997)

É composto de 5 módulos: – Sumarização do texto– Monitoração e modelagem do usuário– Máquina de busca– Filtragem de links – Compilação dos resultados

WEBSOM (http://websom.hut.fi/websom/) SYSKILL (http://www.ics.uci.edu/pazzani/Syskill.html)

Page 31: Agentes em Recuperação da Informação

EXEMPLOS

Bullseye Desktop software Utiliza cerca de 600 search engines

NewsHound Busca notícias de diversos jornais a partir do

perfil do usuário. Envia estas informações através de e-mail ou

páginas html. Utiliza critérios de relevância.

Page 32: Agentes em Recuperação da Informação

EXEMPLOS NewsWeeder (uso experimental Carnegie Mellon

University) Usuário visita cada NewsGroup e avalia artigos

com notas de 1 a 5 Perfil do usuário a partir das notas 50 melhores artigos selecionados de acordo com

seu perfil A classificação Técnicas de medidas de

similaridade

Page 33: Agentes em Recuperação da Informação

EXEMPLOS Pefna (Universidade de Estocolmo - Kilander)

Categorias em ordem de importância

Bom exemplo da categoria é assinalado para seu treinamento

Categoria pode conter um ou mais exemplos

Comparação Medidas de similaridade com categorias existentes

Page 34: Agentes em Recuperação da Informação

Notificadores WEB

Serviço automático ativado por algum evento ocorrido dentro de um critério;

Critérios são geralmente definidos por termos;

Agentes enviam mensagens (e-mail, SMS...) para usuários registrados;

Page 35: Agentes em Recuperação da Informação

Como funcionam?

Trabalham em conjunto com outro serviço de informação

Acionado quando o critério é atingido Exemplos:

Google Alert ChangeDetect

Page 36: Agentes em Recuperação da Informação

Google Alert 1/2

Cadastra termos de busca no google Classificação:

News (Artigos) Web (Internet “top20”) News and Web (Artigos e Internet

“top20”) Groups (Google Groups)

Envia e-mail quando o termo combina com novos resultados

Page 37: Agentes em Recuperação da Informação

Google Alert 2/2

Forma ‘Google’ de criar e gerenciar as entradas Simples Intuitivo

Page 38: Agentes em Recuperação da Informação

ChangeDetect 1/3

Notifica sobre modificações em páginas cadastradas para usuários;

Destaca as modificações nas páginas por códigos de cor;

Muito “completo”: detecções constantes ou programadas filtragem extra categorias personalizadas várias formas de notificação detecta modificações em vários formatos de

arquivo

Page 39: Agentes em Recuperação da Informação

ChangeDetect 2/3

É extremamente configurável pode ser um problema...

Page 40: Agentes em Recuperação da Informação

ChangeDetect 3/3

Page 41: Agentes em Recuperação da Informação

Automatizar parte do processo -> economia Comparar produtos de diferentes

vendedores Quão fácil é expressar suas

preferências para a tarefa? Comprar um presente

Decisões sub-ótimas -> riscos Comprar um carro, vender e comprar

ações

Agentes em Sistemas de E-Commerce

Page 42: Agentes em Recuperação da Informação

Consumer Buying Behaviour

Identificação da necessidade Busca pelo produto Busca pelo vendedor Negociação Compra e entrega Avaliação

Estágios “agent-centric”!

Page 43: Agentes em Recuperação da Informação

Tecnologias

Sistemas de recomendação Filtragem baseada em conteúdo Filtragem colaborativa Filtragem baseada em restrições

Negociação Constraint Satisfaction Problem Teoria da utilidade multi-atributo

Page 44: Agentes em Recuperação da Informação

Fornecer nova informação que possa motivar o usuário a comprar algo.

Filtragem Resolução de constraints Filtragem colaborativa

Agentes monitores

Identificação da Necessidade

Page 45: Agentes em Recuperação da Informação

Definir "o que" comprar "Serendipity“ Estratégia

Resolução de constraints Filtragem colaborativa Função de utilidade multi-atributo

Escolha do produto

Page 46: Agentes em Recuperação da Informação

Definir "de quem" comprar Consultar vários sites de vendas on-

line Dificuldade: criar "wrappers" para cada

site Solução: Web Semântica = XML + RDF +

OWL

Exemplo BargainFinder Jango Tete-a-tete

Escolha do Vendedor

Page 47: Agentes em Recuperação da Informação

Tecnologias Constraint Satisfaction Problem Teoria da utilidade multi-atributo Leilões

Exemplos: Kasbah AuctionBot Tete-a-tete

Negociação

Page 48: Agentes em Recuperação da Informação

Chatterbots

Sistemas capazes de dialogar com os usuários em linguagem natural restrita

Agentes inteligentes Simular uma conversa Troca de mensagens de texto

Tornar mais familiar a interação entre o homem e a máquina Impressão de que o computador possui uma

personalidade

Page 49: Agentes em Recuperação da Informação

Exemplos de Aplicações

Uma “recepcionista” em um site comercial

Responder a FAQs (Frequently Asked Questions)

Atuar na área educacional dando suporte ao estudo e pesquisa

Entretenimento

Page 50: Agentes em Recuperação da Informação

Exemplo de Diálogo

Vendedor: “Olá! O que você está procurando?”

Usuário: “Um notebook para meu negócio de consultoria.”

Vendedor: “Por favor descreva se você tem alguma restrição de preços.”

Usuário: “Não é muito importante. Estou interessado em alta performance.”

Vendedor: “Você está procurando algum notebook topo-de-linha?”

Usuário: “Sim, exatamente!”

Vendedor: “Acredito que temos o produto certo para você. Clique aqui para ver o MacBook Pro 2.16Ghz”

Page 51: Agentes em Recuperação da Informação

Frases são entendidas através dos padrões

A resposta do chatterbot depende do padrão que casou a frase

Como chatterbots são implementados

Page 52: Agentes em Recuperação da Informação

Artificial Inteligence Markup Language (AIML)

Linguagem de marcação utilizada para: Definir os padrões compreendidos pelo

chatterbot Definir as réplicas de cada padrão

<category> <pattern>Olá</pattern> <template>

Olá, usuário </template></category>

Elementos Category: Unidade básica Pattern: Padrão de

entrada Template: Resposta do

chatterbot

Page 53: Agentes em Recuperação da Informação

Arquitetura

Session LogPadrões de Conversação

ChatterBot

Usuário

Casamento de padrões Raciocínio baseado em casos

Page 54: Agentes em Recuperação da Informação

Comportamento dos Bots

Iniciativa através de questionamento Partes da pergunta na resposta Manter o diálogo em um mesmo

tópico pelo maior tempo possível Iniciar novo tópico em diálogos

repetitivos Comentários humorísticos ou

controversos sobre tópico

Page 55: Agentes em Recuperação da Informação

Perguntas, Dúvidas ou Ressentimentos ????????????

Page 56: Agentes em Recuperação da Informação

Referências Bibliográficas

Gleaning Information from the Web: Using Syntax to Filter out Irrelevant Information, R. Chandrasekar e B. Srinivas, University of Pennsylvania, Philadelphia, PA 19104;

Text Summarisatio for Knowledge Filtering Agents in Distributed Heterogeneous Environments, H. Leong, S. Kapur, O de Vel, James Cook University of North Queensland, Austrália;

A Brief Comparison of News Filtering Software, Fredrik Kilander, Stockholm University, Sweden;

Learning Rules that Classify E-Mail, William W. Cohen, AT&T Laboratories;

Page 57: Agentes em Recuperação da Informação

Referências Bibliográficas

Agent Sourcebook, Alper K. Caglayan e Colin G. Harrison;

Message Classification and Filtering, Fredrik Kilander, Stockholm University, Sweden;

A Framework for Comparing Text Categorization Approaches, Isabelle Moulinier, LAFORIA-IBP-CNRS, Université Paris VI, France;

Page 58: Agentes em Recuperação da Informação

Referências Bibliográficas

http://www.cs.cmu.edu/~softagents/webmate.html;

http://web.media.mit.edu/~lieber/Lieberary/Letizia/Letizia-Intro.html;

http://www.novotek.nl/Products/PlantIntelligence/infoagent.htm;

Aula da disciplina mineração na WEB relativa à agentes na WEB e recuperação de informação;