48
Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Embed Size (px)

Citation preview

Page 1: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Sistemas de RecomendaçãoMineração da Web

Equipe

Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Page 2: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Roteiro

Motivação Coleta de informações Estratégias Técnicas

Filtragem de Informação Arquitetura Exemplos Referências

Page 3: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Motivação

Diversidade de opções

O usuário deseja customização

Segmentação de mercado

Fidelização

Page 4: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Motivação

Processo de indicação já bastante conhecido na relação social entre seres humanos

Re-edição do tempo onde os vendedores conheciam os clientes

E-commerce

Empresas lucram com isso!!

Page 5: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Coleta de Informações

Objetivo: Conhecer o usuárioÉ necessário capturar e armazenar seus

dados pessoais e comportamentais

Há duas formas habituais de identificação:

no Servidor e no Cliente

Page 6: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Coleta de Informações

Identificação no ServidorÁrea de cadastro de informações pessoaisO usuário loga no sistema Identificação com precisão

Identificação no ClienteUtilização de cookiesAssume-se que o computador é utilizado

por uma única pessoaMais simples, porém menos confiável

Page 7: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Coleta de Informações

Page 8: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Coleta de Informações Explícita

Page 9: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Coleta de Informações Implícita

A partir de dados da navegação, inferem-se suas preferências

Page 10: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégias de Recomendações

Empresas precisam lucrar! Boas estratégias garantem fidelidade de

clientes As estratégias são várias e de

complexidade variada: Lista de recomendações Avaliação dos usuários Suas recomendações “Interessados por X se interessam por Y” Associação por conteúdo

Page 11: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégia 1: Lista de Recomendação

Sem análises profundas Tipos populares ordenados

Page 12: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégia 2: Avaliação dos usuários

Bastante utilizada

Útil para os potenciais consumidores

Não exige nenhum mecanismo de inteligência na implementação

Page 13: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégia 2: Avaliação dos usuários

Page 14: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégia 2: Avaliação dos usuários

Page 15: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégia 3: Suas recomendações

Sugestões feitas especificamente para o usuário

implícitas ou explícitas

Page 16: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégia 3: Suas recomendações

Page 17: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégia 4: “Interessados em X se interessam por Y”

Associações entre itens avaliados por usuários

comprados, lidos, ...

Bastante comum em sites e-commerce

Estratégia mais complexa que as outras

Page 18: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégia 4: “Interessados em X se interessam por Y”

Page 19: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégia 5: Associação por conteúdo

Baseado no conteúdo de determinado item

É necessário encontrar associações ex: Os livros A e B são freqüentemente

vendidos juntos

Diferentes técnicas podem ser usadas para esse tipo de estratégia

Page 20: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Estratégia 5: Associação por conteúdo

Page 21: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Recuperação de Informação (RI) X Filtragem de Informação (FI)

RI Envolve armazenamento, índices e tecnologia para

recuperação de documentos textuais Mantém uma base com caracterísitica mais

estática no armazenamento de informações. Início da interação provocada pelo usuário (query) Baseia-se na percepção de uma necessidade de

momento FI

Mantém perfil dos interesses do usuário Maior tempo de duração no casamento de

interesses Início da interação provocada pelo sistema Não se refere ao momento, mas sim a preferências

Page 22: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Técnicas – Filtragem de Informações

Nome utilizado para descrever uma variedade de processos que envolvem a entrega de informação para as pessoas que realmente necessitam delas.

Quase todo sistema de recomendação vê a filtragem de informações ou seleção de um produto como um problema de classificação.

F(usuário, produto) | {gosta, não gosta}

Page 23: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Filtragem baseada em conteúdo

Baseada na análise de conteúdo dos itens e no perfil do usuário

Descrição de interesses do usuário é obtida através de informações fornecidas por ele mesmo ou através de ações como seleção e aquisição de itens

Ferramentas utilizam TF-IDF Modelo Vetorial Índices de Busca booleana Filtragem probabilística Interfaces de consulta com linguagem natural

Page 24: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Filtragem baseada em conteúdo

Como utilizar:Solicita ao usuário uma análise de itens

indicando se cada um destes é de interesse ou não

Após a avaliação feita pelo usuário o sistema busca itens que “casam” em

conteúdo com o que foi classificado como de interesse

e desconsidera os que “casam” com o que foi classificado como de não interesse

Page 25: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Filtragem baseada em conteúdo

Problemas:Conteúdo de dados pouco estruturado é

difícil de ser analisado vídeo, som

Entendimento do conteúdo do texto prejudicado pelo uso de sinônimos

Super-especialização só serão recomendados itens já avaliados, não

explorando novas categorias de itensFalta de surpresa na recomendação

produtos que não se relacionam com o perfil do usuário jamais serão recomendados

Page 26: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Filtragem baseada em conteúdo

Exemplos filmes do mesmo gênero que o assistidooutros CD’s dos artistas já adquiridosprodutos complementares aos adquiridos

“DVD player” hometheater

Page 27: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Filtragem Colaborativa

Desenvolvida para atender pontos que estavam em aberto na filtragem baseada em conteúdo

Diferencia-se da filtragem baseada em conteúdo exatamente por não exigir a compreensão ou reconhecimento do conteúdo dos itens

Baseado na troca de experiências entre as pessoas que possuem interesses comuns

Page 28: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Filtragem Colaborativa

Como utilizar: Itens filtrados baseados nas avaliações feitas

pelos usuáriosUsuários dos sistemas colaborativos devem

pontuar cada item experimentado, indicando o quanto este item casa com sua necessidade de informação

Page 29: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Filtragem Colaborativa

Problemas:1º avaliador: novo item no BD nunca é

recomendado até que um usuário o avaliePontuações esparsas: número de usuários

pequeno em relação ao volume de informações no sistema

Similaridade: um usuário exótico terá dificuldades para

encontrar outros usuários com gostos similares, sendo assim suas recomendações podem se tornar pobres

Page 30: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Filtragem Colaborativa

Detalhando o funcionamentoCalcular o peso de cada usuário em

relação à similaridade ao usuário ativo métrica de similaridade

Selecionar um subconjunto de usuários com maiores similaridades (vizinhos) para considerar na predição.

Normalizar as avaliações e computar as predições ponderando as avaliações dos vizinhos com seus pesos.

Page 31: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Filtragem Colaborativa - Exemplo

Se quisermos recomendar um produto ao usuário Mauro, procuraremos outros usuários com hábitos de consumos semelhantes

Page 32: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Filtragem Híbrida

Procura combinar os pontos fortes da filtragem colaborativa e da baseada em conteúdo e ao mesmo tempo eliminar as fraquezas de cada uma

Page 33: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Vantagens da Filtragem Híbrida

Utilizando recomendações colaborativas, experiências de outros usuários são levadas em consideração;

Utilizando recomendações baseadas em conteúdo, é possível lidar com itens não vistos por outros usuários;

É possível recomendar bons itens a um usuário mesmo que não haja usuários semelhantes a ele.

Page 34: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Arquitetura

Um Sistema de Recomendação deve funcionar como um servidor capaz de recuperar, para determinado

usuário, suas preferências explícitas, implícitas, conteúdo e ofertas relacionadas a itens nos quais já mostrou interesse

Deve ficar em comunicação com o sistema que irá apresentar as recomendações para o usuárioEx.: Servidor Web

Page 35: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Tipos de Arquitetura

Basicamente existem dois tipo de arquitetura possíveisBaseado em técnicas de filtragem de

informaçãoBaseado em Mineração de Dados

Page 36: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Baseado em Técnicas de Filtragem de Dados

Sistema de Apresentação

Módulo Central

Banco de Estratégias

Consulta dados pessoais Consulta dados Transacionais

Page 37: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Baseado em Mineração de Dados

Módulo de Mineração

Infere padrõesDemográficos e Transacionais

Armazena padrões

Page 38: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Exemplo de Arquitetura

Sistema RecommenderSistema de RecomendaçãoPermite que clientes e visitantes do

website de uma empresa possam receber, no momento exato, recomendações de produtos e serviços adequados aos seus interesses

Recomendações obtidas através de indicações explícitas de preferência ou através da técnica de filtragem colaborativa

Page 39: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Exemplo de Arquitetura

Page 40: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Exemplo de Arquitetura

Recommender Server Utilizado para dar acesso aos

SessionsControllers e às rotinas de recomendações

Page 41: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Exemplo de Arquitetura

Session Controller Ao entrar no site, uma

sessão é iniciada para o usuário, onde várias informações são armazenadas sobre sua interação

É carregado com todas as informações coletadas no passado sobre o usuário (itens adquiridos, áreas de preferência do site, etc.)

Page 42: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Exemplo de Arquitetura

StrategyList Guarda vários modelos de recomendação, cada um

orientado a um tipo de recomendação específica Baseado em listas armazenadas pelo sistema

(mais vendidos, lista de presentes, etc) Baseado em preferências explícitas ou implícitas

Difetentes estratégias podem ser criadas e utilizadas em paralelo em um mesmo website

Page 43: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Exemplo de Arquitetura

InterestList Mantém as preferências explícitas e

implícitas do usuário Coleta implícita: Na medida em

que o usuário navega, seleciona e adquiri itens, suas preferências são armazenadas na InterestList

Coleta Explícita: O usuário indica espontaneamente suas preferências e estas são armazenadas em outra InterestList

Mais tarde, todas essas preferências podem ser utilizadas

Page 44: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Exemplo de Arquitetura

FindingList Complementam as informações que se tem sobre os

usuários Utilizado para armazenar características demográficas

sobre eles (faixa etária, sexo, ocupação, ...) ou hábitos de consumo (itens adquiridos ou colocados no carrinho de compras)

É através desta “lista de achados” que se pode encontrar recomendações precisas para o usuário

Page 45: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Implementando Recomendação a partir dos itens comprados

pelo usuário:

Page 46: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Implementando

Recomendação de novidades:

Page 47: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Sistemas de recomendação - exemplos

Referral Web

GroupLens

Page 48: Sistemas de Recomendação Mineração da Web Equipe Bruno Rodrigues Danilo Torres David Emmanuel Rodrigo Siqueira

Referências

Wikipedia Reategui,Eliseo B. e Cazella, Sílvio C. Sistemas

de Recomendação Dot.dot.dot