Mineração na Web – CIn/UFPE
Emmanuel TenórioThiago FialhoWagner Rolim
Filtragem de Informação
RoteiroIntroduçãoFiltragem de Informação x
RecuperaçãoPerfil do usuárioTécnicas de FiltragemFiltragem Baseada no ConteúdoFiltragem ColaborativaConclusãoReferências
IntroduçãoRecuperação de informação traz
grande volume de informações irrelevantes.
IntroduçãoFalta de padronização e
classificação de conteúdo
Como encontrar algo relevante?Esforço próprioSorteRecomendação de amigos
Introdução
Necessidade de Filtragem de informação!!
Principais tiposFiltragem baseada em conteúdoFiltragem colaborativa
Filtragem x RecuperaçãoFiltragem de Informação
Recuperação de Informação
Perfil do usuárioArmazenamento, índices, tecnologia para recuperar docs
Maior tempo no casamento de interesses
Base estática no armazenamento
Início da interação provocada pelo sistema
Início da interação provocada pelo usuário (query)
Preferências Necessidade de momento
Perfil do UsuárioColeta de informações para conhecer o
usuárioDados pessoaisComportamentais
Possibilita a triagem de informação relevante
Identificação acontece no servidor (login) ou no cliente (cookies)
Perfil do UsuárioIdentificação por login
Cadastro de dados pessoaisMaior precisão
Identificação por cookiesSuposição de computador com um único
usuárioMais simples, menos confiável
Perfil do UsuárioForma Implícita: Inferência
Monitoramento de ações que indicam interesseAdicionar aos favoritosVisualizar página por muito tempoColocar produto em cesta de compras
Análise de estatística de acesso
Perfil do UsuárioForma Implícita: Desvantagem
O usuário pode comprar presente para outra pessoa!
Perfil do UsuárioForma Explícita
Definição explícita de preferências do usuário
Perfil do UsuárioForma Explícita: Desvantagem
Demanda tempo, paciência e atenção do usuário!
Técnicas de FiltragemCross Selling
Histórico de vendas de clientes com mesmo perfil
Filtragem Baseada em ConteúdoFiltragem Colaborativa
Filtragem Baseada em ConteúdoAnalisa a correlação entre as informações
contidas no perfil do usuário e as características extraídas dos itens selecionados a fim de sugerir os itens relevantes e descartar os itens que não são interessantes ao perfil do usuário.
Filtragem Baseada em ConteúdoSegundo Lichtnow et al (2006) a
filtragem por conteúdo parte do princípio de que os usuários tendem a se interessar por itens que se interessaram no passado
Segundo Schafer (1999), esta técnica pode ser chamada de recomendação de “item para item”
Filtragem Baseada em Conteúdo
Base de dados do perfil
Novo item relacionado com os itens antigos
Filtragem Baseada em ConteúdoO perfil do usuário pode ser atualizado
ManualmenteAutomaticamente de acordo com o feedback
ProblemasDesempenho comprometido cuja importância
é enormeComo extrair automaticamente atributos
relevantes de música, fotos, filmes etc.?Como descobrir coisas novas e
interessantes?
Filtragem Baseada em ConteúdoUm exemplo pode ser a filtragem de
conteúdos impróprios para crianças bloqueando o sistema de transmitir a informação como programas de acesso a sites destinados a adultos
Outro exemplo é o filtro de spam, onde um sistema verifica o conteúdo de uma mensagem e analisa o padrão das mensagem para identificar se ela se encaixa no perfil de spam ou até mesmo de vírus
Filtragem ColaborativaBaseada em análises anteriores de
outros usuário com o mesmo interesse
Nota: 5 estrelas
Nota: 5 estrelas
Sem notaChute: 5 estrelas
Filtragem ColaborativaMede a similaridade entre os
usuários
Pessoas que concordam no passado tendem a concordar novamente no futuro
Tem que garantir a honestidade da informação
Filtragem ColaborativaAplicação em qualquer domínioPode gerar recomendações
inesperadasPrincipais funções:
Retornar para o usuário somente informações importantes para ele
Recomendar o mesmo resultado para outros usuário com interesse comum
Filtragem ColaborativaPode ser dividida em 2 momentos:
1º - usuário como produtor da informação
Perfil dos usuários
Sistema de Recomendaçã
o
Informações coletadas de forma implícita ou explícita
Informações adicionadas ao perfil do usuário
Filtragem ColaborativaPode ser dividida em 2 momentos:
2º - usuário como consumidor da informação
Recomendações
Perfil dos usuários
Sistema de Recomendaçã
o
Usuário deseja receber uma recomendação
Informações são lidas pelos sistema de recomendação
O SR filtra os itens de acordo com o perfil do usuário
O SR gera as recomendações
As recomendações são entregues ao usuário
Filtragem ColaborativaA filtragem é feita em três passos:
Encontrar os usuários vizinhosProcessar as avaliações registradasAplicar a predição
ConclusãoResolve o problema do retorno da
grande quantidade de conteúdo indesejado
Diminui o tempo gasto em pesquisas
Direcionamento de produtos
Referênciashttp://www.slideshare.net/leandrociuffo/um-
estudo-de-caso-para-verificar-a-suscetibilidade-a-incentivos-de-avaliadores-de-produtos-na-web
http://www.frb.br/ciente/Impressa/Info/I.3.Oliveira,CAF.%20FiltragemColaborativa.pdf
www.cin.ufpe.br/~compint/aulas-IAS/ias/ias-021/filtragem.ppt
http://www.cin.ufpe.br/~tg/2001-2/bldb.pdf
Recommended