33
Defesa de Proposta de Dissertação Nailson Boaz Costa Leite 29/05/2014 Nailson Boaz Costa Leite (UFCG) 1 Banca examinadora: Leandro Balby Marinho (orientador) Carlos Eduardo Batista (orientador) Nazareno Andrade Claudio Campelo PPGCC/UFCG Campina Grande Maio, 2014

Defesa de proposta de dissertacao UFCG

Embed Size (px)

Citation preview

Page 1: Defesa de proposta de dissertacao UFCG

Defesa de Proposta de

Dissertação Nailson Boaz Costa Leite

29/05/2014 Nailson Boaz Costa Leite (UFCG) 1

Banca examinadora: Leandro Balby Marinho (orientador)

Carlos Eduardo Batista (orientador)

Nazareno Andrade

Claudio Campelo

PPGCC/UFCG

Campina Grande – Maio, 2014

Page 2: Defesa de proposta de dissertacao UFCG

Explorando a Diversidade em Sistemas de

Recomendação baseados em Linked Open Data

Nailson Boaz Costa Leite

29/05/2014 Nailson Boaz Costa Leite (UFCG) 2

PPGCC/UFCG

Campina Grande – Maio, 2014

Page 3: Defesa de proposta de dissertacao UFCG

Sumário • Introdução

• Motivação

• Problema Abordado

• Proposta de Solução

• Objetivos

• Relevância

• Cronograma

• Referências

29/05/2014 Nailson Boaz Costa Leite (UFCG) 3

Page 4: Defesa de proposta de dissertacao UFCG

Introdução

Linked Data

• Difundir boas práticas para publicar e interligar

dados estruturados (RDF);

• Padronizar tecnologias e mecanismos que

facilitam o processamento, o compartilhamento,

a escalabilidade e o reuso de dados

29/05/2014 Nailson Boaz Costa Leite (UFCG) 4

Page 5: Defesa de proposta de dissertacao UFCG

Introdução

4 princípios do Linked Data:

• Use URIs para identificar os objetos

• Use URIs HTTP para acessar o objeto

• Cada objeto possui sua descrição

• As propriedades dos objetos podem ser referenciadas

por URIs.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 5

Page 6: Defesa de proposta de dissertacao UFCG

Exemplo RDF/XML

<rdf:RDF>

<rdf:Description rdf:about="http://dbpedia.org/resource/The_Lord_of_the_Rings">

<rdfs:label xml:lang="ja">指輪物語</rdfs:label>

<rdfs:label xml:lang="en">The Lord of the Rings</rdfs:label>

...

<dcterms:subject rdf:resource="http://.../Category:Sequel_novels" />

<dcterms:subject rdf:resource="http://...Category:High_fantasy_novels" /

...

<owl:sameAs rdf:resource="http://rdf.freebase.com/ns/m.07bz5" />

<dbpprop:author rdf:resource="http://dbpedia.org/resource/J._R._R._Tolkien" />

<dbpprop:books rdf:resource="http://.../The_Return_of_the_King" />

<dbpprop:books rdf:resource="http://.../The_Two_Towers" />

<dbpprop:books rdf:resource="http://.../The_Fellowship_of_the_Ring" />

...

</rdf:Description>

</rdf:RDF>

29/05/2014 Nailson Boaz Costa Leite (UFCG) 6

Page 7: Defesa de proposta de dissertacao UFCG

Introdução

29/05/2014 Nailson Boaz Costa Leite (UFCG) 7

(Noia, T. 2012)

Page 8: Defesa de proposta de dissertacao UFCG

Introdução

Linked Open Data

(LOD)

29/05/2014 Nailson Boaz Costa Leite (UFCG) 8

Page 9: Defesa de proposta de dissertacao UFCG

Introdução

Linked Open Data Cloud

29/05/2014 Nailson Boaz Costa Leite (UFCG) 9

(Cyganiak, A., 2011)

Page 10: Defesa de proposta de dissertacao UFCG

Introdução

Sistemas de Recomendação baseados

em LOD

Diversos trabalhos científicos tem utilizado a

estrutura e o conteúdo disponível nas bases de

dados de LOD para realizar recomendações.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 10

Page 11: Defesa de proposta de dissertacao UFCG

Introdução

As bases de dados de LOD oferecem aos SR:

• Descrições para diversos tipos de domínios;

• Taxonomia entre os objetos;

• Cruzamento entre várias bases de dados LOD;

• Facilidade na coleta dos dados;

• Facilita a exploração dos objetos e suas relações;

• Adiciona semântica aos dados.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 11

Page 12: Defesa de proposta de dissertacao UFCG

Motivação

“O real valor de uma recomendação está em

sugerir objetos que os usuários não descobririam

por si mesmos” (Herlocker, 2004)

• Recomendações óbvias

• Recomendações redundantes

• Recomendações populares

29/05/2014 Nailson Boaz Costa Leite (UFCG) 12

Page 13: Defesa de proposta de dissertacao UFCG

Motivação

29/05/2014 Nailson Boaz Costa Leite (UFCG) 13

(Sandoval, S., 2012)

Page 14: Defesa de proposta de dissertacao UFCG

Motivação

Novas dimensões para avaliação de SR:

• Novidade

• Diversidade

• Seredipidade

29/05/2014 Nailson Boaz Costa Leite (UFCG) 14

Page 15: Defesa de proposta de dissertacao UFCG

Motivação

Diversidade em SR:

A diversidade de uma lista de itens

recomendados refere-se ao quão diferente

cada item é dos demais, de acordo com uma

ou mais propriedades.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 15

Page 16: Defesa de proposta de dissertacao UFCG

Diversidade e acurácia

29/05/2014 Nailson Boaz Costa Leite (UFCG) 16

(Ziegler, 2005)

Page 17: Defesa de proposta de dissertacao UFCG

Problema de Negócio

Os usuários estão recebendo muitas

recomendações óbvias e redundantes em

relação ao que já foi visto anteriormente.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 17

Page 18: Defesa de proposta de dissertacao UFCG

Problema Técnico

Gerar listas ranqueadas de recomendações

que apresentem diversidade e relevância

entre os seus itens.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 18

Page 19: Defesa de proposta de dissertacao UFCG

Proposta de Solução

Utilizar as informações semânticas, as

propriedades e a taxonomia das bases de

dados LOD para solucionar o trade-off entre

diversidade e acurácia.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 19

Page 20: Defesa de proposta de dissertacao UFCG

Proposta de Solução

• Topic Diversification (Ziegler, 2005)

Algoritmo “guloso” de re-rankeamento que

computa a similaridade entre os itens através de

sua taxonomia e controla o fator diversidade com

uma variável ΘF.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 20

Page 21: Defesa de proposta de dissertacao UFCG

Proposta de Solução

29/05/2014 Nailson Boaz Costa Leite (UFCG) 21

(Ziegler, 2005)

Page 22: Defesa de proposta de dissertacao UFCG

Proposta de Solução

• Topic Diversification

29/05/2014 Nailson Boaz Costa Leite (UFCG) 22

(Sandoval, S., 2012)

Page 23: Defesa de proposta de dissertacao UFCG

Proposta de Solução

Podemos utilizar as complexas taxonomias entre

as propriedades dos objetos para reordenar as

listas de recomendações através do topic

diversification e tentar inferir o valor de ΘF.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 23

Page 24: Defesa de proposta de dissertacao UFCG

Objetivos Gerais

Desenvolvimento e avaliação de um SR que utiliza

as bases de dados de LOD para realizar

recomendações diversas e acuradas.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 24

Page 25: Defesa de proposta de dissertacao UFCG

Objetivos Específicos

1. Analisar o conjunto de dados semânticos de LOD em

contextos de recomendação (livros, filmes, músicas).

2. Desenvolver um modelo de SR que utilize métodos que

exploram o conteúdo extraído das bases de LOD

3. Realizar um estudo comparativo entre a diversidade e

acurácia dos modelos propostos

29/05/2014 Nailson Boaz Costa Leite (UFCG) 25

Page 26: Defesa de proposta de dissertacao UFCG

Relevância

(Ziegler, 2005) - Intra-List, Topic diversification

(Vargas, S., 2011) - Diversity and Novelty metrics

(Noia, T., 2012) - LOD to suport content based RS

(Ostuni, V., 2013) – Top-N recommendation leveraging

LOD

29/05/2014 Nailson Boaz Costa Leite (UFCG) 26

Page 27: Defesa de proposta de dissertacao UFCG

Relevância

ESWC 2014 Challenge:

Task 3: Diversity

A tarefa 3 do ESWC foi o desenvolvimento de um SR

baseado em conteúdo que leve em consideração a

acurácia (F-measure) e a diversidade (intra-list) das

recomendações utilizando o conteúdo disponível nas

bases de dados de LOD. .

29/05/2014 Nailson Boaz Costa Leite (UFCG) 27

Page 28: Defesa de proposta de dissertacao UFCG

Metodologia

• Revisão Sistemática

o Algoritmos e Métricas de Diversidade

• Estudo das Bases de LOD

• Desenvolvimento de SR baseado em LOD

• Escrita de Artigos

29/05/2014 Nailson Boaz Costa Leite (UFCG) 28

Page 29: Defesa de proposta de dissertacao UFCG

Cronograma

Meses

Fase 06/14 07/14 08/14 09/14 10/14 11/14 12/14 01/15 02/15 03/15 04/15

1 X X X

2 X X X

3 X

4 X X X

5 X X

6 X X X X X X X

29/05/2014 Nailson Boaz Costa Leite (UFCG) 29

Page 30: Defesa de proposta de dissertacao UFCG

Obrigado

29/05/2014 Nailson Boaz Costa Leite (UFCG) 30

Page 31: Defesa de proposta de dissertacao UFCG

Referências

(Noia, T. 2012) Tommaso Di Noia, Roberto Mirizzi, Vito Claudio Ostuni, and Davide Romito. Exploiting the web of data in model-based recommender systems.In Proceedings of the sixth ACM conference on Recommender systems, pages 253–256. ACM, 2012.

(Sandoval, S., 2012) Novelty and Diversity Enhancement and Evaluation in Recommender Systems.

(Ziegler, 2005) Cai-Nicolas Ziegler, Sean M McNee, Joseph A Konstan, and Georg Lausen. Improving recommendation lists through topic diversification. In Proceedings of the 14th international conference on World Wide Web, pages 22–32. ACM, 2005.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 31

Page 32: Defesa de proposta de dissertacao UFCG

Referências

(Vargas, S., 2011) Saúl Vargas and Pablo Castells. Rank and

relevance in novelty and diversity metrics for recommender

systems. In Proceedings of the fifth ACM conference on

Recommender systems, pages 109–116. ACM, 2011.

(Cyganiak, A., 2011) Anja Jentzsch Richard Cyganiak. Linking

open data cloud diagram, 2011.

29/05/2014 Nailson Boaz Costa Leite (UFCG) 32

Page 33: Defesa de proposta de dissertacao UFCG

Defesa da Proposta de

Dissertação de Mestrado

Nailson Boaz Costa Leite

29/05/2014 Nailson Boaz Costa Leite (UFCG) 33

Banca examinadora: Leandro Balby Marinho (orientador)

Carlos Eduardo Batista (orientador)

Nazareno Andrade

Claudio Campelo