Recomendação de Conteúdo e QoE - Centro Federal de ... · 2. Obtivemos mais de 1,000 amostras de...

Preview:

Citation preview

Recomendação de Conteúdo e QoE:Um Experimento Quantificando o Impacto da QoS nas Preferências por Conteúdos

Universidade Federal do Rio de Janeiro

Felipe Assis de Souza, Mateus Schulz Nogueira, Daniel S. Menasche, João Ismael Pinheiro, Carla Delgado, Pavlos Sermpezis, Thrasyvoulos Spyropoulos, Savvas Kastanakis

Parte 1: Introdução

Sistemas de Recomendação e Caches

3

-Youtube tem 1.9 bilhões de usuários logados mensalmente. -Mais de 1 bilhão de horas assistidas diariamente.[1][1]https://www.youtube.com/yt/about/press/

Netflix atinge 130 milhoes de assinaturas em Julho/2018[2]

[2]https://www.statista.com/chart/10311/netflix-subscriptions-usa-international/

Sistemas de Recomendação

4

Motivação

Estima-se que o sistema de recomendação da Netflix influencia 80% da demanda.[3]

5

[3] Gomez-Uribe, Carlos A., and Neil Hunt. "The netflix recommender system: Algorithms, business value, and innovation." ACM Transactions on Management Information Systems (TMIS) 6.4 (2016): 13.

O que considerar num sistema de recomendação?

1. ideia 12. ideia 23. ….4. …5.

6

Sistemas de Caches

7

Amazon Cloud

Benefícios:● Consumo de banda reduzido● Prevenção de atrasos de transmissão

Request Cached?

Reply

Origin server

Request

Reply

O Experimento

8

Qual deles um usuário iria preferir?

Questões a serem respondidas

● Quais são os critérios utilizados por um usuário ao escolher um vídeo?

● É possível quantificar o quanto um usuário é sensível a falhas na qualidade da transmissão?

● É possível quantificar o interesse do usuário por algum conteúdo?

● O que é mais importante, o conteúdo do vídeo ou a qualidade da transmissão?

9

Metodologia

● Experimento dividido em 3 etapas:a. O usuário responde um rápido questionário no qual ordena 5 categorias gerais de conteúdo

em ordem de preferência (esportes, comédia, música, documentários e animais).

b. O usuário assiste a um par de vídeos cujos conteúdos são iguais, diferindo apenas na qualidade.

c. O usuário assiste assiste a outros 3 pares de vídeos, sorteados aleatoriamente dentre um conjunto de 7 pares.

■ Cada par é constituído de modo que um dos vídeos seja mais interessante do que o outro. O vídeo mais interessante possui uma qualidade inferior ao vídeo menos interessante.

10

Vídeos com o mesmo conteúdo mas com qualidade diferente.11

Vídeos com conteúdo e qualidade distintas.12

Dados Coletados

● Estresse: o quanto o usuário se sentiu afetado pelas falhas na qualidade de serviço. [numérico de 0 a 10]

● Interesse VideoLowQoS: Interesse pelo conteúdo do vídeo de qualidade baixa. [numérico de 0 a 5]

● Interesse VideoHighQoS: Interesse pelo conteúdo do vídeo de qualidade alta. [numérico de 0 a 5]

● Incômodo: indica o quanto o usuário se sentiu incomodado com as falhas. [numérico de 0 a 5]

● Vídeo Preferido: Qual dos vídeos de uma sessão foi preferido pelo usuário. [variável categórica]

● Justificativa: informação textual. 13

Ferramentas utilizadas

14

Parte 2: Processamento dos Dados

As falhas de QoS não passaram despercebidas.

Estresse

16

Média Desvio Padrão6.922819 2.369949

Existe um tradeoff entre qualidade de transmissão e interesse pelos vídeos.

Interesses

17

IntLowQoS 3.285235 1.422214IntHighQoS 2.733781 1.513892

Média Desvio Padrão

fraç

ão d

e us

uário

s

interesse de usuários

Preferências dos usuários por categoria

18

Preferências dos usuários por categoria

19

A maioria dos usuários preferiu o vídeo de alta QoS

Preferências dos usuários por categoria

20

A maioria dos usuários preferiu o vídeo de alta QoS

Embora o interesse maior fosse pelo vídeo de Low QoS

Preferências dos usuários por categoria

21

A maioria dos usuários preferiu o vídeo de alta QoS

Embora o interesse maior fosse pelo vídeo de Low QoS

Tradeoff: Interesse versus Incômodo

22

interesse

incômodo

Resultado: usuário prefere vídeo de baixa QoS (Low QoS)

Tradeoff: Interesse versus Incômodo

23

interesse

incômodo

Resultado: usuário prefere vídeo de alta QoS (High QoS)

Ciência: Interesse Alto Impacto

24

incômodo (3.33, o menor observado)

Resultado: usuário prefere vídeo de baixa QoS (Low QoS)

diferença de interesses (0.90, a mais alta)

Música: Incômodo Alto Impacto

25

diferença de interesses (0.38)

incômodo (3.8)

Resultado: usuário prefere vídeo de alta QoS (High QoS)

Os usuários se incomodam bastante com distúrbios de qualidade

Incômodo

26

Média Desvio Padrão3.585011 1.326379

Estatísticas por sessão [1/4]

27

Sessão 1 [139] IntLowQoS IntHighQoS IncômodoMédia 3.086331 2.42446 3.755396Desvio padrão 1.617307 1.592457 1.184695

Sessão 2 [109] IntLowQoS IntHighQoS IncômodoMédia 3.238532 2.899083 3.559633Desvio padrão 1.353316 1.403905 1.545273

Falhas para esportes pode incomodar muito mais.

LowQoS 43%HighQoS 57%

LowQoS 31%HighQoS 69%

68% preferiram o vídeo com maior qualidade.

esporte comédia

Sessão 4 [141] IntLowQoS IntHighQoS IncômodoMédia 3.141844 2.489362 3.588652Desvio padrão 1.376235 1.381599 1.248261

Sessão 3 [122] IntLowQoS IntHighQoS IncômodoMédia 2.868852 2.098361 3.303279Desvio padrão 1.520933 1.501569 1.430999

Estatísticas por sessão [2/4]

28

Menor interesse para a categoria de animais.

LowQoS 52%HighQoS 48%

LowQoS 47%HighQoS 53%

Equilíbrio na preferência de vídeos apesar da diferença expressiva de interesses.

petsesporte radical

Sessão 6 [124] IntLowQoS IntHighQoS IncômodoMédia 3.935484 3.056452 3.306452Desvio padrão 1.228006 1.438735 1.301515

Sessão 5 [118] IntLowQoS IntHighQoS IncômodoMédia 3.076271 2.983051 3.694915Desvio padrão 1.378447 1.461664 1.349317

Estatísticas por sessão [3/4]

29

LowQoS 60%HighQoS 40%

LowQoS 28%HighQoS 72%

Maior proporção de usuários que preferiram qualidade alta (72%).

Muitos preferiram menor qualidade. Segunda menor média de incômodo.

animaisciência

Sessão 7 [141] IntLowQoS IntHighQoS IncômodoMédia 3.624113 3.212766 3.829787Desvio padrão 1.168265 1.382588 1.319943

Estatísticas por sessão [4/4]

30

Em todas as sessões o vídeo com pior qualidade foi considerado mais interessante.

A média do incômodo para a categoria música foi a mais alta.

LowQoS 38%HighQoS 62%

Nas duas sessões em que a maioria preferiu o vídeo de pior qualidade foram observadas as menores médias de incômodo

música

Matriz de Correlações

Correlação baixa entre [estresse, incômodo] e [IntHighQoS, IntLowQoS].

31

Usuários entenderam a distinção entre interesse pelo vídeo e incômodo com a qualidade

Matriz de Correlações

Correlação baixa entre [estresse, incômodo] e [IntHighQoS, IntLowQoS].

32

Usuários entenderam a distinção entre interesse pelo vídeo e incômodo com a qualidade

Entre estresse e incômodo há alta correlação

Wordcloud

33

Nuvem de palavras mais frequentes da classe LowQoS

Nuvem de palavras mais frequentes da classe HighQoS

Wordcloud

34

Wordcloud

35

Wordcloud

36

Can we use sentiment analysis to automatically classify users?

Wordcloud

37

Can we use sentiment analysis to automatically classify users?

Sentiment analysis: accuracy of 62%

38

Positiviness < 0.35

High QoS Low QoS

Natural Language Processing

● tentar descobrir se usuário fez escolha por ○ rejeição (detestou o outro)○ vontade (porque gostou muito daquela)

● melhorar nuvens de pontos○ criar classes representatitvas, por exemplo, pegando extremos○ tirar palavras irrelevantes

● fazer análise de sentimento e aplicar outros algoritmos padrões de NLP nos dados

● etiquetar alguns (todos?!) manualmente, criando features extras, e ver se consegue algum nível de classificação automática

39

Parte 3: Modelos e Resultados

Visualização dos dados

41

LDAlogistic regression

low QoShigh QoS

Árvore de Decisão [1]

Parâmetros:

42

min_samples_split 38min_samples_leaf 11max_depth 3

O interesse nos vídeos se mostrou importante

Preferência x Diferença de Interesse

43

QoS é muito importante quando a diferença de interesse pelos vídeos é nula.

Interesse é muito importante mas não é absoluto.

focus attention here

Preferência x Diferença de Interesse

44

QoS é muito importante quando a diferença de interesse pelos vídeos é nula.

Interesse é muito importante mas não é absoluto.

focus attention here

Preferência x Diferença de Interesse

45

Interesse é muito importante mas não é absoluto.

Nessa região, decisão óbvia: sem tradeoff

Challenges

● unbalanced classes○ use weights to fix

■ however, "accuracy" decreased■ report multiple metrics of "accuracy"

○ use bootstrapping techniques○ use different cost matrices, to account for false positives and false negatives

● check table here○ https://en.wikipedia.org/wiki/Precision_and_recall

● interesting observation○ the root of the new decision tree is now "annoyance" (high QoS video may be preferable if

"annoyance is small") - only if "annoyance" is very high users prefer the high QoS

46

Árvore de Decisão com análise textual

47

Extra Trees Classifier (check also xgboost and gradient boosting)

48

Accuracy: 88%Without Stress(8% of accuracy decrease)

Conclusão

1. Propusemos um experimento para quantificar a sensibilidade dos usuários ao conteúdo de vídeos e a qualidade de transmissão (QoS).

2. Obtivemos mais de 1,000 amostras de usuários reais sobre seus sentimentos com relação aos vídeos.

3. Propusemos um sistema de recomendação que leva em conta a qualidade da transmissão dos vídeos (QoS) e a natureza do conteúdo recomendado (QoR), conjuntamente impactando a qualidade de experiência (QoE).

Link para o experimento: www.experimentoqos.com

mateussnogs@gmail.com

felipe.s@.ufrj.br49

Fim

Obrigado!

Tree Dif = 0

51

Balanced

Unbalanced(No cotnribution)

Tree Dif = 1

52

BalancedUnbalanced(no contribution )

Tree Dif = 2

53

Unbalanced(No contribution) Balanced

Random Forrest: Feature Importance (DiffInt = 0)

Accuracy: 83%

54

Extra Tree Dif = 1

Accuracy: 88%

55

Extra Tree Dif = 2

87% Accuracy

56

Recommended