112
TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta¸c˜ ao para obten¸ c˜ao do Grau de Mestre em Engenharia Inform´ atica e de Computadores uri Presidente: Professor Doutor Nuno Jo˜ ao Neves Mamede Orientador: Professor Doutor Paulo Jorge Pires Ferreira Acompanhante: Professor Doutor V´ ıtor Rodrigues Vogal: Professor Doutor Renato Jorge Caleira Nunes Novembro de 2009

TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

TargetAdPublicidade Direccionada em Sistemas IPTV

Pedro Francisco Revez Abrantes

Dissertacao para obtencao do Grau de Mestre emEngenharia Informatica e de Computadores

Juri

Presidente: Professor Doutor Nuno Joao Neves Mamede

Orientador: Professor Doutor Paulo Jorge Pires Ferreira

Acompanhante: Professor Doutor Vıtor Rodrigues

Vogal: Professor Doutor Renato Jorge Caleira Nunes

Novembro de 2009

Page 2: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica
Page 3: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Agradecimentos

Em primeiro lugar gostava de agradecer ao Professor Paulo Ferreira pela sua disponibilidade, pelo seuenorme empenho e pela sua contagiante devocao ao trabalho e a excelencia.

Gostaria de agradecer, tambem, a todos aqueles que na Movensis tao bem me receberam e que per-mitiram o desenvolvimento deste trabalho. As contribuicoes dos Engenheiros Vıtor Rodrigues, FranciscoChaves e Diogo Simoes foram, de facto, muito enriquecedoras e valiosas para este projecto.

Nao seria justo, no ultimo trabalho do curso, nao agradecer aqueles a quem muito fiquei a dever aolongo destes 5 anos. Assim sendo, quero agradecer ao Nuno Ferreira e ao Joao Neves por terem sidoparte integrante do meu percurso academico, percurso esse que teria sido muito mais difıcil se nao tivessetido a sua ajuda: mais visıvel nos inumeros trabalhos que realizamos conjuntamente; menos visıvel, masnao menos importante, nos momentos corriqueiros de todos os dias.

A todos os meus amigos, quero agradecer terem sido uma fonte inesgotavel de divertimento e momentosde ocio, que me permitiu compensar e tolerar os momentos mais aborrecidos destes ultimos 5 anos.

Aos meus pais e irmaos, mais do que um agradecimento, um reconhecimento de que se estou a es-crever estas palavras, na recta final de um curso, e fruto dos valores que me transmitiram e da vontadede vencer que em mim inculcaram. Terminar o curso e dizer-lhes que o seu esforco nao foi em vao.

Por ultimo, queria agradecer a minha namorada, Andreia, que e a base na qual me apoio em tudo oque faco. Como bem sabemos, o culminar de um projecto e o embriao de inumeros outros.

Lisboa, 29 de Novembro de 2009Pedro Francisco Revez Abrantes

Page 4: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica
Page 5: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

”Half the money I spend on advertising is wasted —

the trouble is I don’t know which half.”

John Wanamaker

Page 6: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica
Page 7: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Resumo

Desde 1965 que a eficacia da publicidade televisiva esta a diminuir. Actualmente, a explosao de canaisoferecidos, o advento do Video-on-Demand e a proliferacao de Personal Video Recorders vieram con-tribuir para reduzir, ainda mais, esta eficacia. Ao mesmo tempo que os anuncios televisivos vao sendovotados a indiferenca, a publicidade na internet bate recordes de lucros. A explicacao para o sucesso dapublicidade neste meio e a relevancia, ou seja, os anuncios apresentados sao do interesse dos utilizadores.Como tal, ha que apresentar, na televisao, publicidade relevante para os telespectadores.

Neste sentido, foi desenhado, implementado e avaliado o TargetAd (Targeted Advertising), um sis-tema que permite a apresentacao de publicidade direccionada em sistemas IPTV. Este sistema tem comoobjectivo a apresentacao de publicidade que seja relevante para o utilizador. Desta forma, provamos que aapresentacao de publicidade direccionada provoca um crescimento dos lucros dos operadores de televisao,aumenta a eficacia dos investimentos em publicidade televisiva dos anunciantes e melhora a experienciatelevisiva do utilizador.

Page 8: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica
Page 9: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Abstract

The effectiveness of television advertising is diminishing since 1965. Nowadays, the explosion of availablechannels, the advent of Video-on-Demand and the proliferation of Personal Video Recorders are furtherlowering the efficacy of television advertisements. As television advertising gets ignored by viewers, inter-net advertising achieves new profit records. Internet advertising success is tightly related to its relevance,i.e., internet advertisements are often interesting to users. Therefore, it is mandatory to present interes-ting and relevant advertisements to television viewers as well.

In order to present a solution to this problem, we have designed, implemented and evaluated TargetAd

(Targeted Advertising), a system for targeting advertisements on IPTV systems. TargetAd’s goal isto present advertisements which are relevant to the user. Additionally, it is shown that targeted tele-vision advertising generates greater revenues than traditional advertising, improves the effectiveness ofadvertisers’ investments and, most importantly, betters users’ television experience.

Page 10: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica
Page 11: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Palavras Chave

Keywords

Palavras Chave

IPTV

Publicidade direccionada

Publicidade televisiva

Anuncios

Modelacao de Utilizadores

Keywords

IPTV

Targeted Advertising

Television Advertising

Advertisements

User Modeling

Page 12: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica
Page 13: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Conteudo

1 Introducao 1

1.1 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Objectivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 Desafios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.4 Solucoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Trabalho Relacionado 7

2.1 Insercao Dinamica de Anuncios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1.1 Insercao Local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.1.2 Insercao Remota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2 Escalonamento de Anuncios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.3 Formas de Enderecamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.1 Enderecamento tematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.2 Enderecamento geografico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.3 Enderecamento ao lar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.3.4 Enderecamento comportamental . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.3.5 Enderecamento a estereotipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.3.6 Enderecamento colaborativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.4 Perfis de Utilizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.4.1 Processos de Construcao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.4.2 Fontes de Dados Utilizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.5 Identificacao de Utilizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.6 Relatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.7 Solucoes existentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3 Arquitectura 23

3.1 Requisitos funcionais e nao-funcionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.2 Visao geral da Arquitectura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.3 Visao detalhada da Arquitectura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.3.1 Insercao Dinamica de Anuncios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.3.2 Escalonamento de Anuncios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.3.3 Forma de Enderecamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.3.4 Perfis de Utilizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.3.5 Identificacao de Utilizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.3.6 Relatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.4 Privacidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

i

Page 14: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

4 Implementacao 35

4.1 SDS e IMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364.2 Componentes do TargetAd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364.3 Interface Grafica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394.4 Classificador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404.5 Base de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.5.1 Base de Dados do Servidor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.5.2 Base de Dados do Cliente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5 Avaliacao 51

5.1 Teste de Eficiencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515.2 Testes com Utilizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5.2.1 Primeiro Teste com Utilizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545.2.2 Segundo Teste com Utilizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

5.3 Viabilidade Economica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595.3.1 Canais Televisivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595.3.2 Operadores Televisivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605.3.3 Anunciantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

6 Conclusoes 63

6.1 Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 646.1.1 Forma de Enderecamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 646.1.2 Identificacao Implıcita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656.1.3 Esforco Negocial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

A Taxonomia TV-Anytime 69

B Teste com Utilizadores 83

C Resultados do Inquerito 91

ii

Page 15: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Lista de Figuras

1.1 Lucros da publicidade na internet nos Estados Unidos da America . . . . . . . . . . . . . 21.2 Tres versoes do mesmo anuncio direccionadas para casais idosos (A), para famılias com

criancas (B) e para jovens (C) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3.1 Arquitectura do TargetAd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2 Exemplo de interaccao entre o cliente e o servidor, utilizando o protocolo SIP . . . . . . . 253.3 Payload dos pacotes UDP utilizados para assinalar intervalos publicitarios . . . . . . . . . 293.4 Prototipo da interface grafica onde sao criados os perfis de utilizadores . . . . . . . . . . . 31

4.1 Principais componentes do SDS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354.2 Relacao entre o ICP e o ambiente fornecido pelo SDS . . . . . . . . . . . . . . . . . . . . . 364.3 Esquema da implementacao do TargetAd . . . . . . . . . . . . . . . . . . . . . . . . . . . 374.4 Interface grafica desenvolvida para o TargetAd . . . . . . . . . . . . . . . . . . . . . . . . 394.5 Apresentacao de anuncio direccionado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404.6 A ferramenta Explorer, integrada na biblioteca Weka . . . . . . . . . . . . . . . . . . . . . 414.7 Inquerito utilizado para recolha de dados para o treino e teste do classificador . . . . . . . 424.8 Arvores que representam as preferencias televisivas de um inquirido . . . . . . . . . . . . . 434.9 Excerto de uma arvore de decisao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444.10 Estrutura da base de dados do servidor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464.11 Estrutura da base de dados do cliente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.1 Grafico com o tempo de execucao do algoritmo de seleccao e escalonamento dos anunciosem diferentes cenarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.2 Aplicacao web que suportou o Segundo Teste com Utilizadores . . . . . . . . . . . . . . . 58

iii

Page 16: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

iv

Page 17: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Lista de Abreviacoes

API Application Programming Interface

ARFF Attribute-Relation File Format

CSCF Control Sequence Call Function

DNS Domain Name Service

EPG Electronic Program Guide

HSS Home Subscriber Server

HTTP Hypertext Transfer Protocol

ICP IMS Client Platform

IDE Integrated Development Environment

IMS IP Multimedia Subsystem

IP Internet Protocol

IPTV Internet Protocol Television

JAX-WS Java API for XML Web Services

JDK Java Development Kit

JVM Java Virtual Machine

LAN Local Area Network

PHP Hypertext Preprocessor

PVR Personal Video Recorder

RFID Radio-Frequency Identification

ROI Return On Investment

RSA Rivest, Shamir and Adleman

RTP Real-time Transport Protocol

SDS Service Development Studio

SIP Session Initiation Protocol

SOAP Simple Object Access Protocol

v

Page 18: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

SQL Structured Query Language

STB Set-Top-Box

SVM Support Vector Machine

SWT Standard Widget Toolkit

TargetAd Targeted Advertising

TCP Transmission Control Protocol

UDP User Datagram Protocol

URL Uniform Resource Locator

VLC Video LAN Client

VoD Video on Demand

vi

Page 19: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Lista de Tabelas

2.1 Comparacao entre o sistema iMedia e o Sistema T . . . . . . . . . . . . . . . . . . . . . . 192.2 Comparacao entre 3 solucoes comerciais para o direccionamento de publicidade televisiva 21

4.1 Comparacao entre os varios algoritmos de classificacao testados . . . . . . . . . . . . . . . 43

5.1 Teste ao tempo de execucao do algoritmo de seleccao e escalonamento de anuncios . . . . 525.2 Classificacao dos intervalos segundo a sua relevancia . . . . . . . . . . . . . . . . . . . . . 565.3 Valores observados e esperados relativos a classificacao do intervalo mais relevante . . . . 565.4 Dados relativos a classificacao do intervalo mais relevante, dispostos de acordo com o Teste

Exacto de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575.5 Dados relativos a classificacao do intervalo mais relevante, para o segundo Teste Exacto

de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

vii

Page 20: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica
Page 21: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Capıtulo 1

Introducao

1.1 Motivacao

Em 1965, 34% dos telespectadores adultos norte-americanos conseguiam lembrar-se de uma marca pu-blicitada durante o programa de televisao que tinham acabado de ver. No ano 2000, este numero desceupara 9% [5]. A publicidade na televisao esta, portanto, a tornar-se cada vez menos eficaz.Existem varias explicacoes para esta diminuicao de eficacia. A explosao do numero de canais oferecidospelos operadores de televisao provoca uma fragmentacao do publico. Esta fragmentacao torna mais difıcila transmissao de publicidade a um determinado publico-alvo, visto que este pode estar subdividido porvarios canais. O Video-on-Demand (VoD), comummente utilizado para aluguer online de filmes, crioumais uma forma dos utilizadores consumirem conteudos televisivos sem apresentacao de publicidade. Achegada dos Personal Video Recorders (PVRs) — dispositivos que possibilitam a gravacao, em formatodigital, de emissoes televisivas — veio permitir que o utilizador controle a reproducao do conteudo gra-vado, podendo evitar assim as pausas comerciais. A fragmentacao do publico e as novas formas de evitaros anuncios tiveram, e continuam a ter, um impacto negativo nos lucros gerados pela publicidade televi-siva [5, 24].De acordo com um estudo realizado em territorio nacional [10], 70% dos telespectadores portuguesesadmitem que o numero elevado de canais a sua disposicao faz com que mudem de canal frequentemente.Este estudo revela ainda que 74% dos inquiridos tem por habito, durante os intervalos dos programas,ausentarem-se do local ou dedicarem-se a outras actividades. Estes numeros mostram, pois, que umagrande parte dos telespectadores ignora o conteudo apresentado quando este nao e do seu interesse.

Um dos principais problemas da publicidade televisiva actual reside no facto de o direccionamento dosanuncios se basear apenas na audiencia do programa. Este direccionamento e tanto mais limitativo quantomais generalista for o programa, visto que a audiencia pode ser bastante heterogenea. A apresentacao deum anuncio a um publico-alvo diferente daquele que foi definido pelo anunciante tem, pelo menos, duasconsequencias negativas:

1. Perda de dinheiro: o investimento do anunciante e desperdicado pois o anuncio nao chega aopublico-alvo desejado;

2. Perda de interesse: o telespectador, ao ver algo que nao lhe e claramente dirigido, pode mudar decanal ou dedicar-se a outras actividades.

As falhas na transmissao da mensagem publicitaria devem ser evitadas, visto que todas as partes envolvi-das perdem: os anunciantes fazem um investimento infrutıfero; os canais, a longo prazo, poderao assistir

1

Page 22: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

4.0

61

$

4.1

86

$ 4.7

84

$

4.8

99

$

5.0

94

$

5.2

67

$ 5.9

46

$

5.7

65

$

5.7

45

$

4.000 $

5.000 $

6.000 $

7.000 $

Mil

es d

e D

óla

res

1.9

92

$

2.0

91

$

1.9

51

$

2.1

23

$

1.8

72

$

1.8

48

$

1.7

73

$

1.6

41

$

1.5

20

$

1.4

58

$

1.4

51

$

1.5

80

$

1.6

32

$

1.6

60

$

1.7

93

$

2.1

82

$

2.2

30

$

2.3

69

$

2.1

82

$

2.6

94

$

2.8

02

$

2.9

85

$

3.1

47

$

3.6

08

$

3.8

48

$

4.0

61

$

4.1

86

$ 4.7

84

$

0 $

1.000 $

2.000 $

3.000 $

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

Tri

m.

2000 2001 2002 2003 2004 2005 2006 2007 2008

Mil

es d

e D

óla

res

Figura 1.1: Lucros da publicidade na internet nos Estados Unidos da America

a uma diminuicao das receitas da venda de espaco publicitario, dado o baixo retorno do investimento porparte dos anunciantes; e, por fim, os telespectadores incorrem numa ma experiencia televisiva, na medidaem que assistem a conteudos desinteressantes.

O sucesso de um anuncio depende significativamente da sua relevancia para o consumidor [5]. A apostacrescente na publicidade na internet e reveladora da importancia da constatacao anterior. Segundo dadosrecentes, os lucros registados, nos Estados Unidos da America, relativos a publicidade na internet no 1o

semestre de 2008, ascenderam a 11.5 mil milhoes de dolares (ver Figura 1.1) [11]. Este valor representauma subida de 15.2% em relacao ao mesmo perıodo de 2007. Este estudo revela ainda que 44% desteslucros foram originados apenas pela compra de anuncios que sao exibidos nas pesquisas em motores debusca.

O que diferencia a publicidade na internet da publicidade televisiva e, exactamente, a relevancia dosanuncios para o utilizador. Enquanto que na televisao o telespectador assiste, frequentemente, a anunciosque nao lhe suscitam qualquer interesse, na internet o utilizador encontra, normalmente, publicidade quelhe interessa. E, portanto, desejavel tornar a publicidade televisiva mais interessante e relevante para otelespectador, de modo a contrariar o actual decrescimo de eficacia.

A aposta dos anunciantes na publicidade na internet e devida, tambem em grande parte, a possibilidadede medir com precisao o impacto das campanhas transmitidas neste meio. Tal torna-se especialmenteevidente em epocas de recessao economica e crise generalizada, como aquela a que assistimos actualmente.E, entao, perfeitamente compreensıvel que, na Gra-Bretanha, as receitas geradas pela publicidade na in-ternet tenham ultrapassado, pela primeira vez na historia, as receitas relativas a publicidade televisiva[12]. Esta mudanca ocorreu um ano ou dois antes daquilo que se esperava, sendo que se cre que estaantecipacao tenha sido motivada pela crise.

1.2 Objectivo

O objectivo deste trabalho centrou-se na criacao de um sistema baseado em IPTV que apresentasseanuncios televisivos que fossem relevantes para o utilizador. O sistema criado foi apelidado de TargetAd

2

Page 23: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

(Targeted Advertising).

O TargetAd pretende comprovar que a apresentacao de anuncios dirigidos ao utilizador traz tres vanta-gens:

1. O crescimento das receitas dos operadores de televisao, no que diz respeito a publicidade televisiva,visto que estes passarao a fazer parte do processo de comercializacao de espaco publicitario;

2. O aumento do Return On Investment (ROI )1 das campanhas publicitarias, dado que os anunciosatingirao mais frequentemente o publico-alvo;

3. A melhoria da experiencia televisiva dos utilizadores, na medida em que a publicidade apresentadavai de encontro aos seus interesses e preferencias.

Um dos requisitos do TargetAd consiste em possibilitar que os anuncios fornecidos pelos anunciantes sejamdireccionados aos utilizadores com base nos seus perfis individuais. Outro dos requisitos do sistema eser o menos intrusivo possıvel para o utilizador, dado que a actividade de ver televisao e sobretudo umaactividade de descontraccao e relaxamento, pelo que qualquer esforco exigido ao utilizador e negativo naapreciacao do sistema. Adicionalmente, para que se prove que o sistema consegue, realmente, direccionara publicidade ao segmento de utilizadores seleccionado pelos anunciantes, o TargetAd compila informacaoque atesta a eficacia do direccionamento de publicidade.

1.3 Desafios

No desenvolvimento deste trabalho, varios desafios necessitaram de ser abordados. De seguida, detalha-mos os desafios mais interessantes.

Cada utilizador do sistema tem um perfil que o identifica e que e utilizado para o direccionamentode publicidade. Para que o sistema seja transparente para o utilizador, os perfis de utilizadores devemser construıdos com a menor intervencao possıvel por parte destes. Como tal, um desafio na criacao destesistema passou por encontrar um modo de construir perfis para os utilizadores em que estes tenham umaintervencao mınima.

Para que os anuncios possam ser dirigidos individualmente a cada utilizador, com base no seu perfil,e necessario saber, a cada momento, quem esta a ver televisao. Dado que podem existir varios utilizado-res a coabitar num lar e, consequentemente, a partilharem um ou mais televisores, este e um desafio quetem que ser enderecado.

Alem do desafio inerente a identificacao individual de cada utilizador, foi necessario lidar com o de-safio de identificar situacoes em que varios utilizadores estao a ver televisao em grupo. A identificacaodestas situacoes permite que a publicidade seja direccionada com base no perfil de todos os utilizadoresque estao a ver televisao conjuntamente.

Outro dos grandes desafios que surgiram na concepcao do TargetAd foi a seleccao dos anuncios a seremapresentados a cada intervalo. Em oposicao ao que acontece actualmente, no TargetAd o escalonamentodos anuncios e feito de forma automatica, pelo que se teve que definir um algoritmo responsavel porescalonar os diferentes anuncios.

1Return On Investment e uma medida de performance para avaliar a eficacia de um dado investimento.

3

Page 24: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Por ultimo, no desenvolvimento do TargetAd, foi necessario acautelar a privacidade dos dados dos uti-lizadores. A privacidade e, hoje em dia, um tema com uma grande relevancia social e para o qual aspessoas estao bastante alertas. Assim, a bem do sucesso do sistema, foi essencial assegurar que as questoesrelacionadas com os dados privados dos utilizadores se encontravam precavidas.

1.4 Solucoes

A internet e um meio que permite a apresentacao de publicidade contextualizada com a informacaoconsumida pelo utilizador. Neste meio, o utilizador desempenha um papel mais activo na seleccao deconteudos, em comparacao com o que acontece na televisao. Assim, e mais facil, de uma forma geral,apresentar publicidade relevante para o utilizador na internet, dado que o utilizador fornece indicacoessobre aquilo que esta a procura. Na televisao as decisoes do utilizador sao menos uteis sob um pontode vista comercial. Como tal, torna-se necessario descobrir certas caracterısticas pessoais do utilizadorpara que seja possıvel apresentar-lhe publicidade direccionada. Estas caracterısticas podem ser inferidasatraves dos conteudos televisivos consumidos pelo utilizador.

Intervalo PublicitárioPrograma Programa

A

B

C

Figura 1.2: Tres versoes do mesmo anuncio direccionadas para casais idosos (A), para famılias comcriancas (B) e para jovens (C)

A solucao na qual o TargetAd se baseia consiste em tracar perfis de utilizadores atraves da analisedos conteudos a que assistem, e utilizar essa informacao para criar uma infra-estrutura de publicidadedireccionada.

Na transmissao (e recepcao) de televisao atraves de sinal analogico, o sinal televisivo e directamenteligado ao televisor (nomeadamente atraves de um cabo coaxial). Contudo, para que seja possıvel moni-torizar os conteudos televisivos consumidos, e necessario introduzir um componente entre o televisor e osinal televisivo. No caso da Internet Protocol Television (IPTV ), esse componente e uma Set-Top Box

4

Page 25: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

(STB),2 e tem como principal responsabilidade transformar e descodificar os pacotes IP em imagens esons passıveis de serem emitidos pelo televisor. E possıvel, entao, instalar software nas STBs para queos conteudos televisivos consumidos atraves daquele televisor sejam registados.

Num servico de IPTV e possıvel enderecar individualmente cada STB, o que possibilita o envio depublicidade direccionada aos utilizadores de uma STB. O envio de publicidade direccionada permite,por exemplo, que os anunciantes criem varias versoes do mesmo anuncio para diferentes segmentos dapopulacao (ver Figura 1.2). Este nıvel de granularidade nao e possıvel de atingir com outras formas de di-fusao de conteudos televisivos, como por exemplo a transmissao de televisao em sinal analogico ou digital.

O TargetAd parte da premissa que os canais televisivos enviam meta-informacao associada ao conteudoque emitem. A meta-informacao associada a conteudo televisivo consiste, tipicamente, em texto quedescreve e classifica esse conteudo. Este servico e conhecido por EPG (Electronic Program Guide).

O perfil de um utilizador e construıdo com base nos programas televisivos que o utilizador ve. A partirdesta informacao e possıvel classificar o utilizador, segundo a sua idade e sexo. Esta classificacao e efec-tuada atraves da utilizacao de tecnicas de aprendizagem supervisionada. A aprendizagem supervisionadae uma tecnica de machine learning em que se pretende que um sistema aprenda uma funcao a partir deum conjunto de dados. Este conjunto de dados consiste em varias instancias de inputs e respectivos out-puts. Neste caso particular, cada instancia do conjunto de dados tem como inputs generos de programasvisionados por um telespectador, e como outputs a idade e o sexo desse telespectador.

Os utilizadores do sistema sao, portanto, estereotipados com base na sua idade e sexo. Os anunciosa serem apresentados a um utilizador foram previamente direccionados, pelos anunciantes, ao estereotipoem que esse utilizador se inclui.

O TargetAd contempla, ainda, a producao de relatorios sobre a publicidade que e apresentada. Estae uma funcionalidade muito util. Por um lado, permite que os operadores televisivos comprovem aeficacia do sistema perante os anunciantes. Por outro lado, possibilita que os anunciantes avaliem, comminucia, o sucesso das suas campanhas publicitarias, mimetizando, de certa forma, aquilo que e possıvelfazer com as campanhas na internet. Para a producao destes relatorios e necessario que, sempre que umanuncio e apresentado a um utilizador, tal evento seja registado. Adicionalmente, sao registadas outrasinformacoes, como a data, a hora e o canal que estava a ser televisionado.

O TargetAd, ao utilizar a IPTV como tecnologia de distribuicao de sinal televisivo, goza, tambem,das vantagens inerentes a esta tecnologia. Com efeito, a IPTV permite combinar as vantagens da publi-cidade na internet e da publicidade televisiva. Tal como acontece na internet, com a IPTV e possıvelenviar publicidade diferenciada para cada utilizador, visto que cada utilizador pode ser enderecado indi-vidualmente.3

A IPTV preserva, tambem, a grande vantagem da publicidade televisiva, que e a capacidade de chegar aum grande numero de pessoas. De facto, em Portugal, a publicidade televisiva pode chegar, teoricamente,a toda a populacao, visto que 100% dos lares portugueses possuem televisao. Comparativamente, apenas45% dos lares portugueses possuem internet [10]. Alem disso, espera-se que a IPTV chegue a um maiornumero de lares nacionais, acompanhando a previsao global de forte crescimento desta tecnologia [18].

2Uma Set-Top-Box e um dispositivo electronico ligado a um televisor e a um sinal externo. A STB transformao sinal externo em conteudos televisivos, apresentando estes ultimos no televisor.

3Neste caso pontual, estamos a considerar que existe apenas um utilizador afecto a cada STB.

5

Page 26: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

De facto, cre-se que, em 2012, esta tecnologia chegue a 89 milhoes de pessoas em todo o mundo. EmPortugal, o principal servico de IPTV, o Meo, regista ja cerca de 384 mil subscritores [20].

Resumimos, aqui, a restante estrutura deste documento. Na seccao seguinte analisamos alguns criteriosque definem um sistema para a apresentacao de publicidade televisiva direccionada, apresentando tambemum levantamento de sistemas academicos e comerciais que direccionem anuncios televisivos. Na Seccao3 apresentamos a arquitectura do TargetAd, onde explicitamos e justificamos as decisoes arquitecturaistomadas. A implementacao do TargetAd encontra-se descrita na Seccao 4. As avaliacoes e testes a queo TargetAd foi sujeito sao apresentados na Seccao 5. Na ultima seccao, gizamos as conclusoes sobre otrabalho desenvolvido e identificamos os passos que terao que ser dados futuramente.

6

Page 27: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Capıtulo 2

Trabalho Relacionado

Neste capıtulo, analisamos os seis criterios que definem um sistema de suporte a publicidade televisivadireccionada. Nesta analise, focamo-nos em varios sistemas, com funcionalidades e objectivos variados,sendo que em todos eles existem ideias que podem ser aplicadas na construcao de um sistema como oTargetAd.Na ultima seccao deste capıtulo apresentamos um levantamento dos sistemas actuais que permitem odireccionamento de anuncios televisivos.

Os sistemas que permitem a apresentacao de publicidade televisiva direccionada podem ser caracteri-zados segundo seis criterios:

1. Insercao Dinamica de Anuncios: como e onde sao inseridos os anuncios direccionados na streamde dados;

2. Escalonamento de Anuncios: de que forma sao escalonados os anuncios no ambito de cadaintervalo publicitario;

3. Forma de Enderecamento: que informacao e usada para direccionar os anuncios;

4. Perfis de Utilizadores: como sao construıdos e que informacao contem os perfis que representamos utilizadores;

5. Identificacao de Utilizadores: de que forma o sistema sabe quem esta a ver televisao;

6. Relatorios: como e feita a avaliacao das campanhas publicitarias televisivas.

De seguida, sao analisados varios sistemas existentes na literatura, a luz destes seis criterios.

2.1 Insercao Dinamica de Anuncios

A apresentacao de publicidade direccionada requer que os anuncios sejam inseridos dinamicamente nastream de dados. A forma como e feita esta insercao e o local em que a mesma ocorre, variam de sistemapara sistema.Os anuncios direccionados podem ser inseridos na stream de dados localmente, numa Set-Top-Box (STB),ou remotamente, no servidor.

7

Page 28: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

2.1.1 Insercao Local

A insercao local de anuncios e apenas possıvel em STBs com capacidade de armazenamento. Hoje emdia, muitas STBs possuem discos rıgidos, visto que estas incorporam PVRs. Como tal, parte da capaci-dade de armazenamento utilizada pelo PVR para a gravacao de conteudos televisivos, pode tambem serutilizada para armazenar localmente anuncios direccionados para os utilizadores daquela STB.

A insercao dos anuncios e feita monitorizando pontos na emissao dos conteudos televisivos que iden-tificam intervalos para a insercao de publicidade [24]. Estes pontos tem que ser identificados e fornecidospelos canais de televisao. A monitorizacao destes pontos e feita atraves de software presente na STB.Quando um destes pontos e detectado, o output da STB deixa de ser o conteudo do canal que estava a servisualizado e passa a ser um dos anuncios que se encontram localmente armazenados na STB. A seleccaodo anuncio a ser apresentado depende, principalmente, das preferencias e caracterısticas de quem estaactualmente a ver televisao [24, 3, 16]. Outros factores como onde esta a decorrer a actividade de vertelevisao (ou seja, em que divisao do lar se encontra a STB), que tipo de conteudo televisivo estava a servisualizado e a hora actual podem tambem ser considerados [24].

Como a capacidade de armazenamento de uma STB e limitada, e necessario pre-seleccionar e transferirpara a mesma apenas um subconjunto de todos os anuncios existentes. Este subconjunto compreendeos anuncios que tem uma maior probabilidade de ser do interesse dos utilizadores dessa STB [24, 3, 16].Esta pre-seleccao depende da forma de enderecamento de publicidade utilizada no sistema. As diferentesformas de enderecamento de publicidade, no contexto deste tipo de sistemas, sao abordadas mais a frente.

2.1.2 Insercao Remota

A insercao de anuncios pode tambem ser feita remotamente, ou seja, no lado do servidor [5, 14]. Nainsercao remota de anuncios, tal como na local, e necessario monitorizar pontos identificativos de espacospublicitarios, por forma a saber-se quando se pode inserir anuncios na stream de dados. No caso geralda televisao digital,1 em que tambem e possıvel inserir dinamicamente anuncios, quando e detectadoo comeco de um espaco publicitario, o servidor insere na stream varios anuncios (tipicamente quatro,pois este e o numero de programas com qualidade standard que sao possıveis difundir simultaneamente,utilizando sinal digital, no espectro correspondente ao utilizado na difusao de um canal analogico). Local-mente, a STB extrai a meta-informacao associada a cada anuncio e compara-a com o perfil do utilizadorque esta a ver televisao. O anuncio cuja meta-informacao melhor se enquadrar no perfil local e, entao,apresentado no televisor, sem qualquer intervencao do utilizador [5]. A insercao remota de anuncios emtelevisao digital apresenta uma desvantagem que e o limite do numero de anuncios diferentes que podemser apresentados em cada espaco publicitario.

No caso da IPTV, esta limitacao nao existe. E possıvel apresentar qualquer anuncio (desde que pre-sente no sistema), num dado espaco publicitario, visto que cada STB recebe uma stream de dadosindividual. Como tal, o servidor pode enviar um anuncio diferente para cada STB, se necessario. Paraesta insercao remota de anuncios em IPTV ser possıvel, e necessario que a STB envie antecipadamente,para o servidor, informacao sobre o tipo de anuncios que este devera incluir na stream dirigida a essaSTB. Esta informacao ira reflectir de alguma forma preferencias e caracterısticas dos utilizadores dessaSTB. Com base nessa informacao, sera escolhido e, posteriormente, enviado para a STB, o anuncio maisadequado para o(s) utilizador(es) dessa STB, em cada espaco publicitario [14].

1A televisao digital consiste na transmissao de conteudos televisivos atraves de sinais digitais (discretos), aocontrario do que acontece com a emissao de televisao tradicional (sinal analogico).

8

Page 29: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Tal como sugerido na insercao local de anuncios, e tambem possıvel, na insercao remota, utilizar ou-tros factores para a seleccao do anuncio, como a localizacao da STB no lar, o conteudo televisivo queestava a ser assistido ou a hora actual. Contudo, como este processo ocorre remotamente, a presencadeste tipo de informacao no servidor pode constituir uma invasao a privacidade dos utilizadores.

2.2 Escalonamento de Anuncios

A parte da seleccao de anuncios, um sistema que direccione publicidade televisiva tem que tambemescalonar os anuncios no ambito dos intervalos publicitarios. Actualmente, nos canais de televisao, oescalonamento e feito de forma estatica, sendo que existe um sistema responsavel por produzir diaria-mente um ficheiro onde este escalonamento e definido [5]. Tal escalonamento define a sequencia exactados anuncios dentro de um intervalo, sendo que a duracao deste intervalo e conhecida a priori. Comoacontece frequentemente, os programas televisivos, sobretudo aqueles que sao emitidos em directo, temvariacoes inesperadas de duracao e, consequentemente, o comeco de um espaco publicitario pode seradiantado ou atrasado. Na ocorrencia destes eventos, as correccoes tem que ser feitas manualmente.

Num sistema que permita publicidade televisiva direccionada, este escalonamento tem que ser feito deforma automatica, pois, no mesmo intervalo, diferentes utilizadores podem assistir a diferentes anuncios,o que se traduz, para todos os efeitos, em diferentes escalonamentos. Embora seja reconhecido que osoftware de escalonamento de anuncios necessite de evoluir [5], nao existe na literatura qualquer solucaoconcreta que possa reclamar tal evolucao. Contudo, e claro que uma solucao que permita fazer escalona-mentos diferentes para cada receptor, passara obrigatoriamente por um sistema distribuıdo, na medidaem que e incomportavel que a producao de todos os escalonamentos com anuncios direccionados estejasob a responsabilidade de apenas uma maquina.

De qualquer forma, e possıvel encontrar solucoes que utilizam sistemas de escalonamento actuais, aomesmo tempo que possibilitam a apresentacao de publicidade direccionada. Em particular, uma dessassolucoes passa por utilizar os escalonamentos convencionais de anuncios feitos pelos canais, inserindopublicidade direccionada nas STBs sempre que possıvel [3, 16]. Esta solucao pode ser sumariada emquatro passos:

1. O anunciante, na posse do anuncio que deseja transmitir, identifica o publico-alvo da comunicacao;

2. De seguida, o anunciante compra um slot nos escalonamentos disponıveis, fornecendo como inputo proprio anuncio e a identificacao do publico-alvo correspondente. Os escalonamentos de anunciosforam definidos de antemao pelos canais televisivos;

3. Os anuncios (e a definicao dos publicos-alvo associados) sao enviados, em intervalos regulares, paraas STBs dos clientes;

4. Quando e detectado o inıcio de um slot publicitario, cada STB consulta uma base de dados localpara saber se tem algum anuncio direccionado ao seu utilizador para o slot em questao. Emcaso afirmativo, o anuncio armazenado localmente e apresentado. Caso contrario, e apresentado oanuncio inserido pelo canal televisivo.

Esta solucao apresenta alguns problemas. Por exemplo, a omissao do modo como o inıcio dos slots pu-blicitarios e identificado abre caminho a eventuais deficiencias. Com efeito, a menos que seja utilizadoum mecanismo de sinalizacao do inıcio destes slots, qualquer alteracao pontual do inıcio de um inter-valo publicitario implicara um desfasamento entre o inıcio dos anuncios emitidos pelo canal televisivo e

9

Page 30: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

o inıcio dos anuncios reproduzidos pelas STBs. Tal desfasamento tera, como consequencia mais grave,a sobreposicao de anuncios reproduzidos localmente nas STBs ao conteudo televisivo emitido, fora doambito temporal do intervalo publicitario.Outra das limitacoes desta solucao consiste em requerer que os canais televisivos disponibilizem, atem-padamente, os escalonamentos de anuncios. Tal e bastante arriscado pois todo o sistema fica assimdependente da accao de uma entidade externa.Por ultimo, esta solucao limita igualmente o formato dos anuncios. Suponhamos que o escalonamentode um dado canal de televisao e feito tendo por base apenas anuncios de 60 segundos. Em tal situacao,torna-se impossıvel para um anunciante inserir um anuncio direccionado de 30 segundos nesse canaltelevisivo.

2.3 Formas de Enderecamento

Um sistema que apresente publicidade direccionada necessita de dispor de criterios para direccionar osanuncios aos diferentes utilizadores. Estes criterios correspondem a uma forma de enderecamento dapublicidade. As formas de enderecamento existentes na literatura sao:

1. Enderecamento tematico;

2. Enderecamento geografico;

3. Enderecamento ao lar;

4. Enderecamento comportamental;

5. Enderecamento a estereotipos;

6. Enderecamento colaborativo.

De seguida, cada uma destas formas de enderecamento e analisada em detalhe.

2.3.1 Enderecamento tematico

O enderecamento tematico explora o facto do publico de um certo canal ser mais homogeneo a medida queo numero de canais aumenta [5]. Na verdade, esta forma de enderecamento nao exige qualquer inovacaotecnologica, visto que ja e praticada actualmente — os anunciantes compram espacos publicitarios noscanais cujo publico demonstrara, com maior probabilidade, receptividade em relacao aos seus anuncios.Esta forma de enderecamento tem uma limitacao significativa que e a impossibilidade de chegar a to-talidade do publico-alvo. Por exemplo, nem todos os praticantes de desportos nauticos veem o SailingChannel.

2.3.2 Enderecamento geografico

Esta forma de enderecamento baseia-se na observacao do decrescimo do numero de lares servidos por cadano de rede da operadora televisiva. E, portanto, natural considerar que os lares em cada no se tornam cadavez mais homogeneos, de um ponto de vista etnico-social. Desta forma, e possıvel apresentar publicidadedireccionada a um grupo de lares etnica e socialmente relacionados, inserindo os anuncios no no que osserve [5].O enderecamento geografico tem algumas limitacoes. Apesar de ser verdade que a populacao servida porum dado no e similar tanto etnica como socialmente, e errado assumir que esta e similar, por exemplo, anıvel de idade, pois esta caracterıstica varia significativamente na populacao servida por um no. Assim,

10

Page 31: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

e dado que o local onde uma pessoa vive nao pre-determina totalmente os seus padroes de consumo, estaforma de enderecamento nunca podera alcancar a precisao desejada pelos anunciantes.

2.3.3 Enderecamento ao lar

Nesta forma de enderecamento, sao apresentados aos anunciantes varios perfis de lares. Os anunciantescompram, entao, espaco publicitario que sera visualizado por lares que se enquadrem nos perfis selec-cionados [5]. Tal possibilita que, num intervalo de um dado programa, diferentes lares (com diferentesperfis) visualizem diferentes anuncios.O ponto fraco desta forma de enderecamento reside no factor de existir apenas um perfil por lar. Um lare composto por diferentes pessoas, com interesses diversos. Como tal, um perfil que represente um lar emanifestamente insuficiente para representar todos os elementos que compoem esse lar.

2.3.4 Enderecamento comportamental

O enderecamento comportamental agrega padroes de consumo televisivo passado e associa-os com aactividade actual do utilizador, por forma a determinar o anuncio mais relevante para esse utilizador.Entenda-se por actividade actual o tipo de conteudo que esta a ser visualizado, em que divisao da casaesta a decorrer essa actividade e a hora actual. A escolha do anuncio e feita recorrendo a etiquetas2 quesao extraıdas da meta-informacao que descreve os programas consumidos pelo utilizador [24].

Esta forma de enderecamento tem varias limitacoes. Para as analisar, consideremos um exemplo emque, devido a um utilizador ter assistido a um Grande Premio de Formula 1 e a um rally, uma dasetiquetas que sera usada para a seleccao de anuncios e o termo “automovel”.Uma limitacao surge na seleccao do anuncio. A etiqueta “automovel” apenas indica que o anuncio se-leccionado deve ser sobre automoveis. Porem, um anunciante pode ter disponibilizado varias versoes deum anuncio de um automovel: uma versao para casais jovens e outra para casais reformados. Com estaforma de enderecamento, nao e possıvel direccionar estes anuncios para o seu publico-alvo.Outra limitacao desta forma de enderecamento advem desta assumir que o facto de um utilizador assistira um certo tipo de conteudos revela que o mesmo tem uma necessidade relacionada, de alguma forma,com esses conteudos. Por exemplo, segundo esta forma de enderecamento, o facto de o utilizador assistira programas de desportos motorizados implica que este esta interessado na aquisicao de um veıculo mo-torizado, o que pode nao ser, de todo, verdade.Ainda uma outra limitacao surge na extraccao das etiquetas da meta-informacao que descreve os pro-gramas consumidos pelo utilizador. No exemplo dado, tal e possıvel. Ou seja, e provavel que a meta-informacao associada a uma transmissao de um Grande Premio de Formula 1 ou de um rally contenhamo termo “automovel”. No entanto, existem programas que tal extraccao se apresenta muito difıcil ou ateimpossıvel. Por exemplo, se um utilizador assistir a debates sobre temas como a educacao, a economiaou a saude, apenas e possıvel inferir, segundo esta forma de enderecamento, que o utilizador se interessapor estes temas. Contudo, nao e possıvel, neste caso, extrair informacao do historico de visualizacoes doutilizador que tenha algum valor para a seleccao de anuncios.

2.3.5 Enderecamento a estereotipos

Para que um sistema possa enderecar conteudos, ou publicidade em particular, a estereotipos, e necessariodispor de dois tipos de informacao [21]. O sistema tem que conhecer os estereotipos em si, ou seja, o con-junto de caracterısticas que definem cada estereotipo. Estas caracterısticas podem ser quaisquer, desde

2Uma etiqueta, neste contexto, pode ser o termo “comedia”, presente na meta-informacao que descreve umepisodio de uma serie de humor.

11

Page 32: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

caracterısticas psicologicas [21], ate preferencias de canais de televisao [3, 16, 15, 22].O sistema tem que ter ainda conhecimento de um conjunto de activadores — eventos cuja ocorrencia as-sinala uma relacao entre o utilizador e um, ou mais, estereotipos. Por exemplo, o facto de um utilizadorver frequentemente desenhos animados indicia uma provavel relacao desse utilizador com o estereotipodas criancas.

Existem, basicamente, duas formas de se obterem os estereotipos e os respectivos activadores:

1. Atraves da producao manual desta informacao por um especialista [21];

2. Atraves da monitorizacao de um conjunto de utilizadores e reconhecimento de padroes comporta-mentais [3, 16, 15, 22].

A producao manual de estereotipos e dos respectivos activadores tem a vantagem, por um lado, de serbastante precisa, pois e efectuada por humanos. Por outro lado, tem a desvantagem de ser uma tarefa,na maior parte dos domınios, complexa e demorada. Com efeito, a producao manual de activadores querelacionem todos os programas televisivos que um utilizador pode visualizar (na ordem das centenas oumilhares) com os estereotipos existentes no sistema, e uma tarefa complexa, visto que exige uma analisecuidada das relacoes de todos esses programas com os diferentes estereotipos, e demorada, dado o elevadonumero de programas.

A obtencao dos estereotipos e respectivos activadores pode ser, tambem, efectuada atraves da moni-torizacao de utilizadores. Desta forma, existe um conjunto de utilizadores que disponibiliza alguns dadospessoais, como por exemplo a idade e o sexo, que servirao para associar cada um desses utilizadores, deimediato, a um estereotipo. Estes utilizadores sao, entao, monitorizados, com o objectivo de se extraırempadroes comportamentais. Estes padroes comportamentais serao, posteriormente, utilizados para associarum dado utilizador (nao monitorizado) a um determinado estereotipo, com base nos seus comportamen-tos. Tal e possıvel atraves da aplicacao de tecnicas de aprendizagem supervisionada. Tipicamente, emsistemas que direccionam publicidade televisiva, estes comportamentos correspondem aos canais ou pro-gramas que um utilizador visualiza [3, 16, 15].Existem duas alternativas para a escolha dos utilizadores monitorizados:

1. Um utilizador pode fornecer os seus dados pessoais voluntariamente e a partir daı fica incluıdo noconjunto de utilizadores monitorizados [3, 16];

2. Os utilizadores monitorizados sao pre-seleccionados pelos administradores do sistema [15, 22].

A primeira alternativa tem a vantagem de todos os utilizadores do sistema poderem fornecer os seus da-dos pessoais, o que permitiria direccionar muito eficazmente a publicidade. Porem, tal cenario e utopicoe ate e mais provavel acontecer o contrario: nenhum utilizador fornecer voluntariamente os seus dadospessoais e, consequentemente, nao existir materia-prima para se proceder a classificacao dos utilizadoresdo sistema. Como tal, esta alternativa coloca parte do sistema nas “maos” dos utilizadores, o que podeser perigoso e incontrolavel. De facto, mesmo que seja monitorizado um numero de utilizadores aceitavel,nada garante que esse conjunto de utilizadores seja representativo do universo de utilizadores do sistema.Por exemplo, se so fornecerem os seus dados pessoais criancas de 10 anos, apenas se conseguirao extrairregras que permitam inferir se um dado utilizador tem ou nao 10 anos.

A segunda alternativa, apesar de acarretar alguma morosidade administrativa, visto que tem que seridentificado e seleccionado um conjunto de utilizadores que, idealmente, represente todo o universo deutilizadores do sistema, apresenta-se como sendo uma opcao mais fiavel, pelas desvantagens apontadas a

12

Page 33: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

alternativa anterior.

Para que se possa treinar o classificador, os dados referentes aos conteudos televisivos visualizados pelosutilizadores monitorizados terao que ser enviados para o operador televisivo. Este tratamento de dadosnecessita de consentimento explıcito dos seus titulares, como disposto na Lei de Proteccao de Dados (Lein.o 67/98).

A classificacao de utilizadores e uma mais-valia desta forma de enderecamento, no sentido em que per-mite que os anunciantes direccionem os seus anuncios segundo as caracterısticas que definem os diferentesestereotipos.

2.3.6 Enderecamento colaborativo

Esta forma de enderecamento tem como intuito criar relacoes entre os utilizadores do sistema. Estasrelacoes entre utilizadores podem ser criadas atraves da comparacao de dados pessoais (como a idade eo sexo), de preferencias televisivas e de interaccoes com os anuncios.3 A vizinhanca de um utilizador econstituıda por utilizadores que se encontrem perto deste, ou seja, que se assemelhem a este segundo ascaracterısticas atras mencionadas. Desta forma, e possıvel apresentar publicidade que seja do interessedo utilizador com base em informacoes inferidas a partir dos vizinhos [15].

O enderecamento colaborativo e inspirado nos sistemas de recomendacao colaborativos e, como tal, sofredos mesmos problemas que estes. O problema mais grave, que atinge esta forma de enderecamento, re-sulta na possibilidade de existirem muitos mais conteudos televisivos e anuncios que utilizadores. Assimsendo, torna-se mais difıcil encontrar no sistema utilizadores que tenham assistido aos mesmos programasou interagido com os mesmos anuncios, o que conduzira a que todos os utilizadores se encontrem muitodistanciados. A utilizacao de dados pessoais, como a idade e o sexo, no calculo da distancia entre utiliza-dores, vem atenuar um pouco este problema, pois e inevitavel existirem muitos utilizadores com a mesmaidade e/ou com o mesmo sexo. Esta e uma limitacao tıpica dos sistemas de recomendacao colaborativosquando o domınio dos itens e esparso, isto e, o racio entre o numero de itens e o numero de utilizadorese alto [4, 17].

2.4 Perfis de Utilizadores

Algumas das formas de enderecamento analisadas atras, nomeadamente o enderecamento ao lar, o en-derecamento comportamental, o enderecamento a estereotipos e o enderecamento colaborativo, utilizamos perfis dos utilizadores para direccionarem a publicidade convenientemente. Como tal, um sistema queapresente publicidade televisiva direccionada, caso utilize uma destas formas de enderecamento, necessitade construir perfis para os diferentes utilizadores do sistema.Os perfis de utilizadores podem ser construıdos — isto e, criados e mantidos — atraves de processos edados diversos. Assim sendo, os perfis de utilizadores divergem, de sistema para sistema, segundo:

1. Os processos de construcao: os perfis dos utilizadores podem ser criados e actualizados manu-almente, automaticamente ou segundo uma abordagem hıbrida;

2. As fontes de dados utilizadas: a informacao presente nos perfis dos utilizadores pode ser deri-vada de varios tipos de dados.

3A interaccao entre um utilizador e um anuncio so e possıvel num sistema que suporte Interactive Television(iTV ). A iTV consiste num conjunto de tecnicas que permitem que o telespectador interaja com o conteudotelevisivo.

13

Page 34: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

As diferentes formas como sao construıdos os perfis dos utilizadores, bem como os diferentes tipos dedados utilizados na derivacao da informacao que contem, sao analisados de seguida.

2.4.1 Processos de Construcao

Os perfis dos utilizadores podem ser criados e actualizados de uma forma manual, automatica ou hıbrida.A construcao manual de perfis de utilizadores diz respeito a processos de criacao e actualizacao dosmesmos que requerem intervencao explıcita de seres humanos. Este tipo de construcao de perfis podeser executado mediante mecanismos externos ao sistema, como entrevistas telefonicas, questionarios ouconsulta de registos publicos [5], ou atraves de uma interface onde o utilizador e convidado a introduzirdados [3, 16, 9, 27].A criacao e actualizacao automatica de perfis de utilizadores e feita principalmente atraves da monito-rizacao de conteudos, sejam eles programas de um canal televisivo [15, 22, 9, 27, 19], anuncios [3, 16, 15]ou ate qualquer tipo de conteudo multimedia (vıdeo, musica, etc.) [27]. Alem dos conteudos, os perfisconstruıdos automaticamente podem tambem registar informacao contextual, como em que divisao dolar o utilizador ve, habitualmente, televisao [24] ou as horas a que, habitualmente, o faz [24, 9].A construcao hıbrida combina as construcoes manual e automatica de perfis de utilizadores. Este tipo deconstrucao de perfis monitoriza e regista dados como os conteudos consumidos pelo utilizador e, eventu-almente, dados contextuais, tal como acontece na construcao automatica de perfis. Alem disso, permiteque informacao relativa ao perfil de um utilizador seja alterada manualmente. Esta alteracao manualdas informacoes do perfil de um utilizador pode ser executada pelo proprio utilizador, voluntariamente eatraves de uma interface [3, 16, 27], ou por um administrador do sistema.

Os perfis construıdos manualmente tem como vantagem a fiabilidade dos seus dados, visto que este eum processo com intervencao humana, logo mais fiavel. Por outro lado, a construcao manual dos perfise feita atraves de processos morosos e, muitas vezes, incomodativos para os utilizadores.A construcao automatica de perfis tem a vantagem de ser invisıvel para o utilizador, no sentido em queeste nao se apercebe que esta a ser construıdo um perfil que o representa no sistema. Contudo, este tipode construcao nao e tao fiavel como a construcao manual, dado que, na maior parte dos casos, o perfil deum utilizador apenas consegue ser uma boa aproximacao ao perfil ideal correspondente.A construcao hıbrida de perfis tenta colmatar as desvantagens individuais das construcoes manual e au-tomatica, combinando-as. Por um lado, segundo este processo de construcao de perfis, o fornecimentoexplıcito, por parte do utilizador, dos seus dados esta inteiramente dependente da sua vontade e, portanto,nao se pode considerar um processo intrusivo. Por outro lado, a possibilidade do utilizador fornecer osseus dados cria condicoes para que o seu perfil, entretanto construıdo automaticamente, seja corrigido,caso tal se verifique necessario.

2.4.2 Fontes de Dados Utilizadas

A existencia de perfis de utilizadores num sistema que direcciona publicidade televisiva, pressupoe que aforma de enderecamento dessa mesma publicidade esta relacionada com a informacao presente dos perfis.A informacao presente nos perfis pode ser derivada de varias fontes de dados. Esta informacao e, conse-quentemente, os dados donde foi derivada, esta intimamente relacionada com a forma de enderecamentode publicidade utilizada pelo sistema. Adicionalmente, estes dados podem ser tambem utilizados paraidentificacao dos utilizadores, como veremos mais a frente.A informacao guardada nos perfis de utilizadores pode ser inferida, de uma forma nao exclusiva, a partirde varias fontes de dados:

14

Page 35: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

1. Dados pessoais;

2. Habitos de compra;

3. Conteudos consumidos;

4. Conteudos nao consumidos;

5. Interaccao com anuncios;

6. Horarios de visualizacao.

1. Dados pessoais Os dados pessoais dos utilizadores sao normalmente utilizados para derivar in-formacao que e guardada nos seus perfis quando a forma de enderecamento publicitario do sistema eo enderecamento ao lar [5], o enderecamento a estereotipos [3, 16, 21, 15, 9] ou o enderecamento co-laborativo [15]. Os dados pessoais utilizados sao, normalmente, caracterısticas fısicas ou sociais queinfluenciam, de um modo geral, as preferencias e os gostos das pessoas, como a idade, o sexo e a profissao[5, 3, 16, 21, 15, 9]. Porem, e tambem possıvel direccionar/recomendar conteudos aos utilizadores combase no seu caracter (por exemplo, se o utilizador e calmo ou nervoso, se e introvertido ou extrovertido)ou ate segundo a sua religiao [21].Como nao existe forma de um sistema computacional aferir de forma inequıvoca este tipo de dados, autilizacao de dados pessoais apenas pode ser feita em sistemas cujos perfis sejam construıdos segundo umprocesso manual, isto e, recorrendo a intervencao humana.

2. Habitos de compra O enderecamento a estereotipos e o enderecamento colaborativo podem tambemfazer uso de dados relativos aos habitos de compra para construir os perfis dos utilizadores [3, 16, 15].Este tipo de dados, na pratica, apenas pode ser registado em sistemas cuja construcao dos perfis sejafeita de forma manual, pela mesma razao apontada anteriormente.Com a utilizacao de dados relativos a habitos de compra, e possıvel classificar os utilizadores segundoestereotipos (enderecamento a estereotipos) [3, 16] ou criar relacoes entre utilizadores baseadas nas se-melhancas entre os seus habitos de compra (enderecamento colaborativo) [15].

3. Conteudos consumidos Nos sistemas que direccionam publicidade televisiva ou recomendamconteudos multimedia aos seus utilizadores, os dados que mais comummente sao utilizados para construiros perfis dos utilizadores sao dados sobre os conteudos que foram consumidos [5, 24, 3, 16, 15, 22, 27, 19, 8].Estes conteudos consumidos podem ser de diversos tipos, desde anuncios [5], programas televisivos[24, 3, 16, 15, 22, 19, 8] ou ate qualquer tipo de conteudo multimedia [27].

Os sistemas que constroem os perfis dos seus utilizadores com base nesta fonte de dados utilizam, habi-tualmente, uma metrica apelidada de “nıvel de interesse” (em ingles, degree of interest) [27, 19, 8]. Destaforma, os utilizadores tem um dado nıvel de interesse para cada conteudo que consomem. Este nıvelde interesse varia continuamente entre 0 e 1, e representa, tipicamente, a percentagem da totalidade deum conteudo que o utilizador consumiu. Como tal, a incorporacao do nıvel de interesse num sistema,possibilita uma representacao mais precisa das preferencias dos utilizadores.Em sistemas em que existe a possibilidade do utilizador fazer zapping,4 como acontece na televisao ena radio, irao existir muitos conteudos cujo nıvel de interesse associado sera baixo e, consequentemente,pouco informativo. E aconselhavel, portanto, inserir nestes sistemas um limite mınimo de tempo, em queapenas serao registados como conteudos consumidos pelo utilizador aqueles cujo consumo ultrapasse esse

4Zapping consiste em alternar entre varios conteudos num curto espaco de tempo, sem dedicar especial atencaoa qualquer um deles

15

Page 36: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

limite temporal [27].

As formas de enderecamento de publicidade que normalmente exploram os dados relacionados com oconsumo de conteudos sao o enderecamento ao lar [5], o enderecamento comportamental [24], o en-derecamento a estereotipos [3, 16, 15] e o enderecamento colaborativo [15].

4. Conteudos nao consumidos Os conteudos que nao sao consumidos podem tambem ser utilizadospara derivar as preferencias do utilizador. Com efeito, se dois conteudos c1 e c2 estao a ser transmitidosem simultaneo, e se o utilizador escolhe consumir, por exemplo, c1, esta escolha indica que o utilizadorprefere c1 em prejuızo de c2. Esta observacao obvia pode conduzir a dois tipos de registos de dados: porum lado, e registado que o utilizador consumiu c1 e daı decorre que o conteudo c1 e do seu agrado; poroutro lado, e registado que o utilizador preferiu consumir outro conteudo que nao c2, e daı decorre queo conteudo c2 nao e do seu agrado. O registo dos conteudos que o utilizador nao consumiu revelam-se,assim, uteis no apuramento das preferencias dos utilizadores, pois identificam conteudos (ou categoriasde conteudos) que nao sao do interesse do utilizador [19].

Contudo, a utilizacao desta fonte de dados e perigosa. Apesar da ideia ser inovadora e interessante,apresenta varios problemas de difıcil resolucao. Um deles consiste na escolha dos conteudos que saopreteridos. Tomando o exemplo da televisao, tendo em conta as centenas de canais que sao disponibili-zados, ao estarmos a assistir a um programa, estamos tambem a preterir centenas de outros. Porem, eincomportavel considerar centenas de programas preteridos por cada programa que o utilizador assiste.Como tal, e necessario escolher apenas alguns programas preteridos para serem registados. Uma formade o fazer, sem intervencao do utilizador, e escolher aleatoriamente uma pequena amostra de programaspreteridos. Porem, a escolha desta amostra de programas preteridos, ao ser feita de forma aleatoria,tem o inconveniente de os programas contidos nessa amostra poderem ser quase tao interessantes parao utilizador quanto o programa que este esta a assistir nesse momento. Por conseguinte, programas quenao eram de todo do interesse do utilizador nao se encontram nessa amostra. Tal implicara duas falhasno sistema: a primeira consiste no sistema considerar como programas desinteressantes para o utilizadorprogramas que, na realidade, ate tem um relativo interesse para este; a segunda consiste no sistema naoconsiderar como programas desinteressantes para o utilizador programas que, na realidade, o sao.O problema analisado adquire ainda maior relevancia pois o utilizador pode nem ter consciencia de outrosprogramas que estejam a ser transmitidos simultaneamente, dado o elevado numero de canais actualmenteoferecidos pelas operadoras televisivas. Assim, pode existir um programa p1 que o utilizador consideremuito interessante, contudo, ao nao saber que p1 esta a ser transmitido, escolhe assistir a outro programap2, que apenas lhe suscita um interesse relativo. Com algum azar, ao escolhermos aleatoriamente umaamostra dos programas preteridos, o programa p1 estara contido nessa amostra, o que agravaria as falhasexpostas atras.

As formas de enderecamento de publicidade que podem extrair informacao dos dados relacionados comconteudos que nao sao consumidos pelos utilizadores sao as mesmas formas de enderecamento que extraeminformacao dos dados relacionados com conteudos que sao consumidos pelos utilizadores: enderecamentoao lar, enderecamento comportamental, enderecamento a estereotipos e enderecamento colaborativo.

5. Interaccao com anuncios Num sistema que suporte iTV e possıvel que os utilizadores intera-jam com os anuncios que lhes sao apresentados podendo, por exemplo, pedir mais informacoes acerca doproduto que esta a ser publicitado. Um utilizador, ao interagir com um anuncio interactivo, revela alguminteresse no produto publicitado. Como tal, os dados relativos a estas interaccoes podem ser registados

16

Page 37: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

para serem utilizados na construcao de perfis dos utilizadores, ja que estes sao informativos de algumasdas preferencias dos utilizadores [3, 16, 15].As formas de enderecamento que, na literatura, exploram os dados relativos as interaccoes dos utilizado-res com os anuncios, sao o enderecamento a estereotipos [3, 16] e o enderecamento colaborativo [15].

6. Horarios de visualizacao O horario a que um dado utilizador consome conteudos pode ajudarna caracterizacao do mesmo, ou seja, na construcao do seu perfil. Por exemplo, se um utilizador ve habi-tualmente televisao entre as 10 horas da noite e as 3 horas da madrugada, provavelmente esse utilizador eum adulto que e estudante (com aulas da parte da tarde) ou esta desempregado. Neste exemplo, criou-seuma relacao entre um determinado comportamento e uma classe de pessoas, atraves de um estereotipo.Como tal, a forma de enderecamento mais adequada para extrair informacao dos dados relativos aohorario em que os utilizadores consomem conteudos e o enderecamento a estereotipos. Contudo, o en-derecamento colaborativo tambem pode explorar esta fonte de dados.

2.5 Identificacao de Utilizadores

Dado que os televisores sao dispositivos multi-utilizador, no sentido em que podem ser utilizados porvarias pessoas de forma simultanea, e necessario identificar quem se encontra a frente do televisor porduas razoes: por um lado, para ser possıvel apresentar publicidade direccionada a esse(s) utilizador(es);por outro lado, para ser possıvel associar dados individualmente a cada utilizador, quando e feito umregisto destes dados de forma automatica (registos esses que sao posteriormente utilizados para a cons-trucao de perfis). Se nao considerassemos a hipotese do consumo televisivo ser feito em grupo, ocorreriamsituacoes em que um perfil de utilizador representaria varios utilizadores, o que poderia implicar que esseperfil fosse inconsistente ou pouco informativo (por exemplo, um perfil de utilizador construıdo a partirde registos de visualizacoes de desenhos animados e debates polıticos). Alem disso, nesta situacao, seriamuito mais difıcil direccionar os anuncios para os diferentes utilizadores pois nao se saberia quem estava,realmente, a ver televisao, nem tao pouco os seus dados individuais, visto que os dados de todos osutilizadores de um televisor eram agregados no mesmo perfil.

A identificacao de utilizadores pode ser feita explıcita ou implicitamente.

A identificacao explıcita de utilizadores, na sua forma mais basica, consiste na identificacao voluntariapor parte destes. A identificacao explıcita pode, ainda, ser levada a cabo pedindo ao(s) utilizador(es),periodicamente e atraves de uma interface grafica apresentada no televisor, a identificacao de todos osutilizadores que se encontram, actualmente, a ver televisao [3, 16]. Esta forma de identificacao de utili-zadores piora de forma significativa a experiencia do utilizador, dado que a actividade de ver televisao einterrompida, de tempos a tempos, para que se proceda a identificacao de utilizadores.

A identificacao implıcita de utilizadores pode ser efectuada de duas formas:

1. Analisando o horario em que o utilizador ve televisao;

2. Analisando os canais visualizados pelo utilizador.

Para se poder efectuar uma identificacao automatica de utilizadores com base no horario em que estesveem, habitualmente, televisao, o sistema tem que saber de antemao qual e a probabilidade de um dadoutilizador estar a ver televisao a uma determinada hora. Essa informacao pode ser pedida ao utilizador,

17

Page 38: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

atraves de uma interface grafica, na primeira vez em que este utiliza o sistema [9].Sempre que alguem liga o televisor, o sistema tem de calcular a probabilidade de cada membro da famıliaestar a ver televisao a essa hora. Se existir um membro cuja probabilidade de estar a ver televisao aessa hora seja muito superior a probabilidade dos restantes, entao o sistema conclui que esse utilizadoresta a ver televisao sozinho. Se dois ou mais utilizadores tiverem probabilidades altas de estarem a vertelevisao a essa hora, entao o sistema conclui que esses utilizadores estao a ver televisao em conjunto.Sabendo quais os utilizadores que se encontram actualmente a ver televisao, o sistema pode apresentarpublicidade direccionada a esses utilizadores, conforme informacao contida nos perfis correspondentes.Testes demonstraram que a identificacao implıcita de utilizadores, com base nos horarios de visualizacaode conteudos, e apenas ligeiramente menos eficaz que um metodo de identificacao explıcita [9]. Apesardeste tipo de identificacao implıcita de utilizadores ser menos intrusiva que uma identificacao explıcita,esta requer, ainda assim, que os utilizadores, ao usarem o sistema pela primeira vez, identifiquem as horasa que habitualmente veem televisao, o que implica algum esforco por parte destes.

A identificacao implıcita de utilizadores tambem pode ser realizada atraves da analise dos canais visuali-zados pelos utilizadores [23]. Uma forma de identificar os utilizadores atraves dos canais que visualizam,passa por construir um grafo dirigido acıclico, que representa o comportamento do utilizador. Cadavertice do grafo corresponde a um canal visionado pelo utilizador, sendo que e anotada a hora a que outilizador comeca a ver cada canal. Desta forma, e possıvel ligar e ordenar temporalmente os vertices dografo. Dependendo do tempo que cada utilizador despende em cada canal, e possıvel inferir se gostou,nao gostou ou ignorou o seu conteudo. A meta-informacao associada aos canais — tipicamente o seugenero — permite associar estes comportamentos a perfis de utilizadores existentes no sistema [23].Infelizmente, o algoritmo apresentado nao foi sujeito a uma avaliacao experimental, pelo que, apesar daideia subjacente ser bastante interessante, nao podemos afirmar com certeza se o mesmo cumpre, ounao, o seu objectivo. Alem disso, e questionavel a eficacia do algoritmo se considerarmos que dois oumais utilizadores estao a ver televisao em grupo. Em tal situacao, o comportamento apresentado nanavegacao entre canais poderia nao coincidir com nenhum dos perfis existentes no sistema, pelo que naoseria possıvel identificar os utilizadores que se encontravam a ver televisao.

2.6 Relatorios

Um sistema que direccione a publicidade televisiva consoante as preferencias ou caracterısticas dos seusutilizadores, pode produzir relatorios com informacao como:

1. A que tipo de pessoa foi apresentado um anuncio;

2. Qual a percentagem do anuncio que foi visualizada;

3. A que horas foi apresentado o anuncio;

4. A que conteudos assistiu essa pessoa.

Embora a producao deste tipo de relatorios seja prescindıvel na construcao de um sistema destes, estapode revelar-se bastante util. Com efeito, podem ser aplicadas tecnicas de data mining5 a estes relatorios,tentando perceber melhor que tipo de anuncios sao do interesse de um determinado conjunto de utilizado-res. Estes relatorios podem, tambem, ser utilizados para uma medicao precisa de audiencias de programastelevisivos e, tambem, de anuncios. Atraves desta informacao e possıvel mostrar aos anunciantes a ver-dadeira eficacia de anuncios direccionados aos utilizadores e, com isso, negociar espacos publicitarios a

5Data mining e um processo de extraccao de padroes invisıveis a partir de um conjunto de dados.

18

Page 39: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

precos mais altos [5].A producao de relatorios e um modulo fulcral em alguns sistemas que direccionam publicidade televisiva[5, 3, 16].

2.7 Solucoes existentes

A nıvel academico encontramos apenas dois sistemas que suportam o direccionamento de publicidadetelevisiva: o iMedia [3, 16] e outro sistema, que, a falta de nome, chamar-lhe-emos Sistema T para faci-lidade de leitura [24].

No iMedia, a insercao dinamica de anuncios e feita de forma local, ou seja, na STB. O escalonamentodos anuncios e feito de forma centralizada, pelos canais de televisao, sendo que os anuncios direccionadossao inseridos “por cima” dos anuncios emitidos pelo canal de televisao. De resto, este escalonamentoesta detalhado no final da Seccao 2.2. Neste sistema, os utilizadores sao classificados e agrupados em es-tereotipos. Esta classificacao e feita com recurso a tecnicas de aprendizagem nao-supervisionada. Comotal, existe uma percentagem de utilizadores que fornecem dados pessoais e cujos consumos televisivossao monitorizados, sendo que, a partir desses dados, sao extraıdas regras para classificar os restantesutilizadores. No iMedia, os perfis sao construıdos automaticamente, utilizando como fonte de dados osconsumos televisivos dos utilizadores. E com base nestes consumos que os utilizadores sao classificadosem diferentes estereotipos. A identificacao de utilizadores e feita de forma explıcita, atraves de umainterface que e apresentada a intervalos regulares no televisor. Neste sistema, esta tambem contempladoo envio de dados relativos a consumos televisivos e a interaccoes com anuncios para o servidor, caso outilizador o tenha autorizado, com o objectivo de serem produzidos relatorios.

No Sistema T, a insercao dinamica de anuncios tambem e feita localmente na STB. O escalonamentode anuncios nao e explicitado, pelo que nos parece que este sistema apresenta uma lacuna neste ponto.Os anuncios sao direccionados com base num enderecamento comportamental. Os perfis sao construıdosde forma automatica, utilizando como fontes de dados conteudos consumidos, horarios de visualizacaoe intencoes de compra (este sistema regista as interaccoes dos utilizadores com anuncios interactivos).A identificacao dos utilizadores e feita de forma implıcita, com base nos horarios de visualizacao e noscanais visualizados. Neste sistema nao esta contemplada a producao de relatorios.

iMedia Sistema T

Insercao Dinamica de Anuncios Local (STB) Local (STB)

Escalonamento de Anuncios Centralizado e estatico Nao definido

Forma de Enderecamento Estereotipos Comportamental

Perfis de Utilizadores Automaticos Automaticos

Identificacao de Utilizadores Explıcita Implıcita

Relatorios Sim Nao

Tabela 2.1: Comparacao entre o sistema iMedia e o Sistema T

No campo das solucoes comerciais, existem, pelo menos, tres solucoes para o direccionamento de publi-

19

Page 40: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

cidade televisiva:

1. OpenTV R©6 SpotOn R©;

2. Invidi7 AdvatarTM;

3. VisibleWorld R©8 intelliSpot R©.

Apesar de existir pouca documentacao tecnica sobre estas solucoes comerciais, procedemos a uma analisegenerica que se encontra detalhada de seguida. Contudo, em relacao a solucao da OpenTv R©, o SpotOn R©,as informacoes oficiais sao tao parcas que se tornou inviavel proceder a qualquer analise.

O AdvatarTM da Invidi utiliza dados demograficos como um dos criterios para direccionar os anunciostelevisivos. Tal e explicitado num press release da empresa, que da conta de um acordo celebrado com aNielsen,9 anunciando uma parceria entre estas duas empresas [13].O AdvatarTM permite que, num mesmo slot publicitario, um anunciante disponibilize varias versoes domesmo anuncio, ou que varios anunciantes disponibilizem diferentes anuncios. Este sistema reclamater uma caracterıstica unica: a possibilidade de agregar audiencias dispersas por varios canais. Estacaracterıstica permite que sejam apresentados anuncios em canais que nao vendem publicidade devidoas baixas audiencias; ou seja, esta solucao permite obter lucro monetario a partir de todos os canaistelevisivos, mesmo que se encontrem na long tail [1].No AdvatarTM os utilizadores sao classificados segundo quatro criterios: sexo, idade, rendimentos e lo-calizacao geografica. O sexo e a idade sao inferidos a partir dos consumos televisivos. Os rendimentossao apurados atraves dos dados recolhidos no census norte-americano, sendo que existe informacao querelaciona um dado codigo postal a um rendimento medio. A localizacao geografica e obtida atraves doendereco IP da STB, recorrendo a infra-estrutura do operador televisivo.Este sistema insere os anuncios localmente nas STBs, utilizando nesse processo tecnologia proprietariaque visa acelerar a comutacao entre streams, para que a interrupcao de sinal seja quase imperceptıvel —tal como acontece actualmente na publicidade televisiva tradicional.O AdvatarTM contempla ainda a producao de relatorios sobre as campanhas publicitarias que transmite.

A suite de servicos intelliSpot R© da VisibleWorld R© contempla uma forma alternativa de direcciona-mento de anuncios. Em vez de o anunciante inserir no sistema varias versoes de um anuncio, esta suitepermite que sejam feitas alteracoes rapidas e eficientes a um anuncio que ja se encontre em producao.Por exemplo, imaginemos que um anunciante cria um anuncio para um festival de verao de tres dias, eque esse anuncio sera transmitido na televisao durante os tres dias do festival. Apesar de ser sempre omesmo anuncio base a ser exibido, a suite intelliSpot R© permite que sejam feitas alteracoes ao texto doanuncio, para que esse anuncie, em cada um dos tres dias do festival, o cabeca-de-cartaz correspondente.Estas alteracoes aos anuncios podem ser baseadas em regras, o que permite, por exemplo, que marcas deambito nacional e presenca local possam informar os telespectadores da sua proximidade. Assim, e ape-nas a tıtulo de exemplo, os anuncios de filmes poderiam substituir a impessoal (e tradicional) assinaturafinal “num cinema perto de si”, passando a indicar, de facto, quais os cinemas perto do telespectador queestao a exibir o filme anunciado.Embora a solucao adoptada pelo intelliSpot R© pareca interessante, esta suite tem algumas limitacoes noque toca ao direccionamento efectivo de anuncios. Uma dessas limitacoes e nao ser possıvel apresentar,

6http://www.opentv.com/7http://www.invidi.com/8http://www.visibleworld.com/9http://www.nielsen.com/

20

Page 41: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

no mesmo slot publicitario, versoes de um mesmo anuncio que variem segundo as caracterısticas do te-lespectador. Como tal, esta suite sera melhor classificada como um sistema que permite a personalizacaorapida de anuncios em producao, mas que, na realidade, nao faz o seu direccionamento, visto que naoutiliza qualquer forma de enderecamento.

Embora nao se possa considerar de todo um servico de direccionamento de publicidade televisiva, cremosser importante analisar, tambem, o servico GoogleTM TV Ads, a fim de esclarecer eventuais duvidassobre o mesmo.O servico GoogleTM TV Ads e uma extensao a plataforma GoogleTM AdWords, sendo, como o nomeindica, utilizado para transmitir anuncios televisivos. Atraves do GoogleTM TV Ads e possıvel os anun-ciantes criarem campanhas publicitarias em varios canais televisivos, definindo a partida quanto queremgastar. Para tal, os anunciantes, depois de criarem e submeterem um anuncio no sistema, seleccionamos canais, programas e horarios em que desejam que esse anuncio seja apresentado. Adicionalmente,o GoogleTM TV Ads pode sugerir ao anunciante, mediante a indicacao de algumas caracterısticas dopublico-alvo, canais e programas cuja audiencia comporte, com uma certa probabilidade, telespectadoresincluıdos nesse publico-alvo.O escalonamento e seleccao dos anuncios a passar em cada intervalo publicitario sao executados uma vezpor dia — no GoogleTM AdWords, por exemplo, a seleccao de um anuncio e feita em tempo real —,baseando-se num modelo de leiloes. Assim sendo, e mimetizando o que acontece nos leiloes, se existiremdois anuncios a concorrerem para o mesmo espaco publicitario, e apresentado aquele cujo anuncianteestiver disposto a pagar mais. Depois de um anuncio ser apresentado, sao disponibilizadas informacoesao anunciante indicando o canal, programa e data em que essa apresentacao ocorreu.

Depois desta breve analise, torna-se evidente que o GoogleTM TV Ads nao compreende qualquer funcio-nalidade de direccionamento de publicidade. Alias, este servico apenas permite agilizar a comercializacaode publicidade televisiva, atraves da automatizacao de algumas partes do processo negocial, que, de resto,e igual ao que e praticado actualmente.

Na Tabela 2.2 apresentamos uma comparacao entre as diversas solucoes comerciais apresentadas, comexcepcao do SpotOn R© da OpenTV R© devido a inexistencia de informacoes suficientes.

AdvatarTM intelliSpot R© Google TV Ads

Insercao Dinamica de Anuncios Local (STB) Remota Remota

Escalonamento de Anuncios Nao definido Estatico Estatico

Forma de Enderecamento Estereotipos Geografico Inexistente

Perfis de Utilizadores Automaticos Inexistentes Inexistentes

Identificacao de Utilizadores Nao definida Inexistente Inexistente

Relatorios Sim Sim Sim

Tabela 2.2: Comparacao entre 3 solucoes comerciais para o direccionamento de publicidade televisiva

Concluımos, assim, que o AdvatarTM e a unica solucao comercial analisada que permite, efectivamente,direccionar publicidade televisiva com base nas caracterısticas dos utilizadores. A suite intelliSpot R©,apesar de levar em conta a localizacao geografica dos utilizadores, nao efectua um direccionamento dapublicidade. Com efeito, esta suite altera o conteudo dos anuncios conforme a localizacao do lar onde

21

Page 42: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

os anuncios sao entregues, nao podendo ser considerada assim como uma solucao que direccione, verda-deiramente, publicidade televisiva. O servico GoogleTM TV Ads, como foi mencionado acima, permiteuma agilizacao e automatizacao do processo de compra e venda de espaco publicitario na televisao. Esteservico nao permite, de modo algum, o direccionamento de publicidade.

22

Page 43: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Capıtulo 3

Arquitectura

Neste capıtulo e analisada a arquitectura do sistema desenvolvido, o TargetAd. Comecamos por listaros seus requisitos funcionais e nao-funcionais. De seguida, e feita uma analise global da arquitectura.Esta analise e detalhada posteriormente, sendo explicitada a forma como o TargetAd se encaixa nos seiscriterios que definem um sistema para direccionamento de publicidade televisiva, criterios esses apre-sentados e utilizados no Capıtulo 2. No final deste capıtulo e abordado um tema incontornavel nodesenvolvimento de um sistema deste tipo: a privacidade. Aı se descreve de que forma o TargetAdgarante a privacidade dos seus utilizadores.

3.1 Requisitos funcionais e nao-funcionais

Os requisitos funcionais tidos em conta no desenvolvimento do TargetAd foram os seguintes:

1. Os anunciantes devem poder carregar directamente para o sistema os seus anuncios, bem como adefinicao do respectivo publico-alvo;

2. Os anuncios televisivos devem ser apresentados ao publico-alvo definido, tendo como base os perfisindividuais dos utilizadores;

3. O TargetAd deve fazer um escalonamento de anuncios que seja correcto e justo, garantindo quetodos os anuncios tem sensivelmente as mesmas hipoteses de serem apresentados;

4. Os utilizadores do sistema devem poder identificar-se explicitamente, contudo, caso nao o facam, oTargetAd deve tentar identificar implicitamente quem se encontra a ver televisao;

5. O sistema deve contemplar a producao de relatorios que atestem a eficacia do direccionamento depublicidade.

Relativamente a requisitos nao-funcionais, foram considerados os seguintes:

1. O TargetAd deve ser o menos intrusivo possıvel, visto que a experiencia de ver televisao e tipicamenteuma experiencia relaxante e que exige pouco esforco;

2. Os canais televisivos que desejem continuar a transmitir publicidade nos moldes tradicionais devempoder faze-lo. Como tal, o TargetAd apenas pode transmitir publicidade direccionada em canaisque o tenham previamente autorizado;

3. O sistema nao deve interferir na transmissao de conteudos televisivos, nem tao pouco deteriorar asua qualidade;

23

Page 44: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

4. O TargetAd deve ser eficiente na insercao dos anuncios direccionados, para que a execucao desteprocesso nao implique interrupcoes na emissao de conteudos, perceptıveis pelos telespectadores;

5. O sistema deve ser escalavel de modo a que a sua performance global nao seja influenciada pelonumero de clientes do operador de televisao — numero esse que se deseja ser tao elevado quantopossıvel;

6. A privacidade dos utilizadores deve ser sempre respeitada, seguindo as disposicoes da Lei de Pro-teccao de Dados (Lei n.o 67/98).

3.2 Visao geral da Arquitectura

O TargetAd e um sistema distribuıdo, com um modulo instalado no lado do cliente, nomeadamente nasSTBs dos clientes da operadora de televisao, e varios modulos instalados no servidor.

TargetAd Client

CSCF

DNS ServerHSS

TargetAd SIP

Server

TargetAd TV

Server

Canal de TV 1

<<RTP>>

<<RTP>>

<<SIP>>

<<SIP>>

<<RTP>>

<<UDP>>

<<Diameter>>

Canal de TV N

Legenda:

Módulos do sistema Módulos da arquitectura IMS Entidades externas ao sistema

Servidor Aplicacional Fluxo de Dados

Set-Top Box

Servidor

Entidades Físicas

Servidor HTTP

Vídeos<<HTTP>>TargetAd

Loader Server

Anúncios

<<HTTP>>

<<HTTP>>

Anunciantes

TargetAd

Loader Client

<<HTTP>>

Internet

Base de dados

Anúncios

<<TCP>>

Figura 3.1: Arquitectura do TargetAd

A arquitectura do TargetAd foi desenhada com base na solucao arquitectural IP Multimedia Subsystem(IMS ). O IMS e visto como uma solucao promissora para facilitar o fornecimento de servicos multimediasobre o protocolo IP, como tambem no suporte da interoperabilidade e convergencia de diferentes tiposde redes [2]. O IMS e agnostico em relacao ao tipo de acesso, seja ele feito atraves de um terminal fixoou wireless. Assim, o IMS facilita a criacao de servicos que tanto podem ser usados a partir de uma STBcomo de um telemovel, criando, desta forma, um ambiente de convergencia fixo-movel. Alem disso, aoserem integrados dentro da mesma arquitectura varios tipos de servicos (voz, televisao, internet, etc.), epossıvel criar interaccoes entre os diversos servicos — por exemplo, alterar o canal de televisao atraves

24

Page 45: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

do telemovel.A integracao do IMS no desenho do TargetAd tem dois objectivos fundamentais:

1. Aproximar o sistema de uma solucao comercial, que possa ser colocada em producao com alteracoesarquitecturais mınimas;

2. Dotar o sistema com tecnologia que permita que lhe sejam adicionadas extensoes e novas funciona-lidades no futuro.

Como se pode ver na Figura 3.1, o IMS esta inserido no TargetAd atraves dos tres seguintes modulos:

1. Home Subscriber Server (HSS): modulo onde estao armazenadas todas as informacoes relativasaos clientes e aos servicos por eles subscritos;

2. Control Sequence Call Function (CSCF): modulo que constitui o ponto de contacto entre asaplicacoes cliente e a rede IMS, sendo sua responsabilidade fazer o controlo de sessoes;

3. Domain Name Server (DNS): servidor que contem as tabelas de traducao entre enderecosalfanumericos e enderecos IP.

Figura 3.2: Exemplo de interaccao entre o cliente e o servidor, utilizando o protocolo SIP

25

Page 46: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

O cliente, no caso o modulo TargetAd Client, comunica com o servidor atraves do protocolo Session Initia-tion Protocol (SIP). Os pedidos SIP enviados pelo cliente passam, primeiro, por uma camada de controlode acessos implementada pelos modulos IMS, e sao entregues, posteriormente, ao modulo TargetAd SIPServer, que se encontra em execucao no servidor aplicacional. Este modulo envia uma resposta parao cliente atraves do mesmo protocolo, sendo que, dependendo do pedido feito, podera ser estabelecidauma ligacao directa entre o cliente e este modulo atraves de outros protocolos, nomeadamente Real-timeTransport Protocol (RTP) ou Hypertext Transfer Protocol (HTTP). Na Figura 3.2 encontra-se um exem-plo de uma interaccao utilizando o protocolo SIP, entre o cliente e o servidor. Nesta interaccao, o clientecomeca por registar-se com o modulo CSCF. De seguida, o cliente subscreve um servico, no caso o servicodisponibilizado pelo modulo TargetAd SIP Server, atraves de uma mensagem com o codigo INVITE.O CSCF reencaminha a mensagem para o TargetAd SIP Server. Apos a subscricao ter sido efectuadacom sucesso, inicia-se uma troca de mensagens entre o cliente (TargetAd Client) e o servidor (TargetAdSIP Server), mensagens essas que contem dados relativos a operacao do TargetAd. Estas mensagens po-dem conter dados como meta-informacao sobre os anuncios, a localizacao do ficheiro de EPG, entre outros.

Os conteudos televisivos sao transmitidos pelos canais (entidades externas ao sistema) para o TargetAdatraves do protocolo RTP. O modulo TargetAd TV Server e responsavel por redireccionar e transmitirestes dados audio e vıdeo para a rede gerida pela operadora de televisao, sendo que o streaming para osclientes e feito mais uma vez utilizando o protocolo RTP.

3.3 Visao detalhada da Arquitectura

Nesta seccao explicitamos de que forma o TargetAd se define segundo os seis criterios apresentados noCapıtulo 2, Trabalho Relacionado, que aqui relembramos:

1. De que forma sao inseridos dinamicamente os anuncios;

2. Como se processa o escalonamento dos anuncios;

3. Qual e a forma de enderecamento de publicidade utilizada;

4. Como sao definidos e construıdos os perfis de utilizadores;

5. De que forma sao identificados os utilizadores;

6. E, por ultimo, que dados contem os relatorios relativos aos anuncios apresentados.

3.3.1 Insercao Dinamica de Anuncios

A insercao dinamica de anuncios e feita de forma local, na STB do cliente. Antes desse processo ser deta-lhado, e necessario explicar o processo de carregamento de um anuncio para o sistema e, posteriormente,para a STB.

Carregamento de Anuncios para o sistema

O TargetAd permite que os anunciantes carreguem directamente para o sistema os seus anuncios. Dadoque esta comunicacao e feita atraves da internet, e necessario que as mensagens sejam assinadas digi-talmente, a fim de se provarem autenticas, ıntegras e nao poderem ser repudiadas. Como tal, para queum anunciante possa ser registado no TargetAd, e necessario gerar um par de chaves de criptografia as-simetrica, sendo que a chave publica fica associada ao anunciante no sistema, e a chave privada fica como anunciante. E, tambem, necessario que o anunciante disponha de um servidor web, onde os ficheiros de

26

Page 47: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

vıdeo correspondentes aos seus anuncios estejam alojados e possam ser descarregados por HTTP, comose pode ver na Figura 3.1.

No servidor do TargetAd, nomeadamente no modulo TargetAd Loader Server, encontra-se implemen-tado um web service que permite, entao, que sejam inseridos anuncios no sistema. Este web servicepode ser consumido pelos anunciantes, atraves de uma aplicacao que lhes e fornecida, representada naFigura 3.1 pelo modulo TargetAd Loader Client. A chave privada do anunciante deve ser fornecida a estaaplicacao atraves de um ficheiro de configuracao.

Atraves desta aplicacao e, entao, possıvel que os anunciantes insiram no sistema os seus anuncios. Parainserir um anuncio, um anunciante tem que inserir os seguintes dados:

1. O nome do anuncio;

2. O sexo do publico-alvo;

3. O intervalo de idades do publico-alvo;

4. A duracao, em segundos, do anuncio;

5. A data de validade do anuncio;

6. O numero maximo de apresentacoes do anuncio num lar;

7. O Uniform Resource Locator (URL) do ficheiro de vıdeo correspondente ao anuncio, bem como umcodigo de verificacao de integridade;

8. E os canais onde esse anuncio pode ser apresentado.

Estes dados comporao a principal estrutura de dados do sistema: o anuncio. De seguida, analisamosalguns destes dados em detalhe, explicando a sua utilidade no funcionamento global do sistema.

O intervalo de idades do publico-alvo e definido recorrendo a taxonomia TV-Anytime [25]. Nesta ta-xonomia sao definidos varios grupos etarios, de amplitude variavel, sendo que os agrupamentos de idadesreflectem, de certo modo, uma homogeneidade de preferencias. A utilizacao desta taxonomia pretendefacilitar a tarefa de identificacao do intervalo de idades do publico-alvo aos anunciantes, incentivando-osa usar grupos etarios standard.

A data de validade do anuncio e utilizada para impedir que o anuncio seja apresentado apos essa data.Desta forma e possıvel automatizar a tarefa de remocao dos anuncios do sistema, sem que haja espacopara a falha humana, inevitavel em todas as tarefas manuais. Os anunciantes tem, assim, a possibilidadede definir limites temporais exactos para as suas campanhas publicitarias, com uma precisao de segundos,embora seja expectavel que a precisao horaria seja de maior utilidade, na pratica.

O numero maximo de apresentacoes de um anuncio num lar pode parecer, a primeira vista, um parametrosuperfluo mas e, na verdade, essencial dado o modelo de negocio inerente ao TargetAd. Uma das principaisvantagens do TargetAd, face a publicidade televisiva tradicional, e dotar os anunciantes com a capacidadede pagar individualmente por cada anuncio que e, efectivamente, apresentado a um indivıduo. Para queos anunciantes possam controlar, a partida, os seus orcamentos e definirem um valor maximo para cadacampanha, e necessario que se possa definir um limite maximo para as apresentacoes de um anuncio,sob pena de ocorrerem casos em que o valor a cobrar ao anunciante e muito superior aquele que este

27

Page 48: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

pretendia investir em publicidade.

Ao inserirem um anuncio no TargetAd, os anunciantes devem indicar o URL do ficheiro de vıdeo doanuncio. Uma vez inserido o anuncio no sistema, o TargetAd tratara de fazer o download do ficheiro devıdeo. Uma vez replicado localmente no servidor, e executada uma verificacao da integridade do ficheirode vıdeo, utilizando o codigo inserido pelo anunciante.

E possıvel, tambem, restringir a apresentacao de um anuncio a um ou mais canais. Para tal, os anun-ciantes devem definir em que canais pode ser apresentado o anuncio em questao. Caso esta informacaonao seja fornecida, e assumido que o anuncio pode ser apresentado em qualquer canal.A possibilidade de aplicar tais restricoes tem como objectivo incentivar uma mudanca progressiva naspraticas negociais da publicidade televisiva. Estas praticas encontram-se muito enraizadas, pelo que umamudanca disruptiva nas mesmas seria algo indesejavel e, presumivelmente, improvavel. No modelo denegocio proposto pelo TargetAd, a publicidade televisiva deixaria de ser comprada aos canais televisivos,passando a ser comprada aos operadores. Tal implica que sejam negociados acordos para que os canaistelevisivos possam lucrar, tambem, com esta mudanca de paradigma negocial. No ambito desta mudanca,e crıvel que alguns canais televisivos continuem dispostos a manter activos os seus departamentos comer-ciais, alterando apenas a forma como os anuncios sao distribuıdos e apresentados, ou seja, inserindo osanuncios no TargetAd para que o sistema os apresente aos utilizadores. Para estes casos, e necessario queos anuncios introduzidos no TargetAd por um departamento comercial de um canal de televisao sejamapenas apresentados a um utilizador caso este esteja a ver esse canal.

Carregamento de Anuncios para o cliente

Para que seja possıvel inserir localmente, na STB, os anuncios, estes tem que se encontrar replicados nocliente.

Quando o modulo TargetAd Client e iniciado, e construıdo um pedido SIP, que contem a idade e osexo de todos os utilizadores da STB. O modulo TargetAd SIP Server ao receber este pedido, envia parao cliente, atraves de uma ligacao Transmission Control Protocol (TCP), uma representacao codificada emtexto da meta-informacao correspondente aos anuncios elegıveis para serem apresentados aos utilizadoresdaquela STB. A aplicacao cliente, ao receber estas meta-informacoes, opta por uma de duas estrategias,dependendo da largura de banda disponıvel:

1. Se nao se estiver a ver televisao nessa STB, o TargetAd Client aproveita essa largura de banda quenao esta a ser utilizada para descarregar, um por um, os anuncios que recebeu do servidor;

2. Se se estiver a ver televisao nessa STB, o download dos anuncios e adiado ate que se pare de vertelevisao, e esteja disponıvel a largura de banda correspondente.

Este processo e repetido de 12 em 12 horas, para que anuncios que tenham sido entretanto carregadosno sistema pelos anunciantes, possam ser copiados para a STB. Neste processo sao tambem removidosda STB os anuncios cujo prazo de validade tenha sido ultrapassado.

Monitorizacao de Intervalos Publicitarios

Para que os anuncios possam ser inseridos dinamicamente na stream de dados e necessario que se identi-fique o inıcio (e fim) dos intervalos publicitarios. Os intervalos publicitarios sao identificados atraves depacotes User Datagram Protocol (UDP) cujo payload contem um codigo com informacao sobre o intervalo,nomeadamente um numero identificador do intervalo e a duracao, em segundos, ate ao final do intervalo

28

Page 49: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

TargetAdBreak Identificador D Duração SECONDS

26 bytes 4 bytes 1 byte 4 bytes 14 bytes

Legenda:

Dados constantes Dados variáveis

49 bytes

Figura 3.3: Payload dos pacotes UDP utilizados para assinalar intervalos publicitarios

(ver Figura 3.3). Quando e iniciado um intervalo publicitario, e da responsabilidade do canal de televisaoque emite os conteudos, enviar estes pacotes a cada segundo ate ao final do intervalo. Assim, mesmo queo utilizador mude para um canal que esteja a meio de um intervalo dedicado a publicidade direccionada,o TargetAd, ao saber quantos segundos faltam ate ao final do intervalo, pode ainda apresentar anunciosdireccionados ao utilizador.O facto de serem os canais a definirem o inıcio e fim dos intervalos para apresentar publicidade direccio-nada confere uma grande flexibilidade ao sistema e apresenta varias possibilidades:

1. Para efeitos de teste, e possıvel limitar a apresentacao de publicidade direccionada a um determinadoperıodo do dia, sendo que fora desse perıodo nao sao transmitidos quaisquer pacotes que identifiquemintervalos publicitarios;

2. Em casos em que existam contratos que obriguem a passar certos anuncios imediatamente apos umconteudo televisivo, o canal pode emitir esses anuncios como se fossem conteudos do canal, e soassinalar o comeco de um intervalo destinado a publicidade direccionada depois disso;

3. Os canais podem continuar a negociar espacos publicitarios, reservando apenas uma parte da tota-lidade do intervalo para publicidade direccionada.

No modulo TargetAd Client, a stream de dados, relativa ao canal que esta a ser apresentado no televisor,esta constantemente a ser analisada a procura destes pacotes que identificam intervalos publicitarios.Quando um pacote deste tipo e encontrado, e desencadeado, entao, um processo para seleccionar eapresentar os anuncios direccionados ao(s) utilizador(es), processo esse que sera explicado em detalhe deseguida.

Insercao Dinamica de Anuncios

Para os anuncios serem inseridos e apresentados dinamicamente e necessario, em primeiro lugar, saberquem esta actualmente a ver televisao. A forma como essa informacao e obtida sera explicitada maisa frente, na Seccao 3.3.5, Identificacao de Utilizadores. A identificacao dos utilizadores que estao, numdado momento, a usar o sistema, e utilizada para pre-seleccionar os anuncios que sao dirigidos, a nıvelde idade e sexo, a esses utilizadores.Feita esta pre-seleccao, e necessario seleccionar e escalonar os anuncios a serem apresentados num de-terminado intervalo. Esta seleccao e escalonamento estao detalhados na Seccao 3.3.2, Escalonamento deAnuncios.

Embora nao tenha sido explicitado acima, pode acontecer que o ficheiro de vıdeo correspondente a um

29

Page 50: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

anuncio seleccionado para ser apresentado num dado intervalo publicitario ainda nao se encontre repli-cado localmente na STB, quer por falta de oportunidade para fazer o download, quer por falta de espacoem disco. Para colmatar este problema, foi criado um mecanismo que permite que o modulo TargetAdClient peca ao TargetAd SIP Server uma stream unicast do anuncio em questao. O pedido e enviadoatraves do protocolo SIP, contendo um numero identificador do anuncio. A stream unicast e enviada,mais uma vez, atraves do protocolo RTP, sendo que a sua gestao e delegada ao modulo TargetAd TVServer.

Em suma, o TargetAd suporta insercao dinamica de anuncios na stream de dados localmente, na STB,mas tambem remotamente, nos casos em que o ficheiro de vıdeo nao se encontra replicado no cliente.Contudo, a monitorizacao dos pontos de insercao de publicidade e feita exclusivamente na STB.

3.3.2 Escalonamento de Anuncios

Uma vez identificado o inıcio de um intervalo e pre-seleccionados os anuncios elegıveis a serem apresen-tados ao(s) utilizador(es) activo(s), e necessario seleccionar quais desses anuncios serao, efectivamente,apresentados, bem como definir o seu escalonamento.

A seleccao destes anuncios (e o seu escalonamento) e feita atraves de uma analogia ao Problema daMochila (Knapsack Problem). Segundo esta analogia, a duracao do intervalo representa a capacidadeda mochila, os objectos que se podem colocar na mochila sao os anuncios, sendo que o peso de cadaobjecto e a duracao do anuncio, e o valor do objecto e o numero de segundos que passaram desde aultima visualizacao desse anuncio. Desta forma, e minimizada a diferenca entre a duracao do intervaloe a soma das duracoes dos anuncios apresentados, ao mesmo tempo que se promove a rotatividade dosanuncios, associando um valor mais alto aqueles que foram apresentados ha mais tempo.

No caso especial em que o anuncio e inserido remotamente, ou seja, em que o ficheiro de vıdeo cor-respondente ao anuncio nao se encontra replicado na STB, sao adicionados 2 segundos1 ao peso doanuncio, neste algoritmo. Tal tem como proposito reflectir na seleccao dos anuncios o overhead (a nıvelde processamento e comunicacao) causado por esta solucao.

3.3.3 Forma de Enderecamento

No TargetAd, a publicidade televisiva e enderecada a estereotipos. Os estereotipos sao definidos tendoem conta duas caracterısticas: idade e sexo.

Como veremos mais a frente, na Seccao 3.3.4, Perfis de Utilizadores, as informacoes relativas a idadee ao sexo de cada habitante do lar sao fornecidas quando a STB e instalada. Assim, a associacao en-tre um utilizador e um estereotipo e obvia, nao sendo necessaria a definicao de activadores para este efeito.

Os anunciantes, por sua vez, dirigem os anuncios a um, ou mais, estereotipos. Para que o TargetAdpossa apresentar um anuncio a um determinado estereotipo, isto e, aos utilizadores que compoem esseestereotipo, e necessario apenas que o sistema saiba que esses utilizadores estao a ver televisao. A formacomo esta situacao e identificada esta explicitada na Seccao 3.3.5, Identificacao de Utilizadores.

1Valor observado empiricamente como sendo o mais adequado.

30

Page 51: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

3.3.4 Perfis de Utilizadores

Os perfis de utilizadores sao construıdos manualmente, aquando da instalacao da STB. Quando a STBe ligada pela primeira vez, o TargetAd solicitara ao utilizador, via interface grafica, a idade e o sexo detodos os habitantes do lar (ver Figura 3.4). Desta forma, cada potencial utilizador dessa STB tem umperfil associado, cujas informacoes que contem sao o sexo e a idade do utilizador. Dada a natureza destesdados, os perfis sao imutaveis.

Figura 3.4: Prototipo da interface grafica onde sao criados os perfis de utilizadores

3.3.5 Identificacao de Utilizadores

Como vimos ate aqui, cada STB tem conhecimento dos seus varios utilizadores, nomeadamente ao terum perfil associado a cada um deles com a sua idade e sexo. A identificacao de utilizadores, ou seja,a identificacao de quem esta, num dado momento, a ver televisao, pode ocorrer de forma implıcita ouexplıcita.

Identificacao Implıcita

A identificacao implıcita de utilizadores e desenvolvida sem qualquer intervencao por parte destes. Estaidentificacao recorre a tecnicas de aprendizagem supervisionada para tentar identificar qual e o utiliza-dor, entre os habitantes do lar, que se encontra a ver televisao, com base nos conteudos que estao a servisionados. Esta identificacao, que sera explicada em detalhe de seguida, e possıvel utilizando regras quesao geradas a partir dos conteudos que outros utilizadores veem.

O TargetAd sabe o que esta a ser visualizado, num dado momento numa STB, atraves do EPG. O

31

Page 52: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

TargetAd impoe que, no EPG, a informacao de cada programa inclua a classificacao do mesmo segundotres vectores:

1. Tema: o tema geral do programa. Por exemplo, para um programa de crıtica cinematografica otema e, obviamente, cinema;

2. Formato: o formato do programa. Este pode variar desde concursos com apresentadores ate docu-mentarios;

3. Intencao: a intencao do programa. A intencao de um programa pode ser entreter, informar, educar,entre outras.

Para esta classificacao foi utilizada a taxonomia definida nos esquemas de classificacao de meta-informacaodo forum TV-Anytime [25].

No TargetAd, existe uma pequena amostra de utilizadores que sao monitorizados, de modo a que ostemas, formatos e intencoes dos programas que veem sejam registados nas STBs. Estes dados sao envi-ados, periodicamente, para o servidor, por forma a ser treinado um classificador que, tendo como inputtemas, formatos e intencoes de programas, produza como output o sexo e a idade mais provaveis dealguem que tenha visto conteudos com essas caracterısticas.

Esta amostra de utilizadores monitorizados compreende 10% dos utilizadores do sistema, sendo que edesejavel que estes sejam representativos, a nıvel de idade e sexo, dos restantes 90%. Estes utilizadores,ao serem monitorizados, sao obrigados a identificar-se explicitamente sempre que veem televisao. Emboraseja imprescindıvel para o sistema a existencia de utilizadores monitorizados, estes tem duas desvanta-gens obvias face aos utilizadores nao monitorizados: perda consentida de privacidade e obrigatoriedadede se identificarem explicitamente. Como tal, e aconselhavel que estes desfrutem de algum tipo de com-pensacao, que pode traduzir-se, por exemplo, num desconto na subscricao mensal do servico prestadopelo operador televisivo. Alem disso, estes utilizadores tem que autorizar o registo e tratamento de dadosrelativos aos conteudos televisivos que consomem.

Como referido acima, os temas, formatos e intencoes dos programas consumidos pelos utilizadores moni-torizados sao utilizados para treinar um classificador cujo objectivo e identificar, tanto quanto possıvel,a idade e o sexo de um utilizador segundo, precisamente, os temas, formatos e intencoes dos programasque visualizou. Este classificador e treinado no servidor, sendo que de 12 em 12 horas e actualizado emtodas as STBs, de forma faseada.

Ao longo de uma sessao televisiva, os temas, formatos e intencoes do programas visualizados pelo utili-zador, estao a ser fornecidos ao classificador como input. Com base nestes dados, o classificador produzuma lista de resultados que consistem na probabilidade de, para cada combinacao de idade e sexo, umutilizador com essas caracterısticas ter visualizado o tipo de programas definido no input. O utilizadorque e identificado implicitamente e aquele cuja probabilidade de ter visto este tipo de programas e maior,entre todos os utilizadores existentes na STB.2

Dada a arquitectura para a identificacao implıcita de utilizadores, o classificador pode ser qualquer.Segundo os testes desenvolvidos, e que se encontram detalhados no Capıtulo 4, Implementacao, o classi-ficador Naıve Bayes foi aquele que permitiu obter melhores resultados.

2Como se pode depreender, a identificacao implıcita nao faz sentido em STBs apenas com um utilizador.

32

Page 53: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Identificacao Explıcita

Como referido anteriormente, os utilizadores monitorizados necessitam de se identificar explicitamentecada vez que veem televisao. Tal identificacao e feita atraves de uma interface grafica, sendo que o input efornecido atraves do controlo remoto da STB. Nesta interface grafica, o utilizador apenas tem que activaro seu perfil.

A identificacao explıcita de utilizadores tambem permite colmatar uma lacuna do TargetAd: a iden-tificacao implıcita de utilizadores nao consegue identificar mais do que um utilizador em simultaneo.Em situacoes em que varios utilizadores estao a ver televisao em conjunto, e necessario que estes seidentifiquem, tambem, explicitamente, caso queiram receber publicidade que seja dirigida a todos eles.

3.3.6 Relatorios

Actualmente, uma das maiores dificuldades dos anunciantes que utilizam a televisao como meio de trans-missao de publicidade e saberem a quem foram apresentados os seus anuncios. Com efeito, tendo oTargetAd a possibilidade implıcita de fornecer este tipo de informacao aos anunciantes, a producao derelatorios com este tipo de dados torna-se incontornavel. Assim, os anunciantes que utilizem o TargetAdpara comunicarem as suas campanhas publicitarias ficam imediatamente habilitados a avaliarem as mes-mas com uma enorme precisao, podendo saber, para cada anuncio, qual a idade e o sexo das pessoas queo viram, a percentagem do anuncio que foi visualizada e as horas a que ocorreram essas visualizacoes.

Para tal ser possıvel, sempre que um anuncio direccionado e apresentado, o TargetAd regista essaocorrencia. Nomeadamente, e registado a idade e o sexo do utilizador a quem foi apresentado o anuncio,a que horas aconteceu essa apresentacao e qual a percentagem do anuncio que foi visualizada. Estes da-dos sao enviados, esporadicamente, para uma base de dados no lado do servidor, para que sejam, entao,produzidos relatorios a serem apresentados aos anunciantes.

3.4 Privacidade

A privacidade e, hoje em dia, um assunto para o qual as pessoas mostram, justificadamente, grandesensibilidade. Como tal, a manutencao da privacidade dos utilizadores do TargetAd foi uma preocupacaoindelevel no desenvolvimento do sistema.

Em primeiro lugar, convem apurar, a luz da legislacao actual, que tipo de dados sao considerados pesso-ais. Segundo a Directiva 95/46/CE do Parlamento Europeu, relativa a proteccao das pessoas singularesno que diz respeito ao tratamento de dados pessoais e a livre circulacao desses dados [7], transposta paraa ordem jurıdica portuguesa atraves da Lei n.o 67/98, os dados pessoais sao definidos como:

�Dados pessoais�, qualquer informacao relativa a uma pessoa singular identificada ouidentificavel (�pessoa em causa�); e considerado identificavel todo aquele que possa ser iden-tificado, directa ou indirectamente, nomeadamente por referencia a um numero de identi-ficacao ou a um ou mais elementos especıficos da sua identidade fısica, fisiologica, psıquica,economica, cultural ou social;

Os unicos dados, relativos aos utilizadores, registados pelo TargetAd passıveis de serem consideradosdados pessoais sao a idade e o sexo. Dado que a idade e o sexo sao caracterısticas insuficientes para iden-tificar uma pessoa — pelo menos no universo de utilizadores de uma operadora televisiva —, concluımos,assim, que o sistema nao regista quaisquer dados pessoais dos utilizadores.

33

Page 54: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Assim, todos os utilizadores do TargetAd tem a garantia de que a sua privacidade e preservada. Maisa mais, os dados relacionados com o tipo de programas que os utilizadores veem nunca saem da STB,sendo inclusivamente apagados apos cada sessao televisiva. Esta ultima afirmacao ja nao e verdade paraos utilizadores monitorizados. Contudo, estes, para fazerem parte do grupo de utilizadores monitorizados,tem que anuir que os seus consumos televisivos sejam registados e tratados, pelo que tambem nao existeaqui qualquer violacao da lei. De qualquer forma, os utilizadores monitorizados devem ser informadosque todo o processo de tratamento dos dados relativos aos seus consumos televisivos e feito de formaautomatica (desde a sua recolha ate ao fornecimento destes como conjunto de treino do classificador), eque em situacao alguma estes serao fornecidos a terceiros.

Os registos dos anuncios apresentados, utilizados para produzir relatorios com informacao sobre as cam-panhas publicitarias a decorrerem sobre o TargetAd e que sao entregues, posteriormente, aos anunciantes,tambem nao violam a privacidade dos utilizadores pois, mais uma vez, estes nao contem qualquer dadoque os possa identificar individualmente. Alem disso, a informacao sobre os anuncios televisivos vistospor uma dada pessoa diz muito pouco, ou nada, sobre essa pessoa, visto esta nao ter forma de escolheros anuncios que lhe sao apresentados.

Concluımos, entao, que o TargetAd e um sistema que permite fornecer dados valiosos aos anuncian-tes, no ambito da avaliacao das suas campanhas publicitarias, sem infringir a legalidade nem, tao pouco,por em causa a privacidade dos seus utilizadores.

34

Page 55: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Capıtulo 4

Implementacao

O TargetAd divide-se em varios componentes implementados de forma independente, sendo que todoseles estao escritos em Java e correm sobre a Java Virtual Machine (JVM). Listamos, de forma resumida,o software utilizado no desenvolvimento deste projecto:

1. Java Development Kit (JDK) 6 como plataforma para o desenvolvimento dos componentes;

2. O servidor aplicacional Java Glassfish;

3. O conjunto de servlets para processamento de SIP, Java SailFin;

4. O Integrated Development Environment (IDE ) Eclipse;

5. O Service Development Studio (SDS) da Ericsson, para o desenvolvimento e teste de aplicacoesIMS ;

6. O software de gestao de base de dados MySQL;

7. O Video LAN Client (VLC) como cliente e servidor de streaming de vıdeo;

8. E a suite de software Waikato Environment for Knowleged Analysis (Weka) para imple-mentacao, treino e teste do classificador.

Figura 4.1: Principais componentes do SDS

35

Page 56: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

4.1 SDS e IMS

A escolha do Java como plataforma de desenvolvimento do TargetAd esteve relacionada com a utilizacaodo SDS como simulador de uma rede IMS. Visto que o SDS integra o servidor aplicacional Java Glassfishe o servlet de SIP Java SailFin, a plataforma Java tornou-se uma opcao obvia.Uma rede IMS e composta por varios componentes. O SDS simula muitos destes componentes, nomea-damente o servidor aplicacional, o CSCF, o HSS e o DNS. Estes componentes comunicam entre si paraprocessar pedidos, enviados atraves do protocolo SIP [6]. No que concerne ao lado do cliente, o SDSfornece tambem uma plataforma denominada de IMS Client Platform (ICP). O ICP e o middleware, ins-talado no cliente, que permite que as aplicacoes cliente comuniquem e interajam com o servidor, atravesda rede IMS (ver Figura 4.2). As aplicacoes cliente acedem ao ICP atraves de uma Application ProgramInterface (API ) disponibilizada pelo mesmo.

Figura 4.2: Relacao entre o ICP e o ambiente fornecido pelo SDS

Alem de simular uma rede IMS, o SDS integra tambem varias ferramentas de teste e diagnostico queforam muito uteis no desenvolvimento deste projecto.

4.2 Componentes do TargetAd

Os varios componentes desenvolvidos no ambito do TargetAd dividem-se em componentes funcionais eadministrativos. Componentes funcionais sao aqueles que assumem uma importancia fulcral na organicado TargetAd, sem os quais seria impossıvel o sistema atingir os seus objectivos. Os componentes admi-nistrativos, por outro lado, nao sendo acessorios, nao desempenham funcoes cujo sucesso seja vital parao sistema global. Estes componentes encarregam-se, nomeadamente, da gestao dos anuncios, providen-ciando uma interface com os anunciantes. Na Figura 4.3 encontram-se esquematizadas as relacoes entreestes componentes.

Como componentes funcionais, foram desenvolvidos o TargetAd Client, TargetAd SIP Server, TargetAdTV Server e o TargetAd Break Manager. Os componentes TargetAd Loader Server e TargetAd Loader

36

Page 57: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Servidor

TargetAd TV

Server

TargetAd SIP

Server

TargetAd

Loader Server

Anúncios

IMS

Core

Canal Televisivo

TargetAd Break

Manager

<<UDP>><<RTP>>

Anunciante

TargetAd Loader

Client

Vídeos

<<HTTP>>

Cliente

TargetAd ClientAnúncios

<<RTP>>

<<SIP>>

<<RTP>>

VLC

VLC

<<SIP>>

Componente Funcional do TargetAd Componente Administrativo do TargetAd Base de dados MySQL Componente Externo

Video Lan Client Limite Lógico Fluxo de Dados

<<HTTP>>

Servidor HTTP

<<TCP>>

<<HTTP>>

Servidor Aplicacional

Figura 4.3: Esquema da implementacao do TargetAd

Client foram os componentes administrativos desenvolvidos.

Componentes Funcionais

O componente TargetAd Client e o unico componente do sistema instalado no lado do cliente. Como tal,este componente e responsavel por todas as funcionalidades que necessitam de ser executadas no cliente,tal como definido na arquitectura do TargetAd. Assim, as principais responsabilidades do TargetAd Clientsao:

1. Gestao do download dos anuncios;

2. Monitorizacao dos pontos de insercao de publicidade direccionada;

3. Insercao dinamica de anuncios, bem como a seleccao e escalonamento dos mesmos;

4. Identificacao implıcita e explıcita dos utilizadores;

5. Registo da apresentacao de anuncios, para posterior compilacao de dados no servidor.

Os pedidos feitos pelo TargetAd Client sao recebidos e processados, no servidor, pelo componenteTargetAd SIP Server. Estes dois componentes concentram em si grande parte da logica funcional dosistema. Com efeito, os restantes componentes funcionais, TargetAd Break Manager e TargetAd TV Ser-ver, desempenham papeis “menores”.O componente TargetAd TV Server e, apenas, responsavel por redireccionar as streams de vıdeo querecebe dos canais televisivos para os clientes, sem processar ou interpretar os dados em transito. Adicio-nalmente, nos casos em que e necessario inserir um anuncio direccionado remotamente, este componentee responsavel pela criacao da stream unicast para o componente TargetAd Client.

37

Page 58: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Na infra-estrutura do canal televisivo encontra-se o componente TargetAd Break Manager. Este com-ponente e responsavel pelo envio dos pacotes UDP que assinalam os intervalos televisivos destinados apublicidade direccionada. Como referido anteriormente, estes pacotes contem no seu payload um iden-tificador do intervalo, bem como os segundos que faltam ate ao termo do mesmo. O TargetAd BreakManager nao faz parte da arquitectura do TargetAd — daı nao ter sido mencionado no Capıtulo 3,Arquitectura —, uma vez que o envio destes pacotes UDP e da inteira responsabilidade dos canais televi-sivos. A sua implementacao teve apenas como propositos provar o conceito e facilitar os testes do sistema.

Para simular um ambiente real, recorremos ao software open-source VLC. Foram utilizadas duas instanciasdo VLC: uma como servidor do stream de vıdeo, instalada na infra-estrutura do canal televisivo; e a outracomo cliente desse mesmo stream, instalada na STB dos clientes. Naturalmente, a instancia servidorado stream de vıdeo nao fazia mais do que redireccionar um stream de vıdeo recebido atraves da inter-net. Durante o desenvolvimento do TargetAd, este stream correspondeu quase exclusivamente a emissaoonline da RTP Mobile.

Componentes Administrativos

No TargetAd, os componentes administrativos sao apenas dois, e sao responsaveis por automatizar ocarregamento de anuncios para o sistema, anuncios estes fornecidos directamente pelos anunciantes.O componente TargetAd Loader Server implementa o web service que pode ser consumido pelos anun-ciantes para inserirem os anuncios no sistema. Para facilitar esta interaccao, foi criado o componenteTargetAd Loader Client, que nao e mais que uma aplicacao que consome este web service. Para a imple-mentacao do web service foi utilizada a biblioteca JAX-WS.

1 <S:Envelope xmlns:S="http :// schemas.xmlsoap.org/soap/envelope /">

2 <S:Header >

3 <ns1:client xmlns:ns1="http :// targetad.com/">

4 Agencia de Publicidade 1

5 </ns1:client >

6 <ns1:signature xmlns:ns1="http :// targetad.com/">

7 c+wBojqmErzy5k62xYJNkGBVbp9tpp0wYE0O3JAmwSF1Qfz6Zgq8LPBX+debxZ4m9mje0chHlRp2

egxHmYA6BA ==

8 </ns1:signature >

9 </S:Header >

10 <S:Body>

11 <ns2:loadAd xmlns:ns2="http :// targetad.com/">

12 <arg0>

13 <id>0</id>

14 <entity >Agencia de Publicidade 1</entity >

15 <name>Sanex Desodorizante </name>

16 <duration >30</duration >

17 <dueDate >2009 -09 -06 T18 :13:43.830+01:00 </dueDate >

18 <maxDisplays >0</maxDisplays >

19 <url>http :// web.ist.utl.pt/~ ist155462/targetad/videos/sanexdeo.mpg</url>

20 <checksum >3f795d170ebb38d729bbf314c64f7573 </checksum >

21 <audiences >4.2.2.3 </audiences >

22 <audiences >4.2.3</audiences >

23 <gender >F</gender >

38

Page 59: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

24 <channels >0</channels >

25 </arg0>

26 </ns2:loadAd >

27 </S:Body>

28 </S:Envelope >

Exemplo 4.1: Exemplo de envelope SOAP com pedido de adicao de anuncio ao TargetAd

Como referido anteriormente, sendo que as comunicacoes entre estes dois componentes sao feitas atravesda internet, e necessario que estas sejam assinadas digitalmente, por forma a garantir a autenticidadee integridade das mensagens e o seu nao-repudio. As garantias de autenticidade e de nao-repudio dasmensagens sao essenciais para efeitos de facturacao. Para assinar digitalmente as mensagens e necessariogerar um par de chaves para cada anunciante, sendo que a chave privada fica na posse do anunciante, ea chave publica e inserida no TargetAd. A chave privada do anunciante deve ser fornecida a aplicacaoimplementada pelo componente TargetAd Loader Client, atraves de um ficheiro de configuracao. Ageracao destas chaves de criptografia assimetrica e realizada atraves do algoritmo RSA (Rivest, Shamire Adleman). As mensagens sao digitalmente assinadas quando sao enviadas, estando este mecanismoimplementado num SOAP (Simple Object Access Protocol) handler. Como se pode ver no Exemplo 4.1,a assinatura digital da mensagem e inserida no header do envelope SOAP. A verificacao da assinaturadigital de uma mensagem recebida encontra-se, igualmente, implementada num SOAP handler. Caso averificacao da assinatura digital falhe, a mensagem em questao e descartada.

4.3 Interface Grafica

Para a apresentacao do stream de vıdeo proveniente do servidor e dos vıdeos dos anuncios direccionados,foi utilizado o VLC. Este software possui uma interface que possibilita o seu controlo atraves de um socket,para onde sao enviados um conjunto de comandos pre-definidos. Assim, tornou-se possıvel controlar oVLC a partir do componente TargetAd Client, alternando entre a apresentacao do stream de vıdeo doscanais televisivos com vıdeos de anuncios.

Figura 4.4: Interface grafica desenvolvida para o TargetAd

Para alem da apresentacao de vıdeo, foi tambem necessario criar uma interface grafica para permitir

39

Page 60: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

a introducao de dados pelo utilizador. Dado que ao ver televisao o utilizador possui um dispositivo deintroducao de dados que e, tipicamente, o controlo remoto, esta interface pretende simular um dispositivodesse tipo. Com efeito, a interface criada possui apenas alguns dos botoes mais utilizados nos controlosremotos, como podemos ver na Figura 4.4. Esta interface permite que se mude de canal, que se coloqueo sistema em stand-by e que os utilizadores se identifiquem explicitamente. A implementacao destainterface grafica foi executada com recurso a biblioteca grafica SWT (Standard Widget Toolkit), integradana plataforma Java.

Figura 4.5: Apresentacao de anuncio direccionado

Adicionalmente, foi tambem desenvolvida a interface grafica para o componente TargetAd Break Manager.Como esta patente na Figura 4.5, nesta interface podem definir-se os parametros necessarios para iniciarum intervalo de publicidade direccionada. Estes sao o IP e o porto utilizados pelo modulo TargetAd TVServer para receber dados segundo o protocolo UDP, um numero identificador do intervalo e a duracao,em segundos, do mesmo.

4.4 Classificador

Como referido anteriormente, para a implementacao do classificador — classificador este cuja funcaoe identificar implicitamente o utilizador que esta a ver televisao — socorremo-nos da biblioteca Weka.Esta biblioteca possui uma vasta coleccao de implementacoes de algoritmos utilizados para tarefas de datamining. Estes algoritmos estao implementados em Java, pelo que sua a integracao no TargetAd nao cons-tituiu um problema. Adicionalmente, a biblioteca Weka possui algumas ferramentas destinadas a apoiartodo o processo experimental imanente a tarefa de data mining. As ferramentas Explorer e Experimenterforam aquelas que mais uteis se revelaram. A ferramenta Explorer e uma interface grafica que permiteaceder a todas as funcionalidades da biblioteca Weka, atraves de menus e outros elementos graficos. Estaferramenta tem uma componente educativa, na medida em que invalida opcoes quando estas nao saoaplicaveis, apresentando, de quando em vez, notas com informacoes que permitem ao utilizador melhoraros seus conhecimentos sobre data mining em geral. A ferramenta Experimenter, tambem uma aplicacaografica, foi concebida para responder a uma questao que se coloca sempre na seleccao e aplicacao detecnicas de classificacao: quais os melhores metodos e parametros para este problema especıfico? Com oExperimenter foi possıvel identificar, de forma rigorosa, o melhor algoritmo disponıvel para esta tarefa

40

Page 61: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

concreta — a identificacao implıcita de utilizadores.

Figura 4.6: A ferramenta Explorer, integrada na biblioteca Weka

Para ser possıvel comparar os diferentes algoritmos de classificacao foi necessario obter um conjunto dedados. Estes dados teriam que conter associacoes entre tipos de conteudos televisivos, classificados deacordo com a taxonomia TV-Anytime segundo tema, formato e intencao, e a idade e o sexo da pessoaque visualiza esse tipo de conteudos. A recolha destes dados foi feita atraves da criacao de um ques-tionario na web, que solicitava aos inquiridos que, apos introduzirem a sua data de nascimento e sexo,seleccionassem os programas televisivos que costumam ver ou que veriam se tivessem oportunidade paratal. Os programas apresentados foram retirados de um EPG de uma operadora televisiva nacional, sendoque a janela temporal disponıvel compreendia sete dias. Este questionario foi desenvolvido em PHP eJavaScript, utilizando uma base de dados MySQL para persistir as respostas dos inquiridos. Na Figura4.7 encontra-se um screenshot do referido questionario.Neste inquerito, estavam disponıveis para seleccao 9518 programas, distribuıdos por 50 canais em 7 dias.Responderam ao inquerito 55 pessoas, sendo que 15 dos inquiridos eram do sexo feminino, e os restantes40 do sexo masculino. As idades variaram entre os 18 e 60 anos e a media situou-se nos 27.3 anos. Cadainquirido seleccionou, em media, 34 programas distribuıdos por 4 canais diferentes. Foram, portanto,seleccionados no total 1870 programas televisivos.

O passo seguinte consistiu em classificar, manualmente, estes 1870 programas segundo os tres vecto-res acima referidos: tema, formato e intencao. Como e natural, muitos dos programas contidos nestelote de 1870 encontravam-se repetidos, devido a terem sido seleccionados por dois ou mais inquiridos.

41

Page 62: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Figura 4.7: Inquerito utilizado para recolha de dados para o treino e teste do classificador

Adicionalmente, os programas que consistiam em episodios de uma serie foram considerados apenas umprograma pois a sua classificacao era igual. Terminado este pos-processamento dos dados do inquerito,foram classificados manualmente 423 programas.

Uma vez classificados todos os programas seleccionados pelos inquiridos, foi necessario transformar osdados do inquerito em informacao inteligıvel para um classificador. Para este efeito, foram construıdastres arvores para cada inquirido, sendo que cada arvore corresponde a um vector de classificacao dosprogramas seleccionados pelos inquiridos. Ou seja, para um dado inquirido, uma das arvores correspondeaos temas dos programas seleccionados por este, outra das arvores corresponde as intencoes desses progra-mas e, finalmente, a arvore restante corresponde aos formatos dos programas. Estas arvores representam,de uma forma estruturada, as preferencias televisivas dos inquiridos, no que diz respeito as intencoes,formatos e temas dos programas a que assistem.

Ao ser utilizada uma taxonomia para classificar os programas, e tendo em conta que os termos nastaxonomias se encontram hierarquizados, foi razoavelmente facil criar estas arvores, sendo que os nos dasmesmas correspondiam aos termos da taxonomia. Tomemos por exemplo um inquirido que seleccionou,maioritariamente, jogos de futebol como programas televisivos que ve (ou veria se pudesse). A arvorecorrespondente aos temas dos programas seleccionados por este inquirido teria um maior peso nos ramos(e nos) que definiam o caminho da raiz ate a folha correspondente ao termo “Jogos de Futebol”. Na Fi-gura 4.8 encontra-se uma representacao grafica destas arvores, esquematizando as preferencias televisivasde um inquirido do sexo feminino com 23 anos de idade.

Antes, ainda, de se iniciar efectivamente os testes aos diferentes algoritmos de classificacao, foi necessariotransformar os dados relativos as arvores de preferencias acima referidas, para que estes estivessem deacordo com o formato ARFF (Attribute-Relation File Format) [28]. O formato ARFF e o formato su-portado pelas ferramentas da biblioteca Weka, pelo que o conjunto de dados fornecido as mesmas tem,

42

Page 63: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Figura 4.8: Arvores que representam as preferencias televisivas de um inquirido

Algoritmo % de classificacoes incorrectas Erro Quadratico Medio

Naıve Bayes 52.93% 0.0441

LibSVM 59.77% 0.0529

LibLinear 60.53% 0.0529

One Rule 61.63% 0.0576

Decision Table 64.17% 0.0361

Bayes Network 64.87% 0.0361

Arvore de Decisao C4.5 73.17% 0.0529

Tabela 4.1: Comparacao entre os varios algoritmos de classificacao testados

obviamente, que obedecer a este formato.

Dado o enorme leque de escolha oferecido pela biblioteca Weka, foi possıvel testar varios algoritmosde classificacao. Podemos consultar uma representacao grafica do classificador resultante de um destesalgoritmos, no caso uma arvore de decisao, na Figura 4.9. Os algoritmos que obtiveram melhores resulta-dos encontram-se listados na Tabela 4.1. Para avaliar a performance de cada um dos algoritmos testadosfoi utilizada a tecnica de 10-fold cross-validation. Esta e a tecnica standard de predicao da taxa de errode um algoritmo de aprendizagem, utilizando apenas um conjunto de dados nao variavel [28]. No 10-foldcross-validation, o conjunto de dados e dividido em 10 partes iguais, definidas de forma aleatoria. Estas10 partes contem, idealmente, a mesma proporcao de classes que o conjunto de dados total (neste casoparticular, as classes sao a idade e o sexo). O teste e executado em 10 iteracoes, sendo que em cadaiteracao sao utilizadas 9 das 10 partes do conjunto de dados — estas 9 partes definem o conjunto detreino nessa iteracao — para treinar o classificador, finalizando cada iteracao testando o classificador na

43

Page 64: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

parte que nao foi utilizada no seu treino — parte essa que e o conjunto de teste nessa iteracao. Apos estas10 iteracoes, e calculada a media da percentagem de erros resultante da classificacao de cada iteracao,sendo esse valor a percentagem de erros esperada para o classificador num cenario real.

Segundo os testes realizados, o algoritmo de classificacao que obteve melhores resultados foi o NaıveBayes, apresentando uma taxa de erro de cerca de 53%. Dentro das instancias incorrectamente classi-ficadas por este algoritmo, cerca de 23% destas foram incorrectamente classificadas tanto no sexo comona idade, 13% so no sexo e cerca de 64% so na idade. Apesar desta taxa de erro parecer muito poucosatisfatoria, existem varias atenuantes que devem ser levadas em conta. Em primeiro lugar, o baixonumero de inquiridos contribuiu de algum modo para a baixa precisao das classificacoes, dado que exis-tem algumas classes que, tendo apenas uma instancia, nao podem estar representadas simultaneamenteno conjunto de treino e no conjunto de teste. Relembramos que em producao, o conjunto de treino doclassificador sera composto por 10% dos utilizadores do TargetAd. Supondo que o numero de utilizadoresnum ambiente real se encontra na ordem das dezenas de milhar, e expectavel que os dados contidos nesteconjunto de treino sejam muito vastos e representativos da restante populacao, esperando-se assim queo classificador produza melhores resultados num ambiente real do que nos testes realizados. Contudo, ataxa de erro do classificador ainda pode ser menor, visto que, em alguns casos, uma classificacao erradapode ser corrigida. Com efeito, neste teste nao foi considerado que uma classificacao so e valida se existiralguem no lar que possua as caracterısticas (idade e sexo) ditadas por essa classificacao. Por exemplo,num lar em que vivam um homem e uma mulher, ambos com 50 anos, mesmo que o classificador identi-fique implicitamente que quem esta a ver televisao e um homem de 56 anos, essa classificacao e corrigidatendo em conta os habitantes do lar. Infelizmente, nao nos parece possıvel quantificar a percentagem declassificacoes incorrectas que sao passıveis de serem corrigidas com sucesso em producao. De qualquerforma, e indubitavel que a taxa de erro de 53% representa o pior cenario possıvel.

Figura 4.9: Excerto de uma arvore de decisao

44

Page 65: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

4.5 Base de Dados

No desenho arquitectural do TargetAd foi definido que seria necessario utilizar duas bases de dados, umapresente no servidor e outra no cliente. Nesta seccao detalhamos de que forma estas bases de dados saoutilizadas e apresentamos, graficamente, a sua estrutura.

4.5.1 Base de Dados do Servidor

A base de dados presente no servidor e o ponto central de armazenamento de anuncios. E nesta base dedados que sao inseridos e mantidos todos os anuncios existentes no TargetAd. Alem dos dados directa-mente relacionados com os anuncios, sao tambem registadas nesta base de dados informacoes relativasas entidades externas habilitadas a introduzir anuncios no sistema. Estas informacoes tem como intuitoprimordial serem utilizadas a posteriori para efeitos de facturacao.

A base de dados do servidor e composta por seis tabelas. A tabela “nevralgica” e a tabela ads (verFigura 4.10). E nesta tabela que sao armazenados os anuncios do TargetAd. Os anunciantes inseremdirectamente os anuncios nesta tabela, atraves do procedimento descrito na Seccao 3.3.1. Para tal, temque ser fornecidos alguns dados, que tem uma correspondencia directa com os campos da tabela ads. Enecessario, entao, que os anunciantes definam, para cada anuncio:

• O nome do anuncio;

• O sexo do publico-alvo;

• O intervalo de idades do publico-alvo;

• A duracao, em segundos, do anuncio;

• A data de validade do anuncio;

• Numero maximo de apresentacoes do anuncio num lar;

• O URL do ficheiro de vıdeo correspondente ao anuncio;

• E os canais onde esse anuncio pode ser apresentado.

De seguida explicitamos os detalhes de implementacao para o processamento de alguns destes dados.

Dado que um anuncio pode ser dirigido a homens, a mulheres ou a ambos, o sexo do publico-alvopode, consequentemente, assumir tres valores: ‘M’ se se desejar que o anuncio seja apenas apresentado ahomens, ‘F’ para o caso das mulheres, e ‘B’ (do ingles both) para ambos os casos.

Ao inserirem um anuncio no TargetAd, os anunciantes devem indicar o URL do ficheiro de vıdeo doanuncio. Uma vez inserido o anuncio no sistema, o TargetAd tratara de fazer o download do ficheiro devıdeo, de modo a armazena-lo localmente. Uma vez terminado o download, o URL correspondente aoanuncio e actualizado, de modo a reflectir a nova localizacao do ficheiro de vıdeo, localizacao essa que seencontrara dentro da infra-estrutura do operador de televisao. O ficheiro de vıdeo e submetido a umaverificacao de integridade. Utilizou-se, para tal, o algoritmo de hash MD5 (Message Digest algorithm 5 ).

Na tabela external entities da base de dados do servidor sao guardados os dados relativos as entida-des externas habilitadas a inserir anuncios directamente no TargetAd. Nomeadamente, e registado um

45

Page 66: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Figura 4.10: Estrutura da base de dados do servidor

46

Page 67: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

nome identificativo e uma chave publica para cada entidade. Esta chave publica e usada quer para as-sinar, quer para verificar as assinaturas digitais das mensagens trocadas entre o TargetAd e a entidadeexterna.A criacao de entidades externas no TargetAd e feita atraves de um procedimento manual, sendo tambemmanual a distribuicao do par de chaves: a chave privada e entregue a respectiva entidade, enquanto quea chave publica e guardada no TargetAd, na tabela external entities, como descrito.

As tabelas ads audiences e ads channels tem como unico intuito criar relacoes de muitos-para-muitosentre a tabela ads e as tabelas tva audiences e channels, respectivamente. Tais relacoes advem de umanuncio poder ser destinado a uma ou mais audiencias e a sua apresentacao estar restringida a um oumais canais, ao mesmo tempo que uma audiencia pode ser o publico-alvo de um ou mais anuncios, e queum canal pode ter um ou mais anuncios restringidos.

4.5.2 Base de Dados do Cliente

A base de dados do lado do cliente, ou seja, a base de dados instalada nas STBs, possui uma estruturamais complexa do que a base de dados do servidor, como esta patente na Figura 4.11. Esta complexidadeestrutural e justificada por ser necessario capturar e persistir dados mais variados no cliente do que noservidor. Com efeito, no servidor, os dados existentes nas diversas tabelas da base de dados tem sobretudoque ver com os anuncios, ao passo que no cliente, alem de ser necessario armazenar os dados relativos aosanuncios, e tambem necessario registar dados sobre os utilizadores e sobre as suas sessoes televisivas. Deseguida, descrevemos de forma sucinta a estrutura das bases de dados existentes nas STBs dos utilizadores.

Como seria de esperar, e visto que os anuncios sao carregados para o cliente a partir do servidor, osdados relativos aos mesmos sao armazenados da mesma forma no cliente e no servidor. Assim, existemna base de dados do cliente as mesmas tabelas — a nıvel de estrutura e nao dos dados que contem —que compoem a base de dados do servidor, com excepcao da tabela external entities. Portanto, as tabelasads, ads channels, ads audiences e tva audiences estao presentes tanto no servidor como no cliente.Tal como acontece no servidor, uma vez feito o download para a STB do ficheiro de vıdeo correspondentea um anuncio, o campo URL desse registo na base de dados e actualizado para reflectir a localizacao doficheiro na STB.A tabela ads do cliente possui apenas mais um campo do que a sua congenere presente no servidor: ocampo last viewed. Este campo contem a data em que o anuncio foi apresentado pela ultima vez. Estainformacao e necessaria para seleccionar e escalonar os anuncios a serem inseridos num intervalo publi-citario, como explicitado na Seccao 3.3.2. Como facilmente se entende, estes dados nao teriam qualquerutilidade no servidor, daı este campo nao existir na tabela ads da base de dados do servidor.

Sempre que um utilizador comeca a ver televisao, e criada uma nova sessao televisiva. As sessoes televisi-vas sao registadas na tabela sessions. Estas definem-se por uma data de inıcio e outra de fim, sendo quenao podem existir sessoes sobrepostas no tempo. Uma sessao e composta por uma sequencia de programasassistidos pelo utilizador nesse perıodo temporal. A visualizacao de cada um desses programas corres-ponde a um record, registado em tabela homonima. Um record e caracterizado, entao, pela sessao em quese insere, por uma data de inıcio e de fim — que nunca podem exceder o intervalo temporal balizado pelasessao que integram —, pelo programa que esta a ser visto e o seu respectivo canal, e pelo(s) utilizador(es)identificado(s) como estando a assistir a esse programa. De facto, apenas pode ser associado mais doque um utilizador a um record caso estes se identifiquem explicitamente, dado que, como mencionadona Seccao 3.3.5, a identificacao implıcita de utilizadores so consegue identificar um utilizador de cada vez.

47

Page 68: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Figura 4.11: Estrutura da base de dados do cliente

48

Page 69: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

O racional que sustenta o facto de os utilizadores identificados serem associados aos records e nao assessoes pode nao parecer obvio numa primeira avaliacao. Contudo, existem duas fortes razoes parasustentar que assim seja:

1. Uma eventual associacao entre utilizadores e sessoes seria manifestamente abusiva e imprecisa, dadoque numa sessao televisiva o grupo de utilizadores activos e, tipicamente, dinamico. Por exemplo,se numa sessao televisiva forem visualizados um bloco informativo, uma telenovela e uma serie dehumor, e provavel que o grupo de utilizadores que assiste aos tres programas se altere ao longo dasessao;

2. Sendo o algoritmo de identificacao implıcita baseado nos programas televisivos, pode ser feita umanova predicao do utilizador que se encontra a ver televisao sempre que comeca um novo programa,ou, neste caso, sempre que se inicia um record.

A tabela records possui, ainda, um campo intitulado sent, que e basicamente uma flag que indica se orecord correspondente ja foi enviado, ou nao, para o servidor. Obviamente, esta flag so faz sentido e sopode ser activada para os clientes que pertencam aos 10% de utilizadores cujos consumos televisivos saomonitorizados e cujos records constituem o conjunto de treino para o classificador.

Na base de dados do cliente sao tambem registados os intervalos publicitarios destinados a insercaode anuncios direccionados. Estes sao registados na tabela adbreaks e definem-se atraves de um identifica-dor do intervalo e do canal ao qual estao associados. Sempre que e identificado um intervalo deste tipo, ecriado um novo registo nesta tabela. Caso seja identificado um intervalo que ja exista na tabela adbreaks,ou seja, que ja tenha sido identificado anteriormente, essa sinalizacao e imediatamente descartada.

Para que se possam elaborar relatorios sobre as campanhas publicitarias e, eventualmente, sobre osmeritos e vantagens do TargetAd, e necessario que, sempre que um anuncio direccionado seja apresen-tado, tal seja registado. Desta forma, apos um anuncio direccionado ter sido apresentado, e registadona tabela ads appearances quando e que este anuncio foi apresentado, a percentagem do anuncio que foivisualizada, em que intervalo publicitario foi inserido e, finalmente, qual era o record activo no momentodessa apresentacao.

Nao foram abordadas detalhadamente algumas tabelas que tambem fazem parte da base de dados pre-sente no cliente. Foram apenas objecto de analise as tabelas que tem uma maior importancia na organicano lado do cliente do TargetAd, pelo que as tabelas que nao figuraram nesta analise tem uma importanciasecundaria e nao ha nada referente as mesmas que necessite de especial atencao.

49

Page 70: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

50

Page 71: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Capıtulo 5

Avaliacao

Apos o desenvolvimento do TargetAd, foi efectuada uma avaliacao qualitativa e quantitativa do mesmo,para perceber se este consegue corresponder as expectativas e objectivos tracados inicialmente. Nessesentido, foram realizados tres testes:

1. Teste a correccao do classificador, que permite identificar utilizadores de forma implıcita;

2. Teste a eficiencia do algoritmo de seleccao e escalonamento de anuncios, que corresponde a umaanalogia ao Problema da Mochila;

3. E testes com utilizadores.

Os testes a correccao do classificador foram utilizados para seleccionar o melhor algoritmo de classi-ficacao disponıvel. Tal encontra-se explicitado na Seccao 4.4. Como entao mencionado, o classificadortem uma precisao de cerca de 47%, ou seja, e crıvel que, em producao, o classificador consiga identificarcorrectamente o utilizador que se encontra a ver televisao em 47% dos casos. Contudo, espera-se queesta precisao seja mais elevada em producao, por duas razoes: por um lado, devido aos resultados doclassificador serem ajustados aos habitantes do lar; por outro, visto que os dados de treino disponıveis emproducao serao em maior quantidade e mais representativos do universo de utilizadores, em comparacaocom o teste efectuado.

O teste a eficiencia do algoritmo de seleccao e escalonamento de anuncios e os testes com utilizadoresserao descritos em detalhe nas paginas seguintes. Este capıtulo termina, ainda, com um pequeno estudosobre a viabilidade economica do TargetAd, cujo objectivo e demonstrar que os operadores televisivos,os canais e os anunciantes terao vantagens economicas na utilizacao do TargetAd.

5.1 Teste de Eficiencia

No TargetAd, os anuncios, inseridos dinamicamente a cada intervalo publicitario, sao seleccionados eescalonados atraves de uma solucao para o Problema da Mochila. Como o Problema da Mochila e NP-Completo, nao e conhecido um algoritmo que o resolva em tempo polinomial, pelo que tornou-se evidentea necessidade de avaliar se a utilizacao desta solucao para escalonar e inserir anuncios dinamicamentenao representaria um problema. Mais a mais, segundo a arquitectura do TargetAd, o escalonamento einsercao dinamica de anuncios sao executados nas STBs dos clientes, que, como e sabido, sao equipamen-tos que tem grandes limitacoes a nıvel de hardware, o que torna ainda mais imperativa uma avaliacao daperformance do algoritmo.

51

Page 72: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Para tentar mimetizar as capacidades de processamento e de memoria de uma STB, o teste, imple-mentado em Python 2.6, foi realizado num computador com um processador Intel R© PentiumTM a 266MHz e com 128 MB de memoria principal. Este teste foi executado com diferentes parametros, porforma a simular diferentes cenarios possıveis, nomeadamente atraves da variacao da duracao do intervalopublicitario (correspondente a capacidade da mochila) e do numero de anuncios (itens) disponıveis. Aduracao de cada anuncio, correspondente ao peso de cada item, foi gerada aleatoriamente, sendo quevariou entre 5 e 60 segundos. Tambem foi necessario gerar aleatoriamente os segundos desde a ultima vezque o anuncio foi apresentado. Este valor corresponde ao valor do item a colocar na mochila. Para cadadiferente cenario, o teste foi executado 10 vezes, sendo que os valores recolhidos, respeitantes ao tempode execucao do algoritmo, correspondem a media do tempo de 10 execucoes. Na Tabela 5.1 encontram-sediscriminados os resultados do teste.

Duracao do Intervalo Numero de Anuncios Tempo Medio de Execucao

60 s 50 69 ms

60 s 100 155 ms

60 s 150 207 ms

60 s 200 279 ms

300 s 50 341 ms

300 s 100 685 ms

300 s 150 1122 ms

300 s 200 1378 ms

600 s 50 803 ms

600 s 100 1901 ms

600 s 150 2465 ms

600 s 200 2881 ms

900 s 50 1072 ms

900 s 100 2090 ms

900 s 150 3198 ms

900 s 200 4203 ms

Tabela 5.1: Teste ao tempo de execucao do algoritmo de seleccao e escalonamento de anuncios

Como seria expectavel, o tempo de execucao do algoritmo cresce linearmente em funcao da duracao dointervalo e do numero de anuncios. De facto, a complexidade do algoritmo utilizado, tanto temporalcomo espacial, e dada por Θ(WN), em que W e a duracao do intervalo (capacidade da mochila) e N eo numero de anuncios disponıveis para seleccao (numero de itens passıveis de serem colocados na mochila).

Nos casos em que a execucao do algoritmo leva menos de 1 segundo, acreditamos que os utilizadoresnao se aperceberao da execucao do algoritmo, pelo que tal nao influenciara negativamente a experienciatelevisiva dos mesmos. Contrariamente, quando a execucao deste algoritmo ultrapassa a barreira do1o segundo, cremos que este tempo de espera deve ser aligeirado, ainda que de uma forma meramenteaparente, sob pena dos utilizadores serem levados a acreditar na ocorrencia de uma falha no servico queesteja na origem da ausencia de conteudos. Uma solucao simples para este problema passa por incluir

52

Page 73: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Figura 5.1: Grafico com o tempo de execucao do algoritmo de seleccao e escalonamento dos anuncios emdiferentes cenarios

na STB um conteudo audiovisual que seja apresentado sempre que seja expectavel que a execucao doalgoritmo de seleccao e escalonamento de anuncios demore mais do que 1 segundo. Outra solucao, naotao simples de implementar, mas certamente mais elegante, consiste em requerer que os canais televisivosanunciem o comeco dos intervalos com algum tempo de antecedencia, tempo esse que devera excedero tempo de execucao do algoritmo. Contudo, esta solucao nao resolve o problema quando o utilizadordecide mudar para um canal em que ja foi dado inıcio a um intervalo publicitario. Uma ultima solucaopassa por seleccionar imediatamente um anuncio para ser apresentado — entre os anuncios passıveis deserem apresentados ao utilizador actualmente identificado —, sendo que, enquanto ocorre a apresentacaodesse anuncio, e executado o algoritmo de seleccao e escalonamento de anuncios para o tempo restantedo intervalo. A desvantagem desta ultima solucao e que a seleccao do primeiro anuncio a ser apresentado,que ocorre fora do ambito do algoritmo, nao leva em conta ha quanto tempo o anuncio em questao foiapresentado pela ultima vez, nem procura optimizar a utilizacao do espaco do intervalo.

A utilizacao de uma analogia ao Problema da Mochila para seleccionar os anuncios a serem apresentadosdurante um intervalo publicitario permite que possam ocorrer casos em que o somatorio das duracoesdos anuncios seleccionados seja inferior a duracao do intervalo. A diferenca entre estes valores e sem-pre inferior a menor duracao dos anuncios ainda disponıveis a serem apresentados — caso contrario,esse anuncio seria apresentado pois ainda haveria “espaco” para o mesmo. Sabendo que, tipicamente,a duracao mınima de um anuncio e 5 segundos e se assumirmos que existem sempre anuncios com estaduracao disponıveis para serem inseridos, concluımos que a diferenca entre o somatorio das duracoes dosanuncios apresentados e a duracao do intervalo nunca excede os 5 segundos. Nao sendo este um valor ne-gligenciavel — consideramos, acima, que uma interrupcao de conteudos acima de 1 segundo seria notadapelos utilizadores —, tambem nao e tao elevado para que se considere um factor inibidor da aceitacaogeral do TargetAd. De qualquer forma, uma solucao simples para o mesmo, que ja foi inclusivamenteapresentada acima, passa pela inclusao de um conteudo audiovisual na STB que seja apresentado sempreque esta diferenca exceda 1 segundo.Adicionalmente, a frequencia destes casos, em que existe uma diferenca entre o somatorio das duracoes

53

Page 74: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

dos anuncios e a duracao do intervalo, tende a ser inversamente proporcional ao numero de anunciosdisponıveis, sobretudo se existir uma percentagem significativa de anuncios com duracoes reduzidas, poisestes, dada a sua menor duracao, permitem colmatar espacos com maior facilidade.

Esta ultima observacao conduz-nos, ainda, a uma ultima conclusao. O facto de os anuncios mais curtos,a nıvel de duracao, serem inseridos com uma maior facilidade confere-lhes uma prioridade implıcita so-bre os seus congeneres mais longos, que e, eventualmente, suprimida quando o valor dos anuncios maislongos — ou seja, o numero de segundos que passaram desde a ultima vez que foram apresentados —for tal que permita que a sua seleccao seja efectuada. Esta prioridade implıcita pode ser explicada peloseguinte cenario: se considerarmos dois anuncios, A1 e A2, cujo valor (expresso em segundos desde queforam apresentados pela ultima vez) e aproximadamente o mesmo (vA1 ' vA2) e cujas duracoes diferemtal que dA1 < dA2 , entaoA1 sera seleccionado em detrimento de A2. Esta prioridade implıcita pode sercorrigida alterando a forma de calculo do valor de cada anuncio, fazendo com que este valor inclua umnovo componente que seja directamente proporcional a duracao do anuncio.

Concluımos, entao, que o algoritmo utilizado para seleccionar e escalonar os anuncios a serem apre-sentados no ambito do TargetAd cumpre os objectivos gizados, tanto em termos de funcionalidade comode eficiencia, ainda que, como exposto nesta seccao, necessite de algumas pequenas correccoes visando omelhoramento do seu desempenho.

5.2 Testes com Utilizadores

Os testes realizados com utilizadores, no ambito do TargetAd, focaram-se apenas na avaliacao da sa-tisfacao destes relativamente a relevancia dos anuncios seleccionados e apresentados pelo sistema. Umaavaliacao da interface grafica do TargetAd, alem de nao fazer parte do ambito deste trabalho, seria poucointeressante. A interface grafica do TargetAd deve encontrar-se embebida na interface utilizada pelo ope-rador televisivo, de modo a que ambas as interfaces se aproximem tanto a nıvel grafico como funcional.A interface grafica do TargetAd deve, portanto, ser desenvolvida aquando da implementacao do sistemapor um operador televisivo, sendo que os testes com utilizadores relativos a mesma devem ser efectuadosnessa altura.

5.2.1 Primeiro Teste com Utilizadores

Para avaliar a relevancia dos anuncios apresentados pelo TargetAd aos utilizadores foi necessario, emprimeiro lugar, recolher anuncios televisivos. A recolha destes anuncios foi efectuada, de uma forma resu-mida, recorrendo a uma placa de captura de televisao, e ao software que a acompanhava. Tal possibilitougravar intervalos publicitarios, compostos por varios anuncios, havendo a necessidade posterior de dividiro ficheiro de vıdeo correspondente a um intervalo em varios ficheiros mais pequenos, correspondentesaos diferentes anuncios. Esta divisao foi feita recorrendo a aplicacao FFmpeg. Uma vez na posse dosanuncios televisivos, foi necessario definir a que publico-alvo se destinariam. Esta classificacao foi feitade forma informal, tendo como base o proprio anuncio, o tipo de comunicacao patente no mesmo e oconhecimento geral que (nem sempre) possuıamos acerca do produto ou servico anunciado.

A metodologia utilizada para avaliar a relevancia dos anuncios direccionados atraves do TargetAd aoutilizador, consistiu na apresentacao de tres intervalos publicitarios, todos eles com a duracao de cinco

54

Page 75: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

minutos, que diferiam no direccionamento da publicidade, como se detalha de seguida:

1. Intervalo em que a publicidade nao era direccionada, correspondendo a anuncios que foram, efec-tivamente, transmitidos na televisao, durante um intervalo de um programa habitualmente vistopelo utilizador;

2. Intervalo em que a publicidade era direccionada ao utilizador, utilizando o TargetAd e pressupondouma correcta identificacao do utilizador;

3. Intervalo em que a publicidade era direccionada a outro utilizador do lar, tambem utilizando oTargetAd e, naturalmente, pressupondo uma incorrecta identificacao do utilizador.

Apos o visionamento dos tres intervalos, era pedido ao utilizador que indicasse qual o intervalo que con-tinha os anuncios mais relevantes para si. Fez-se notar, ao utilizador, que esta avaliacao deveria ser feitasob um ponto de vista comercial, isto e, se o utilizador se considerava um potencial consumidor do pro-duto/servico anunciado, ignorando eventuais meritos artısticos ou tecnicos que encontrasse nos anuncios.Esperavamos, com este teste, que, pelo menos, 50% dos utilizadores considerasse o intervalo numero 2como o mais relevante. Tal bastaria para provar que a publicidade televisiva direccionada, neste casosuportada pelo TargetAd, melhorava a experiencia televisiva dos telespectadores, na medida em que estesassistiam a anuncios que lhes despertavam maior interesse.Contudo, desde o inıcio dos testes foi perceptıvel que os resultados dificilmente iriam corresponder aodesejado. Esta percepcao foi motivada pela longa duracao dos intervalos apresentados — cinco minutoscada —, o que dificultou uma avaliacao mais precisa por parte dos utilizadores. Com efeito, apos assisti-rem a 15 minutos de anuncios televisivos, os utilizadores mostraram alguma dificuldade em recordar osanuncios correspondentes a cada intervalo, o que deteriorou significativamente as suas avaliacoes.Adicionalmente, a morosidade inerente a esta metodologia de testes, causada pela necessidade de recolheranuncios transmitidos nos intervalos de programas vistos pelos utilizadores e pelo supervisionamento dostestes, impediu que os testes com utilizadores fossem realizados numa escala maior e, portanto, que osseus resultados fossem mais fidedignos.

Estes testes foram realizados com cinco utilizadores, tres do sexo feminino e dois do sexo masculino,com idades compreendidas entre os 24 e os 60 anos. Numa primeira leitura, os resultados, apresentadosna Tabela 5.2, parecem ser inconclusivos. De qualquer forma, foi realizado um teste de hipoteses para opodermos afirmar de forma assertiva.

Teste de Hipoteses

Numa primeira instancia, consideramos utilizar o teste do Qui-Quadrado para tentar avaliar se os testesrealizados com utilizadores eram passıveis de suportar, ou nao, a tese de que os utilizadores escolhem,como intervalo mais relevante, o 2o intervalo apresentado [26]. Contudo, neste caso particular, o testedo Qui-Quadrado nao pode ser aplicado dado existirem valores esperados abaixo de 5, como se podeconstatar na Tabela 5.3 [29].

Como referido acima, para que a publicidade direccionada se provasse, efectivamente, mais relevante,era necessario que o 2o intervalo fosse classificado como sendo o mais relevante, no mınimo, por 50%dos utilizadores. Era expectavel, tambem, que os restantes utilizadores (50%) classificassem de formaequitativa o 1o e 3o intervalos como mais relevante.

Dada a impossibilidade de utilizarmos o teste do Qui-Quadrado, recorremos ao Teste Exacto de Fisher

55

Page 76: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Utilizadores Mais Relevante Relevante Menos Relevante

U1 2o Intervalo 3o Intervalo 1o Intervalo

U2 1o Intervalo 2o Intervalo 3o Intervalo

U3 2o Intervalo 1o Intervalo 3o Intervalo

U4 1o Intervalo 2o Intervalo 3o Intervalo

U5 1o Intervalo 3o Intervalo 2o Intervalo

Intervalos Mais Relevante Relevante Menos Relevante

1o Intervalo 3 vezes 1 vez 1 vez

2o Intervalo 2 vezes 2 vezes 1 vez

3o Intervalo 0 vezes 2 vezes 3 vezes

Tabela 5.2: Classificacao dos intervalos segundo a sua relevancia

[29] para podermos, entao, avaliar se os dados relativos a este teste eram inconclusivos.No Teste Exacto de Fisher, a hipotese nula (H0) afirma que as categorias sao independentes dos resul-tados, ou seja, que nao existe uma relacao visıvel entre ambos. Para o conjunto de dados em questao,a hipotese nula significa que o facto de um utilizador considerar um tipo de intervalo relevante, ou nao,nao tem qualquer relacao com o tipo de intervalo em si — se nao e direccionado (1o intervalo), se edireccionado ao utilizador (2o intervalo) ou se e direccionado a outro utilizador (3o intervalo).

Intervalos Valor Observado Valor Esperado

1o Intervalo 3 1.25

2o Intervalo 2 2.50

3o Intervalo 0 1.25

Tabela 5.3: Valores observados e esperados relativos a classificacao do intervalo mais relevante

Na Tabela 5.4 os dados sao dispostos num formato adequado aos calculos que sao necessarios efectuar noambito do Teste Exacto de Fisher. O p-value desta tabela (Tabela 5.4) e aproximadamente 0.033. Douniverso das 21 tabelas possıveis, 5 tabelas tem a mesma probabilidade que a Tabela 5.4 e 9 tem umaprobabilidade mais baixa. Assim sendo, o p-value one sided, ou seja, o somatorio dos p-values iguais oumenores que o p-value da tabela em analise, e igual a 0.25. Este valor faz com que nao possamos consi-derar a Tabela 5.4 “incomum”, por ser um valor muito elevado. Consequentemente, nao nos e possıvelrejeitar a hipotese nula, ou seja, nao podemos rejeitar a tese da independencia entre o tipo de publicidadedo intervalo e a relevancia dos anuncios para os utilizadores.

Se duvidas existirem, podemos esclarece-las com um novo Teste Exacto de Fisher, desta feita aplicadoapenas ao 1o e 2o intervalos. Este novo teste de hipoteses advem da observacao de que, se queremos,de facto, tentar perceber se a publicidade direccionada apresenta anuncios mais relevantes para os uti-lizadores, podemos ignorar o 3o intervalo, visto que este foi classificado como irrelevante por todos osutilizadores. Desta forma, podemos comparar directamente os intervalos apresentados actualmente na

56

Page 77: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

televisao — publicidade nao direccionada — com os intervalos com publicidade direccionada apresenta-dos pelo TargetAd. Em todo o caso, este novo teste de hipoteses apenas corroborara os resultados doteste de hipoteses explicitado acima, ou seja, confirmara que este teste com utilizadores nao aferiu deforma satisfatoria se existe, ou nao, uma relacao directa entre a publicidade televisiva direccionada e arelevancia dos anuncios para os telespectadores.

Classificacao 1o Intervalo 2o Intervalo 3o Intervalo

O Mais Relevante 3 2 0

Menos Relevante 2 3 5

Tabela 5.4: Dados relativos a classificacao do intervalo mais relevante, dispostos de acordo com o TesteExacto de Fisher

O p-value da Tabela 5.5 e, aproximadamente, 0.4. No universo das 6 tabelas possıveis neste Teste Exactode Fisher, a Tabela 5.5 e a que tem o p-value mais elevado, sendo que apenas uma das 5 tabelas restantestem igual p-value. Como tal, escusamo-nos de calcular o p-value one-sided, visto que ao possuir o p-valuemais elevado do conjunto das 6 tabelas, consideramo-la, imediatamente, como uma tabela “comum”.Mais uma vez, nao podemos rejeitar a hipotese nula, confirmando-se que o teste com utilizadores emanalise nao provou que existe uma relacao entre a relevancia dos anuncios televisivos para o telespecta-dor e o facto da publicidade ser direccionada ou nao.

Classificacao 1o Intervalo 2o Intervalo

O Mais Relevante 3 2

Menos Relevante 2 3

Tabela 5.5: Dados relativos a classificacao do intervalo mais relevante, para o segundo Teste Exacto deFisher

5.2.2 Segundo Teste com Utilizadores

O primeiro teste com utilizadores revelou-se incapaz de provar que os anuncios direccionados aos utili-zadores, atraves do TargetAd, sao mais relevantes para estes do que os anuncios que sao transmitidosactualmente na televisao. Contudo, nao ficamos convencidos que estes resultados correspondessem averdade. Estavamos certos de que com um novo teste com utilizadores, em que fossem corrigidos osproblemas que identificamos durante a execucao do primeiro, conseguirıamos provar que os anuncios di-reccionados aos utilizadores sao, de facto, mais relevantes.

O segundo teste com utilizadores foi feito atraves de uma aplicacao web (ver Figura 5.2). Neste testeeram solicitados ao inquirido o sexo e a data de nascimento. Com base nestes dados, era seleccionado umanuncio da base de dados, que poderia ser direccionado ao utilizador ou nao (mediante escolha pseudo-aleatoria, com probabilidades iguais para ambas as hipoteses). O utilizador via o anuncio e classificava-o,em termos de relevancia, segundo a seguinte escala:

1. Nada relevante;

2. Pouco relevante;

57

Page 78: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Figura 5.2: Aplicacao web que suportou o Segundo Teste com Utilizadores

3. Algo relevante;

4. Relevante;

5. Muito relevante;

6. Totalmente relevante.

A base de dados continha 101 anuncios diferentes, sendo que um mesmo anuncio era apresentado uma euma so vez a cada utilizador. Os inquiridos poderiam classificar tantos anuncios quantos desejassem (nomaximo 101).

Este segundo teste com utilizadores diferiu do primeiro sobretudo no momento em que era pedido ofeedback ao utilizador. Ao inves do que foi feito no primeiro teste, em que se pedia ao utilizador paraclassificar tres intervalos, de acordo com a sua relevancia, apos ter assistido a 15 minutos de publicidade,neste segundo teste, os utilizadores classificavam cada anuncio, em termos de relevancia, durante ouimediatamente apos a sua visualizacao. Quis-se, desta forma, tornar as consideracoes dos utilizadoressobre os anuncios mais fidedignas, solicitando a classificacao de cada anuncio ao utilizador enquanto este(o utilizador) ainda o tinha presente em memoria.Adicionalmente, sendo este teste realizado atraves da web e acarretando menos morosidade processual,tornou-se possıvel inquirir um maior numero de utilizadores.

Participaram no teste 31 utilizadores, sendo que 23 deles eram do sexo masculino e apenas 8 do sexofeminino. Os inquiridos tinham entre 19 e 67 anos. Cada inquirido classificou, em media, cerca de 12anuncios, totalizando 369 classificacoes. Destas 369 classificacoes, 182 corresponderam a anuncios naodireccionados e 187 a anuncios direccionados ao utilizador.De seguida efectuamos um teste de hipoteses para perceber se o direccionamento de publicidade tem, ounao, influencia directa na relevancia dos anuncios para os utilizadores.

Teste de Hipoteses

Para averiguar se os anuncios direccionados sao, ou nao, significativamente mais relevantes para os uti-lizadores que os seus congeneres nao direccionados, recorremos ao Teste t de Student, dado este ser um

58

Page 79: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

teste de hipoteses adequado para perceber se existe uma diferenca estatisticamente significativa entre amedia das duas populacoes [26]. Para tal, formulamos as seguintes hipoteses:

• H0 (hipotese nula): µ1 = µ2, ou seja, a relevancia dos anuncios para os utilizadores e independentedestes serem direccionados;

• H1 (hipotese alternativa): µ1 6= µ2, ou seja, a relevancia dos anuncios para os utilizadores dependese estes sao direccionados ou nao.

As medias das classificacoes das duas populacoes sao:

• Anuncios nao direccionados: x1 = 2.07;

• Anuncios direccionados: x2 = 2.76.

O p-value deste teste e aproximadamente zero (13 × 10−8). Como tal, e para um nıvel de significanciade 1% (α = 0.01), constatamos que o p-value e menor que o nıvel de significancia (13 × 10−8 < 0.01).Consequentemente, a hipotese nula e rejeitada.

Com estes resultados podemos concluir que os anuncios direccionados sao cerca de 33%1 mais rele-vantes para os utilizadores que os anuncios nao direccionados, com uma confianca de 99%. Provamos,desta forma, que a experiencia televisiva dos utilizadores e melhorada quando a publicidade apresentadae direccionada aos utilizadores, nomeadamente atraves do TargetAd.

5.3 Viabilidade Economica

A implementacao do TargetAd num operador de televisao, apesar de poder ser feita gradualmente,obriga a algumas mudancas de fundo no que diz respeito a negociacao de espaco publicitario televisivo.Tradicionalmente, esta negociacao e efectuada entre os canais televisivos e os anunciantes, sendo que osoperadores televisivos nao tem qualquer controlo sobre a publicidade apresentada nos canais por elesdistribuıdos (salvo raras excepcoes).Segundo o modelo negocial subjacente ao TargetAd, a venda de espaco publicitario e feita pelos operadorestelevisivos aos anunciantes. Tal implica, obviamente, que sejam celebrados acordos entre os operadores eos canais televisivos, de modo a estes ultimos serem compensados pela cedencia dos direitos de venda doseu espaco publicitario.Uma adopcao efectiva do TargetAd esta dependente que as tres partes envolvidas no processo de comprae venda de espaco publicitario televisivo — os canais, os operadores e os anunciantes — desfrutem devantagens com a mesma. Estas vantagens podem ser varias, conquanto se traduzam, inevitavelmente,numa vantagem economica. Nas proximas paginas e descrito de que forma a adopcao do TargetAdbeneficia estes tres intervenientes no processo negocial.

5.3.1 Canais Televisivos

Os canais televisivos serao, justificadamente, entre os tres diferentes tipos de intervenientes, aqueles quemais reservas apresentarao em relacao a uma adopcao do TargetAd. Isto deve-se, essencialmente, ao factode actualmente os canais televisivos nao terem que repartir as receitas geradas pela publicidade televisivacom nenhuma outra entidade.Como tal e necessario garantir que os canais televisivos obtem, pelo menos, o mesmo valor de receitasresultantes da venda de publicidade televisiva que tem vindo a obter ate aqui. Adicionalmente, os canais

1x2/x1 = 2.76/2.07 = 1.3(3)

59

Page 80: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

poderao tambem reduzir custos, em consequencia da transferencia, total ou parcial, da gestao da publi-cidade televisiva para os operadores televisivos.

Num contrato de cedencia de direitos de transmissao de publicidade de um canal a um operador detelevisao, o operador deve pagar ao canal o valor correspondente a percentagem das receitas de publi-cidade televisiva que o canal vai perder, em resultado da celebracao deste contrato. Consideremos, porexemplo, que este contrato e celebrado entre um canal televisivo cuja emissao e feita em sinal aberto eque tem um share de 20%, em media, e um operador televisivo com 100 mil clientes. Sabendo que, emPortugal, a taxa de penetracao da televisao e de 100% [10], um share de 20% correspondente a cerca de2 milhoes de telespectadores. O numero de telespectadores servidos pelo operador televisivo correspondeao numero medio de habitantes por lar multiplicado pelo numero de clientes. Sendo o numero mediode habitantes por lar, em Portugal, cerca de 2.7,2 podemos concluir que este operador serve 270 miltelespectadores. Estes 270 mil telespectadores correspondem, por sua vez, a 13.5% dos telespectadoresdo canal de televisao (270 mil / 2 milhoes de telespectadores). Como tal, ao ser celebrado um contratode cedencia de direitos de transmissao de publicidade, devera ser estipulado que o operador tem quecompensar financeiramente o canal televisivo com uma verba nunca inferior a 13.5% das receitas de pu-blicidade televisiva registadas ate esse momento.

Os canais televisivos que mais lucrarao com esta mudanca no paradigma negocial sao aqueles que trans-mitem pouca ou nenhuma publicidade. Tipicamente estes sao canais tematicos com shares muito baixos.Estes canais sao, efectivamente, pouco atraentes para os anunciantes pois sao poucos os telespectadoresque os veem.Com a adopcao do TargetAd, estes canais tornar-se-ao mais apetecıveis para os anunciantes, dado que acompra de espaco publicitario, utilizando o TargetAd, nao tem quaisquer custos iniciais: os anunciantesso pagam efectivamente pelos anuncios que sao apresentados aos telespectadores. Como tal, se nenhumtelespectador estiver a ver o canal durante um intervalo publicitario, nenhum anuncio e apresentado e,consequentemente, os anunciantes nada tem que pagar.A celebracao de um acordo de cedencia de direitos de transmissao de publicidade entre um canal destetipo e um operador televisivo que utilize o TargetAd para distribuir e apresentar publicidade, permiteque o canal gere (mais) receitas a partir da publicidade televisiva.

5.3.2 Operadores Televisivos

Os operadores televisivos serao os unicos que terao um custo inicial na implementacao do TargetAd.Contudo, cremos que a recuperacao do investimento pode ser feita num curto espaco de tempo, visto queapos a implementacao do sistema, os custos inerentes a sua utilizacao sao inexistentes ou negligenciaveis.

Como vimos acima, os operadores devem pagar aos canais televisivos, no ambito do contrato de cedenciade direitos de transmissao de publicidade, uma verba correspondente ao valor publicitario dos seus teles-pectadores. Tal significa que, se os anunciantes comprassem espaco publicitario ao operador televisivo aomesmo preco que compram ao canal, as receitas da publicidade televisiva geradas pelo operador corres-pondiam exactamente a verba que este teria que pagar ao canal televisivo. Este cenario seria, obviamente,prejudicial para o operador de televisao. Como tal, o operador necessita de gerar receitas superiores averba a pagar ao canal televisivo. O TargetAd possibilita que tal aconteca, atraves de duas assuncoes:

2Valor extraıdo de http://www.ine.pt/

60

Page 81: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

1. Os anunciantes estao dispostos a pagar mais por anuncios que sejam, comprovadamente, apresen-tados ao publico-alvo definido;

2. Os anuncios apresentados sao mais relevantes para os telespectadores e estes evitarao os intervalospublicitarios com menos frequencia, ou seja, cada telespectador assistira em media a mais anuncios.

A primeira assuncao, embora careca de estudos que a possam comprovar, parece-nos bastante plausıveldado o aumento constante das receitas da publicidade noutros meios — nomeadamente na internet —onde ja e possıvel, desde ha algum tempo, direccionar publicidade e medir o seu impacto com precisao.Apesar de nao nos ser possıvel calcular com exactidao qual o aumento percentual que os anunciantesse dispoem a pagar pela transmissao de um anuncio direccionado em televisao, cremos que este valorpode variar de uma forma directamente proporcional a especificidade do publico-alvo do anuncio. Assim,para anuncios direccionados a um publico-alvo mais abrangente, os anunciantes estarao dispostos a pagarmenos, por apresentacao, do que para anuncios cujo publico-alvo seja mais restrito.

E igualmente expectavel que, ao ser apresentada publicidade mais interessante e relevante para os utili-zadores, estes nao a procurem evitar com tanta frequencia. Com efeito, 74% dos inquiridos no ambitode um estudo efectuado em territorio nacional, afirmam que tem por habito, durante os intervalos dosprogramas, dedicarem-se a outras actividades [10]. Cremos que esta percentagem pode descer signifi-cativamente se os anuncios apresentados durante os intervalos comerciais forem mais relevantes para ostelespectadores.Segundo os testes efectuados com utilizadores, explicitados em 5.2.2, os anuncios direccionados atraves doTargetAd foram considerados, pelos inquiridos, 33% mais relevantes que os anuncios nao direccionados.Como tal, podemos concluir que utilizando o TargetAd como plataforma de distribuicao e direcciona-mento de publicidade, os telespectadores passarao a assistir a um maior numero de anuncios televisivos,implicando, em ultima analise, uma subida nas receitas publicitarias geradas.

5.3.3 Anunciantes

Uma eventual adopcao do TargetAd pelos operadores televisivos representa uma serie de vantagens paraos anunciantes. Com efeito, estes poderao direccionar a publicidade televisiva de uma forma sem pre-cedentes. Poderao, tambem, ter acesso a dados relativos as campanhas publicitarias que lhes permitiraavaliar com precisao o sucesso (ou insucesso) das mesmas, bem como fornecer pistas sobre um eventualerro na definicao do publico-alvo.Estas vantagens, por si so, justificam o facto dos anunciantes estarem dispostos a pagar mais pela trans-missao de publicidade televisiva direccionada, em detrimento da transmissao publicitaria feita actual-mente. Adicionalmente, os anunciantes pouparao dinheiro ao utilizarem o TargetAd, na medida em quenao serao apresentados anuncios a telespectadores que nao se incluam no publico-alvo por estes definido.Os anunciantes sao, entre os tres tipos de entidades envolvidas no processo de compra e venda de publi-cidade televisiva, aqueles que mais ganham com a adopcao do TargetAd, tanto a nıvel financeiro comoa nıvel operacional. Assim, e esperado que os anunciantes, alem de darem preferencia a compra depublicidade televisiva direccionada, via TargetAd, impulsionem e fomentem uma adopcao deste sistemaem larga escala pois, dessa forma, poderiam tirar partido das vantagens oferecidas pelo TargetAd maisfrequentemente.

61

Page 82: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

62

Page 83: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Capıtulo 6

Conclusoes

Desde ha algumas decadas a esta parte, tem-se assistido a uma diminuicao contınua da eficacia da publi-cidade televisiva. Prova disso e o facto de cada vez menos telespectadores se recordarem das marcas quesao publicitadas durante os intervalos dos programas. Alem disso, os anunciantes tem-se deparado compoucas ou nenhumas inovacoes no que diz respeito a publicidade televisiva, tendo semelhante dificuldadeem calcular, hoje, o sucesso das suas campanhas televisivas como tinham ha 40 anos.Um dos principais motivos para a actual ineficacia da publicidade televisiva tem que ver com o factodo direccionamento dos anuncios apenas se basear na audiencia (que se cre ser) do programa. Este tipode direccionamento e tanto mais limitativo quanto mais heterogenea for a audiencia. Na internet, porexemplo, a publicidade e direccionada, muitas vezes, segundo aquilo que o internauta esta a ver. Po-demos encontrar exemplos desse tipo de direccionamento na publicidade que e apresentada nos servicosde webmail ou nos motores de busca. Este tipo de direccionamento, em que se tenta individualizar acomunicacao com cada utilizador, permite que os anuncios sejam mais relevantes para o mesmo. Ascrescentes receitas da publicidade na internet revelam que este e o caminho a seguir, sendo, assim, vitaltornar a publicidade televisiva mais relevante para os telespectadores.

Neste sentido, foi desenhado, implementado e avaliado o TargetAd, um sistema que permite a apre-sentacao de publicidade direccionada em sistemas IPTV. O principal objectivo do TargetAd e apresentarpublicidade televisiva que seja mais relevante para o utilizador e que, consequentemente, traga vantagenspara os outros participantes: canais televisivos, anunciantes e operadores de televisao. Com efeito, cremosque o TargetAd permite o crescimento das receitas dos canais e operadores televisivos no que concerne apublicidade televisiva, e possibilita, tambem, que os anunciantes observem um aumento do ROI das suascampanhas.

O TargetAd provou que os anuncios televisivos direccionados sao cerca de 33% mais relevantes paraos telespectadores que os seus congeneres nao direccionados. O aumento da relevancia da publicidadetelevisiva para os telespectadores implica que estes ultimos tenham uma melhor experiencia televisiva,ao mesmo tempo que dedicam mais atencao aos produtos ou servicos publicitados.

Neste sistema, o utilizador que esta a ver televisao e identificado implicitamente, atraves de tecnicasde aprendizagem supervisionada, nomeadamente, utilizando um classificador bayesiano (Naıve Bayes).O classificador e treinado com os consumos televisivos relativos a 10% dos utilizadores do operador detelevisao. O TargetAd nao e capaz, contudo, de identificar varios utilizadores em simultaneo, pelo queem tais situacoes os varios utilizadores tem que se identificar explicitamente.Como em qualquer sistema em que sejam registados dados relativos aos utilizadores, sobretudo para fins

63

Page 84: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

de personalizacao de conteudos, a privacidade e uma questao que deve ser cuidadosamente tratada. Assimsendo, a manutencao da privacidade dos utilizadores foi uma preocupacao constante no desenvolvimentodo TargetAd.Segundo a legislacao actual, dados passıveis de serem considerados pessoais sao aqueles que permitem queo indivıduo a que se referem seja identificavel atraves deles. No TargetAd, os unicos dados relativos aosutilizadores que sao registados nos perfis sao o sexo e a idade, dados esses que, no universo de utilizadoresde um operador de televisao, se revelam insuficientes para identificar unicamente uma pessoa. Como tal,a privacidade dos utilizadores do TargetAd nunca e ameacada.

O TargetAd contempla ainda uma componente administrativa, que automatiza toda a gestao de anuncios.Com efeito, os anunciantes podem submeter remotamente os seus anuncios para o sistema, atraves deuma aplicacao que lhes e fornecida, sendo que a distribuicao remanescente dos anuncios ate as STBs efeita de forma totalmente automatica. As comunicacoes remotas, entre os anunciantes e o sistema, saoassinadas digitalmente atraves de criptografia assimetrica e garantem a autenticidade e integridade dasmensagens, bem como o seu nao-repudio. Desta forma, o TargetAd permite obviar os custos inerentes aactual gestao administrativa dos anuncios, tornando-se uma opcao muito apetecıvel para os canais televi-sivos que pretendam reduzir despesas — o que sucede amiude numa altura de forte contraccao economica.

Para a seleccao e escalonamento dinamicos de anuncios, o TargetAd emprega uma solucao inovadoraque consiste numa analogia ao Problema da Mochila, como esta detalhado nas Seccoes 3.3.1 e 3.3.2.A utilizacao deste algoritmo foi testada, nomeadamente para se perceber qual o seu tempo medio deexecucao (este teste encontra-se explicitado na Seccao 5.1). Os resultados deste teste mostraram que,para intervalos cuja duracao e maior que 10 minutos e tendo mais de 100 anuncios disponıveis para se-leccao, o algoritmo leva mais de 2 segundos a produzir resultados. Para intervalos mais curtos, o tempo deexecucao do algoritmo nao costuma exceder 1 segundo. Cremos, portanto, que para anuncios mais longosa utilizacao deste algoritmo pode representar um problema, na medida em que os telespectadores naoestao habituados a uma interrupcao de conteudos de 2 segundos. Assim sendo, uma diminuicao do tempode execucao deste algoritmo sera um ponto incontornavel em desenvolvimentos futuros do TargetAd.

6.1 Trabalho Futuro

No desenvolvimento do TargetAd, surgiram varias ideias ou correccoes que podem ser implementadasfuturamente, de modo a melhorar o sistema.

6.1.1 Forma de Enderecamento

Actualmente, o TargetAd permite que os anunciantes direccionem a publicidade televisiva com base emdois criterios: idade e sexo do utilizador. Seria interessante, futuramente, integrar mais criterios nodireccionamento de publicidade, cuja prioridade seria definida pela necessidade dos anunciantes. Porexemplo, poder-se-ia incluir criterios como o rendimento do agregado familiar, o numero de filhos ou alocalizacao do lar. A implementacao de novos criterios, que ate pode nao representar um grande desafiotecnologico em alguns casos, levanta, uma vez mais, a questao da privacidade. Com efeito, a medidaque mais informacao pessoal e utilizada pelo sistema para direccionar a publicidade, mais facil se tornaidentificar um utilizador do sistema. Como tal, a utilizacao de novos criterios para direccionamento depublicidade, a ser feita, tem de ser alvo de uma analise detalhada, de forma a garantir que a privacidadedos utilizadores nao e violada.

64

Page 85: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

6.1.2 Identificacao Implıcita

Um dos requisitos nao-funcionais do TargetAd, como explicitado na Seccao 3.1, e nao ser intrusivo paraos utilizadores. Visto que a actividade de ver televisao decorre, tipicamente, num ambiente calmo erelaxado, qualquer esforco que se peca ao utilizador prejudica a experiencia televisiva do mesmo.Nesse sentido, a identificacao individual de utilizadores no TargetAd e feita de forma implıcita, sendopossıvel, de qualquer forma, que os utilizadores se identifiquem explicitamente se assim o desejarem.Contrariamente, o TargetAd nao consegue identificar varios utilizadores em simultaneo, pelo que, nestassituacoes, os diferentes utilizadores tem que se identificar explicitamente. A identificacao explıcita con-siste num esforco que e pedido aos utilizadores, esforco esse que pode nao ser bem aceite pela razao atrasexplicitada. Como tal, um dos futuros melhoramentos do TargetAd — e, talvez, um dos mais importantes— passa por encontrar uma forma de identificar implicitamente varios utilizadores. Embora nos parecaum melhoramento complexo e que talvez careca de outros canais de comunicacao para poder ser imple-mentado (por exemplo, identificacao atraves de RFID1), acreditamos, tambem, que a sua incorporacaono sistema seria um avanco significativo.

6.1.3 Esforco Negocial

Embora este ponto nao seja um melhoramento que seria desejavel integrar no TargetAd, e estritamentenecessario para que o TargetAd possa vir a tornar-se, efectivamente, uma solucao comercial.Dado que o TargetAd implica uma mudanca no paradigma negocial, transferindo a comercializacao doespaco publicitario dos canais televisivos para as operadoras de televisao, temos a consciencia de quesera necessario encetar um enorme esforco negocial para que todos os intervenientes no processo, espe-cialmente os canais televisivos, percebam que o sistema lhes trara, tambem, grandes vantagens. Paraque os canais televisivos entendam o TargetAd como um produto apetecıvel, e necessario, em primeirolugar, demonstrar-lhes que a sua adopcao significa um aumento de receitas e uma reducao de custosoperacionais, no que a publicidade televisiva diz respeito. Em segundo lugar, e indispensavel negociarcontratos entre os operadores e os canais televisivos, contratos esses que devem ser vantajosos para ambasas partes.Acreditamos que, numa fase inicial, a adopcao do TargetAd seja vista com mais reservas e necessite dealguma coragem administrativa. Contudo, estamos em crer que, apos ocorrer uma primeira adopcao porparte de um operador televisao e um ou mais canais, as vantagens serao de tal ordem que rapidamenteoutros concorrentes quererao, identicamente, adoptar o TargetAd.De qualquer forma, temos a consciencia que o TargetAd nao sera, pelo menos para ja, o proximo grandepasso no direccionamento de publicidade televisiva. Acreditamos, contudo, que o TargetAd e, inquestio-navelmente, um passo na direccao correcta.

1Radio Frequency ID

65

Page 86: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

66

Page 87: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Bibliografia

[1] C. Anderson. The Long Tail. Random House Business, 2006.

[2] G. Bertrand. The ip multimedia subsystem in next generation networks. Maio 2007.

[3] T. Bozios, G. Lekakos, V. Skoularidou, and K. Chorianopoulos. Advanced techniques for personalizedadvertising in a digital tv environment: The imedia system. 2001.

[4] R. Burke. Hybrid recommender systems: Survey and experiments. User Modeling and User-AdaptedInteraction, 12(4):331–370, Novembro 2002.

[5] V. L. Dureau. Addressable advertising on digital television. Broadcast Asia 2004, 2004.

[6] Ericsson. Service development studio (sds) 4.1: Developer’s guide, Fevereiro 2009.

[7] P. Europeu. Directiva 95/46/ce, Outubro 1995.

[8] Y. Fernandez, J. Arias, M. Nores, A. Solla, and M. Cabrer. Avatar: an improved solution for persona-lized tv based on semantic inference. Consumer Electronics, IEEE Transactions on, 52(1):223–231,Fevereiro 2006.

[9] D. Goren-Bar and O. Glinansky. Fit - recommending tv programs to family members. Computers& Graphics, 28(2):149–156, Abril 2004.

[10] Havas Media. Estudo sobre habitos e comportamentos dos portugueses face ao consumo de media.Survey, Havas Media, Dezembro 2006.

[11] Interactive Advertising Bureau. Internet advertising revenue report. Technical report, InteractiveAdvertising Bureau, Outubro 2008.

[12] Internet Advertising Bureau. Uk online adspend study results for the half year to june 2009. Survey,Setembro 2009.

[13] Invidi Press Release. Invidi technologies corporation and nielsen, announce agreement to advancemeasurement of targeted tv ads. http://www.invidi.com/pages/press_pr121907.html, Dezem-bro 2007.

[14] T. Kim and J. Brassil. Dynamic program insertion in high quality video over ip. In NOSSDAV ’03:Proceedings of the 13th international workshop on Network and operating systems support for digitalaudio and video, pages 32–40, New York, NY, USA, 2003. ACM.

[15] G. Lekakos and G. Giaglis. A lifestyle-based approach for delivering personalized advertisements indigital interactive television. Journal of Computer-Mediated Communication, Janeiro 2004.

[16] G. Lekakos, D. Papakiriakopoulos, and K. Chorianopoulos. An integrated approach to interactiveand personalized tv advertising. In Proceedings of the User Modelling Conference, 2001.

[17] P. Melville, R. J. Mooney, and R. Nagarajan. Content-boosted collaborative filtering. In In Procee-dings of the 2001 SIGIR Workshop on Recommender Systems, 2001.

[18] Multimedia Research Group. Iptv global forecast - 2008 to 2012. Technical report, MultimediaResearch Group, Outubro 2008.

67

Page 88: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

[19] A. Pigeau, G. Raschia, M. Gelgon, N. Mouaddib, and R. Saint-Paul. A fuzzy linguistic summa-rization technique for tv recommender systems. Fuzzy Systems, 2003. FUZZ ’03. The 12th IEEEInternational Conference on, 1:743–748 vol.1, Maio 2003.

[20] Portugal Telecom. Resultados consolidados. Survey, Portugal Telecom, Abril 2009.

[21] E. Rich. User modeling via stereotypes. pages 329–342, 1998.

[22] W. E. Spangler, M. Gal-Or, and J. H. May. Using data mining to profile tv viewers. Commun.ACM, 46(12):66–72, 2003.

[23] A. Thawani, S. Gopalan, and V. Sridhar. Viewing characteristics based personalized ad streamingin an interactive tv environment. Consumer Communications and Networking Conference, 2004.CCNC 2004. First IEEE, pages 483–488, Janeiro 2004.

[24] A. Thawani, S. Gopalan, and S. V. Context aware personalized ad insertion in an interactive tvenvironment. In Proceedings of the 4th Workshop on Personalization in Future TV, 2004.

[25] Tv-Anytime. Tv-anytime specification series s-3 on metadata, 2002. Acessıvel em http://www.tv-anytime.org/.

[26] T. C. Urdan. Statistics in Plain English, Second Edition. Lawrence Erlbaum Associates, Inc., 2005.

[27] D. Weiß, J. Scheuerer, M. Wenleder, A. Erk, M. Gulbahar, and C. Linnhoff-Popien. A user profile-based personalization system for digital multimedia content. In DIMEA ’08: Proceedings of the 3rdinternational conference on Digital Interactive Media in Entertainment and Arts, pages 281–288,New York, NY, USA, 2008. ACM.

[28] I. H. Witten and E. Frank. Data Mining: Practical Machine Learning Tools and Techniques, SecondEdition. Morgan Kaufmann, San Francisco, Junho 2005.

[29] M. F. Zibran. Chi-squared test of independence. Technical report, Department of Computer Science,University of Calgary, Alberta, Canada, Novembro 2007.

68

Page 89: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Apendice A

Taxonomia TV-Anytime

Neste anexo apresentamos o excerto da taxonomia TV-Anytime [25] utilizada no desenvolvimento doTargetAd e varias vezes referida nesta dissertacao. Alguns termos foram suprimidos por serem demasiadodetalhados e pouco relevantes.

Codigo Tıtulo Descricao

1 Intentions

1.1 Entertainment Programme intended primarily to evoke relaxation,feelings of pleasure and/or awareness of beauty.

1.1.1 Pure entertainment

1.1.2 Informative entertainment Programmes intended primarily to entertain butwith informative elements.

1.2 Information

1.2.1 Government Examples: A short message warning of the dangersof using fireworks, AIDS awareness campaigns etc

1.2.2 Pure information

1.2.3 Infotainment Programmes intended primarily to inform but withentertaining elements.

1.2.4 Advice

Programme intended to advise about matters of per-sonal interest such as consumer prices and quality, fi-nancial matters, health, or, for the interest of specialgroups, weather or traffic information

1.3 EducationProgramme primarily intended to increase kno-wledge about non-current subjects in a didactic ornon-didactic way, or to religiously inspire.

1.3.1 School Programmes

1.3.1.1 Primary Youth education in the first stages: between the agesof approx 4 and 12/13

1.3.1.2 Secondary Youth Education in the second stage - between theages of approx 12/13 and 18

1.3.1.3 Tertiary University/College education

69

Page 90: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

1.3.2 Lifelong/further education Adult education: Additional learning such as postgraduate and distance learning

1.4 Promotional Intended to promote content. Produced by the bro-adcaster or media owner. eg trails for TV/Radio

1.5 Advertising Example: Interstitial commercials

1.6 Retail

1.7 Fund-raising

1.8 Enrichment

1.8.1 General enrichmentProgramme primarily intended to increase kno-wledge about non current subjects in a non-didacticway.

1.8.2 Inspirational enrichment Programme based on different forms of religious be-liefs or intended to edify the audience.

2 Formats

2.1 Structured All programmes dealing with facts, situations, opini-ons, theories and forecasts.

2.1.1 Bulletin

2.1.2 MagazineProgramme consisting of separate items which has atleast one common quality and presented under onemain heading.

2.1.3 Commented event

2.1.4 DocumentaryProgramme concerning a single theme, involving des-criptive and/or interpretative commentaries, illus-trations, I/vs, statements, photos etc

2.1.5 Discussion/Interview/Debate Mainly verbal programme in which more than oneperson participates.

2.1.6 Lecture/Speech/Presentation Mainly verbal programme in which only one personparticipates.

2.1.7 Textual (incl. relayed teletext) Programme consisting only of alphanumerical infor-mation.

2.1.8 Phone-inProgramme with content primarily generated by con-tributions from the general audience either on thetelephone or by sending in emails/letters

2.1.9 DJ with discsProgramme (usually in audio only) in which a specia-list presenter introduces muic or otgher pre-recordedelements

2.2 Representation/PlayExample: Soap opera, Shakespeare play, MontyPython, radio play. Not: documantary or informati-onal programme whose subject is drama

2.2.1 Fictional portrayal of life Programme performed by live actors. E.g. Perfor-med drama

2.2.2 Readings Programmes consisting of readings of poems, storiesor other literary works.

2.2.3 Representation with puppets

70

Page 91: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

2.3 Cartoon/Animation Programme consisting of a dramatic work, construc-ted frame by frame without resource to live images

2.4 Show

2.4.1 Hosted show

Programme, that can be regarded neither as non-fiction nor as drama or music/dance in which one ormore persons fulfill the role of presenter, host, quizor games master, announcer, chairperson or speakerand where the rest of the participants are generallymembers of the public

2.4.1.1 Simple Game show

2.4.1.2 Big Game show

2.4.2 Panel-show

2.4.2.1 Simple Game show

2.4.2.2 Big Game show

2.4.3 Non-hosted show

Programme, that can be regarded neither as non-fiction nor as drama or music/dance in which no onefulfill the role of presenter, host, quiz or games mas-ter, announcer, chairperson or speaker

2.4.4 Standup comedian(s)Programme performed by a single. a pair or a groupof comedians performing directly towards the audi-ence

2.5 Artistic Performance Music,Dance,Mime etc. TV programmes (predomi-nantly) consisting of music, dance or ballet.

2.7 InteractiveFormats making use of a range of features such aslocal application support, return path and direct vi-ewer interaction

2.7.1 Local InteractivityFormats that happen in the ’box’ where broadcast’data’ is processed locally giving a sense of dynamicchoice

2.7.1.1 Static informational Services (news or entertainment) where the informa-tion is fixed and does not update

2.7.1.2 Dynamic informational Services where the information is dynamic and up-dates regularly from the broadcast stream

2.7.1.3 Viewing chats The show displays chats taking place over local andremote systems

2.7.1.4 Quiz - Basic multiple choice Using any key number, ft, or arrows etc

2.7.1.5 Quiz - Text or number entryanswers Entering real text or numbers into a format

2.7.1.6 Re-ordering Competitions based on moving lists into correct or-ders

2.7.1.7 Positional Challenges or games such as ‘Spot the Ball’, clickingon quess where something is

2.7.1.8 Sync quiz Synchronised with audio and/or video (the pro-gramme)

2.7.1.9 Timer quiz Quiz synchronised with audio and/or video

71

Page 92: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

2.7.1.10 Elimination and timer Against the clock

2.7.1.11 Categories Selecting from batches of questions

2.7.1.12 Level based quiz/game Cannot move on without completing last level - Dif-ficulty or linear challenge. . .

2.7.1.13 Following a sequence Temporal, simon says, red next then green etc

2.7.1.14 Local multi player Players using the same box in the same space

2.7.1.15 Multi stream audio-videoServices where the interaction is based mostlyaround alternate, parallel streamed audio or videoaccess

2.7.1.16 Enhanced advertisement Local interaction, more information locally etc

2.7.1.17 Logic based games

2.7.1.18 Word games

2.7.1.19 Positional games

2.7.1.20 Board games

2.7.1.21 Text based gaming

2.7.1.22 Dynamic 2D/3D graphics

2.7.2 Intermittent Response Formats that require an intermittent or continuousreturn path

2.7.2.1 Single impulse vote ala ‘clap-ometer’ - mass aggregation of single hit’press red now if you think this’ type votes

2.7.2.2 Impulse vote from choices Vote from range of items - favourite act, band etc

2.7.2.3 Impulse Yes/No vote Impulse vote from two choices yes/no

2.7.2.4 Impulse vote with a value Vote for something to happen with a value attached- eg: how many tins of baked beans should he eat

2.7.2.5 Submit answers/form Press now to send off answers or details - quiz orcompetition

2.7.2.6 SMS using mobile Sending text from mobile into iTV or web platforms

2.7.2.7 SMS using TV remote Entry of messages using TV number/letter keys

2.7.2.8 Impulse gambling Using intermittent persistently protected connectionto place real or fantasy bets

2.7.2.9 Impulse transaction Using intermittent persistently protected connectionto buy product - T or ECommerce

2.7.2.10 Multi player TS networked servi-ces/games Multi point networking in either time-shifted mode

2.7.2.11 Interactive advertisement Local interaction, request for more info, details evenlink to impulse transaction etc

2.7.3 Always On Connection Formats that ideally require a continuous connectionto be delivered

2.7.3.1 Chat Forum Using built in platform functionality

2.7.3.2 Chat Forum via web STB with other infrastructure layer eg: web chatengine in web browser on top of proprietary api

72

Page 93: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

2.7.3.3 Threaded mail discussions Listed as discussion threads such as usenet type

2.7.3.4 Point to point Show enables/includes one to one mailing

2.7.3.5 3rd party point to point Using 3rd party peer to peer (one to one) chat facilitylayered over the show

2.7.3.6 Voice chat using mic capability Speech to text engine enabling chat/mailing using IPfor example

2.7.3.7 Dual player networked services/-games One to one, peer networking

2.7.3.8 Multi player RT networked ser-vices/games Multi point networking in real time

2.7.3.9 Gambling services Using continuous persistently protected connection

2.7.3.10 Impulse transaction Using intermittent persistently protected connectionto buy product - T or ECommerce

2.7.3.11 Non-linear audio-video

Services where the interaction is based mostlyaround choosing alternate audio or video files - VODand AOD, maybe combined with 2.1.1.15 (multistream)

3 Contents

3.1 Non-Fiction

3.1.1 News Time-sensitive information

3.1.1.1 Daily news

3.1.1.2 Special news/edition

3.1.1.3 Special Reports

3.1.1.4 Commentary

3.1.1.5 Periodical/General

3.1.1.6 National politics/National As-sembly

3.1.1.7 Economy/Market/Financial/Business

3.1.1.8 Foreign/International

3.1.1.9 Sports

3.1.1.10 Cultural

3.1.1.11 Local/regional

3.1.1.12 Traffic

3.1.1.13 Weather forecasts

3.1.1.14 Service information

3.1.1.15 Public Affairs

3.1.1.16 Current affairs

3.1.2 Philosophies of life

3.1.2.1 Religion

73

Page 94: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

3.1.2.2 Non-religious philosophies

3.1.3 General non-fiction

3.1.3.1 Political

3.1.3.2 Social

3.1.3.3 Economic

3.1.3.4 Legal

3.1.3.5 Finance

3.1.3.6 Education

3.1.3.7 International affairs

3.1.3.8 Military/Defence

3.1.4 Media

3.1.4.1 MusicProgramme about a musical subject: NB if the con-tent is predominantly the music itself this is not thecategory to be used - instead refer to 3.6 Music

3.1.4.2 Dance

3.1.4.3 Theatre Programme aboiut he theatre such as a review pro-gramme:

3.1.4.4 Opera

3.1.4.5 Cinema Programme about subject concerning the world ofthe film and cinema not the film itself

3.1.4.6 Advertising Programme about (the world of) advertising

3.1.4.7 Press

3.1.4.8 Plastic Arts

3.1.4.9 Fine arts

3.1.4.10 Experimental arts

3.1.4.11 Architecture

3.1.4.12 Showbiz

3.1.4.13 Television

3.1.4.14 Radio

3.1.4.15 New media

3.1.5 Humanities

The branches of learning regarded as having prima-rily a cultural character and which usually includelanguge, literature, history, mathematics and philo-sophy.

3.1.5.1 Literature

3.1.5.2 Languages

3.1.5.3 History

3.1.5.4 Culture/tradition/anthropology/Ethnicstudies

3.1.5.5 War/Conflict

74

Page 95: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

3.1.6 Sciences

3.1.6.1 Applied sciences Sciences dealing with material phenomena or indus-trial processes.

3.1.6.2 Nature/natural sciences Biology, botany, geology and zoology.

3.1.6.3 Animals/Wildlife

3.1.6.4 Environment/geography

3.1.6.5 Space/Universe Astronomy, astrophisics,

3.1.6.6 Physical sciences Chemistry, electricity, mechanics, physics.

3.1.6.7 Medicine Programmes bout medical subjects, health etc.

3.1.6.8 Technology

3.1.6.9 Physiology

3.1.6.10 Psychology

3.1.6.11 Social

3.1.6.12 Spiritual

3.1.6.13 Mathematics

3.1.6.14 Archaeology

3.1.7 Human interest

3.1.7.1 RealityProgramme based on real life , usually by the cameraobserving without changing what is happening (’flyon the wall documentary’ for example)

3.1.7.2 Society/show business/Gossip

3.1.7.3 Biography/notable personalities

3.1.7.4 Personal problems

3.1.7.5 Investigative journalism

3.1.7.6 Museums

3.1.7.7 Religious buildings

3.1.8 Transport and Communications

3.1.8.1 Air

Programme consisting of elements on aviation as me-ans of commercial aviation. Elements concerning pri-vate pilots and general aviation should go in leisu-re/Hobbies, aviation (3.3.34) Programme consistingof elements on aviation as sport should go in (3.2.14)

3.1.8.2 Land

3.1.8.3 Sea

3.1.8.4 Space

3.1.9 Events

3.1.9.1 Anniversary eg: Royal family jubilee, programme marking theanniversary of a war,

3.1.9.2 Fair

75

Page 96: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

3.1.9.3 Tradeshow

3.1.9.4 Musical

3.1.9.5 Exhibition

3.2 Sports

3.2.1 Athletics

3.2.2 Cycling/bicycle

3.2.3 Team sports

3.2.4 Racket sports

3.2.5 Martial Arts

3.2.6 Water sports

3.2.7 Winter sports

3.2.12 Adventure sports

3.2.13 Strength-based sports

3.2.14 Air sports

Programme consisting of elements on aviation assport. Elements concerning commercial aviationshould be categoriesed in Air Transport (3.1.8.1) andelements concerning private pilots and general avia-tion should go in leisure/Hobbies, aviation (3.3.34)

3.2.15 Golf

3.2.16 Fencing

3.2.17 Dog racing

3.2.18 Casting

3.2.19 Maccabi

3.2.20 Modern Pentathlon

3.2.21 Sombo

3.3 Leisure/Hobby

3.3.1 Do-it-yourself Where the consumer is given advice on how to per-form home improvements themselves

3.3.2 Cookery

3.3.3 Gardening

3.3.4 Travel/Tourism

3.3.5 Adventure/Expeditions

3.3.6 Fishing

3.3.7 Outdoor Hiking, rambling,

3.3.8 Pet

3.3.9 Craft/Handicraft Sewing, model making, pottery

3.3.10 Art

76

Page 97: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

3.3.11 Music teaching how to play musical imstruments on lear-ning how to appreciate music

3.3.12 Board Games monopoply, mah jong etc

3.3.13 Computer Games programme about games played on a computer

3.3.14 Card Cames bridge, poker, etc

3.3.15 Fitness / Keep-fit

3.3.16 Personal health

3.3.17 Car

3.3.18 Motorcycle /Motoring

3.3.19 Fashion

3.3.20 Life/ House Keeping/Lifestyle

3.3.21 Technology/Computing

3.3.22 Gaming Non card games such as roulette, craps, etc

3.3.23 Shopping Consumer shopping advice: Not a programme desig-ned to sell a specific product to the consumer

3.3.24 Adult

3.3.25 Road safety

3.3.26 Consumer advice

3.3.27 Employment Advice

3.3.28 Boating

3.3.29 Parenting

3.3.30 Self-help

3.3.31 Collectibles

3.3.32 Jewellery

3.3.33 Beauty

3.3.34 Aviation

Programme consisting of elements on aviation as ahobby, eg private pilots and general aviation. Ele-ments concerning commercial avaiaton should be ca-tegoriesed in Air Transport (3.1.8.1) and elementsconcerning Aviation as a sport should be in 3.2.14and its sub-categories

3.4 FictionProgramme consisting of a prose or verse composi-tion, resp. one telling a story, written for or as if forperformance by actors, pup pets or animated.

3.4.1 General light drama Drama written after approximately 1918 andwithout literary or cultural pretensions.

3.4.2 Soap Dramatized serial programme dealing with easy-to-grasp situations performed by a limited cast.

3.4.2.1 Soap Opera

3.4.2.2 Soap Special

77

Page 98: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

3.4.2.3 Soap Talk

3.4.3 Romance

3.4.4 Legal Melodrama Drama production where thr primary action takesplace in law courts and/or law firms.

3.4.5 Medical melodrama Drama production situated in hospitals and/or dea-ling with medical subjects.

3.4.6 Action

3.4.6.1 Adventure

3.4.6.2 Disaster

3.4.6.3 Mystery

3.4.6.4 Detective

3.4.6.5 Historical/epic

3.4.6.6 Horror

3.4.6.7 Science fiction

3.4.6.8 War

3.4.6.9 Western

3.4.6.10 Thriller

3.4.6.11 sports

3.4.6.12 Martial arts

3.4.6.13 Epic

Dramatized narrative about the deeds of a traditio-nal or historical hero or heroes and/or dealing withor characterized by events of historical or legendaryimportance.

3.4.7 Fantasy/Fairy tale

3.4.8 Erotica

3.4.9 Drama based on real events (do-cudrama)

Drama based upon reality sometimes with documen-tary inserts.

3.4.10 Musical

3.4.11 Comedy Drama in a humourous style.

3.4.12 Effect Movies

3.4.13 Classical drama Drama written before approximately 1918.

3.4.14 Period drama Drama depicting events before 1918

3.4.15 Contemporary drama Drama written after approximately 1918 and withliterary and/or cultural value.

3.4.16 Religious

3.4.17 Poems / Stories

3.4.18 biography,

3.4.19 psychological drama

78

Page 99: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

3.5 Amusement

3.5.1 Game show

3.5.2 Quiz/Contest Competitions calling into play the competitors’ spe-cial knowledge and intelligence.

3.5.3 Variety Show Programme with various performers such as comedi-ans, magicians, singers etc..

3.5.4 Surprise show Programme of ’dream comes true’ type. ”

3.5.5 Reality show

3.5.6 Candid cameraProgramme in which the recording device is hiddenso the participants are not aware they are being re-corded

3.5.7 Comedy

3.5.7.1 Broken comedyHumorous and/or satirical programme consisting ofshort dramatical seqences, sketches, performed bycomedians.

3.5.7.2 Romantic comedy

3.5.7.3 Sitcom Dramatized series in a humourous style and perfor-med by a more or less fixed cast.

3.5.7.4 Satire

3.5.9 Humour Programme without sketches or ’broken drama’, con-sisting (mainly) of verbal jokes, gags, bloopers etc.

3.5.10 Magic/hypnotism

3.5.11 Circus

3.5.12 Dating show

3.5.13 Bullfighting

3.5.14 Rodeo

3.5.15 Airshow A programme depicting an organised event of an ai-ronautical nature

3.6 Music

3.6.1 Classical music Serious music including chamber, instrumental, ope-ratic, symphonic, vocal and choral music.

3.6.2 Jazz

Indigenous American popular music, born in NewOrleans of African slaves social circumstances. Thejazz idiom is characterized by certain syncopationsover strongly reiterated rhythms in which improvi-sation plays an important part.

3.6.3 Background music

3.6.4 Pop-rock The most central and widely circulated types of po-pular music, in particular rock and roll, etc.

3.6.5 Blues/Rhythm and blues/Soul/-Gospel

3.6.6 Country and Western

3.6.7 Rap/Hip Hop/Reggae79

Page 100: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

3.6.8 Electronic/Club/Urban/Dance

3.6.9 World/Traditional/Ethnic/Folkmusic

Music that is the product of a tradition that has beenevolved through the process of oral transmission.

3.6.10 Hit-Chart/Song Requests

3.6.11 Childrens Songs

3.6.12 Event music

3.6.13 spoken

3.6.14 Dance

3.7 Interactive Games

3.7.1 Content games categories

3.7.2 Style

4.1 General Audience Programmes not intended for a specific target group.

4.2 Age Groups The age group levels for which the programme is pri-marily intended..

4.2.1 Children

4.2.1.1 age 4-7 Age ranges are indicative and may vary slightly ineach country

4.2.1.2 age 8-13 Age ranges are indicative and may vary slightly ineach country

4.2.1.3 age 14-15 Age ranges are indicative and may vary slightly ineach country

4.2.2 Young Adults

4.2.2.1 age 16-17 Age ranges are indicative and may vary slightly ineach country

4.2.2.2 age 18-20 Age ranges are indicative and may vary slightly ineach country

4.2.2.3 age 21-24

4.2.3 Adults

4.2.3.1 age 25-34 Age ranges are indicative and may vary slightly ineach country

4.2.3.2 age 35-44 Age ranges are indicative and may vary slightly ineach country

4.2.3.3 age 45-54 Age ranges are indicative and may vary slightly ineach country

4.2.3.4 age 55-64 Age ranges are indicative and may vary slightly ineach country

4.2.3.5 age 65+ Age ranges are indicative and may vary slightly ineach country

4.2.3.6 specific single age

4.2.4 All Ages

4.3 Social Groups

80

Page 101: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Codigo Tıtulo Descricao

4.3.1 Ethnic Programme for people differing in language and/orculture E.g. .Local key words to apply (ie Asian, )

4.3.2 Religious Local key words to apply (ie Shinto, Christian, Hinduetc)

4.4 Occupational Groups The occupation of the consumer for whitch the pro-gramme is primarely intended

4.4.1 AB

4.4.1.1 A Opinion former, Judge, Member of the govt etc

4.4.1.2 B Industry leader, Senior Govt figure, Professionals(Doctors, Lawyers etc) etc

4.4.2 C1C2

4.4.2.1 C1 ”White Collar worker”

4.4.2.2 C2 Skilled manual labourer

4.4.3 DE

4.4.3.1 D General manual labourer

4.4.3.2 E Unemployed (+ students!)

4.5 Other special interest/occupati-onal groups

Local Keywords to apply. (ie Farmer, Student, DIY,Angler, Gay and lesbian,

4.6 Gender

4.7 Geographical The territory for which the programme is primarilyintended..

4.7.1 Universal Intended for all audiences regardless of territory

4.7.2 Continental Asia, European

4.7.3 National France, S Africa

4.7.4 Regional Mid West, Pacific Rim

4.7.5 Local Zip Codes, Postcodes, Towns

4.8 Education Level

4.9 Lifestyle Stages

4.9.1 Single Single person with no dependants

4.9.2 Couple cohabiting adult with no dependants

4.9.3 Family with Children 0-3 adult with pre school children

4.9.4 Family with Children 4-7 adult with young children

4.9.5 Family with Children 8-15 adult with older children

4.9.6 Family with Children 16+ adult with young dependant adults

4.9.7 Empty Nester adult whose dependants have left home

4.9.8 Retired single or widowed adult whose dependants have lefthome

Excerto da taxonomia TV-Anytime utilizada no desenvolvimento do TargetAd

81

Page 102: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

82

Page 103: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Apendice B

Teste com Utilizadores

Neste apendice sao detalhados os resultados do 2o Teste com Utilizadores, mencionado na Seccao 5.2.2.Nestes testes, foram apresentados aos inquiridos anuncios direccionados e nao direccionados, de formaaleatoria. Apos a apresentacao de um anuncio, solicitava-se ao inquirido que o classificasse segundo asua relevancia, numa escala de 1 (nada relevante) a 6 (totalmente relevante). Atraves da analise dosresultados concluımos que os anuncios direccionados sao 33% mais relevantes para os utilizadores que osanuncios nao direccionados.

Idade Sexo Nome do Ficheiro Direccionado Relevancia

24 M activia.flv Nao 122 M activia.flv Nao 525 M activia.flv Nao 131 M activia.flv Nao 124 M americanexpress.flv Sim 322 M americanexpress.flv Sim 124 F ariel.flv Nao 223 M ariel.flv Nao 221 F ariel.flv Nao 424 F ariel.flv Nao 323 M ariel.flv Nao 222 M ariel.flv Nao 323 M azeitegallo.flv Sim 323 M azeitegallo.flv Sim 227 M azeitegallo.flv Sim 325 M azeitegallo.flv Sim 424 M cabovisaomagico.flv Sim 331 M cabovisaomagico.flv Sim 225 M caipirao.flv Sim 423 F caipirao.flv Sim 223 M caipiraosmall.flv Sim 421 F casioexilim.flv Sim 267 F casioexilim.flv Sim 123 M centrum.flv Nao 225 M cif.flv Nao 231 M cif.flv Nao 121 F cif.flv Nao 424 F cif.flv Nao 322 M cif.flv Nao 323 M cifactivegel.flv Nao 126 M cifactivegel.flv Sim 2

83

Page 104: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Idade Sexo Nome do Ficheiro Direccionado Relevancia

23 M cigala.flv Nao 123 M cigala.flv Nao 123 M cigala.flv Nao 321 F cigala.flv Nao 224 F cigala.flv Nao 424 F cigala.flv Nao 267 F cigala.flv Sim 427 M circuitoboavista.flv Sim 127 F circuitoboavista.flv Nao 125 M circuitoboavista.flv Sim 323 M cofidis.flv Sim 221 F cofidis.flv Sim 131 M cofidis.flv Sim 125 M cofidissmall.flv Sim 225 M cofidissmall.flv Sim 131 M cofidissmall.flv Sim 125 M cokelagrima.flv Sim 123 M cokelagrima.flv Sim 125 M cokelagrima.flv Sim 431 M cokelagrima.flv Sim 225 M colgateesmalete.flv Sim 331 M colgateesmalete.flv Sim 367 F colgateesmalete.flv Sim 124 F compalfrutosvermelhos.flv Nao 423 F compalfrutosvermelhos.flv Nao 425 M continentebifanas.flv Nao 431 M continentebifanas.flv Sim 225 M continentebifanas.flv Sim 323 M continentebifanas.flv Nao 521 F continentebifanas.flv Nao 427 F continentebifanas.flv Sim 226 M continentecamping.flv Sim 324 F continentecamping.flv Sim 338 M continentecamping.flv Sim 127 F continentecamping.flv Sim 423 M continentecamping.flv Sim 231 M continentecamping.flv Sim 167 F continentefrescos.flv Sim 122 M creditoagricola.flv Sim 223 F creditoagricola.flv Sim 327 F creditoagricola.flv Sim 123 M creditoagricolasmall.flv Sim 325 M dieselperfume.flv Sim 423 F dieselperfume.flv Nao 427 F dieselperfume.flv Nao 422 M dieselperfume.flv Sim 124 F dieselperfume.flv Nao 325 F dieselperfume.flv Nao 125 M dovepessego.flv Nao 231 M dovepessego.flv Nao 125 M dovepessego.flv Nao 223 M dovepessego.flv Nao 1

84

Page 105: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Idade Sexo Nome do Ficheiro Direccionado Relevancia

23 M durex.flv Sim 431 M durex.flv Sim 223 M ecopontoamarelo.flv Sim 622 M ecopontoamarelo.flv Sim 431 M ecopontoamarelo.flv Sim 325 M elcorteingles.flv Sim 124 M energiasolar.flv Nao 423 M energiasolar.flv Nao 424 F energiasolar.flv Nao 323 F euromilhoesjoker.flv Sim 138 M euromilhoesjoker.flv Sim 124 M Famousgrouse.flv Nao 123 M Famousgrouse.flv Nao 421 F famousgrouse.flv Nao 223 F famousgrouse.flv Nao 424 F famousgrouse.flv Nao 225 M Famousgrouse.flv Sim 325 M Famousgrouse.flv Nao 431 M Famousgrouse2.flv Sim 323 F famousgrouse2.flv Nao 167 F famousgrouse2.flv Sim 624 M Famousgrouse2.flv Nao 122 M Famousgrouse2.flv Nao 225 F famousgrouse2.flv Sim 324 M Formasluso.flv Nao 125 M Formasluso.flv Nao 223 M Formasluso.flv Nao 238 M Formasluso.flv Nao 231 M Formasluso.flv Nao 124 M garnierespumas.flv Nao 125 M garnierespumas.flv Nao 223 M garnierespumas.flv Nao 126 M garnierespumas.flv Nao 138 M garnierespumas.flv Nao 125 M garnierespumas.flv Nao 131 M garnierespumas.flv Nao 123 M garnierorquid.flv Nao 126 M garnierorquid.flv Nao 127 F garnierorquid.flv Nao 227 M garnierorquid.flv Nao 125 M garnierorquid.flv Nao 131 M garnierorquid.flv Nao 123 F garnierorquid.flv Nao 267 F garnierorquid.flv Nao 623 M gazela.flv Sim 323 M gazela.flv Sim 225 M gazela.flv Sim 424 F hpv.flv Sim 523 M ikeacozinhas.flv Sim 267 F ikeacozinhas.flv Nao 123 M johnsonsbaby.flv Nao 1

85

Page 106: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Idade Sexo Nome do Ficheiro Direccionado Relevancia

23 M johnsonsbaby.flv Nao 124 F johnsonsbaby.flv Sim 227 F johnsonsbaby.flv Sim 122 M johnsonsbaby.flv Nao 231 M johnsonsbaby.flv Nao 325 M lancomehypnose.flv Nao 325 M lancomehypnose.flv Nao 225 M lancomehypnose.flv Nao 331 M lancomehypnose.flv Nao 124 F leocohen.flv Nao 131 M leocohen.flv Sim 324 M lidl.flv Sim 225 M lidl.flv Sim 323 M lidl.flv Sim 225 M lidl.flv Sim 325 M liptongreenlimao.flv Sim 431 M liptongreenlimao.flv Sim 125 M lorealshave.flv Sim 327 F lorealshave.flv Nao 122 M lorealshave.flv Nao 425 F lorealshave.flv Nao 138 M lutsine.flv Sim 224 F lutsinebebe.flv Sim 123 M magnum.flv Nao 124 F Magnum.flv Sim 422 M magnum.flv Nao 431 M magnum.flv Nao 123 M marcoaldany.flv Nao 122 M marcoaldany.flv Nao 325 M marcoaldany.flv Nao 131 M marcoaldany.flv Nao 121 F Meofibra.flv Sim 238 M meofibra.flv Sim 525 M meofibra.flv Sim 424 F Mimosaiogurtes.flv Sim 322 M mimosaiogurtes.flv Sim 331 M mimosaiogurtes.flv Sim 225 M mimosaiogurtes2.flv Nao 225 M mimosaiogurtes2.flv Nao 431 M mimosaiogurtes2.flv Nao 124 M mimosaiogurtes2.flv Nao 227 M mimosaiogurtes2.flv Nao 423 M mimosaiogurtes2.flv Nao 122 M mimosaiogurtes2.flv Nao 423 M minipreco.flv Sim 231 M minipreco.flv Sim 167 F Minipreco.flv Sim 424 M minipreco.flv Sim 122 M monologosvagina.flv Sim 124 M monologosvagina.flv Sim 221 F nintendodscam.flv Sim 323 M nintendodscam.flv Sim 4

86

Page 107: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Idade Sexo Nome do Ficheiro Direccionado Relevancia

31 M nintendodscam.flv Sim 267 F nintendodscam.flv Nao 123 M nissanpixo.flv Sim 222 M nissanpixosmall.flv Sim 324 M notarios.flv Nao 223 M notarios.flv Nao 523 M notarios.flv Nao 424 F notarios.flv Nao 125 M notarios.flv Sim 425 F notarios.flv Sim 125 M notarios.flv Nao 523 F notarios.flv Nao 421 F nseguros.flv Nao 125 M nseguros.flv Nao 331 M nseguros.flv Sim 325 F ob.flv Sim 531 M ob.flv Nao 123 F ob.flv Sim 467 F ob.flv Nao 626 M ob.flv Nao 123 M ob.flv Nao 125 M olay.flv Nao 125 F olay.flv Nao 131 M olay.flv Nao 125 M olay.flv Nao 123 M olay.flv Nao 123 F olay.flv Nao 327 F olay.flv Nao 324 F olay.flv Nao 323 M oliveiradaserra.flv Sim 421 F oliveiradaserra.flv Sim 223 M oliveiradaserra.flv Sim 322 M oliveiradaserra.flv Sim 525 M oliveiradaserra.flv Sim 424 M oliveiradaserra.flv Sim 224 F optimusalive.flv Sim 525 M optimusalive.flv Sim 524 M optimusalive.flv Sim 438 M optimusalive.flv Nao 267 F optimuskanguru.flv Nao 123 M optimuskanguru.flv Sim 421 F optimuskanguru.flv Sim 326 M optimuskanguru.flv Sim 338 M optimuskanguru.flv Sim 524 F optimuskanguru.flv Sim 425 M optimuskanguru.flv Sim 431 M optimuskanguru.flv Sim 224 M optimussony.flv Sim 225 M optimussony.flv Sim 267 F optimussony.flv Nao 123 M pilhao.flv Sim 4

87

Page 108: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Idade Sexo Nome do Ficheiro Direccionado Relevancia

25 M pilhao2.flv Sim 423 M pingodoceessentya.flv Nao 238 M pingodoceessentya.flv Nao 127 F pingodoceessentya.flv Sim 322 M pingodoceessentya.flv Nao 331 M pingodoceessentya.flv Nao 123 M pleno.flv Sim 127 F pleno.flv Sim 431 M pleno.flv Sim 267 F pleno.flv Nao 124 M plenotisanas.flv Sim 323 M plenotisanas.flv Sim 324 F plenotisanas.flv Sim 325 M plenotisanas.flv Sim 225 M plenotisanas.flv Sim 223 F plenotisanas.flv Sim 367 F plenotisanas.flv Nao 123 M plenotisanas.flv Sim 425 M politecnicos.flv Nao 431 M politecnicos.flv Nao 123 F politecnicos.flv Sim 523 M politecnicos.flv Sim 127 F politecnicos.flv Nao 423 M politecnicos.flv Sim 125 F politecnicos.flv Nao 126 M pontelectrao.flv Sim 524 M pontelectrao.flv Sim 323 M radiorenascenca.flv Nao 223 F radiorenascenca.flv Nao 223 M roc.flv Nao 225 M roc.flv Nao 125 M roc.flv Nao 131 M roc.flv Nao 124 M roc.flv Nao 327 F roc.flv Nao 227 M roc.flv Nao 124 M sagreszero.flv Sim 224 F sagreszero.flv Nao 227 F sagreszero.flv Nao 125 M sagreszerosmall.flv Sim 224 M sagreszerosmall.flv Sim 125 M sagreszerosmall.flv Sim 221 F sagreszerosmall.flv Nao 127 M sagreszerosmall.flv Sim 124 F sagreszerosmall.flv Nao 327 F sagreszerosmall.flv Nao 122 M sagreszerosmall.flv Sim 224 F sagreszerosmall.flv Nao 225 M sagreszerosmall.flv Sim 325 F sagreszerosmall.flv Nao 123 M sanexdeo.flv Nao 227 M sanexdeo.flv Nao 3

88

Page 109: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Idade Sexo Nome do Ficheiro Direccionado Relevancia

26 M sanexdeo.flv Nao 425 M sanexdeo.flv Nao 231 M sanexdeo.flv Nao 121 F santandersolid.flv Sim 227 M santandersolid.flv Sim 123 M santandersolid.flv Sim 124 F santandersolid.flv Sim 521 F santandersolidlongo.flv Sim 223 M sapoadsl.flv Nao 222 M sapoadsl.flv Nao 325 M sapoadsl.flv Nao 331 M sapoadsl.flv Nao 123 M sapoadsl.flv Nao 219 M sapoadsl.flv Nao 324 M sbsr.flv Sim 227 F sbsr.flv Sim 524 F sbsr.flv Sim 431 M sbsr.flv Sim 421 F segurodirecto.flv Sim 123 M segurodirecto.flv Sim 425 M sumolbliss.flv Sim 431 M sumolbliss.flv Sim 219 M sumolbliss.flv Nao 324 M sunnydelight.flv Nao 121 F sunnydelight.flv Nao 322 M sunnydelight.flv Nao 224 F sunnydelight.flv Nao 123 M surf.flv Nao 238 M surf.flv Nao 125 M surf.flv Nao 131 M surf.flv Nao 124 M surf.flv Nao 167 F surf.flv Sim 424 M surf.flv Nao 225 M surf.flv Nao 223 M surf.flv Nao 227 M surf.flv Nao 122 M telepizza.flv Sim 425 F telepizza.flv Sim 323 M tmnfamilybox.flv Sim 321 F tmnfamilybox.flv Sim 424 F tmnmeomovel.flv Sim 325 M tmnmeomovel.flv Sim 323 M tmnmeomovel.flv Sim 426 M tonycarreiradueto.flv Nao 131 M tonycarreiradueto.flv Nao 124 M turismopt.flv Nao 423 M turismopt.flv Nao 324 M vaqueironatas.flv Sim 223 M vaqueironatas.flv Sim 325 M vaqueironatas.flv Sim 331 M vaqueironatas.flv Sim 2

89

Page 110: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Idade Sexo Nome do Ficheiro Direccionado Relevancia

23 M vitalis.flv Nao 124 F vitalis.flv Sim 325 M vitalis.flv Nao 231 M vitalis.flv Nao 127 M vitalis.flv Nao 426 M vodafonenokia.flv Sim 323 M vodafonenokia.flv Sim 123 M vodafonenokia.flv Sim 225 M vodafoneroaming.flv Sim 425 M vodafoneroaming.flv Sim 423 M vodafoneroaming.flv Sim 323 M vodafoneroaming.flv Sim 425 M vodafonesamsung.flv Sim 424 M wiifit.flv Sim 223 M wiifit.flv Sim 327 F wiifit.flv Sim 425 M wiifit.flv Sim 267 F wiifit.flv Nao 124 F wortencanon.flv Sim 323 M wortencanon.flv Sim 331 M wortencanon.flv Sim 227 F yorn.flv Sim 422 M yorn.flv Sim 267 F yorn.flv Nao 138 M yorn.flv Nao 124 F zonfibra.flv Sim 422 M zonfibra.flv Sim 531 M zonfibra.flv Sim 3

Resultados detalhados do 2o Teste com Utilizadores

90

Page 111: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

Apendice C

Resultados do Inquerito

Na Seccao 4.4 foi descrita a execucao de um inquerito para gerar dados que permitissem treinar e testaro classificador utilizado no TargetAd. Nesse questionario, pedia-se aos inquiridos que seleccionassem osprogramas televisivos a que assistiam, ou assistiriam, caso estivessem em casa. Embora seja impossıvelapresentar aqui todas as respostas, devido a limitacoes de espaco, disponibilizamos alguns resultados, atıtulo de curiosidade, com base nas mesmas.

# Numero de Seleccoes Programa

1 115 Os Simpsons

2 83 Telejornal

3 71 Dr. House

4 58 Investigacao Criminal

5 57 Servico de Urgencia

6 49 Anatomia de Grey

7 41 O Mundo de Jim

8 36 Futurama

9 33 Mentes Criminosas

10 32 Family Guy

Top 10 dos programas mais vistos

91

Page 112: TargetAd - ULisboa...TargetAd Publicidade Direccionada em Sistemas IPTV Pedro Francisco Revez Abrantes Disserta˘c~ao para obten˘c~ao do Grau de Mestre em Engenharia Inform atica

# Numero de Seleccoes Canal

1 296 Fox

2 234 AXN

3 182 Fox Life

4 173 RTP 1

5 116 SIC Notıcias

6 95 TVI

7 93 Sport TV 1

8 81 Discovery Channel

9 79 SIC

10 71 SIC Mulher

Top 10 dos canais mais vistos

92