Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
INSTITUTO TECNOLÓGICO DE AERONÁUTICA
Israel Sales Ramos
Metodologia para otimização de anúncios pagos do Google
Trabalho de Graduação
2014
Civil
CDU: 658.8:519.862.6
Israel Sales Ramos
Metodologia para otimização de anúncios pagos do Google
Orientador
Prof. Dr. Alessandro Vinícius Marques de Oliveira (ITA)
Engenharia Civil-Aeronáutica
SÃO JOSÉ DOS CAMPOS
INSTITUTO TECNOLÓGICO DE AERONÁUTICA
2014
Dados Internacionais de Catalogação-na-Publicação (CIP) Divisão de Informação e Documentação
Ramos, Israel S. Metodologia para otimização de anúncios pagos do Google / Israel Sales Ramos São José dos Campos, 2014. 54f. Trabalho de Graduação � Engenharia Civil-Aeronáutica � Instituto Tecnológico de Aeronáutica, 2014. Orientador: Prof. Dr. Alessandro Vinícius Marques de Oliveira 1. Econometria. 2. Programação Matemática. 3. Marketing. I. Instituto Tecnológico de Aeronáutica. II.Título
REFERÊNCIA BIBLIOGRÁFICA RAMOS, Israel S. Metodologia para otimização de anúncios pagos do Google. 2014. 55f. Trabalho de Conclusão de Curso. (Graduação) � Instituto Tecnológico de Aeronáutica, São José dos Campos. CESSÃO DE DIREITOS NOME DO AUTOR: Israel Sales Ramos TÍTULO DO TRABALHO: Metodologia para otimização de anúncios pagos do Google TIPO DO TRABALHO/ANO: Graduação / 2014 É concedida ao Instituto Tecnológico de Aeronáutica permissão para reproduzir cópias deste trabalho de graduação e para emprestar ou vender cópias somente para propósitos acadêmicos e científicos. O autor reserva outros direitos de publicação e nenhuma parte desta monografia de graduação pode ser reproduzida sem a autorização do autor. ____________________________________ Israel Sales Ramos Rua Gustavo Sampaio, n 764 � São Gerardo CEP 60455-001 � Fortaleza - CE
RESUMO
Este Trabalho de Graduação visa à criação de uma nova metodologia de otimização de
investimentos em anúncios pagos do Google, baseado na escolha da melhor oferta para cada
uma das palavras-chave de um determinado portfólio de anúncios. O Trabalho é divido em
duas etapas: a modelagem econométrica da influencia da oferta de cada palavra-chave sobre
sua eficiência e a otimização da oferta no contexto global de um portfólio de palavras-chave.
A modelagem foi desenvolvida por meio de rotinas computacionais do Software
STATA de forma a obter equações que relacionem a oferta da palavra-chave com o seu custo
por venda e com o seu Quota de Mercado. Foi utilizado, também, programação não-linear
para decidir, a nível de portfólio, qual a melhor oferta para cada palavra-chave.
Ao final, foi feita uma comparação entre duas diferentes abordagens: uma utilizando
apenas a oferta como critério de otimização e a outra utilizando a oferta e a posição média do
anúncio para a tomada de decisão.
Palavras-chaves: Econometria; Carteira de projetos; Otimização; Análise de séries
temporais; Internet; Marketing; Administração.
ABSTRACT
This Graduate Work aims the creation of a new methodology for the optimization of the
investments in paid advertisings on Google, based on the choice of the best offer for each
������� �� � ���� ����� ����� ������ �� ��� ���� � � ��� � �� ��� ��
econometric modeling about the influence of the offer of each keyword over its efficiency and
the optimization of the offer in the global context of the k������� ������ �
The modeling was developed through the software STATA computer routines, in order to
��� � ���� �� �� ����� �� ������� ����� � � ���� �� ��� Quota de Mercado. It
was also utilized non-linear programming to decide, at a portfolio level, which was the best
offer to each keyword.
At last, it was made a comparison between both approaches: one using only the offer as
�� �� � �� �� �� �� � ��� �� ���� � �� �� ����� ��� �� ����� ��� Posição Média to
the decision-making.
Keywords: Econometrics: Project portfolio; Optimization; Time series analysis; Internet; Marketing; Administration.
Dedico esse trabalho ao meu pai,
Francisco Eduardo Nogueira Ramos
AGRADECIMENTOS
Aos meus pais, pelas oportunidades que me proporcionaram durante toda a minha vida.
Aos meus avós, que sempre alimentaram meus sonhos.
Aos meus amigos do ITA, por serem parte dessa conquista.
Aos professores Alessandro e Scarpel que me orientaram nesse trabalho
Aos demais professores do ITA e em especial aos professores da CIVIL, pelos ensinamentos e
dedicação.
��� � ���� ���� ���� ���� ����� �� �� �� �������� ��� ��� ������� �� giants.�
Isaac Newton
LISTA DE FIGURAS
Figura 1: Anúncios pagos (em negro) e anúncios orgânicos (em vermelho) ........................... 12Figura 2: Faturamento e-commerce (em bilhões de reais) ....................................................... 13Figura 3: Número de e-consumidor - em milhões .................................................................... 14Figura 4: Anúncio padrão do Google ....................................................................................... 17Figura 5: Volume de Busca para a palavra-����� �������� ..................................................... 20Figura 7: Matriz de correlações de Pearson Oferta .................................................................. 30Figura 8: Oferta Exponencial ................................................................................................... 31Figura 9: Matriz de correlações de Pearson Posição Média ..................................................... 35Figura 10: Matriz de correlações de Pearson Classificação do Anúncio ................................. 38Figura 11: Ferramenta de otimização baseado em Oferta ........................................................ 41Figura 12: Solver (Método e restrições) ................................................................................... 42Figura 13: Ferramenta de otimização baseado em Posição Média ........................................... 43Figura 14: Regressão Oferta x Quota de Mercado ................................................................... 50Figura 15: Elasticidades da regressão Oferta x Quota de Mercado .......................................... 50Figura 16: Regressão Oferta x Custo por Ordem ..................................................................... 51Figura 17: Elasticidades da regressão Oferta x Custo por Ordem ............................................ 51Figura 18: Regressão Posição Média x Quota de Mercado ...................................................... 51Figura 19: Elasticidades da regressão Posição Média x Quota de Mercado ............................ 52Figura 20: Regressão Posição Média x Custo por Ordem ........................................................ 52Figura 21: Elasticidades da regressão Posição Média x Custo por Ordem .............................. 52Figura 22: Regressão Classificação do Anúncio Competitor Raiz x Posição Média ............... 53Figura 23: Elasticidades da regressão Classificação do Anúncio Competitor Raiz x Posição Média ........................................................................................................................................ 53
LISTA DE TABELAS
Tabela 1: Tipos de palavras para anúncios de texto do Google ............................................... 16Tabela 2: Exemplos de Oferta .................................................................................................. 17Tabela 3: Exemplo de Classificação do Anúncio e do posicionamento do anúncio ................ 18Tabela 4: Teste Breusch � Pagan para Oferta........................................................................... 28Tabela 5: Matriz de correlações Oferta .................................................................................... 29Tabela 6: VIF para regressão modelo de Quota de Mercado ................................................... 32Tabela 7: VIF para regressão modelo de Custo por Ordem ..................................................... 32Tabela 8: Teste RESET (Modelo Oferta) ................................................................................. 32Tabela 9: Teste Breusch � Pagan para Posição Média ............................................................. 33Tabela 10: Matriz de correlações Posição Média ..................................................................... 34Tabela 11: VIF para regressão Posição Média x Quota de Mercado ....................................... 36Tabela 12: VIF para regressão Posição Média x Custo por Ordem ......................................... 36Tabela 13: Teste RESET (Modelo Posição Média).................................................................. 36Tabela 14: Matriz de correlação Classificação do Anúncio x Posição Média ......................... 38Tabela 15: VIF para regressão Classificação do Anúncio x Posição Média ............................ 39Tabela 16: Resultados do modelo baseado em Oferta .............................................................. 44Tabela 17: Resultados do modelo baseado em Posição Média ................................................ 45Tabela 18: Resultados comparativos entre os métodos ............................................................ 46
SUMÁRIO
1 I�T��DU��� ................................................................................................................................ 1�
1.1 M�TI�A��� .......................................................................................................................... 1�
1.� �O�ETI��............................................................................................................................... 1
� FU�DAME�TA��� C��CEITUA .................................................................................................. 1�
�.1 PAA��AR-C�A�E ................................................................................................................. 1�
�.� A�Ú�CI�R ............................................................................................................................. 1�
�.� �A�I �EIR.............................................................................................................................. 1�
�.�.1 �FE�TA.......................................................................................................................... 1�
�.�.� �DICE DE QUAIDADE .................................................................................................. 1�
�.�.� CARRIFICA��� D� A��CI� ....................................................................................... 1�
�.�. CPC ................................................................................................................................ 1�
�.�.� ��UME DE OURCA ....................................................................................................... 1�
�.�.� PA�CEA DE IMP�ERR�� DA �EDE DE PERQUIRA ........................................................ �2
�.�.� CT�................................................................................................................................. �2
�.�.� TA�A DE C���E�R�� ................................................................................................... �2
�.�.� QU�TA DE ME�CAD� ................................................................................................... �2
�.�.12 CURT� P�� ��DEM ...................................................................................................... �1
�.�.11 DU�A��� MËDIA DE UMA �IRITA ................................................................................ �1
�.�.1� TA�A DE C�MPETI���.................................................................................................. �1
�. DEFI�I��� D� DERAFI� ........................................................................................................ �1
� M�DE� DE �EG�ERR�� I�EA� MUTIPA ................................................................................ �
�.1 MÉT�D� D�R MÍ�IM�R QUAD�AD�R ��DI� �I�R (MQ�� ............................................... �
�.� C�EFICIE�TE DE DETE�MI�A��� ��................................................................................... ��
�.� TERTE T D�R PA��MET��R................................................................................................... ��
�. TERTE F .................................................................................................................................. ��
�.� MUTIC�I�EA�IDADE.......................................................................................................... ��
�.� �ETE��RCEDARTICIDADE...................................................................................................... ��
�.� TERTE �ERET .......................................................................................................................... ��
M�DEAGEM EC���MET�ICA..................................................................................................... ��
.1 DAD�R C�ETAD�R............................................................................................................... ��
4.� S��T�A�� TI�I�AD� .......................................................................................................... �2
4.� M�D��� BAS�AD� �M ����TA ........................................................................................... �2
4.4 M�D��� BAS�AD� �M P�SIÇ� MÉDIA.............................................................................. ��
5 �TIMI�A� ................................................................................................................................. 4
5.� M�D���S BAS�AD� �M ����TA.......................................................................................... 4
5.� M�D��� BAS�AD� �M P�SIÇ� MÉDIA.............................................................................. 4�
6 �ST D� D� CAS� .......................................................................................................................... 4�
6.� M�D��� BAS�AD� NAMÉDIA D� C ST� P�� ��D�M �MÉT�D� �).................................. 4�
6.� M�D��� BAS�AD� �M ����TA �MÉT�D� �) ...................................................................... 44
6.� M�D��� BAS�AD� �M P�SIÇ� MÉDIA �MÉT�D� �) ........................................................ 45
6.4 C�MPA�A� D�S M�D���S ............................................................................................. 46
7 C�NC� SÕ�S................................................................................................................................. 42
2 �����RNCIAS................................................................................................................................. 4
AN�E�S ................................................................................................................................................. 5
M�D��� BAS�AD� �MMAE CPC ..................................................................................................... 5
M�D��� BAS�AD� �M P�SIÇ� MÉDIA.......................................................................................... 5�
�����SS� C�ASI�ICAÇ� D� ANÚNCI� C�MP�TIT�� E P�SIÇ� MÉDIA ................................... 5�
12
1 INTRODUÇÃO
Google adwords é o nome da ferramenta de publicação de anúncios disponibilizada pelo
Google. A empresa aproveita os bilhões de visitantes mensais de sua plataforma para publicar
anúncios.
Quando é feita uma busca no Google o sistema identifica quais anunciantes escolheram
publicar seu anúncio para a palavra-chave buscada e de acordo com a quantidade paga por
cada anunciante (Oferta) e com a qualidade de seus anúncios (Índice de Qualidade) é feito o
posicionamento dos mesmos.
Figura 1: Anúncios pagos (em negro) e anúncios orgânicos (em vermelho)
O sistema funciona como um leilão no qual cada anunciante declara quanto está disposto
a pagar por cada anúncio. Uma métrica chamada de �Ad Rank� definida pelo produto do
Oferta pelo Índice de Qualidade é utilizada para definir o posicionamento de cada anúncio.
13
1.1 MOTIVAÇÃO
Dispensando a construção de lojas físicas, que aumentam consideravelmente os custos
fixos, e contando com a migração de clientes do mercado off-line, o mercado de e-commerce
tem se tornado cada vez mais atrativo no cenário nacional. Somente em 2013 o faturamento
com comercio eletrônico foi de 28.8 bilhões de reais, representando um aumento de 28% em
relação ao ano de 2013 (Webshoppers, 2014) (Figura 2).
Figura 2: Faturamento e-commerce (em bilhões de reais)
O número de e-consumidores atingiu o valor de 51.3 milhões no final de 2013 (Figura 3)
e possui a previsão de chegar ao patamar de 63 milhões de usuários no final de 2014, ou seja,
mais de 30% dos brasileiros terão realizado alguma compra online (Webshoppers, 2014).
14
Figura 3: Número de e-consumidor - em milhões
As grandes empresas varejistas brasileiras tem aproveitado a mudança de paradigma e
investido cada vez mais no mercado online de venda criando gigantes do ecommerce
brasileiro: Nova Pontocom, controladora das operações online da Casas Bahia, Extra e Ponto
Frio, e a B2W, controladora das operações online da americanas.com, Submarino, Shoptime e
Sou Barato.
O varejo online trouxe consigo mudanças na maneira de divulgar seus produtos. O
marketing off-line (televisão, radio, outdoor, banners, etc) não capturava todas as
oportunidades possíveis de convencer um cliente a realizar uma compra. Foi então que surgiu
o marketing online, totalmente conectado com o uso da internet.
Dentre os vários canais, destaca-se o anúncio de texto do Google por ser o mais difundido
no mercado mundial. Esse tipo de anúncio possui a vantagem de ser visível para o
consumidor apenas quando o mesmo realiza uma busca no site do Google sobre um tema
relacionado ao produto oferecido pela empresa. O anúncio do produto, portanto, é direcionado
somente aos usuários que realmente possuem interesse nele.
1.2 OBJETIVO
Diferentemente do marketing off-line, no qual é difícil mensurar o impacto sobre as
vendas de uma determinada campanha, o marketing online oferece muitos recursos para
avaliar a desempenho de suas campanhas: número de vendas por uma determinada campanha,
tempo de permanência na pagina web, número de pessoas que chegaram até a pagina de
pagamento, mix de produto, custos exatos com cada campanha. São quase ilimitadas as
métricas de desempenho que se pode observar no marketing online.
15
Apesar da imensa base de dados disponível para analise é raro encontrar empresas que
consigam aproveitar toda essa informação para a tomada de decisão estratégica. O intuito
desse trabalho foi, portanto, criar uma abordagem para determinar o valor ótimo da oferta de
cada uma das palavras-chave de um portfolio de anúncios pagos do Google. A metodologia
baseou-se na otimização do máximo valor pago por um click com o objetivo de maximizar o
número de vendas a um determinado valor de custo por transação estabelecido. Dessa
maneira, para uma determinada situação financeira da empresa (máximo valor admitido por
uma transação), é possível predizer o máximo número de transações de um determinado
portfolio de campanhas.
Existem diversas ferramentas no mercado que fazem a otimização da oferta para
palavras-chave (Camato, 2014) (Smartsuite, 2014), porém poucas são as referências
divulgadas que tratam do assunto. Esse trabalho vem, portanto, explorar mais sobre o tema da
otimização.
16
2 FUNDAMENTAÇÃO CONCEITUAL
2.1 PALAVRAS-CHAVE
Os anúncios são associados a palavras-chave definidas pelo anunciante e cada vez que
alguém busca no Google alguma dessas palavras-chave, os anúncios podem aparecer para
quem está realizando a busca. Na pratica existem três tipos de palavras: amplias, frases e
exatas que são exemplificadas na Tabela 1.
Tabela 1: Tipos de palavras para anúncios de texto do Google
Tipo de
Palavra
Exemplo
de Palavra
Como é
simbolizada
Anúncios podem
aparecer em buscas
que contenham:
Exemplo de buscas
que ativarão essa
palavra
Amplia Passagens
aéreas
+passagens
+ aéreas
Inclui erros de
digitação, sinônimos,
buscas relacionadas ao
tema
Passagens de avião
Frase Passagens
aéreas
����������
������
São frases e pequenas
variações dessas frases
Horários passagens
aéreas
Exata Passagens
aéreas
[passagens
aéreas]
É a busca exata e
pequenas variações da
mesma
Passagens aéreas
2.2 ANÚNCIOS
Os anúncios possuem a seguinte estrutura básica, exemplificada na Figura 4:
17
Figura 4: Anúncio padrão do Google
� Titulo : Primeira linha do anúncio que aparece na cor azul
� URL de Visualização: URL que estará visível no anúncio. Utiliza-se uma URL
diferente da verdadeira URL da pagina web para tornar o anúncio mais atrativo.
� URL de destino: Pagina web de destino na qual será direcionado o usuário.
� Linha descritiva 1: Linha utilizada para descrever mais sobre a empresa e o produto
� Linha descritiva 2: Linha secundária que é utilizada de apoio para descrever em mais
detalhes a empresa e o produto.
2.3 VARIÁVEIS
Nessa sessão é apresentado o conceito de todas as variáveis utilizadas para a resolução
do problema, discorrendo um pouco sobre a importância de cada uma delas para a tomada de
decisão.
2.3.1 OFERTA
� ������� �� ����� �� �� �� �� ������ ��������� � ������� �����-per-click
������� � ������ ���� �� ������ � ���� ���� ������� ����� ���� � ���or máximo
deseja pagar por um click para que o seu anúncio seja divulgado na busca do Google.
\
Tabela 2: Exemplos de Oferta
Palavra Anunciante Oferta
[passagens aéreas] TAM R$ 1,00
[passagens aéreas] Submarino Viagens R$ 1,50
[passagens aéreas] Decolar.com R$ 1,50
18
Palavra Anunciante Oferta
[reserva de hotel] Decolar.com R$ 1,00
[reserva de hotel] Booking.com R$ 1,50
2.3.2 ÍNDICE DE QUALIDADE
O Índice de Qualidade é um índice de qualidade que o Google dá a cada palavra-chave
e que serve de base para definir o posicionamento dos anúncios. O intuito é evitar que
usuários do Google tenham sua experiência prejudicada pela má qualidade de um anúncio. O
Índice de Qualidade depende basicamente de 3 fatores:
� CTR: Mede o quão atrativo é um anúncio para os usuários do Google. Basicamente é
o número de clicks que recebeu o anúncio dividido pelo número de vezes que o mesmo foi
mostrado. Será discutido com mais profundidade mais adiante.
� Relevância do Anúncio: Métrica utilizada para medir se o anúncio está relacionado
com a palavra-chave
� Experiência da pagina de destino: Métrica utilizada para avaliar a experiência do
usuário na pagina de destino do anúncio.
2.3.3 CLA SSIFICAÇÃO DO ANÚNCIO
Classificação do Anúncio é a métrica utilizada pelo Google para definir o
posicionamento do anúncio em sua pagina de busca. É definido pela multiplicação da Oferta
pelo Índice de Qualidade. Quanto mias alto o valor do Classificação do Anúncio melhor será
o posicionamento do anúncio, como mostra a Tabela 3.
Tabela 3: Exemplo de Classificação do Anúncio e do posicionamento do anúncio
Anunciante Palavra Oferta Índice de
Qualidade
Classificação
do Anúncio
Posição
TAM [passagens aéreas] R$ 1,00 9 9,00 1º
Lugar
Submarino
Viagens
[passagens aéreas] R$ 1,10 8 8,80 2º
Lugar
19
Anunciante Palavra Oferta Índice de
Qualidade
Classificação
do Anúncio
Posição
Decolar.com [passagens aéreas] R$ 1,20 7 8,40 3º
Lugar
2.3.4 CPC
O Google não cobra do anunciante o valor da Oferta por um click. O valor cobrado
(CPC) é o menor valor necessário para manter a mesma posição definida pela Classificação
do Anúncio. Dessa maneira, o valor é calculado dividindo-se o valor da Classificação do
Anúncio do competidor com uma posição inferior pelo Índice de Qualidade da palavra-chave
do anunciante em questão e somando a este valor a quantia de R$ 0,01.
���
���������� � �������� �� ���� �������
������ �� ��������� �� ������� � ������ ����
(1)
������
�
!� ���� "# ��!!
(2)
���$%&'()*+,
�-
� ���� "# ���.
(3)
2.3.5 VOLUME DE BUSCA
O Volume de Busca é volume de busca mensal para uma determinada palavra-chave.
O Volume de Busca representa a demanda do mercado.
20
Figura 5: Volume de Busca para a palavra-����� ��������
Como visto na Figura 5 o volume pode mudar de acordo com a época do ano. A
metodologia desenvolvida também terá que levar em consideração essas mudanças.
2.3.6 PARCELA DE IMPRESSÃO DA REDE DE PESQUISA
A Parcela de Impressão é definida pelo número de vezes em que o anúncio foi
mostrado dividido pelo Volume de Busca da palavra-chave.
2.3.7 CTR
O CTR é definido como a razão entre o número clicks no anúncio e o número de
impressões do anúncio. Essa é a métrica que possui maior peso para a definição do Índice de
Qualidade.
2.3.8 TAXA DE CONVERSÃO
A Taxa de Conversão é a razão entre o número de vendas e o número de clicks
necessários para gerar tais vendas.
2.3.9 QUOTA DE MERCADO
Para a aplicação da metodologia criou-se uma métrica que é definida pela razão entre
o número de vendas provinda de uma determinada palavra-chave e o seu Volume de Busca,
ou seja, qual é a porcentagem da demanda por uma palavra-chave está sendo transformada em
venda.
21
2.3.10 CUSTO POR ORDEM
Custo por Ordem é a média do custo decorrente de uma venda. Por exemplo, foi
necessário 1 mil clicks de um anúncio a um CPC de R$ 0,20 para realizar 10 vendas, o Custo
por Ordem será calculado da seguinte maneira:
����� ��� ��� �����
���� � ����� ���� � �� ����
�� �� ����������
2.3.11 DURAÇÃO MËDIA DE UMA VISITA
O Google permite saber qual foi o tempo médio de duração de um usuário na pagina
web a qual ele foi direcionado. Um alto valor dessa métrica, em geral, significa que a
mensagem divulgada no anúncio e que a palavra-chave que o ativou estão atraindo o público
alvo correto para o seu produto e mais do que isso, que navegação na pagina web está
agradando aos usuários.
2.3.12 TAXA DE COMPETIÇÃO
Taxa de Competição é definido como a porcentagem das vezes em que um determinado
competidor tem o seu anúncio publicado para uma mesma palavra-chave escolhida.
Exemplificando, se a empresa TAM e a empresa Submarino Viagens publicam anúncios para
a mesma palavra-chave [passagens aéreas] e seus anúncios são publicados 100 vezes e 30
vezes respectivamente, então a Submarino Viagens possui uma taxa de competição de 30%
nos anúncios da TAM. Essa métrica é importante para medir a competição com outros
grandes anunciantes que possuem produtos similares.
2.4 DEFINIÇÃO DO DESAFIO
O principal desafio encontrado pelos que gerenciam contas em Google Adwords é
aperfeiçoar o investimento em seus anúncios. Existem diversas ações que se pode tomar para
diminuir custos e gerar mais clientes: melhorar qualidade do anúncio, utilizar palavras-chaves
exatas para diminuir o risco, utilizar palavras-chave que tragam fluxo de clientes interessados
em produtos substitutos (vender passagem de avião para quem está interessado em comprar
passagem de ônibus), criar paginas web de destino mais atrativas para os usuários. Uma ação
22
muito conhecido pelos usuários de Adwords é mudança da Oferta. Por afetar diretamente os
custos e a receita gerada pelas campanhas, é muito utilizada para tomada de decisões
estratégicas da empresa. Por exemplo, a empresa decide duplicar suas vendas em um
determinado mês ainda que a rentabilidade caia um pouco ou a empresa está passando por
uma fase de redução de custos e precisa tornar mais rentáveis as campanhas de marketing
online, ainda que essa decisão implique em uma redução no número vendas.
A correta escolha da Oferta para cada uma das palavras-chave de um portfólio é,
portanto, de extrema importância para o crescimento sustentável das vendas de uma empresa
que utiliza esse canal de marketing.
A metodologia adota por esse trabalho será definir equações, através de regressões
multivariadas, que relacionem as variáveis de Oferta, Quota de Mercado e Custo por Ordem,
segundo as seguintes equações:
����� �� �������� �
� ������� �� �������� �� �������� �� �������� �� � (4)
����� ��� ������� �
� ������� ��� ������� �� �������� �� �������� �� � (5)
Posteriormente, essas equações serão utilizadas para montar um sistema não linear no
qual serão definidos as Ofertas de cada palavra-chave de modo a maximizar o número de
vendas a um máximo Custo por Ordem estabelecido para o portfólio de campanhas.
Por fim, esse modelo será comparado a um modelo utilizando a Posição Média como
métrica intermediaria das equações, ou seja, o problema será resolvido em uma etapa a mais.
Primeiramente, serão geradas as seguintes equações:
����� �� �������� � �
������� �� �������� �� ������� ������� �� ������� ������� �� � (6)
����� ��� ������� �
� ������� ��� ������� �� ������� ������� �� ������� ������� �� � (7)
Então, é definida a Posição Média para cada palavra-chave de modo a maximizar o
número de vendas. Posteriormente, encontra-se a Oferta referente a cada Posição Média
através da equação:
23
������� ������ � � ��������� ������ �� ������� �� ������� �� � (8)
Finalmente uma comparação entre os dois modelos é feita a fim de identificar qual dos
dois modelos melhor se aplica ao problema.
24
3 MODELO DE REGRESSÃO LINEAR MULTIPLA
Uma Regressão linear múltipla é definida quando duas ou mais variáveis independentes
se relacionam de forma linear para tentar explicar o comportamento de uma variável que será
chamada de dependente.
O modelo de uma regressão linear múltipla com k variáveis é dado por:
� �� � ���� � ���� � ���� � � � ���� � (9)
Para uma amostra com n observações, o modelo pode ser escrito da seguinte na forma
matricial:
�
�����������
��
� ��� ��� � ������
���������� � ������ � ���� � �
� ��� ��� � ������ �
��
������������ �
�
�������
(10)
O valor ��� é a j-ésima variável da i-ésima observação. A equação é então resumida da
seguinte forma:
� �� � (11)
3.1 MÉTODO DOS MÍNIMOS QUADRADOS ORDINÁRIOS (MQO)
O método MQO baseia-se na minimização da soma do quadrado dos erros ����� � ������ �. Utilizando a equação 16:
���� � ���
��� �� ! ��� �� ! ��� � � ! � �� ! � � � ! � � ��
(12)
A minimização ocorrerá quando a derivada de ���� em relação a b for zero.
25
��
�� ���
�� � ��
��� �
(13)
� ��
������ (14)
Para a utilização do método dos mínimos quadrados é necessário que algumas premissas
sejam cumpridas:
� Os regressos são fixos: as variáveis da matriz X não são estocásticas.
� O erro é aleatório com média zero
� Homoscedasticidade
� Não existe correlação entre os erros das observações
� Os parâmetros do modelo são valores fixos e desconhecidos
� Modelo é linear
� Erro tem distribuição normal
Quando alguma dessas premissas não é cumprida o método pode gerar estimadores com
viés.
3.2 COEFICIENTE DE DETERMINAÇÃO ��
O coeficiente de determinação é uma medida da qualidade do modelo em relação a estimação correta da variável dependente y. O coeficiente é definido matematicamente como:
�� � �� ��� � ���
����
� ��� � ������
(15)
Onde �� é a variável independente e ��� os valores preditos pelo modelo.
3.3 TESTE T DOS PARÂMETROS
O teste T de student tem por objetivo testar a significância das variáveis independentes
individualmente. Se a hipótese nula ��� ! �, não for rejeitada, significa que a variável
independente x não tem efeito sobre a explicação da variável y, caso contrario aceita-se a
hipótese alternativa �� ! " �.
26
3.4 TESTE F
O teste F é um teste de significância global, similar ao teste t. Esse teste verifica se existe
relação linear entre a variável Y e as variáveis explicativas X em que abaixo do nível de
significância rejeita-se a hipótese nula, e acima aceita-se.
3.5 MULTICOLINEARIDADE
Multicolinearidade é um problema onde as variáveis independentes possuem relações
lineares exatas ou aproximadamente exatas. Um indício claro de multicolinearidade é quando
o valor de �� é elevado, porém nenhum dos coeficientes da regressão é estatisticamente
significante segundo a estatística t. A consequência da multicolinearidade em uma regressão é
a presença de erro-padrão elevado no caso de multicolinearidade moderada ou severa.
A multicolinearidade foi identificada por meio do Teste de fator inflação da variância �
FIV. Como regra prática, para valores de ��� �� observa-se problemas de
multicolinearidade.
3.6 HETEROSCEDASTICIDADE
A regressão linear possui a premissa que a variância dos ��� ���� ão constantes e
condicionais aos valores das variáveis explicativas. O fenômeno ocorre quando as variâncias
não são iguais, ou apresentam uma forte dispersão. Como consequência os estimadores de
MQO são comprometidos em grau de confiabilidade.
A identificação da heteroscedasticidade foi feita pelo teste de Breusch � Pagan, tem como
teste de hipótese nula, que as variâncias dos erros são iguais, homoscedasticas, e a hipótese
alternativa é que as variâncias de erros são heteroscedásticas.
A estimação robusta é um método de correção para o caso de heterocedasticidade, que
possibilitará ainda o uso do método dos mínimos quadrados ordinários, em outras palavras, é
uma espécie de validação junto a heteroscedasticidade.
3.7 TESTE RESET
Esse teste foi proposto por Ramsey como um teste geral de erro de especificação de
regressão. A ideia de Ramsey é que se é percebido um padrão em que a média muda
27
sistematicamente com o estimado, aumentará R² sistematicamente. Isso indicaria que a função
está incorreta.
Ramsey, propõe testar a adição de potências na regressão original. Nesse teste, incluem-
se dentre as variáveis dependentes estimadas, duas potências uma ao quadrado e outra ao cubo
da variável dependente:
�� �� � ���� � ������ ����
�� �� (16)
É admitido um novo teste R², é feita uma relação com o R² antigo e calcula-se novamente
o teste F, a partir da seguinte fórmula:
������
� ������ ��������� �� ����� �� ���������
�! � ����� ���� � ������ �� "#�$��%��� �� ���� ����&��
(17)
Se o valor calculado de F for significativo, a um nível de significância de 5%, aceita-se a
hipótese de que o modelo está especificado corretamente.
28
4 MODELAGEM ECONOMETRICA
4.1 DADOS COLETADOS
Os dados utilizados para a modelagem econométrica são dados diários retirados da conta
de Google Adwords da Empresa CLICKBUS SERVICOS DE AGENDAMENTO LTDA. A
empresa se dedica a venda online de passagens rodoviárias. O site da empresa
(www.clickbus.com.br) agrega os serviços de diversas empresas de ônibus rodoviários
comparando os preços das passagens, a duração de viagem e tipo de serviço oferecido. Foram
colhidos dados referentes a palavra-chave [viação cometa no período de 24/01/2014 a
03/11/2014.
4.2 SOFTWARE UTILIZADO
O Software empregado para as analises econométricas foi o Stata/SE 11.1, por ser o
utilizado na disciplina de TRA-44 Planejamento dos Transportes e possuir todas as
ferramentas necessárias para as analises requeridas.
4.3 MODELO BASEADO EM OFERTA
Para modelar a Quota de Mercado foram utilizadas as seguintes variáveis: Oferta
Exponencial, Taxa de Conversão, Tendência, Volume de Busca, Dummies de Mês e
Dummies de dias da semana.
Primeiramente, realizou-se o teste de heteroscedasticidade de Breusch � Pagan (Tabela
4)
Tabela 4: Teste Breusch � Pagan para Oferta
Variável Dependente da Regressão �
Quota de Mercado 54,97
Custo por Ordem 541,00
Os resultados presentes na Tabela 4 indicam que as duas regressões possuem indícios
de heteroscedasticidade. Utilizou-se, então, uma regressão linear com controle de
autocorrelação e heteroscedasticidade (Estimador de Variância de Newey-West). Além disso,
29
com o objetivo de corrigir o problema da heteroscedasticidade utilizou-se a forma funcional
logarítmica para o caso da variável dependente.
Com o objetivo de investigar o problema da correlação entre as variáveis gerou-se a
matriz de correlação, presente na Tabela 5.
Tabela 5: Matriz de correlações Oferta
Cust� �r �rdem Qu�t� de�erc�d� �Oert� V�lume de �usc� Tendênci�
���� � �� �� 1
���� � M���� -0�3908 1
������ 0�5335 0�084 1
����� � B���� 0�1915 -0�1726 0�0864 1
��� ����� -0�2661 0�3363 -0�0261 -0�7496 1
O maior módulo de correlação encontrada foi entre o Volume de Busca e a Tendência (-
0,7496), porém, não temos indícios de correlação forte entre as variáveis.
Todas as relações apresentadas na Tabela 5 estão de acordo com as observações praticas
do comportamento de anúncios em adwords. A principal conclusão é de que a Oferta se
relaciona de forma positiva com o Custo por Ordem e Quota de Mercado, ou seja, um
aumento no valor da Oferta irá gerar um aumento do número de vendas, porém ocasionará,
também, um aumento no custo por venda. A variável de tendência se relaciona negativamente
com o Custo por Ordem e positivamente com o Quota de Mercado, mostrando que com o
passar do tempo a palavra tornou-se mais rentável. Pode-se atribuir essa melhoria as
constantes mudanças nos textos dos anúncios, as melhorias de usabilidade do site e a
implementação de novos meios de pagamento.
A seguir utilizou-se a matriz de correlações de Pearson para investigar que tipo de
relação possuem as variáveis entre si.
30
Figura 6: Matriz de correlações de Pearson Oferta
Deve-se observar que o tipo de relação existente na Matriz de Pearson é apenas um
indicio do verdadeiro comportamento entre as variáveis, pois o cruze feito na Matriz é apenas
entre duas variáveis e não leva em conta o peso das demais variáveis. Portanto, as relações
evidenciadas aqui devem ser comprovadas posteriormente através de argumentos
econométricos e comprovação pratica desse comportamento.
Um ponto muito importante dessa modelagem foi perceber que o Custo por Ordem e a
Quota de Mercado não variam de forma linear com a Oferta. Na pratica, percebe-se que a
partir de certo valor, incrementos no Oferta não geram aumento no número de vendas nem
aumento de Custo por Ordem. Optou-se, então, em transformar os dados de Oferta na seguinte
equação:
����������� �� � � � ����������� (18)
A equação foi desenhada de modo que alterações no valor de Oferta quando o mesmo
se encontrar acima R$ 10,00 não representem mudanças significativas no ����������� ��
(Figura 7).
Cost /converted
click
marketshare
ClickConversionRate
CTR
Impressionshare
maxcpc
tendencia
0
100
200
300
0 100 200 300
0
.01
.02
0 .01 .02
0
.05
.1
0 .05 .1
0
.1
.2
.3
0 .1 .2 .3
.5
1
.5 1
0
5
10
0 5 10
0
100
200
300
0 100 200 300
31
Figura 7: Oferta Exponencial
A forma funcional utilizada foi então:
�������� �� ������
�� � ���������������� � �� � �!� �� "�#$�%&� � �� �
'�(�)� �� *�%�� � �+ � �#��#�,� � � � -�)),#�% .% � � �
-�)),�% �� �,� �� %�)�#�
(19)
���"�%�� /� ���)�
�� � ���������������� � �� � �!� �� "�#$�%&� � �� �
'�(�)� �� *�%�� � �+ � �#��#�,� � � � -�)),#�% .% � � �
-�)),�% ���,� �� %�)�#�
(20)
Os resultados das regressões estão expostos da Figura 13 a Figura 16 do anexo do
presente documento.
Os valores de 0� encontrados foram de 81.53% para a regressão do Quota de Mercado
e de 77.51% para a regressão do Custo por Ordem. Além disso, percebeu-se que as variáveis
de Tendência, Volume de Busca, Dummy de Mês e Dummy de dia da semana não possuíram
significância t em todas as equações, indicando a não importância das mesmas para a
resolução do problema. Para esses casos foi retirada a variável da regressão.
As regressões foram aprovadas para o teste F de significância global: Quota de
Mercado (F=73,65) e Custo por Ordem (F=116,97).
As regressões também foram aprovadas pelo teste de multicolinearidade:
32
Tabela 6: VIF para regressão modelo de Quota de Mercado
Variável VIF 1/VIF
T�ndên��� 2�7� 0��6582�
���m� d� Bs�� 2�4� 0�4687
O��� � �5 0�66�9�2
m4 �46 0�687269
m8 �� 0�76�59
m9 �04 0�95825
Tabela 7: VIF para regressão modelo de Custo por Ordem
Variável VIF 1/VIF
T�ndên��� 2��2 0�4�669
m� �96 0�50968
m4 �85 0�5�9678
m8 �72 0�58288
O��� � �65 0�60459
m �55 0�64756
m6 �2 0�8�4986
Cs � �� O�d�m �7 0�85545
wd4 �0 0�99028
O resultado do teste RESET se encontra na Tabela 8:
Tabela 8: Teste RESET (Modelo Oferta)
Variável dependente da regressão RESET P valor
Quota de Mercado 36,9517 0,0000
Custo por Ordem 1,7191 0,1898
Passada a parte de validação dos testes, deseja-se, então comparar estados iniciais e
finais de Quota de Mercado, Custo por Ordem e Oferta. Então:
�������� �� ������������! " #$ % �& ' �()*+,-�.3:�;<=>?! @ #A %
D�E� �� ��GH��JK� @ #A % L�M�N� �� P�J�� @ #Q % D�G��G�R� @ # %
S�NNRG�J �UJ @ # % S�NNR�J �� �R� �� J�N�G�
(21)
��W����� �� ����������X���Y " #$ % W&' �()*+,-�.3:�<=<Z<>?Y @ #A %
D�E� �� ��GH��JK� @ #A % L�M�N� �� P�J�� @ #Q % D�G��G�R� @ # %
S�NNRG�J �UJ @ # % S�NNR�J �� �R� �� J�N�G�
(22)
33
Considerando que as demais variáveis permanecem constantes, calcula-se a diferença
entre as equações:
�� ����� �� ����������� � �������� �� ������������� � �� �
������ �!"#�$%$&$'( � ������ �!"#�)$%'(�
(23)
����� �� ���������� �
����� �� ������������ � �*+�,!-./012)345'$%$&$'(�!
-./012)345')$%'(6
(24)
Substituindo o valor de ��:
����� �� ���������� �
����� �� ������������ � ��78��,!-./012)345'$%$&$'(�!-./012)345')$%'(6
(25)
Analogamente, encontra-se a equação que relaciona Custo por Ordem e Oferta:
��9�� :� ;��<�����
� ��9�� :� ;��<�������
� ����=�,!-./012)345'$%$&$'(�!-./012)345')$%'(6
(26)
4.4 MODELO BASEADO EM POSIÇÃO MÉDIA
Para modelar o Quota de Mercado foram utilizadas as seguintes variáveis: Posição
Média Hiperbólico, Taxa de Conversão, Tendência, Volume de Busca, Dummies de Mês e
Dummies de dias da semana.
Primeiramente, realizou-se o teste de heteroscedasticidade de Breusch > Pagan (Tabela
9)
Tabela 9: Teste Breusch ? Pagan para Posição Média
Variável Dependente da Regressão @A
Quota de Mercado 6,39
Custo por Ordem 133,47
Portanto, nos dois casos rejeitamos a hipótese de homoscedasticidade dos erros.
Utilizou-se, então, uma regressão linear com controle de autocorrelação e
34
heteroscedasticidade (Estimador de Variância de Newey-West). Além disso, com o objetivo
de corrigir o problema da heteroscedasticidade utilizou-se a forma funcional logarítmica para
o caso da variável dependente.
A matriz de correlação entre as variáveis citas é apresentada na Tabela 10.
Tabela 10: Matriz de correlações Posição Média
Mk� Share Cus�t tr �rdem Ptsiçãt M�dia Vtlume de �usca Tendência
Q���� � ����� 1
���� ��� ���� -0,3908 1
������� �� -0,6157 -0,0254 1
����� � B���� -0,1726 0,1915 0,2067 1
�������� 0,3363 -0,2661 -0,5115 -0,7496 1
A maior correlação entre as variáveis é -0,74596, não apresentando, portanto indícios de
correlação forte entre as variáveis.
As relações apresentadas na Tabela 10 estão de acordo com as observações praticas do
comportamento de anúncios em adwords. A principal conclusão é de que o Posição Média se
relaciona de forma positiva com o Custo por Ordem e forma negativa com o Quota de
Mercado, ou seja, quanto mais próximo da primeira posição o anúncio maior será o número
de vendas e maior será o custo por venda.
A seguir utilizou-se a matriz de correlações de Pearson para investigar que tipo de
relação possuem as variáveis entre si (Figura 8).
35
Figura 8: Matriz de correlações de Pearson Posição Média
A partir da Figura 8 e de comprovações práticas percebe-se que a Quota de Mercado e
Custo por Ordem não são uma função linear de Posição Média. Será adotada então a forma
funcional de uma hipérbole para a Posição Média.
Portanto, utilizou-se a seguinte formula funcional:
�������� �� ������ �� ��
������� ������ �� � ���� �� �!"�#$� � �� �
%�&�'� �� (�#�� � �) � ��!��!�*� � � � +�''*!�# ,# � � �
+�''*�# �� �*� �� #�'�!�
(27)
��� �#�� -� .��'� �� ��
������� ������ �� � ���� �� �!"�#$� � �� �
%�&�'� �� (�#�� � �) � ��!��!�*� � � � +�''*!�# ,# � � �
+�''*�# �� �*� �� #�'�!�
(28)
Os resultados das regressões estão expostos da Figura 17 a Figura 20 do Anexo presente
documento. Os valores de /� encontrados foram de 92,29% para a regressão do Quota de
Mercado e de 71,76% para a regressão do Custo por Ordem. Além disso, as variáveis
obtiveram boa significância do teste t (todos com mais de 95% de confiança).
marketshare
Cost /converted
click
Averageposition
searchvolume
tendencia
0
.01
.02
0 .01 .02
0
100
200
300
0 100 200 300
1
1.5
2
2.5
1 1.5 2 2.5
0
5000
10000
0 5000 10000
0
100
200
300
0 100 200 300
36
As regressões foram aprovadas pelo o teste F de significância global: Quota de
Mercado (F=281,6104) e Custo por Ordem (F=85,6043).
As regressões também foram aprovadas pelo teste de multicolinearidade:
Tabela 11: VIF para regressão Posição Média x Quota de Mercado
Variáveis VIF 1/VIF
Po��ç�o é��� �,2� 0,8�48�
T��� �� on����o �,�� 0,87299
ol�m� �� B���� �,09 0,9��9
m� �,0� 0,9��77
m9 �,0� 0.9667�
Tabela 12: VIF para regressão Posição Média x Custo por Ordem
Variáveis VIF 1/VIF
Po��ç�o é��� �,�� 0,64429�
m� �,48 0,67�008
T��� �� on����o �,�9 0,8�788�
m6 �,�4 0,879276
m� �,�2 0,89026�
m7 �,�2 0,890�08
m8 �,� 0,90�60�
m9 �,04 0,96�7��
w�4 �,0� 0,987�0�
A seguir o teste RESET:
Tabela 13: Teste RESET (Modelo Posição Média)
Variável dependente da regressão RESET P valor
Quota de Mercado 119,1225 0,0000
Custo por Ordem 0,5045 0,4775
Apesar de o teste RESET dar indícios que o modelo está especificado incorretamente
para o caso do Custo por Ordem, será adotada a forma funcional exposta dado que seu
comportamento é condizente com o que é visto na prática.
A relação entre estados iniciais e finais ficará:
�������� �� ����������!"# $
%& '&
()*�+-) 35:�!;<=>?@ %A ' C�D� �� E�GH��JK� @ %A ' L�M�N� �� O�J�� @
%Q ' C�G��G�R� @ % ' S�NNRG�J �UJ @ % ' S�NNR�J ���R� �� J�N�G�
(29)
37
�������� �� ������ ����� ��� �
�������� ������ !�"#
$ �% � &�'� �� (�)*�+,� $ �% � -�.�/� �� 0�+�� $
�1 � &�)��)�2� $ � � 3�//2)�+ 4+ $ � � 3�//2�+ ���2� �� +�/�)�
(30)
Subtraindo as equações:
����� �� �����5� �� �
����� �� ������ ���� � �6789 7
:;<�=>; ?@A�"B� "#C 7:;<�=>; ?@A�"� !�"#
D
(31)
Substituindo o valor de ��:
����� �� �����5� �� �
����� �� ������ ���� � �%EF%89 7
:;<�=>; ?@A�"B� "#C 7:;<�=>; ?@A�"� !�"#
D
(32)
Analogamente, encontra-se a equação que relaciona Posição Média com Custo por
Ordem:
(�+�� G� H��/5� ��� (�+�� G� H��/� ����
� �%E%I8J �
������� �����B� "#C�
������� ������ !�"#K
(33)
A segunda parte da modelagem baseada em Posição Média é relacionar a posição ideal
para o anúncio com o valor de Oferta. Sabendo que a posição do anúncio é definida pelo
Classificação do Anúncio, uma regressão associando Posição Média e Classificação do
Anúncio foi criada de maneira a relacionar Posição Média com Oferta LHM��� �
N�����5������ �� O P ���Q ���R �R ST������R U. Para essa modelagem utilizou-se as seguintes variáveis: Posição
Média, Classificação do Anúncio, Volume de Busca, Tendência, Dummy de mês e Dummy
de dia da semana.
Analisa-se a matriz de correlações:
38
Tabela 14: Matriz de correlação Classificação do Anúncio x Posição Média
P�siçã� �dia Classificaçã� d� �núnci� Tendência
�o����o �é� 1
����� ����o o ������o -0,2129 1
������� -0,5099 -0,2555 1
Através dos valores expostos, conclui-se que não existem indícios para haver uma
correlação forte entre as variáveis.
A correlação entre a variável Classificação do Anúncio e a variável Posição Média é -
0,2129. O sinal negativo apresentado está coerente com a maneira de posicionamento do
Google no qual anunciantes com alto Classificação do Anúncio possuem um baixo Posição
Média.
A Figura 9 apresenta a matriz correlações de Pearson, que será utilizada para investigar a
forma funcional de cada variável:
Figura 9: Matriz de correlações de Pearson Classificação do Anúncio
Utilizou-se a forma funcional raiz quadrática para o Classificação do Anúncio. A forma
funcional final da regressão foi a seguinte:
Cost /converted
click
marketshare
Averageposition
Adrankcomp
0
100
200
300
0 100 200 300
0
.01
.02
0 .01 .02
1
1.5
2
2.5
1 1.5 2 2.5
0
20
40
0 20 40
39
������� ����
� � ����������� �� ������� � � � �� �� ���������
� � � ������ �� ��� � ! � �������� � "
� #������ �$� � % � #&����� �� � ����
(34)
O resultado detalhado da regressão encontra-se no Anexo desse trabalho (Figura 21 e
Figura 22). Portanto, a equação final que relacionam os estados iniciais e finais de Posição
Média e Classificação do Anúncio é a seguinte:
O valor de '� foi de 0,7942, porem alguns de seus estimadores não alcançaram
significância e foram removidos da equação, restando apenas os estimadores com 95% de
significância.
O teste F de significância global foi F = 91,8386, indicando que a variável dependente
pode ser explicada conjuntamente pelas variáveis independentes.
O resultado para o teste de multicolinearidade seguem na Tabela 15.
Tabela 15: VIF para regressão Classificação do Anúncio x Posição Média
Variáveis VIF 1/VIF
C()**+f+,)-.o
do 02ú2,+o 3453 64785857
T92dê2,+) 548: 64;;::3
m7 54<< 64<63==8
m= 54;; 64<7<<>3
m< 5477 64<:7>6=
m5 54> 648<=:7=
m; 5468 64:>75:7
wd7 5463 64:8:=57
Todos os valores de VIF foram menor que 10, indicando que não há indícios de
multicolinearidade na regressão.
O valor encontrado para o teste de Breusch-Pagan foi de Chi quadrado = 62,69 e P valor
de 0,0000, indicando que existe heteroscedasticidade. O problema foi resolvido utilizando o
estimador de variância de Newey-West na regressão
O valor para o teste de RESET foi de 20,9541 e 0,000 para o seu P valor, indicando que
não existe erro de especificação incorreta na regressão.
40
������� ������ � � ������� ������ � � �� � ���� ����� � �
����������� �� �� ������ �!
(35)
Dado que ���������� �� �� ���� � "�#$% � &����# �# '(����#, então:
������� ������ � � ������� ������ � � �� � �&����# �# '(����# �
��"�#$%�� � � �"�#$%�� �!
(36)
Substituindo o valor de ��:
������� ������ � �
������� ������ � � )*+,-) � �&����# �# '(����# � ��"�#$%�� � �
�"�#$%�� �!
(37)
5 OTIMIZAÇÃO
A segunda etapa do presente trabalho é criar uma ferramenta, com base nas equações
geradas na Sessão 4, que consiga, dado um valor máximo de Custo por Ordem admitido,
definir o Oferta de cada uma das palavras-chaves de um portfolio de modo a maximizar o
número total de vendas geradas por elas.
Para a construção da ferramenta utilizou-se o Software Excel e sua solução de problema
de programação matemática (Solver). Como se trata de um problema não linear utilizou-se o
método de .Gradiente Reduzido Generalizado/0
5.1 MODELOS BASEADO EM OFERTA
A Figura 10 apresenta a ferramenta de otimização de investimentos baseado em Oferta.
41
Figura 10: Ferramenta de otimização baseado em Oferta
As células A7 a A15 são um exemplo de um portfolio de palavras-chave de anúncios
Google. Para cada uma dessas palavras as variáveis Oferta, Quota de Mercado e Custo por
Ordem para a situação atual estão detalhadas nas colunas C, F e I.
A Quota de Mercado e o Custo por Ordem final estão dispostos nas colunas G e J e são
calculados a partir das equações 16 e 17 de acordo com a nova Oferta definida.
O número de vendas total é calculado através da seguinte equação:
������ �� ���� ������� �� ���� � ���� �� �������
�
���
(38)
O número de vendas para a situação inicial e a situação final é apresentado nas células
B2 e C2, respectivamente.
O Custo por Ordem total do portfolio é calculado através da seguinte equação:
���� ��� �����
� ������ �� ���� � ���� �� ������� � ���� ��� ����������
� ������ �� ���� � ���� �� �����������
(39)
Os Valores de Custo por Ordem para a situação inicial e a situação final são
apresentados nas células B3 e C3, respectivamente.
Utilizou-se, então a ferramenta Solver de programação matemática do Excel:
42
Figura 11: Solver (Método e restrições)
Definiu-se como célula objetivo o número de vendas final e as células sujeitas a
variações foram as de Oferta final. Além disso, duas restrições foram adicionadas ao sistema:
��� � ����������� � ��������� � ���� � ����������� (40)
����� ��� ��������� � ����� ��� ����������� (41)
Por ultimo, definiu-se o valor máximo de Custo por Ordem admitido para o portfolio de
palavras-chave. Os resultados para essa metodologia são detalhados na sessão 6.
5.2 MODELO BASEADO EM POSIÇÃO MÉDIA
A Figura 12 apresenta a ferramenta de otimização de investimentos baseado em Posição
Média.
43
Figura 12: Ferramenta de otimização baseado em Posição Média
Nesse caso, a Posição Média é uma variável intermediaria definida pela equação 28. A
Posição Média, por sua vez, define os valores de Quota de Mercado e Custo por Ordem por
meio das equações 23 e 24.
As restrições para esse problema de otimização são definidas abaixo:
������� ������ � � � (42)
������� ������ � � ���� (43)
����� ��� ������� � � ����� ��� �������� (44)
Os resultados para essa metodologia são detalhados na sessão 6.
6 ESTUDO DE CASO
6.1 MODELO BASEADO NA MÉDIA DE CUSTO POR ORDEM (MÉTODO
1)
O modelo baseado na média de Custo por Ordem define o ajuste de Oferta igualando a
diferença percentual entre o Custo por Ordem da palavra-chave e a média do Custo por
44
Ordem a diferença percentual entre o ���������� e o ����������, segundo a equação
abaixo:
���������� �����������
�����������
������ ��� ���������������� ����� ��� ����������
����� ��� ����������
(45)
���������� �
���������� � �����������������
����� ��� ����������
(46)
A grande desvantagem na adoção desse modelo é não saber o impacto no número de
vendas devido à mudança de Oferta, pois uma palavra-chave pode possui um Custo por
Ordem um pouco acima da média e possuir um número de vendas muito superior à média. A
diminuição da Oferta impactará diretamente o número de vendas do portfolio. Nesse casso,
portanto, uma diminuição da Oferta para outras palavras-chave seria a solução que poderia
maximizar o numero de vendas.
Outro problema decorrente ao uso desse modelo é o aumento excessivo do valor de
Oferta, para alguns casos observa-se que a palavra-chave já se encontra com todas as
variáveis otimizadas (Posição Média, CTR, Taxa de Conversão), porém a decisão é pelo
aumento do Oferta. O modelo não consegue identificar casos em que uma palavra já está em
um estado ótimo de rentabilidade.
6.2 MODELO BASEADO EM OFERTA (MÉTODO 2)
O modelo de ajuste de Oferta foi testado rodando o Solver em 5 diferentes situações de
Custo por Ordem admitido: -20%, -10%, 0%, +10%, +20%. Os resultados estão expostos na
Tabela 16.
Tabela 16: Resultados do modelo baseado em Oferta
Custo por Ordem Vendas
-20% -4,89%
-10% -0,11%
0% 3,69%
45
10% 6,80%
20% 9,40%
Percebeu-se que 26% das palavras-chave tiveram a Oferta aumentada em 100% (limite
estabelecido para máxima variação positiva) e que 10% das palavras-chave tiveram o Oferta
diminuído em 20% (limite estabelecido para máxima variação negativa). O motivo para que
ocorram mudanças tão agressivas é que, apesar de haver sido utilizada uma forma funcional
exponencial com o intuito de evitar que um aumento indiscriminado da Oferta gera-se um
aumento significativo do Custo por Ordem ou da Quota de Mercado, o modelo tenta,
insistentemente, aumentar o Oferta de palavras-chave que possuem um alto valor de Volume
de Busca, mas que já possui suas principais variáveis (Posição Média, CTR e Taxa de
Convesão) otimizadas.
6.3 MODELO BASEADO EM POSIÇÃO MÉDIA (MÉTODO 3)
O modelo de ajuste de Oferta foi testado rodando o Solver em 5 diferentes situações de
Custo por Ordem admitido: -20%, -10%, 0%, +10%, +20%, porém o modelo não conseguiu
atingir os valores de máximo Custo por Ordem admitido para os valores de +10% e +20% .
Nesses casos, um aumento dos valores de Oferta não gerava uma melhoria na Posição Média,
dado que todos os anúncios já estavam na posição 1,0. Dessa maneira, o Solver encerrou sua
solução, impondo um limite para a otmização. Os resultados estão expostos na Tabela 17.
Tabela 17: Resultados do modelo baseado em Posição Média
Custo por Ordem Vendas
-20% -7,54%
-10% +1,85%
0% 8,80%
+10% (atingiu 6%) 11,93%
+10% (atingiu 6%) 11,93%
O modelo baseado no Posição Média possui a vantagem de levar em consideração
uma das principais métricas responsáveis por mudanças no Custo por Ordem e no Quota de
Mercado.
46
6.4 COMPARAÇÃO DOS MODELOS
Realizou-se uma analise comparativa para o caso em que o Custo por Ordem máximo
admitido é igual ao Custo por Ordem atual. Os resultados para os três métodos apresentados
estão presentes na Tabela 18.
Tabela 18: Resultados comparativos entre os métodos
Palavra-chave Variação percentual do Oferta
Método 1 Método 2 Método 3
1 -1�� -1�� 0�
� 30� 100� 0�
3 130� 100� 0�
4 -�2� -3�� 0�
5 -4�� -�0� 0�
� �3� 100� �4�
2 5� 55� 0�
� �3� 100� 0�
9 �2� 100� 0�
10 -�� 1�� 0�
11 -11� �� 0�
1� 2�� 100� 0�
13 -44� -�0� -��
14 0� 3�� 0�
15 �1� 100� 0�
1� 1�� 2�� 0�
12 2�� 100� 0�
1� 99� 100� 0�
19 -49� -�0� -11�
�0 -�0� -�0� 0�
�1 41� 100� 0�
�� -42� -�0� -15�
�3 -33� -55� �1�
�4 -�4� -30� �1�
47
Palavra-chave Variação percentual do Oferta
Método 1 Método 2 Método 3
2� 996% 100% 296%
26 1�% 70% 0%
27 -4�% -80% -4%
28 80% 100% 0%
29 22% 100% 1�2%
30 8% 79% 0%
Percebe-se uma semelhança entre os resultados gerados a partir do método 1 e os
resultados gerados a partir do método 2. Os sinais das variações percentuais são quase todos
os mesmos, indicando que a decisão para aumentar ou diminuir o Oferta é a mesma nos dois
métodos. As variações em modulo, porém, são em média 32% mais intensas no método 1.
As variações percentuais de Oferta do método 3 foram bem distintas dos outros métodos.
Apenas algumas palavras-chaves desse método sofreram alteração de Oferta. Isso se deve
principalmente ao fato de esse método levar em conta o Posição Média não aumentar o Oferta
para uma palavra-chave quando a mesma já possui o Posição Média igual a 1. Essa
característica é bem marcante nesse método e reflete também nos resultados do portfolio
como um todo. Na comparação entre a Tabela 16 e a Tabela 17 percebe-se um crescimento
constante em torno de 3% no número de vendas para cada 10% de aumento no Custo por
Ordem máximo admitido, enquanto que no método 3 o crescimento é interrompido no 6% do
Custo por Ordem, pois nesse cenário todas as posições já estão em 1.0.
Uma desvantagem dos modelos 2 e 3 é o fato de que os coeficientes encontrados foram
calculados em base a uma palavra-chave. Dessa maneira, é assumido que o comportamento
das palavras-chave é o mesmo. Na pratica, nota-se que as palavras-chaves possuem
comportamentos distintos, pois cada uma delas possui uma concorrência diferente. No
entanto, para palavras-chaves que possuem concorrência semelhante as equações podem ser
aplicadas.
48
7 CONCLUSÕES
No presente trabalho foi destacada a importância de uma abordagem matemática para a
resolução do problema da otimização de investimento em anúncios pagos do Google.
Uma vez que o tema é considerado novo e possui alta complexidade, poucas empresas
que necessitam do serviço desprendem tempo para a resolução do problema, contratando uma
empresa para a realização do serviço.
O tema é ideal para uma analise matemática, já que o marketing online, diferentemente
do marketing off-line, consegue nos fornecer todos os dados da interação com o cliente final,
desde a visualização do anúncio até a realização da compra. Apesar disso, a criação dessa
metodologia foi complicada por não haver literatura divulgada sobre o assunto. Portanto,
durante a execução das analises não se tinha a certeza que a metodologia proposta resolveria o
problema.
A integração entre a modelagem econométrica e a programação matemática tornou
possível testar as equações encontradas em cenários de crescimento ou de redução de custos.
Aliando ao conhecimento pratico sobre o assunto, foi possível determinar que os modelos 1 e
2 possuem limitações claras na sua implementação. Ambos propõem aumento de Oferta
quando o Posição Média principal variável afetada pela variação do Oferta, já se encontra em
1.0. Além disso, o modelo 1 não se adapta as necessidades do momento da empresa, que pode
optar pela redução de custos ou por ser mais agressivo em seu crescimento e admitir um
Custo por Ordem mais alto. A metodologia 3 é, dentre as metodologias expostas, a que
produziu melhores resultados. Limitou o aumento de Oferta para as palavras-chave que
tinham um Posição Média maior que 1.0.
Esse estudo foi baseado em estimadores pelo Método dos Mínimos Quadrados
Ordinários. O fato é que as hipóteses iniciais do MQO, em especial a hipótese de que os
resíduos não tem correlação com as variáveis independentes, podem não estar sendo
cumpridas. Esse problema pode gerar um possível viés e inconsistência dos parâmetros
estimados. Apesar disso, esse método de estimação mostrou-se muito adequado para o estudo,
mas entende-se que existe a possibilidade de aprimorar o método de estimação dos modelos.
49
8 REFERÊNCIAS
Webshoppers� ����� ����� �� ��������� � ���� ��� �������� Disponível em: http://img.ebit.com.br/webshoppers/pdf/WebShoppers2014_2oSeme.pdf. Acesso em 18/11/2014. Devore� �� ��� ����� �Probability and Statistics for Engineering and the Sciences, 6th Edition �� ���� � !�lytechnic State University, Estados Unidos Camato� ����� �"�# ��$� % ���$� ���� Disponível em: http://www.camato.de/br/tecnologia.html. Acesso em 18/11/2014. Smartsuite, ����� �Bid Management�. Disponível em: http://smartsuite.com.br/bid-management. Acesso em 17/11/2014. STATA � ����� �Stata 13 documentation�� &���� '(� �)*
http://www.stata.com/features/documentation/. Acesso em 17/11/2014.
50
ANEXOS
MODELO BASEADO EM MAX CPC
Figura 13: Regressão Oferta x Quota de Mercado
Figura 14: Elasticidades da regressão Oferta x Quota de Mercado
_cons -7.679734 .1950424 -39.37 0.000 -8.063712 -7.295756 m9 .2867663 .0547506 5.24 0.000 .1789794 .3945533 m8 .3393379 .0487548 6.96 0.000 .2433547 .4353211 m4 -.6964023 .1615883 -4.31 0.000 -1.01452 -.3782847searchvolume .000071 .0000161 4.42 0.000 .0000393 .0001027 tendencia .0032596 .0004536 7.19 0.000 .0023666 .0041526clickconve~e 35.05547 2.49996 14.02 0.000 30.13382 39.97711 maxcpchiper .6085652 .1148792 5.30 0.000 .3824035 .8347268 lnmarketsh~e Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
Residual SS = 21.20141145 Root MSE = .2787Total (uncentered) SS = 7905.366632 Uncentered R2 = 0.9973Total (centered) SS = 114.8258144 Centered R2 = 0.8154 Prob > F = 0.0000 F( 7, 273) = 73.65 Number of obs = 281
RESET_PValue 0.0000 RESET 36.9517 F_PValue 0.0000 F 73.6528 RMSE 0.2787 R-squared 0.8153 [0.001] month==November 0.0031*** [0.005] month==May 0.0374*** [0.005] month==January -0.0198*** [0.070] search volume 0.3098*** [0.064] tendencia 0.4596*** [0.086] ClickConversionRate 1.2028*** [0.080] max cpc hiper 0.4214***
51
Figura 15: Regressão Oferta x Custo por Ordem
Figura 16: Elasticidades da regressão Oferta x Custo por Ordem
MODELO BASEADO EM POSIÇÃO MÉDIA
Figura 17: Regressão Posição Média x Quota de Mercado
_cons 3.941153 .1944008 20.27 0.000 3.558425 4.32388 wd4 -.1232209 .0611855 -2.01 0.045 -.2436803 -.0027614 m8 -.633423 .099172 -6.39 0.000 -.8286685 -.4381776 m6 -1.004442 .0616426 -16.29 0.000 -1.125801 -.8830827 m4 -1.504421 .2889524 -5.21 0.000 -2.073298 -.9355445 m3 -.2768049 .1177678 -2.35 0.019 -.5086611 -.0449488 m1 -.4107896 .1036073 -3.96 0.000 -.6147672 -.2068121 tendencia -.0031494 .0004589 -6.86 0.000 -.0040529 -.0022459clickconve~e -26.96905 2.971228 -9.08 0.000 -32.81867 -21.11942 maxcpchiper 1.531526 .168628 9.08 0.000 1.199539 1.863513 lncostconv~k Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
Residual SS = 37.79750784 Root MSE = .3735Total (uncentered) SS = 3270.942796 Uncentered R2 = 0.9884Total (centered) SS = 168.1028336 Centered R2 = 0.7752 Prob > F = 0.0000 F( 9, 271) = 116.97 Number of obs = 281
RESET_PValue 0.1898 RESET 1.7191 F_PValue 0.0000 F 116.9749 RMSE 0.3735 R-squared 0.7751 [0.009] weekday==Sunday -0.0180** [0.011] month==May -0.0699*** [0.007] month==June -0.1072*** [0.008] month==January -0.0428*** [0.012] month==February -0.0276** [0.011] month==April -0.0439*** [0.065] tendencia -0.4441*** [0.102] ClickConversionRate -0.9254*** [0.117] max cpc hiper 1.0606***
_cons -8.728445 .1050567 -83.08 0.000 -8.935262 -8.521627 m5 -.1416748 .0263375 -5.38 0.000 -.1935236 -.0898261 m9 .1963972 .0408405 4.81 0.000 .1159975 .2767969clickconve~e 29.13613 2.04157 14.27 0.000 25.11704 33.15522searchvolume .0000147 6.39e-06 2.30 0.022 2.12e-06 .0000273averagepos~r 2.624415 .1093345 24.00 0.000 2.409176 2.839654 lnmarketsh~e Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
Residual SS = 8.845486393 Root MSE = .1793Total (uncentered) SS = 7905.366632 Uncentered R2 = 0.9989Total (centered) SS = 114.8258144 Centered R2 = 0.9230 Prob > F = 0.0000 F( 5, 275) = 281.61 Number of obs = 281
52
Figura 18: Elasticidades da regressão Posição Média x Quota de Mercado
Figura 19: Regressão Posição Média x Custo por Ordem
Figura 20: Elasticidades da regressão Posição Média x Custo por Ordem
RESET_PValue 0.0000 RESET 119.1225 F_PValue 0.0000 F 281.6104 RMSE 0.1793 R-squared 0.9229 [0.003] month==July -0.0146*** [0.000] month==November 0.0021*** [0.070] ClickConversionRate 0.9997*** [0.028] search volume 0.0641** [0.100] average position h~r 2.4117***
_cons 2.150708 .3214021 6.69 0.000 1.517945 2.78347 wd4 -.1494778 .073557 -2.03 0.043 -.2942936 -.0046619 m9 -.3978327 .1134593 -3.51 0.001 -.6212065 -.1744589 m8 -.5371311 .066155 -8.12 0.000 -.6673742 -.4068881 m7 .9384755 .0994757 9.43 0.000 .7426321 1.134319 m6 -.8482497 .0709874 -11.95 0.000 -.9880067 -.7084927 m5 .2176625 .0495267 4.39 0.000 .1201565 .3151686 m3 1.098995 .1321712 8.31 0.000 .838782 1.359208clickconve~e -26.31646 3.593767 -7.32 0.000 -33.39171 -19.2412averagepos~r 2.199018 .3181735 6.91 0.000 1.572612 2.825425 lncostconv~k Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
Residual SS = 47.45760511 Root MSE = .4185Total (uncentered) SS = 3270.942796 Uncentered R2 = 0.9855Total (centered) SS = 168.1028336 Centered R2 = 0.7177 Prob > F = 0.0000 F( 9, 271) = 85.60 Number of obs = 281
RESET_PValue 0.4775 RESET 0.5045 F_PValue 0.0000 F 85.6043 RMSE 0.4185 R-squared 0.7176 [0.011] weekday==Sunday -0.0218** [0.001] month==November -0.0042*** [0.007] month==May -0.0593*** [0.011] month==March 0.1035*** [0.008] month==June -0.0906*** [0.005] month==July 0.0225*** [0.013] month==February 0.1095*** [0.123] ClickConversionRate -0.9030*** [0.292] averageposition hi~r 2.0156***
53
REGRESSÃO CLASIFICAÇÃO DO ANÚNCIO COMPETITOR X POSIÇÃO
MÉDIA
Figura 21: Regressão Classificação do Anúncio Competitor Raiz x Posição Média
Figura 22: Elasticidades da regressão Classificação do Anúncio Competitor Raiz x Posição Média
_cons 2.077838 .1072453 19.37 0.000 1.866701 2.288974 wd4 -.0558548 .0218649 -2.55 0.011 -.0989008 -.0128089 m8 -.3687234 .0430407 -8.57 0.000 -.4534587 -.2839882 m6 -.3815245 .0376894 -10.12 0.000 -.4557244 -.3073245 m5 -.1165534 .0139882 -8.33 0.000 -.1440922 -.0890145 m4 .5393355 .0995999 5.42 0.000 .3432508 .7354202 m1 -.3278746 .0453839 -7.22 0.000 -.417223 -.2385262 tendencia -.0024841 .0002316 -10.72 0.000 -.0029401 -.0020281adrankcomp~z -.1579541 .0203887 -7.75 0.000 -.1980938 -.1178143 averagepos~n Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust
Residual SS = 5.280923681 Root MSE = .1393Total (uncentered) SS = 390.0463734 Uncentered R2 = 0.9865Total (centered) SS = 25.66727036 Centered R2 = 0.7943 Prob > F = 0.0000 F( 8, 272) = 91.84 Number of obs = 281
RESET_PValue 0.0000 RESET 20.9541 F_PValue 0.0000 F 91.8386 RMSE 0.1393 R-squared 0.7942 [0.003] weekday==Sunday -0.0072** [0.004] month==May -0.0357*** [0.003] month==June -0.0358*** [0.001] month==July -0.0106*** [0.003] month==January 0.0135*** [0.004] month==April -0.0307*** [0.027] tendencia -0.3076*** [0.052] adrankcomp raiz -0.4106***
54
FOLHA DE REGISTRO DO DOCUMENTO
1. CLASSIFICAÇÃO/TIPO
TC
2. DATA
25 de novembro de 2014
3. REGISTRO N°
DCTA/ITA/TC-113/2014
4. N° DE PÁGINAS
55 5. TÍTULO E SUBTÍTULO: Metodologia para otimização de anúncios pagos do Google 6. AUTOR(ES):
Israel Sales Ramos 7. INSTITUIÇÃO(ÕES)/ÓRGÃO(S) INTERNO(S)/DIVISÃO(ÕES): Instituto Tecnológico de Aeronáutica � ITA 8. PALAVRAS-CHAVE SUGERIDAS PELO AUTOR:
Regressões Lineares, Econometria, Modelagem, Séries Temporais, Bid Management, Otimização de Bid, Google Adwords. 9.PALAVRAS-CHAVE RESULTANTES DE INDEXAÇÃO:
Econometria; Carteira de projetos; Otimização; Análise de séries temporais; Internet; Marketing; Administração. 10. APRESENTAÇÃO: X Nacional Internacional
ITA, São José dos Campos. Curso de Graduação em Engenharia Civil-Aeronáutica. Orientador: Prof. Dr. Alessandro Vinícius Marques de Oliveira. Publicado em 2014.
11. RESUMO:
Este Trabalho de Graduação visa à criação de uma nova metodologia de otimização de
investimentos em anúncios pagos do Google, baseado na escolha da melhor oferta para cada uma das
palavras-chave de um determinado portfólio de anúncios. O Trabalho é divido em duas etapas: a
modelagem econométrica da influencia da oferta de cada palavra-chave sobre sua eficiência e a
otimização da oferta no contexto global de um portfólio de palavras-chave.
A modelagem foi desenvolvida por meio de rotinas computacionais do Software STATA de
forma a obter equações que relacionem a oferta da palavra-chave com o seu custo por venda e com o seu
Quota de Mercado. Foi utilizado, também, programação não-linear para decidir, a nível de portfólio, qual
a melhor oferta para cada palavra-chave.
Ao final, foi feita uma comparação entre duas diferentes abordagens: uma utilizando apenas a
oferta como critério de otimização e a outra utilizando a oferta e a posição média do anúncio para a
tomada de decisão.
12. GRAU DE SIGILO:
(X ) OSTENSIVO ( ) RESERVADO ( ) CONFIDENCIAL ( ) SECRETO