12
Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP. Estratégias de retenção de clientes no marketing de relacionamento Anderson Guimarães de Pinho [email protected] Resumo As atuais práticas do mercado provam que é mais lucrativos para a empresa o investimento no relacionamento com o cliente com foco na retenção, do que outros resultados obtidos por incrementos na carteira. Conhecendo-se os riscos associados ao desligamento de um cliente, as empresas podem direcionar estratégias de marketing na busca da retenção para os clientes com maiores chances de evasão. Isto otimiza os resultados de marketing, pois clientes com baixo risco de perda deixam de ser atingidos. Empresas no ramo de seguros de plano de saúde devem se preocupar em criar valor para seus assegurados neste mercado que pouco se assemelha ao transacional, como ocorre nos grandes varejos. Clientes que optam por adquirir um plano de saúde em sua grande maioria buscam um relacionamento de médio para longo prazo. Seguradoras que souberem utilizar uma gestão inteligente do negócio agregando valor contínuo, identificando e antecipando-se a possível perda de um cliente, estarão contribuindo para o sucesso da empresa. Por estes motivos, nosso objetivo aqui será de desenvolver um modelo estatístico que identifique uma possível futura perda do cliente, para que as empresas foquem seus recursos na retenção deste, maximizando os resultados da corporação e satisfação do cliente. Palavra-chave Marketing de Relacionamento, Retenção de Clientes, Análise de Sobrevivência, Regressão Logística, CRM. O Marketing do Novo Século O marketing de relacionamento se apresenta como uma das formas mais contemporânea com a qual as empresas buscam criar valor para seus clientes. Diferentemente de qualquer década anterior, a de 90 tornou-se mais importante na compreensão das necessidades do consumidor e no gerenciamento do relacionamento. Um bom produto ou serviço não mais se venderá simplesmente por sua qualidade e utilidade, e propaganda e marketing criativos não serão fatores decisórios na compra em muitas ocasiões. Por estes motivos, campanhas de marketing focadas na satisfação de uma necessidade tornam-se menos eficazes quando não alinhadas a estratégias de relacionamento. Os objetivos do marketing do novo século são bem claros: criar um relacionamento duradouro de forma singular e nominal, satisfazendo as necessidades dos clientes, traduzindo-se em benefícios mútuos para ambas partes. Tais benefícios resultantes deste tipo de investimento podem ser sumarizados numa analogia aos 4 P´s do Marketing em 4 R´scomumente abordados neste contexto: Retenção, Referenciação, Rentabilização e, se necessária, a Recuperação de clientes. Podemos tratar a busca pela retenção como embrionária na cadeia de relacionamento com o cliente. A empresa focada neste aspecto resulta em fidelidade dos clientes, estes passam a interagir mais por mais tempo, sem a necessidade de que se busque a satisfação de um desejo na concorrência. Cria-se neste ponto um referencial com a empresa contratada (referenciação). Uma vez que o marketing focado na aquisição de novos clientes deixa de ser um aspecto primário, dando lugar ao marketing de relacionamento, os custos de pós-venda diminuem pela permanência de clientes antigos na carteira. Estes em sua grande maioria reagirão melhor ao estímulo de novas campanhas (rentabilização) do que clientes mais novos na carteira. E finalmente para um eventual

Estratégias de Retenção de Clientes no Marketing de Relacionamento

Embed Size (px)

DESCRIPTION

As atuais práticas do mercado provam que é mais lucrativos para a empresa o investimento no relacionamento com o cliente com foco na retenção, do que outros resultados obtidos por incrementos na carteira. Conhecendo-se os riscos associados ao desligamento de um cliente, as empresas podem direcionar estratégias de marketing na busca da retenção para os clientes com maiores chances de evasão. Isto otimiza os resultados de marketing, pois clientes com baixo risco de perda deixam de ser atingidos. Empresas no ramo de seguros de plano de saúde devem se preocupar em criar valor para seus assegurados neste mercado que pouco se assemelha ao transacional, como ocorre nos grandes varejos. Clientes que optam por adquirir um plano de saúde em sua grande maioria buscam um relacionamento de médio para longo prazo. Seguradoras que souberem utilizar uma gestão inteligente do negócio agregando valor contínuo, identificando e antecipando-se a possível perda de um cliente, estarão contribuindo para o sucesso da empresa. Por estes motivos, nosso objetivo aqui será de desenvolver um modelo estatístico que identifique uma possível futura perda do cliente, para que as empresas foquem seus recursos na retenção deste, maximizando os resultados da corporação e satisfação do cliente.

Citation preview

Page 1: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

Estratégias de retenção de clientes no marketing de relacionamento

Anderson Guimarães de Pinho

[email protected]

Resumo

As atuais práticas do mercado provam que é mais lucrativos para a empresa o investimento no relacionamento com o

cliente com foco na retenção, do que outros resultados obtidos por incrementos na carteira. Conhecendo-se os riscos

associados ao desligamento de um cliente, as empresas podem direcionar estratégias de marketing na busca da

retenção para os clientes com maiores chances de evasão. Isto otimiza os resultados de marketing, pois clientes com

baixo risco de perda deixam de ser atingidos.

Empresas no ramo de seguros de plano de saúde devem se preocupar em criar valor para seus assegurados neste

mercado que pouco se assemelha ao transacional, como ocorre nos grandes varejos. Clientes que optam por adquirir

um plano de saúde em sua grande maioria buscam um relacionamento de médio para longo prazo. Seguradoras que

souberem utilizar uma gestão inteligente do negócio agregando valor contínuo, identificando e antecipando-se a

possível perda de um cliente, estarão contribuindo para o sucesso da empresa. Por estes motivos, nosso objetivo aqui

será de desenvolver um modelo estatístico que identifique uma possível futura perda do cliente, para que as empresas

foquem seus recursos na retenção deste, maximizando os resultados da corporação e satisfação do cliente.

Palavra-chave

Marketing de Relacionamento, Retenção de Clientes, Análise de Sobrevivência, Regressão Logística, CRM.

O Marketing do Novo Século

O marketing de relacionamento se apresenta como uma das formas mais contemporânea com a qual

as empresas buscam criar valor para seus clientes. Diferentemente de qualquer década anterior, a de

90 tornou-se mais importante na compreensão das necessidades do consumidor e no gerenciamento

do relacionamento. Um bom produto ou serviço não mais se venderá simplesmente por sua

qualidade e utilidade, e propaganda e marketing criativos não serão fatores decisórios na compra em

muitas ocasiões. Por estes motivos, campanhas de marketing focadas na satisfação de uma

necessidade tornam-se menos eficazes quando não alinhadas a estratégias de relacionamento.

Os objetivos do marketing do novo século são bem claros: criar um relacionamento duradouro de

forma singular e nominal, satisfazendo as necessidades dos clientes, traduzindo-se em benefícios

mútuos para ambas partes. Tais benefícios resultantes deste tipo de investimento podem ser

sumarizados – numa analogia aos 4 P´s do Marketing – em “4 R´s” comumente abordados neste

contexto: Retenção, Referenciação, Rentabilização e, se necessária, a Recuperação de clientes.

Podemos tratar a busca pela retenção como embrionária na cadeia de relacionamento com o cliente.

A empresa focada neste aspecto resulta em fidelidade dos clientes, estes passam a interagir mais por

mais tempo, sem a necessidade de que se busque a satisfação de um desejo na concorrência. Cria-se

neste ponto um referencial com a empresa contratada (referenciação).

Uma vez que o marketing focado na aquisição de novos clientes deixa de ser um aspecto primário,

dando lugar ao marketing de relacionamento, os custos de pós-venda diminuem pela permanência

de clientes antigos na carteira. Estes em sua grande maioria reagirão melhor ao estímulo de novas

campanhas (rentabilização) do que clientes mais novos na carteira. E finalmente para um eventual

Page 2: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

caso de recuperação, o ex-cliente, poderá ponderar a experiência que viveu com a empresa (dentre

outras considerações) na decisão de resgatar este relacionamento.

Segundo Junxiang (1997) a retenção pode custar quatro até oito vezes menos que a aquisição de

clientes. No que tange a referenciação, um cliente insatisfeito manifestará sua infelicidade para

cerca de 8 a 10 pessoas ao seu redor. Conforme Karine (apud Reichheld & Sasser Jr., 1990),

dependendo do setor de atuação, as empresas podem rentabilizar seus negócios em lucros de 25% a

85%, reduzindo em apenas 5% a perda de clientes. E ainda, 70% dos clientes insatisfeitos irão

comprar outro produto da empresa se a empresa corrigir seus erros.

Acreditamos que a retenção de clientes passa a ser tão ou mais importante que a atração de novos

clientes, sendo o desempenho obtido pela empresa em ações que tangem outros R´s, conseqüências

deste aspecto. Sendo assim, este será o tema principal deste estudo, como estratégia competitiva no

aumento da qualidade da carteira de clientes.

Conforme se observa em Vanilda (apud Berry, 2002).

Marketing de Relacionamento é o processo de atrair, manter e aumentar os

relacionamentos com os clientes.

A Empresa e a Motivação do Estudo

A empresa em estudo apresenta-se como uma das maiores seguradoras de planos de saúde do

Brasil, e atualmente, busca alinhar suas práticas de marketing aos objetivos do marketing do novo

século. Identificar e diferenciar o cliente de forma nominal, interagir para que este conhecimento

traduza-se em benefícios para ambas partes, fortalecendo assim o relacionamento. Desta forma, a

gestão da carteira de clientes com foco no relacionamento – neste mercado que em muito pouco se

assemelha ao de transação – torna-se extremamente atraente.

A satisfação do cliente não se resume simplesmente à aquisição de um serviço, mas também na sua

avaliação contínua antes e após a venda. Isto significa que a relação cliente empresa é contínua, se

este relacionamento não permanece forte, o assegurado procurará outros players (concorrentes).

Vemos então que a fidelidade somente existirá enquanto suas necessidades e desejos forem

satisfeitos. Em outras palavras, seremos fiéis a uma empresa até o momento que decidirmos

satisfazer nossas necessidades e desejos em uma concorrente.

A lealdade por sua vez, só é adquirida a partir de um relacionamento de contínuo aprendizado, onde

por interesse próprio, o cliente permanecerá com a empresa mesmo que uma necessidade ou desejo

não seja satisfeito. Nosso principal objetivo aqui será de identificar clientes que estejam com fraco

relacionamento, próximos do desligamento (churn), para que a empresa possa investir no

relacionamento aumentando a fidelização.

Os avanços da tecnologia e as novas ferramentas utilizadas para implementação de estratégias de

negócios permitem que a gestão de milhares de clientes seja feita de empresa para cliente

individualmente (1to1). Todas as atuais práticas de marketing associadas diretamente ao contexto

Page 3: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

estudado (Marketing Direto, Telemarketing, E-mail Marketing), quando alinhadas ao Database

Marketing, viabilizarão toda a estratégia de negócio sem que isto represente custos extraordinários

para a empresa. Seria razoavelmente dispendiosa a demanda por canais de relacionamento com

capacidade para se relacionarem com milhões de clientes num curto período de tempo, sejam pelos

recursos humanos ou tecnológicos associados. Sendo assim, as informações cadastrais e

transacionais fornecidas pelo database marketing serão embrionárias na busca por critérios de

mensuração do risco de perda e evasão de um cliente. Isto será de extrema importância na

identificação de clientes com maiores riscos de evasão, para o direcionamento de ações de

relacionamento, sem que isto sobrecarregue algum tipo de recurso empresarial. As conseqüências

do ponto de vista estratégico, como já mencionado, são claras: aumento da lucratividade e valor

atribuído ao cliente.

Metodologia de Investigação

Muitos autores vêm utilizando duas técnicas estatísticas na prevenção de churn de clientes. O

Modelo de Regressão de Cox (Cox, 1972) e o Modelo de Regressão Logística, respectivamente

associadas a dois grandes grupos de metodologias estatísticas, os Métodos Estatísticos

Multivariados e a Análise de Sobrevivência, podem representar um grande diferencial competitivo

quando alinhadas ao contexto de marketing de relacionamento.

Junxiang (2001) e Gordon (2004) defendem o uso da Análise de Sobrevivência de dados, para

identificar a fidelidade de clientes e quantificar o valor atribuído ao cliente (Customer Life Time

Value, CLV). Já Karine (2006) e Neslin et al (2004), defendem o uso de Modelos de Regressão

Logística para a retenção de clientes, como uma estratégia competitiva no aumento da lucratividade

da empresa.

Ambas técnicas representam suas singularidades na aplicação, as quais dividem pesquisadores e

acadêmicos no que diz respeito à eficácia e conveniência de aplicação. O Modelo de Regressão de

Cox nos permite identificarmos quando consumidores irão interromper seu ciclo de vida, ou ainda,

quanto tempo mais eles manterão seu relacionamento. Esta análise baseia-se no acompanhamento

dos clientes a partir de um determinado tempo t, e a análise posterior de permanência ou evasão dos

mesmos durante um certo período.

No entanto, o Modelo de Regressão Logística trata-se de um método estatístico mais robusto na

análise de eventos dicotômicos se comparado ao Modelo de Cox, pois possui o poder de incorporar

efeitos não lineares associados à ocorrência de um evento. Sua estimação não depende do

acompanhamento do status de clientes a partir de um ponto de origem, o que facilita a

replicabilidade do modelo em outras amostras. E ainda, tratando-se de um modelo totalmente

paramétrico, isto nos permitirá uma melhor interpretabilidade de parâmetros associados ao modelo.

No entanto, este não permitirá investigar a ocorrência de eventos em um determinado tempo t.

Antes que resultados comparativos sejam apresentados para ambos modelos, deixemo-nos entender

um pouco mais destas duas técnicas de estudo na ocorrência de eventos dicotômicos.

Page 4: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

Regressão de Cox

O modelo de Regressão de Cox, ou regressão proporcional de hazard (tradução “perigo”), trata-se

de um método para investigar os efeitos de covariáveis independentes ao longo do tempo,

associadas à ocorrência de um dado evento. Em nosso estudo isto se traduz em avaliar os efeitos de

variáveis demográficas e transacionais na identificação de um possível churn de cliente. Para isto,

este modelo assume que o tempo até ocorrência de um evento, e as covariáveis associadas, são

relacionados pela seguinte equação:

ippi xbxbb

i ethth...

0110)]([)( (1)

onde

hi(t) é o hazard para o iésimo

cliente no tempo t

h0(t) é o patamar de hazard no tempo t

p é o número de covariáveis

bj é o valor do jésimo

coeficiente de regressão

xij é o valor do iésimo

cliente na jésimo

covariável

O objetivo da função de hazard é medir o “potencial” de um evento ocorrer – em nosso estudo,

churn – em um particular tempo t, dado que o evento ainda não ocorreu. Quanto mais alto for este

valor, maior o potencial de ocorrência. Observe que o patamar da função de hazard é igual para

todo cliente (efeito global), enquanto que as covariáveis nos auxiliarão na determinação de efeitos

individuais associados à evasão. Veja também que o efeito associado ao patamar da função é

dependente do tempo t, enquanto que as covariáveis independem de t.

O conceito de “hazard” não é tão intuitivo, no entanto, este se relaciona com a função de

sobrevivência (ver Kaplan e Meier, 1958) da seguinte forma:

t

i dtth

i etS 0

)( )]([

)( (2)

O valor resultante desta função Si(t), será a probabilidade de um dado evento ocorrer em um tempo

t. Quando aplicada esta função a cada um dos clientes da empresa em estudo, considerando o tempo

decorrido desde a sua inclusão até o momento, o resultado será a probabilidade de ocorrência de

churn “hoje”.

Regressão Logística

Page 5: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

O modelo trata-se de um método estatístico multivariado, no relacionamento de variáveis

independentes com uma variável dependente categórica. Esta técnica surgiu a partir da

impossibilidade de prevermos eventos dicotômicos dependentes de uma série de variáveis

independentes, pela utilização da tradicional técnica de regressão múltipla. Em nosso contexto, isto

se traduz na impossibilidade de prevermos a saída ou permanência de um cliente (evento

dicotômico), a partir de informações provenientes do database marketing, e outras fontes de dados

externas atravéz de um modelo de regressão simples ou múltipla.

A regressão logística reescreve o modelo clássico de regressão linear de modo a ajustar o valor de

uma variável dependente entre 0 e 1, representando a probabilidade de um evento estudado ocorrer.

Este enquadramento nesta escala pode ser obtido pela função abaixo, também conhecida como

função logit, e descreve exatamente a probabilidade de ocorrência do evento.

ipxpbi

xbb

ippi

e

ex

xbxbb

...110

110

1

)(

...

(3)

quando linearizada pela função log natural, obtêm-se a equação reduzida para o modelo de

regressão logística

ippi xbxbbodds ...ln 110 (4)

onde

)(1

)(

x

xodds (5)

A equação reduzida do modelo (4), conhecida como função logit, pode variar de menos infinito até

mais infinito. Como o objetivo do nosso estudo é a probabilidade de ocorrência de churn, a equação

logística (4) pode ser transformada numa equação de probabilidade segundo Karine apud Hair

(1999) da seguinte forma:

)...( 1101

1)(

ippi xbxbbe

churnprob (6)

Desta forma, os resultados obtidos pela equação acima retornarão uma probabilidade individual do

cliente sobre o risco de churn, principal objetivo em nosso estudo.

Sobre a natureza e fonte das variáveis utilizadas nos modelos

O database marketing tem permitido que grandes companhias identifiquem e analisem segmentos

de consumidores na mineração de informações importantes que possam ser usadas para o

crescimento do impacto de campanhas de marketing. No caso em estudo, será de grande

Page 6: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

importância no fornecimento de informações cadastrais, demográficas, geográficas e transacionais,

as quais possam ser utilizadas para a estimação dos modelos aqui propostos.

Cadastrais, associadas ao plano contratado. Demográficas, que segundo Kotler (p.246) são os meios

mais comuns de se distinguir grupos de clientes pela relação explicativa em necessidades, desejos e

preferências dos consumidores. Geográficas, no que se referem à distinção de bairros e áreas de

planejamento geográfico. E finalmente transacionais, pois experiências com database marketing

permitidas pelo avanço da tecnologia provam que esta, sem dúvida, é uma grande fonte de

informação na identificação de padrões de relacionamento implícitos.

Apresentamos agora, uma breve descrição das variáveis investigadas em ambos tipos modelos

estudados (algumas variáveis em somente um deles).

Tabela 1 – Variáveis do Modelo

Natureza Variável Descrição

Demográfica Sexo Sexo do cliente.

Demográfica Estado Civil Estado civil do cliente.

Demográfica Faixa Etária Faixa etária do cliente.

Geográfica Bairro Bairro onde encontra-se o domocílio do cliente.

Geográfica Área Administrativa Classificação de bairros segundo área administrativa (classificação do IBGE).

Geográfica Área de RendimentoClassificação de áreas administrativas

segundo participação de receita com a empresa, no rendimento do domicílio.

Cadastral Safra de Inclusão Indica o trimestre de inclusão na empresa.

Cadastral Ano de Inclusão Ano de inclusão na empresa.

Cadastral Agregados Identifica se o cliente tem pelo menos 1 agregado associado ao plano.

Cadastral Dependentes Identifica se o cliente tem pelo menos 1 dependente associado ao plano.

Cadastral Rede de Produto Grupo de produto onde classifica-se o plano do associado.

Cadastral Opcional Odontologia Identifica se o cliente tem opcional odontológico.

Cadastral Opcional p/ Emergências Identifica se o cliente tem opcional para socorros emergênciais.

Cadastral Opcional para Viagens Identifica se o cliente tem opcional socorros em viagens.

Cadastral DCCIdentifica se em algum momento o cliente optou por

pagamento de plano débito em conta corrente.

Transacional Tempo Consulta Tempo decorrido desde a última consulta (em dias).

Transacional Tempo Exame Tempo decorrido desde o último exame (em dias).

Transacional Intenação Identifica se o cliente teve internação em algum momento com a empresa.

Transacional Cirurgia Identifica se o cliente teve cirurgia em algum momento com a empresa.

Transacional Valor T1 Úlltimo valor pago a empresa consolidado no mês.

Transacional Valor T2 Valor pago a empresa consolidado no mês anterior ao pagamento Valor T1.

Transacional Valor T3 Valor pago a empresa consolidado no mês anterior ao pagamento Valor T2.

Transacional Segmento de Utilização Identifica o perfil de utilização do plano com a empresa.

Sobre filtros utilizados na base de clientes

É importante dizer que alguns clientes são de maior valia para a empresa, tornando-se necessária a

exclusão de alguns tipos na análise. Junxiang propõe que consumidores com menos de três meses

de relacionamento sejam excluídos da análise em função do baixo tempo de relacionamento. Outro

filtro diz respeito à residência do assegurado, de tal forma que foram considerados somente clientes

residentes nas grandes capitais. Um outro filtro trata-se da exclusão de clientes, com data de

inclusão anterior a 1999, tendo em vista a diferente legislação que regulamenta os planos de saúde

Page 7: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

anterior a esta data. E o último filtro, talvez o mais importante de todos, a exclusão dos assegurados

por contratos empresariais, uma vez que quem determina a permanência ou não no plano não é o

cliente, e sim o empregador.

Utilizando-se dos filtros acima proposto e considerando-se somente households (chefes de

domicílios), verificamos em 31 de outubro de 2006 um total 110.472 clientes dentre ativos e

inativos.

Estimação e adequação dos modelos aqui propostos

Para o modelo de regressão linear logística, utilizando-se o software SPSS, obteve-se pelo método

de estimação iterativa Forward Stepwise1 um modelo inicial com 14 variáveis. Na busca de um

modelo que facilitasse a aplicação com o mínimo de informação, e tendo em vista alguns critérios

empíricos de seleção, optou-se por um modelo final com somente oito das 14 variáveis iniciais. São

estas variáveis finais: Tempo Exame, Segmento, Faixa Etária, Tempo Consulta, Valor T1, Rede de

Produto, Valor T3 e Valor T2. O valor das estatísticas de Wald pode ser obtido abaixo:

Tabela 2 – Estatísticas de Wald do Modelo Logístico

Variáveis Estatística de Wald %

Tempo Exame 5.042,27 37,1%

Segmento 3.071,76 22,6%

Faixa Etária 1.921,18 14,1%

Tempo Consulta 1.755,88 12,9%

Valor T1 1.631,56 12,0%

Rede de Produto 130,01 1,0%

Valor T3 39,04 0,3%

Valor T2 13,67 0,1%

Total 13.605,36 100,0%

Sobre a qualidade de ajuste do modelo logístico, a partir da estatística de Nagelkerke que mede o

grau de informação explicada pelo modelo, conclui-se que 68,9% da variabilidade do modelo é

explicada. Valor muito bom se comparado aos resultados obtidos freqüentemente no contexto de

aplicação dos modelos de regressão logística.

Para o modelo de Cox2 – de acordo com os mesmos critérios de estimação utilizada no parágrafo

anterior – obteve-se um modelo inicial com 13 variáveis. Objetivando um modelo mais flexível, e

utilizando a experiência do pesquisador, optou-se por cinco variáveis finais: Rede Produto, Safra de

Inclusão, Opcional Sos Viagens, Opcional Odontologia e Opcional Sos.

1 Método que investiga a seleção de variáveis em um modelo, baseado num algoritmo estatístico que checa a importância das variáveis,

as incluindo ou excluindo tendo em vista uma regra fixa.

2 É importante dizer que o modelo aqui estimado não utiliza covariáveis dependentes do tempo, sendo assim, garantimos as suposições

de riscos proporcionais de Cox (1979).

Page 8: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

Tabela 3 – Estatísticas de Wald do Modelo de Cox

Variáveis Estatística de Wald %

Rede de Produto 28.315,91 78,7%

Safra de Inclusão 2.333,41 6,5%

Opcional SOS Viagens 2.888,91 8,0%

Opcional Odontologia 1.323,26 3,7%

Opcional SOS 1.096,03 3,0%

Total 35.957,53 100,0%

Por se tratar o modelo de Cox um método não paramétrico, diversas proposições foram feitas na

metodologia para avaliar a adequação do modelo, mas nenhuma tem sido comumente abordada pela

sua eficácia. Estas técnicas de adequação do modelo dividem-se em dois grandes grupos: as gráficas

e os testes de adequação. Em nosso caso, recorremos às técnicas gráficas pela visualização dos

gráficos dos resíduos contra o tempo de relacionamento do cliente.

Observou-se no modelo de Cox que para as covariáveis categóricas, os gráficos de resíduos se

comportaram numa linha reta ao longo do tempo. Apesar da análise de resíduos ser bastante

criticada na adequação de modelos desta natureza, e diversas outras proposições terem sido feitas

(Enrico apud Barlow e Prentice, 1988, e os de Schoenfeld, 1982), não será nosso objetivo

aprofundar-nos neste aspecto.

Resultados obtidos na aplicação dos modelos

Modelo de Regressão Logístico

Na estimação do modelo proposto por Hosmer e Lemeshow - Logístico, particionamos o grupo de

clientes em dois grupos distintos. O primeiro foi utilizado na estimação e o segundo grupo como

controle na verificação da eficácia da replicabilidade. Desta forma, obteve-se os seguintes

resultados abaixo:

Tabela 4 – Percentual de Acerto do Modelo Logístico

Inativo Ativo

Inativo 35.099 3.735 38.834

Ativo 4.753 36.164 40.917

% Acertos 88,1% 90,6% 89,4%

39.852 39.899 79.751

Inativo Ativo

Inativo 7.740 1.951 9.691

Ativo 1.084 19.946 21.030

% Acertos 87,7% 91,1% 90,1%

8.824 21.897 30.721

Gru

po

s

Pre

dit

os

Clientes Controle

Gru

po

s

Pre

dit

os

Total

Grupos Observados

Grupos Observados

Total

Total

Total

Clientes Selecionados

Entende-se então que as condições de aplicação e replicação do modelo em outras populações que

não a estudada, estão validadas. Observou-se acima um percentual médio de acerto no grupo de

Page 9: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

controle de 90,1%. Ou seja, aproximadamente 90,1% dos clientes foram classificados pelo modelo

de regressão logística em seus grupos (clientes ou ex-cliente) observados inicialmente.

Na busca de resultados mais próximos as reais motivações deste estudo, apresentam abaixo a

classificação de todos os clientes ativos hoje (selecionados e controle) em faixas de probabilidades

de churn. Vemos que aproximadamente 70% dos clientes encontram-se com grau de probabilidade

de churn maior que 80%, devendo ser encaminhados para ações de marketing que busquem a

fidelização e retenção destes clientes.

Tabela 5 – Classes de Probabilidade de Churn

Probabilidade Churn Clientes % % Acumulado

De 90% até 100% 30.415 49,2% 49,2%

De 80% até 90% 12.255 19,8% 69,0%

De 70% até 80% 6.082 9,8% 78,9%

De 60% até 70% 4.345 7,0% 85,9%

De 50% até 60% 3.013 4,9% 90,8%

De 40% até 50% 1.697 2,7% 93,5%

De 30% até 40% 1.060 1,7% 95,3%

De 20% até 30% 709 1,1% 96,4%

De 10% até 20% 580 0,9% 97,3%

Até 10% 1.640 2,7% 100,0%

Total 61.796 100,0%

Modelo de Regressão de Cox

No modelo de Cox, os grupos onde anteriormente foram utilizados na seleção e controle, neste

serão dividido como dois estratos distintos. Em cada um dos estratos, marcamos a probabilidade de

churn dada por este modelo depois de estimado, e posteriormente a classificação em cada um dos

grupos ocasionais, ativo ou inativo. Segue abaixo o percentual de acerto do modelo:

Tabela 6 – Percentual de Acerto do Modelo de Cox

Page 10: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

Inativo Ativo

Inativo 5.670 14.106 21.718

Ativo 34.182 25.793 58.033

% Acertos 14,2% 64,6% 39,5%

39.852 39.899 79.751

Inativo Ativo

Inativo 1.854 9.598 9.590

Ativo 6.970 12.299 21.131

% Acertos 21,0% 56,2% 46,1%

8.824 21.897 30.721

Total

Clientes Selecionados

Estrato 1

Clientes Controle

Estrato 2

Total

Total

Gru

po

s

Pre

dit

os

Gru

po

s

Pre

dit

os

Total

Grupos Observados

Grupos Observados

Observa-se que o modelo de Cox não apresenta a mesma acurácia que o modelo logístico, com um

percentual de acerto total bastante baixo. Para o estrato 1 (um) onde a amostra encontra-se

balanceada entre clientes Ativos e Inativos, observou-se um percentual médio de acerto do modelo

de 37% para o grupo selecionado e 45% para o grupo de controle. Valor muito insatisfatório

considerando-se o objetivo do modelo em identificar grupos com altas chances de churn. Vemos

também que o erro do tipo II, ocorrido quando a classificação do cliente é predita como ativo dado

que este é inativo, é muito alta. Isto faz com que os percentuais de acerto do grupo de inativos nos

estratos 1 e 2 sejam, respectivamente, 14,2% e 21,0%.

Esta ineficácia no modelo de Cox pode-se ser justificada pela ausência de variáveis correlacionadas

com o tempo, que numa outra hora, foram muito importantes em predizer a inatividade de um

cliente. Variáveis como Tempo Consulta, Tempo Exame e Segmento presentes no modelo logístico

– as quais se modificam conforme incrementos no tempo de relacionamento –, tiveram participação

de mais de 70% na identificação de clientes potenciais a churn. Enquanto que no modelo de Cox, a

variável com maior participação foi a de Rede Produto (78%), conforme vimos pela

percentualização da estatística de Wald.

Conclusões

Não há dúvidas de que o modelo logístico foi mais eficaz na identificação de potenciais clientes a

churn, devendo os resultados ser adotados conjuntamente com as ações de marketing de

relacionamento da empresa com foco na fidelização. Variáveis significantes neste modelo

correlacionados com o tempo foram importantes, pois identificaram o grau com quais clientes

continuam mantendo contato com a empresa. Espera-se que o assegurado que não se relaciona com

a empresa, acaba não atribuindo valor sentimental ao produto contratado, e conseqüentemente

torna-se mais propensos a churn. Contrariamente, acredita-se que o assegurado que mantém uma

contínua utilização do plano de saúde, mesmo que preventivamente, agrega mais valor a empresa

fortalecendo seu relacionamento.

Um outro detalhe importante não abordado no modelo de Cox foi a proporção com a qual clientes

entram em uma determinada rede de plano. Dependendo da política de vendas da empresa numa

determinada época, do incentivo ou retração a um grupo de planos específico (ou mesmo

Page 11: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

opcionais), observaremos que estes clientes apresentaram taxas variáveis de inclusão ao longo do

tempo. Isto impactará de certa forma prejudicialmente no poder de predição do modelo de Cox,

devendo este ponto (neste modelo particularmente) ser estudado mais afundo.

Vale ressaltar também que o principal objetivo da escolha pela aplicação de métodos de análise de

sobrevivência é de estudar o tempo necessário até a ocorrência de um evento, obtendo assim um

CLTV futuro do cliente. Mas vimos que no exemplo aqui proposto, o tempo futuro para

investigação da ocorrência de churn foi único para todos os clientes, identificando “hoje” quais

seriam os clientes mais propensos a churn.

Referências Bibliográficas

FERRO, Wanderson Roberto. Contribuição ao Estudo da Implantação da Gestão do

Relacionamento com o Cliente em Bancos Sediados no Estado de São Paulo. Dissertação

(Mestrado em Administração) – Universidade de São Paulo, São Paulo, 2003.

KARAM, Karine de Almeida. Regressão Logística: Um modelo de Risco de Cancelamento de

Clientes. Dissertação (Mestrado em Administração) – Pontifícia Universidade Católica do Rio de

Janeiro, Rio de Janeiro, 2006.

MARTINS, Márcio Severo. A Previsão de Insolvência pelo Modelo de Cox: Uma Contribuição

Para a Análise de Companhias Abertas Brasileiras. Dissertação (Mestrado em Administração) –

Universidade Federal do Rio Grande do Sul, Rio Grande do Sul, 2003.

GIL, Antonio de Lourenço. Segurança em informática. São Paulo: Atlas, 1994.

LINOFF, Gordon. Survival Data Mining for Customer Insight. 2004. USA, Data Miners Inc,

2004.

LU, Junxiang. Predicting Customer Churn in the Telecommunications – An Aplication of

Survival Analysis Modeling Using SAS. Kansas – USA, Sprint Communications Company, 2001.

STATSDIRECT LIMITED. Analysis Survival Cox Regression. England, 2007.

KOTLER, Philip. Administração de Marketing. Editora Pearson, 12ª ed.: São Paulo, 2006.

MANFREDI, Vanilde; MENDES, Jorge. Curso de Extensão: Implementação e Gestão de CRM

– Customer Relationship Management. Pontifícia Universidade Católica do Rio de Janeiro, Rio

de Janeiro, 2006. Material de aula.

REINARTZ, Werner. Customer Relationship Management – A Database Approach. John

Wiley & Sons, Inc: Junho, 2005.

COLOSIMO, Enrico. Análise de Sobrevivência Aplicada. Departamento de Estatística –

Universidade Federal de Minas Gerais, Belo Horizonte, 2001.

Page 12: Estratégias de Retenção de Clientes no Marketing de Relacionamento

Artigo apresentado no congresso Knowledge Management Brasil 2007, São Paulo, SP.

HOSMER, David; LEMESHOW, Stanley. Applied Logistic Regression – 2º Edition. University

of Massachusetts, Amherst, Massachusetts, 2000.

SPSS 12.0 FOR WINDOWS. Case Studies: Binary Logistic Regression, Cox Regression.

Apache Software Foundation, USA, 2003.