9
Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009. Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy Anderson Guimarães de Pinho Pontifícia Universidade Católica do Rio de Janeiro Rio de Janeiro RJ Brasil [email protected] Resumo O presente artigo objetivará a criação de um modelo de inferência fuzzy o qual classifique corretamente futuros clientes evasivos para uma empresa. Em estratégias de marketing, é de grande dúvida para a empresa quais clientes abordar numa campanha, ou quais clientes apresentam maiores chances de evasão. Para responderem a isto, muitos pesquisadores têm recorrido a informações de recência, freqüência e valor do cliente, na mineração de conhecimento valioso o qual possa ser utilizado. Lógica fuzzy será um diferencial competitivo na identificação destes clientes, pois permitirá a criação de um modelo preciso de classificação, alinhado ao conhecimento lingüístico explícito do especialista de marketing. Palavras-chave: Análise RFV, lógica fuzzy, data mining, previsão a churn, lógica nebulosa. 1. Introdução RFV (ou RFM em algumas literaturas) entende-se como recência, freqüência e valor monetário do cliente. Recência como uma medida de quanto tempo se passou desde a última transação com a empresa. Freqüência como uma medida de quão freqüente um cliente efetua transações. E Valor Monetário como o gasto médio feito por transação. Estratégias baseadas em RFV buscam métricas ou regras para avaliar o comportamento e valor do cliente para a empresa. Perguntas como “quais clientes devem ser impactados por uma ação de marketing” ou “quais clientes são mais valiosos para a empresa em termos de contribuição financeira passada e futura” são encontradas frequentemente por pesquisadores na gestão do relacionamento com o cliente (Customer Relationship Management ou CRM). Nestes casos, a análise de RFV pode conter informação valiosa para a empresa na resposta a estes questionamentos. Toda esta informação necessária para análise encontra-se em histórico transacional de vendas de clientes, disponíveis nos bancos de dados de grandes empresas. São dos mais diversos os estudos envolvendo RFV. A exemplo, Fader (2005) apresentou um modelo estocástico para estimar o Valor Financeiro do Tempo de Vida do Cliente (Customer Life Time Value ou CLTV), utilizando como variáveis explicativas RFV em empresas com vínculo não contratual. Em um segundo estudo, Colombo (1999) introduz um simples modelo estocástico baseado em RFV para responder a quais clientes uma firma deve focar para fazer uma oferta de produto. Ambos os estudos levam em comum o mesmo princípio motivacional: medidas comportamentais de clientes são indicadores chaves para predizer comportamento futuro. Sobre o problema de Colombo, sabemos que as empresas podem maximizar o retorno de ações e minimizar custos de marketing se souberem quais clientes endereçarem uma ação de venda. Estes clientes podem ser assim considerados de maior valor para a empresa, pois seu comportamento passado indica uma intenção positiva de manutenção do relacionamento. Por outro lado, clientes menos valiosos seriam aqueles que não apresentam uma intenção de recompra futura. Conseqüentemente, apresentariam baixas chances de resposta a uma ação de venda marketing, seja ela de cross-selling ou up-selling (Berry, 115). No entanto, é importante dizer que não há garantias de que após um longo período de inatividade, um cliente considerado no passado como baixa chance de recompra venha a efetuar uma transação. Em casos afirmativos, dizemos que o evento “transação com a empresa” representa um processo sem memória, de difícil modelagem, onde a ocorrência depende somente de um instante de tempo imediatamente anterior ao ocorrido. Por estes motivos, empresas não se preocupam em investigar um comportamento de compra futuro tão distante, uma vez que a dinâmica de mercados mais longínquos pode não ter dependência ou correlação com o presente. Em outras palavras, as chances de um cliente se tornar de alto valor num

Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento

Embed Size (px)

DESCRIPTION

O presente artigo objetivará a criação de um modelo de inferência fuzzy o qual classifique corretamente futuros clientes evasivos para uma empresa. Em estratégias de marketing, é de grande dúvida para a empresa quais clientes abordar numa campanha, ou quais clientes apresentam maiores chances de evasão. Para responderem a isto, muitos pesquisadores têm recorrido a informações de recência, freqüência e valor do cliente, na mineração de conhecimento valioso o qual possa ser utilizado. Lógica fuzzy será um diferencial competitivo na identificação destes clientes, pois permitirá a criação de um modelo preciso de classificação, alinhado ao conhecimento lingüístico explícito do especialista de marketing.

Citation preview

Page 1: Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento

Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.

Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy

Anderson Guimarães de Pinho

Pontifícia Universidade Católica do Rio de Janeiro – Rio de Janeiro – RJ – Brasil

[email protected]

Resumo

O presente artigo objetivará a criação de um

modelo de inferência fuzzy o qual classifique

corretamente futuros clientes evasivos para uma

empresa. Em estratégias de marketing, é de

grande dúvida para a empresa quais clientes

abordar numa campanha, ou quais clientes

apresentam maiores chances de evasão. Para

responderem a isto, muitos pesquisadores têm

recorrido a informações de recência, freqüência e

valor do cliente, na mineração de conhecimento

valioso o qual possa ser utilizado. Lógica fuzzy

será um diferencial competitivo na identificação

destes clientes, pois permitirá a criação de um

modelo preciso de classificação, alinhado ao

conhecimento lingüístico explícito do especialista

de marketing.

Palavras-chave:

Análise RFV, lógica fuzzy, data mining,

previsão a churn, lógica nebulosa.

1. Introdução

RFV (ou RFM em algumas literaturas) entende-se

como recência, freqüência e valor monetário do

cliente. Recência como uma medida de quanto

tempo se passou desde a última transação com a

empresa. Freqüência como uma medida de quão

freqüente um cliente efetua transações. E Valor

Monetário como o gasto médio feito por

transação.

Estratégias baseadas em RFV buscam métricas ou

regras para avaliar o comportamento e valor do

cliente para a empresa. Perguntas como “quais

clientes devem ser impactados por uma ação de

marketing” ou “quais clientes são mais valiosos

para a empresa em termos de contribuição

financeira passada e futura” são encontradas

frequentemente por pesquisadores na gestão do

relacionamento com o cliente (Customer

Relationship Management ou CRM).

Nestes casos, a análise de RFV pode conter

informação valiosa para a empresa na resposta a

estes questionamentos. Toda esta informação

necessária para análise encontra-se em histórico

transacional de vendas de clientes, disponíveis nos

bancos de dados de grandes empresas.

São dos mais diversos os estudos envolvendo

RFV. A exemplo, Fader (2005) apresentou um

modelo estocástico para estimar o Valor

Financeiro do Tempo de Vida do Cliente

(Customer Life Time Value ou CLTV), utilizando

como variáveis explicativas RFV em empresas

com vínculo não contratual. Em um segundo

estudo, Colombo (1999) introduz um simples

modelo estocástico baseado em RFV para

responder a quais clientes uma firma deve focar

para fazer uma oferta de produto. Ambos os

estudos levam em comum o mesmo princípio

motivacional: medidas comportamentais de

clientes são indicadores chaves para predizer

comportamento futuro.

Sobre o problema de Colombo, sabemos que as

empresas podem maximizar o retorno de ações e

minimizar custos de marketing se souberem quais

clientes endereçarem uma ação de venda. Estes

clientes podem ser assim considerados de maior

valor para a empresa, pois seu comportamento

passado indica uma intenção positiva de

manutenção do relacionamento.

Por outro lado, clientes menos valiosos seriam

aqueles que não apresentam uma intenção de

recompra futura. Conseqüentemente,

apresentariam baixas chances de resposta a uma

ação de venda marketing, seja ela de cross-selling

ou up-selling (Berry, 115).

No entanto, é importante dizer que não há

garantias de que após um longo período de

inatividade, um cliente considerado no passado

como baixa chance de recompra venha a efetuar

uma transação. Em casos afirmativos, dizemos

que o evento “transação com a empresa”

representa um processo sem memória, de difícil

modelagem, onde a ocorrência depende somente

de um instante de tempo imediatamente anterior

ao ocorrido.

Por estes motivos, empresas não se preocupam em

investigar um comportamento de compra futuro

tão distante, uma vez que a dinâmica de mercados

mais longínquos pode não ter dependência ou

correlação com o presente. Em outras palavras, as

chances de um cliente se tornar de alto valor num

Page 2: Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento

Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.

futuro distante, dificilmente encontraria

explicações no comportamento presente.

Numa visão inversa ao problema de Colombo,

poderíamos trabalhar ações de marketing

específicas para clientes com menos chances de

respostas. Tais ações teriam como objetivo a

mudança comportamental em termos de recência,

freqüência e valor, a fim de transformá-los de

maior valor para a empresa.

Como por exemplo, suponha uma empresa

administradora de investimentos na Bolsa de

Valores de São Paulo (BOVESPA). Para clientes

com baixa intenção de manutenção do

relacionamento, poderiam ser oferecidos cursos e

palestras sobre investimentos em ações. Tal ação

teria como objetivo secundário, oferecer aos

clientes ferramental intelectual o suficiente para

que estes possam continuar operando no mercado

de ações pela empresa administradora.

Conseqüentemente, o aumento de lucros pelo

aumento do tempo de relacionamento.

Embora a discriminação de clientes mais e menos

valiosos atenda a múltiplos objetivos, este último

apresentado torna-se mais atraente, pois vai ao

encontro com a retenção de clientes ativos na base

de dados como conseqüência do aumento da

duração do tempo de vida do cliente (Customer

Life Time Duration ou CLTD). Sendo assim, esta

será a principal motivação de nossos estudos nos

próximos capítulos.

A figura a seguir mostra a distinção destes dois

grupos acima discutidos:

Maiores ChancesRecompra.Alto Valor.

Alto CLTD Futuro.

Menores ChancesRecompra.

Baixo Valor.Baixo CLTD Futuro.

(1) (2)

Figura 1 - Tipos de Clientes em Análise de RFV

Para problemas mais simples como a classificação

de dois grupos de clientes, muitas outras técnicas

de menos complexidade, em comparação à

modelagem estocástica, têm sido aplicadas.

Reinartz (2005, p.129-132) destaca o uso da

Regressão Logística e Árvore de Decisão como

solução a problemas envolvendo RFV. Tais

técnicas apresentam suas características, as quais

dividem pesquisadores e acadêmicos na sua

aplicação.

Neste artigo, abordaremos a técnica de Lógica

Fuzzy (Marley apud Lofti Zadeh, 1965) para

problemas de classificação de grupos. Veremos

que esta técnica se apresentará como um

diferencial competitivo, pois permitirá a criação

de um modelo de inferência preciso para

problemas de marketing, considerando o

conhecimento de especialistas sobre o problema

estudado. Isto poderia aumentar a acurácia do

sistema, e por outro lado, permitiria uma

adequação do sistema às atuais práticas da

empresa na identificação de grupos de clientes.

Desta forma, tecnologia, pessoas e processos

poderiam se alinhar de forma a contemplarem este

sistema criado, aumentando lucros e

competitividade no mercado.

2. Customer Life Time Duration (CLTD) e

RFV

O paradigma dos problemas de RFV apresenta-se

como o seguinte: clientes com baixa recência, alta

freqüência, e alto valor, apresentarão um alto

CLTD e conseqüentemente estarão mais dispostos

a manter um vínculo contínuo com a empresa,

respondendo melhor a campanhas de marketing.

Contrariamente, clientes com alta recência, baixa

freqüência e baixo valor, são mais propensos à

interrupção do vínculo empresarial, respondendo

pior a campanhas, pois já sem encontram no fim

do CLTD.

Quando se fala sobre CLTD, nem todas as

relações cliente-empresa são iguais. Dependendo

do tipo de serviço ou produto ofertado, clientes

podem assumir um relacionamento contratual ou

não contratual. Conforme se observa em Kuman

(p.103), casos contratuais constituem a mais

precisa observação do tempo de vida do cliente.

Uma simples medida do tempo decorrido desde o

início do relacionamento (ou início de uma janela

de análise) até o fim do relacionamento (ou fim de

uma janela de análise) pode ser obtida facilmente,

determinando assim o CLTD. Desta forma, um

cliente torna-se inativo quando não ocorre uma

renovação de contrato. Neste caso, dizemos que

ocorreu uma evasão ou “churn” de cliente.

Já em casos não contratuais, onde não há uma

informação explícita sobre o fim de um

relacionamento. Clientes neste mercado não têm

barreiras que os empeçam de continuar ou

interromper o relacionamento quando bem

quiserem, sem alguma comunicação formal à

empresa. Isto nos proporcionará o ambiente ideal

para aplicação de Lógica Fuzzy.

Page 3: Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento

Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.

Nestes ambientes não contratuais, a forma mais

utilizada para cálculo do CLTD é emular uma

regra de classificação de clientes em ativos ou

inativos num tempo finito de relacionamento. Por

exemplo, poderíamos definir uma regra baseada

em RFV passado, para classificar clientes ativos e

inativos após três meses de relacionamento,

caracterizando previamente o fim ou manutenção

do CLTD. Isto ofereceria parâmetros suficientes

para que gestores de relacionamento com o cliente

pudessem agir preventivamente na retenção

destes classificados como futuros inativos,

maximizando lucros da empresa pela permanência

prolongada do status ativo. Conforme se observa

em Karine (apud Reichheld & Sasser Jr., 1990),

dependendo do setor de atuação, as empresas

podem rentabilizar seus negócios em lucros de

25% a 85%, reduzindo em apenas 5% a perda de

clientes.

Por estes motivos, ações focadas em grupos com

maiores chances de evasão, consequentemente

menor chance de resposta a uma ação, passaria a

ser bastante atraente, pois vai ao encontro com a

lucratividade futura da empresa e uma série de

outros aspectos como satisfação e lealdade, sendo

assim a estratégia defendida neste artigo.

3. Introdução a Lógica Fuzzy

Seres humanos lidam frequentemente com

processos de decisões complexos a partir de

informações imprecisas ou aproximadas. Esta

decisão tomada por seres humanos também será

de natureza imprecisa, podendo ser expressa

muitas vezes através de conceitos ou conjuntos

lingüísticos. Teoria de conjuntos fuzzy e Lógica

Fuzzy visam traduzir em termos matemáticos,

portanto precisos, esta informação de natureza

imprecisa através de um conjunto de regras

lingüísticas.

O processo de inferência humano pode ser

entendido através de regras do tipo IF... THEN,

onde a parte IF se refere a um conjunto de

atributos preditores ou independentes, e THEN a

um atributo dependente, ou seja, a variável de

aferição. Um modelo de inferência fuzzy baseado

em regras lingüísticas, por sua vez, seria então

tratado através da Teoria de Conjuntos Fuzzy e a

Lógica Fuzzy.

A Teoria de Conjuntos Fuzzy foi concebida por

L.A. Zadeh com o objetivo de fornecer um

ferramental matemático para o tratamento de

informações de caráter impreciso ou vago. A

Lógica Fuzzy que é baseada nesta última teoria foi

construída a partir de conceitos estabelecidos na

lógica clássica. Operadores foram introduzidos à

semelhança dos tradicionais, e conforme estudos

foram feitos na área, novos operadores de

importância prática eram desenvolvidos.

Sistemas fuzzy têm sido aplicados em diversos

campos de ciência. Este artigo trata

explicitamente de um exemplo de mineração de

dados, ou data mining. A descoberta de

conhecimento em grandes bancos de dados, ou

data mining, tem inspirado muitos pesquisadores

nos mais diversos campos da ciência. Uma

dificuldade em processos de descoberta de

conhecimento ou knowledge discover database

(KDD), trata-se da extração do conhecimento

correto, de fácil compreensão, e de grande

utilidade para o usuário. Berry divide em 5 as

responsabilidades atribuídas à mineração de dados

em processos KDD: (1) classificação; (2)

associação de regras; (3) perfilação de clientes; (4)

clusterização; (5) estimação; e (6) predição.

Pode ser dizer que lógica fuzzy esta associada a

todas estas responsabilidades mencionadas,

apresentando ou não a sua vantagem de utilização

em contrapartida a outras técnicas de mineração.

Na aplicação que se seguirá, veremos estritamente

a resolução de um problema de classificação

através de lógica fuzzy. Como já discutido,

Lógica Fuzzy se apresentará como um diferencial,

pois unirá a precisão de um sistema baseado em

classificação, com o conhecimento lingüístico de

profissionais tomadores de decisão, expresso

através de regras de decisão.

Por diversos textos e livros abordarem o assunto

de lógica fuzzy vastamente, trataremos o

problema analiticamente, buscando sempre uma

formalização técnica quando necessário. Para um

melhor entendimento da técnica recomendamos

[12] e [13].

4. A Empresa e o Problema de Churn de

Clientes

A empresa em estudo trata-se de uma

administradora de investimentos com grande

atuação na Bovespa. Clientes que optam por

investir pelo sistema Home Broker executam

ordens na internet, diversificando seus

investimentos em até 4 categorias de

investimentos: (1) compra e venda de ações; (2)

cotas em fundos de investimentos; (3) bolsa de

mercadorias e valores futuros (ou Bm&f); (4) e

títulos do tesouro direto.

Page 4: Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento

Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.

O problema da empresa apresenta-se da seguinte

forma: clientes após a inclusão na base de dados e

início das operações no sistema home broker,

apresentam um decréscimo significativo na

atividade até o 4º mês de relacionamento,

identificado pela não intenção de continuar

investindo. É comprovado para a empresa que

após o 4º mês de relacionamento clientes que

decidem por continuar suas operações na bolsa ou

outro tipo de investimento o fazem continuamente

ao longo de um horizonte de 12 meses ou mais.

Para que isto fique claro, apresentaremos o gráfico

a seguir. Para tanto, separamos 12 safras mensais

de entrada de cliente ao longo do ano de 2006, e

verificou-se o status do cliente, mês a mês, por um

período seguinte de 12 meses. Quando no mês de

análise, após a inclusão no cadastro da empresa,

não era verificada nenhuma operação no sistema

home broker, o cliente era marcado como inativo.

Contrariamente, recebia a marcação de ativo, caso

viesse a efetuar alguma ordem de investimento no

mês.

0

20

40

60

80

100

1 2 3 4 5 6 7 8 9 10 11 12

Tempo de Relacionamento

% C

lass

e

Ativos Inativos

Gráfico 1 - Curvas de Atividade e Inatividade

Neste tipo de negócio, empresas gestoras de

investimentos geralmente obtêm lucros através de

uma taxa % sobre o valor movimento e/ou uma

constante sobre cada ordem executada. Na

empresa em análise, lucros provêm somente sobre

um valor constante para cada ordem executada.

Desta forma, podemos definir como variável de

Valor, os lucros obtidos por quantidade de ordens

executadas por cada cliente até um instante de

tempo t dado pela função abaixo, onde t é uma

medida mensal:

.1

)( ConstiOrdenst

it

ClienteValor

(1)

Esta última definição de valor seria um problema,

pois pouco explicaria o potencial financeiro do

cliente em questão, uma vez que o montante

movimentado não é considerado no cálculo. Uma

medida mais eficiente para Valor seria “a média

de valor movimento por ordem executada até um

instante de tempo t”, e certamente seria mais

discriminatória que a anterior.

iOrdenst

i

ientadoValorMovimt

it

ClienteValor

1

1)(

(2)

Para Freqüência, definimos como “a média

mensal do número de ordens executadas até um

instante de tempo t”.

t

iOrdenst

it

ClienteFreqüência

1)(

(3)

E por último, Recência, como “o tempo de

decorrido (em dias) até um instante de tempo t,

desde a última ordem executada”.

Sendo assim, para nosso problema,

consideraremos t = 3 representando o terceiro mês

de relacionamento do cliente. Com isto,

buscaremos através de Lógica Fuzzy criar um

sistema que classifiquem futuros clientes inativos

a partir do 4º mês de relacionamento. Desta

forma, a empresa em questão poderá agir

preventivamente através de ações de marketing de

relacionamento, buscando a retenção destes

clientes com maiores chances de evasão,

chamados na literatura de RFV como de menor

valor ou baixo CLTD futuro.

Em mercados como o de investimento, o

comportamento em termos de RFV tem grande

correlação com outras variáveis externas sócio-

econômicas. Desta forma, é de grande

preocupação que o modelo aqui objetivado seja o

menos dependente de comportamentos exógenos à

empresa. Para ilustrarmos nosso raciocínio e

utilizando um mercado hipotético, poderíamos

dizer que um comportamento em termos de

recência do cliente superior a 20 dias sem operar

na bolsa seria típico de um futuro cliente evasivo,

mas que em outra época com menor instabilidade

econômica, isto seria esperado do cliente.

Desta forma, para que o sistema aqui proposto não

fosse dependente à época o qual esta sendo

estudado, optou-se por trabalhar com decis de

valores de recência, freqüência, e valor. Isto vai de

encontro com modelos clássicos de RFV (Kuman,

p.119). Por isso, decis foram criados tendo como

informação de entrada as variáveis definidas no

capítulo 3. Isto permitiria a criação de um modelo

Page 5: Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento

Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.

menos frágil a variabilidade econômica no

mercado, menos perecível com o passar dos

meses.

O banco de dados utilizado apresenta uma

amostra de 14.799 clientes (linhas). As variáveis

de RFV (colunas) apresentam o seguinte domínio:

R (dias) pertence ao Dom {0; 90}; F (média de

ordens executadas mês) ao Dom {0,333; 2,86 x

10A}; e V (média de valor executado por ordem)

ao Dom {3,485 x 10B ; 4,085 x 10

C}.

1 Sendo

assim, cada uma das variáveis foi codificada no

intervalo de 1 a 10, conforme os decis de suas

distribuições de freqüência.

R F V

1 1 1

2 2 2

3 3 3

4 4 4

5 5 5

6 6 6

7 7 7

8 8 8

9 9 9

10 10 10

Mais

Recente

Maior

Freqüência

Maior

Valor

Menos

Recente

Menor

Freqüência

Menor

Valor

Figura 2 - Representação dos Decis de RFV

A variável dependente do modelo, Status no 4º

mês de relacionamento, será representada por uma

variável binária, onde 0 representa o status ativo, e

1 o status inativo.

5. Modelagem por Lógica Fuzzy

5.1. O Sistema

No problema em estudo, o processo de tomada de

decisão pode ser entendido da seguinte forma.

Dado um padrão de comportamento do cliente nos

três primeiros meses de relacionamento em termos

de RFV, precisamos prever classificando o futuro

cliente inativo (ou não) a partir do 4º mês de

relacionamento. Neste sentido, usaríamos a lógica

fuzzy manipulando o conhecimento lingüístico

necessário para responder a este tipo de problema

de classificação.

O sistema de inferência pode ser entendido

conforme figura a seguir. Primeiramente, entradas

precisas são fornecidas ao sistema em termos de

RFV. Conjuntos lingüísticos são gerados de

acordo com as funções de pertinência definidas

sobre cada conjunto. O processo de inferência é

efetuado, gerando conjuntos lingüísticos através

1 Por motivos de segurança, os dados de F e V da empresa aqui utilizados, quando mencionados, serão multiplicados por um

escalar de 10 a menos A, B, ou C.

de conjuntos lingüísticos, por regras previamente

estabelecidas e armazenadas no sistema. Feito

isto, ocorre o processo chamado de defuzzificação

gerando uma ação precisa a ser tomada pelo

sistema, a partir de informações até então

lingüísticas. Tais etapas serão detalhadas a seguir.

Entradas PrecisasR F V

FUZZIFICADOR

REGRAS INFERÊNCIA

DEFUZZIFICADOR

Saída PrecisaStatus

Conjunto Nebuloso de Entrada

Conjunto Nebuloso de Saída

Figura 3 – Sistema de Inferência Fuzzy Estudado

5.2. Fuzzificação

O processo de fuzzificação ocorre com a ativação

de conjuntos lingüísticos através de entradas

precisas fornecidas ao sistema. Para tanto, cada

variável de entrada (RFV) precisa ser definida em

termos de funções de pertinência e conjuntos

fuzzy, a ela associados. Para representação destes

conjuntos fuzzy, desejaríamos que este estivesse

estritamente associado à forma com a qual o

analista de marketing toma decisões em seu

negócio.

A forma mais próxima a qual um analista tomaria

uma decisão em seu negócio, de natureza

imprecisa, poderia ser interpretada através de uma

escala Likert (Rocha apud R.Likert, 1932) de 7

pontos. O principal papel da escala trata-se de

mensurar um conceito subjetivo através de níveis

de intensidade numa escala de concordância. A

escala Likert ganhou fama pela sua simplicidade e

é usada atualmente em diversas áreas da ciência.

Em nosso trabalho, entenda que o processo de

concordar e discordar trata-se essencialmente de

um processo impreciso, portanto adequado a

teoria dos conjuntos fuzzy.

Page 6: Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento

Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.

Por exemplo, para a variável de valor, o processo

de definir um cliente como sendo de ALTO ou

BAIXO valor pelo analista poderia ser

representado através de uma nota numa escala de

1 até 7, onde a nota 7 representa que

definitivamente concorda que o cliente é de

ALTO valor, e 1 que concorda com a afirmação

de que definitivamente o cliente é de BAIXO

valor.

DiscordoTotalmente

ConcordoTotalmente

Figura 4 – Escala Likert de 7 Pontos

Desta forma, um exemplo de raciocínio humano

completo, portanto, representável em termos de

regra no modelo de inferência fuzzy, poderia ser

entendido da seguinte forma: Se um cliente

apresenta uma nota 5 dada pelo analista sobre o

grau de concordância sobre a afirmação que este

cliente é de alto valor financeiro; e nota 3 sobre a

concordância de que é de alta freqüência; e nota 7

concordando que é de alta recência; então na

prática, concluiríamos que este cliente será futuro

inativo a partir do 4º mês de relacionamento com

nota de concordância 3.

Por estes motivos, será necessário criar para cada

variável de entrada (RFV), 7 conjuntos

lingüísticos, cada qual representado por uma nota

dada pelo analista num processo natural de

inferência humano. Por limitações do software, a

forma destes conjuntos será definida na forma

triangular, com igual interseção de 50% dos

conjuntos fuzzy dentre as variáveis. Percebam que

as variáveis de entrada têm os mesmos limites

máximos e mínimos (decis 1 até 10), e mesmos

números de conjuntos fuzzy (notas 1 até 7 de

concordância), e portanto terão a mesma forma de

função de pertinência.

Sendo assim, dado uma variável de entrada X

qualquer e um conjunto fuzzy Y qualquer, a

função de pertinência )(XY apresentará valores

no intervalo de 0 até 1, conforme forma gráfica

das funções a seguir, onde: o eixo x representa a

entrada precisa do sistema; e EQ_0 até EQ_6

concordâncias mínimas e máximas para cada

variável de entrada :

Figura 5 – Conjuntos Fuzzy de Recência

Figura 6 – Conjuntos Fuzzy de Freqüência

Figura 7 – Conjuntos Fuzzy de Valor

Para fins de exemplificação sobre a forma teórica

de representação triangular, definiremos o

conjunto fuzzy referente à nota 4 da concordância

de que o cliente é de alto valor. Sendo assim,

defini-se:

gV

gVffg

Vg

fVeef

Vf

eV

gfeVTRI

,0

,)(

))(

,)(

)(1

,0

),,,( (4)

Onde e=4,375, g=6,625, e f=5,5. Ou seja, a função

que mapeia V em )(4 V , função de pertinência

de V = 4 na forma triangular. Na forma gráfica,

esta função pode ser visualizada em azul na figura

6.

5.3. Regras e Inferência Fuzzy

Precisamos definir agora quais regras serão

utilizadas no processo de inferência fuzzy. Na

forma com a qual nosso sistema esta programado,

regras precisam estar no seguinte formato: Seja,

RDecil=X, e FDecil=Y, e VDecil=Z, então, Status=W,

Page 7: Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento

Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.

onde X, Y, Z e W, valores lingüísticos possíveis

para R, F, V e Status, respectivamente. Sendo

assim, uma regra é definida pela interseção de 3

antecedentes e 1 conseqüente. Percebam que com

isto, teríamos que definir um máximo de até 343

regras (73), cada qual com um único conseqüente.

No entanto, a geração manual de todas estas

regras seria altamente dispendiosa, e por outro

lado, poderia haver regras as quais na prática

nunca seriam utilizadas. Como a base que

dispomos para treinamento é grande, total de

10.000 registros, utilizaremos o procedimento de

geração automática de regras programada no

Fuzzy Rule levando-se em consideração todo este

conjunto de dados.

Em suma, o que este procedimento de geração

automática de regras fará é: (1) determinar os

graus de pertinência que aparecem no domínio de

R, F, V e Status; (2) atribuir a cada valor do

domínio o conjunto fuzzy com maior grau de

pertinência; (3) obter uma regra lingüística para

cada par de entradas RFV e saída Status. Tal

procedimento foi executado e ao final podemos

observar a geração de um total de 303 regras.

O processo de inferência acontece da seguinte

forma: (1) o antecedente da regra é calculado

através da interseção dos conjuntos fuzzy através

do operador mínimo ou produto (definidos pelo

usuário e disponíveis no software). Lembre-se que

para cada conjunto fuzzy ativado, existirá uma

função de pertinência a ele associado; (2) quando

da operação de implicação do resultado do

antecedente, o conseqüente também será

calculado através dos operadores mínimo ou

produto. Com isto, uma regra ativada terá como

saída um conjunto nebuloso com certo grau de

pertinência a ele associado, servindo de resultado

para o processo de defuzzificação.

Neste artigo, testes demonstraram que os

operadores de produto para interseção, e mínimo

para implicação serão mais promissores. Sem

entrar em detalhes sobre os resultados a serem

apresentados no capítulo 6, exemplificaremos

como seria efetuado o cálculo de implicação de

uma regra considerando estes operadores. Seja

),,,(Re

SVFRlação

o valor de pertinência da

função de implicação de RFV em Status, defini-se

laçãoRe como sendo:

)().().(

,)(,

))()),(),(),(((

),,,(Re

VZFYRXefonde

sefmín

sWVZFYRXeff

SVFR

W

lação

(5)

Feito isto, um ajuste ainda é feito no valor de

pertinência geradolaçãoRe

. Cada qual, cálculo

resultante da implicância para cada indivíduo na

amostra, é multiplicado pelo seu peso respectivo.

Um valor variando de 0 a 1 determinando o peso

que aquela regra tem no modelo de inferência.

Sendo assim, teremos então saídas fuzzy para

serem consideradas na próxima etapa.

5.4. Defuzzificação

Tendo em mãos todos os resultados gerados pelas

regras ativadas, conjuntos fuzzy ativados e

funções de pertinência, a próxima etapa será a

defuzzificação para que o sistema possa tomar

uma decisão precisa sobre o problema. Até o

momento dispomos de um ou mais conjuntos

fuzzy para a variável de saída, cada um ativado

com certo grau de pertinência.

Neste artigo serão testados dos tipos de

defuzzificação, o método de altura limite e o

método do centróide. No método de altura limite,

utiliza-se o valor de suporte ou base do máximo

do conjunto, cuja função de pertinência é maior.

Em caso de empate neste último, utilizaríamos o

valor suporte do máximo do conjunto com menor

pertinência. Já no método centróide, o valor

preciso defuzzificado será a média ponderada dos

valores suporte dos máximos dos conjuntos

ativados, multiplicados pelos valores de

pertinência dos mesmos conjuntos ativados.

Como dito anteriormente, para a variável

dependente Status de inatividade no 4º mês,

teremos também 7 conjuntos fuzzy definidos

como a seguir, cada um podendo ser ativado por

uma ou mais regras.

Figura 8 – Conjuntos Fuzzy Status

Page 8: Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento

Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.

Suponhamos na figura 8 que o conjunto S_3 tenha

sido ativado com grau de pertinência min(0,45,

S_3) e o conjunto S_4 tenha sido ativado com

grau de pertinência min(0,70,S_4). Pelo método

da altura limite, a saída precisa seria 0,625,

suporte central do conjunto S_4. Já para o método

centróide, o valor de saída seria

(0,45*0,5+0,70*0,625) /(0,45+0,70)= 0,576087. O

gráfico abaixo fornece uma visualização dos

valores suporte utilizado.

0,45

0,70

0,5 0,625

0,576

Figura 9 – Valores Suporte Utilizados para

Defuzzificação

6. Resultados obtidos

Para criação do sistema de inferência fuzzy

utilizamos o software Fuzzy Rules (Vale, 2001).

Nesta etapa, clientes foram separados em dois

grupos de análise. O primeiro consistia numa

amostra equilibrada de 5000 clientes evasivos, e

5000 retidos, os quais foram utilizados em todos

os passos da modelagem do sistema. O segundo

grupo foi usado como controle para avaliação do

potencial de generalização do sistema obtido, e

consistiu numa amostra de 1.085 clientes evasivos

e 3.714 retidos.

Como detalhado em 5.3, 303 regras foram geradas

utilizando somente o grupo de treinamento. No

nosso problema, testamos todas as possíveis

combinações de operadores de interseção,

implicação e fuzzificação. Os resultados obtidos

para a previsão precisa da variável de interesse, a

qual assume valores 0 ou 1, estão a seguir:

Treinam. Controle

Mínimo Mínimo Altura Limite 16,78 7,69

Mínimo Mínimo Centróide 16,33 7,50

Mínimo Produto Altura Limite 16,75 7,67

Mínimo Produto Centróide 16,39 7,54

Produto Mínimo Altura Limite 16,68 7,65

Produto Mínimo Centróide 16,12 7,40

Produto Produto Altura Limite 16,54 7,58

Produto Produto Centróide 16,37 7,53

Diferença % MédiaInterseção Implicação Defuzificação

Tabela 1 – Resultados Obtidos para Combinação

de Operadores

Percebam que o sistema de inferência fuzzy com

operador de interseção produto, implicação de

mínimo, e defuzzificação de centróide, gerou

melhores resultados sendo a configuração do

modelo final adotado neste artigo. Entendam que

o sistema produziu uma saída contínua no

intervalo de 0 até 1. No entando, nosso problema

real é tratado com uma variável de saída binária,

portanto, uma transformação na variável de saída

Status seria conveniente.

Neste sentido, tratamos o valor preciso de 0,5 na

variável fuzzy de saída como sendo o limiar de

separação entre grupos de clientes ativos, nota 0, e

clientes inativos, nota 1. Sendo assim, ao final foi

possível obter um resultado geral para o sistema

de inferência em termos de % de acerto dos

grupos. Nesta etapa, utilizamos somente o

conjunto denominado como controle a fim de

verificarmos a capacidade de generalização do

sistema de inferência. Temos então que:

Valores Inativo Ativo Total

Inativo 812 273 1.085

Ativo 1.413 2.301 3.714

Total 2.225 2.574 4.799

% Linha Inativo Ativo Total

Inativo 74,8% 25,2% 100,0%

Ativo 38,0% 62,0% 100,0%

Total 46,4% 53,6% 100,0%

Ob

serv

ad

os

Preditos (Inferência do Sistema)

Tabela 2 – % Acerto para Classificação de Status

do Grupo de Controle

Sobre as regras geradas para o modelo de

inferência, podemos destar as com maiores peso

conforme tabela abaixo:

Recência Freqüência Valor Status

E0_0 E1_0 E2_0 S_0 1

E0_6 E1_0 E2_0 S_6 1

E0_6 E1_6 E2_0 S_0 1

E0_0 E1_6 E2_6 S_0 1

E0_6 E1_6 E2_6 S_6 1

Conjuntos FuzzyPeso

Tabela 3 – Regras com Maiores Pesos

7. Conclusões e Próximos Passos

Observamos percentuais de acerto para os grupos

de inativos e ativos, respectivamente, de 74,8% e

62%. Para este tipo de negócio – mercado de

compra e venda de ações – a decisão de investir

Page 9: Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy, no Marketing de Relacionamento

Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.

esta estritamente associada a diversos fatores

exógenos ao cliente como instabilidade

econômica, incerteza de mercado, etc. Somando-

se a isto, poderíamos adicionar fatores

psicológicos dos clientes não controlados pelos

analistas como aspectos de aversão a risco,

conservadorismo, estrategismo, etc.

Percebam então que os resultados obtidos são

satisfatórios em termos de % de acerto, dado toda

esta incerteza inerente ao problema. A empresa

em estudo quando desejado aumentar seus índices

de retenção de clientes, poderia focar ações nos

clientes classificados previamente pelo sistema

como futuros inativos. Contrariamente, visando a

rentabilização e manutenção de cliente na base de

dados, poderia fazer ações focadas nos clientes

classificados como futuros ativos,

consequentemente, clientes mais rentáveis.

8. Referências bibliográficas

[1] COLOMBO, Richard; JIANG Weina. A Stochastic

RFM Model. Journal of Interactive Marketing:

Summer 1999.

[2] FADER, Peter; HARDIE, Bruce; LEE, Ka Lok.

RFM and CLV: Using Iso-Value Curves for

Customer Base Analysis. Journal of Marketing

Research: Vol. XLII (November 2005).

[3] PIERSMA, Nanda, et al. Media Planning by

Optimizing Contact Frequencies. Econometric

Institute Report EI 9856/A.

[4] REINARTZ, Werner. KUMAR, V. Customer

Relationship Management, A Database Approach. John Wiley & Sons, June 2005.

[5] HUMBY, Clive; HUNT, Terry; PHILLIPS, Tim.

Scoring Points. 2nd Ed. London: Kogan Page Limited,

2007.

[6] BARTH, Nelson Lerner. Inadimplência:

Construção de Modelos de Previsão. São Paulo:

Nobel Editora, 2004.

[7] BERRY, Michael; LINOFF, Gordon. Data Mining

Techniques for Marketing, Sales, and Customer

Relationship Management. John Wiley & Sons,

Indianapolis, Indiana, 2004. ´

[8] LAROSE, Daniel; Data Mining, Methods and

Models. John Wiley & Sons, New Jersey, Canada,

2006.

[9] SANTOS, Raul; Extração de Regras de Redes

Neurais via Algoritmos Genéticos. IV Congresso

Brasileiro de Redes Neurais, São José dos Campos, SP,

Julho de 1999.

[10] HAYKIN, Simon. Redes Neurais, Princípios e

Práticas. Paulo Matins Engel. 2ed. Porto Alegre:

Bookman, 2001.

[11] BUSSAB, Wilton de O.; MORETTIN, Pedro A..

Estatística Básica. 5ed. São Paulo: Saraiva, 2006.

[12] TANSCHEIT, Ricardo. Sistemas Fuzzy.

Departamento de Engenharia Elétrica da Pontifícia

Universidade Católica, Rio de Janeiro, RJ, 2009.

[13] MENDEL, Jerry M. Fuzzy Logic Systems for

Engineering: A Tutorial. IEEE, Los Angeles, USA,

1995.

[14] ROCHA, Luiz Carlos da. Construindo Escalas de

Atitude. Escola Nacional de Ciências Estatísticas, Rio

de Janeiro, RJ, 2003.

[15] TANSCHEIT, Ricardo. VELLASCO, Marley.

Notas de Aula do Curso Lógica Fuzzy. Pontifícia

Universidade Católica, Rio de Janeiro, RJ, 2009.

[16] MEIER, Andreas; WERRO, Nicolas. A Fuzzy

Classification Model for Online Customers. Informatica, University of Fribourg, Switzerland,

March of 2007.

[17] Faculty of Information Technology, Iran

Telecommunication Research Center (ITRC), Tehran,

Irans. Optimized ICT Project Selection Utilizing

Fuzzy System. World Applied Sciences Journal, 2008.

[18] RUST et al. Modeling Fuzzy Data in Qualitative

Marketing Research. Journal of Marketing Research,

Vol. XXXVII, November, 2000.

[18] SOUZA et al. A Comparative Study of Fuzzy

Target Selection Methods in Direct Marketing. IEEE, 2002.