Upload
anderson-pinho
View
3.419
Download
15
Embed Size (px)
DESCRIPTION
O presente artigo objetivará a criação de um modelo de inferência fuzzy o qual classifique corretamente futuros clientes evasivos para uma empresa. Em estratégias de marketing, é de grande dúvida para a empresa quais clientes abordar numa campanha, ou quais clientes apresentam maiores chances de evasão. Para responderem a isto, muitos pesquisadores têm recorrido a informações de recência, freqüência e valor do cliente, na mineração de conhecimento valioso o qual possa ser utilizado. Lógica fuzzy será um diferencial competitivo na identificação destes clientes, pois permitirá a criação de um modelo preciso de classificação, alinhado ao conhecimento lingüístico explícito do especialista de marketing.
Citation preview
Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
Estratégias de Marketing através de Análise RFV do Cliente e Lógica Fuzzy
Anderson Guimarães de Pinho
Pontifícia Universidade Católica do Rio de Janeiro – Rio de Janeiro – RJ – Brasil
Resumo
O presente artigo objetivará a criação de um
modelo de inferência fuzzy o qual classifique
corretamente futuros clientes evasivos para uma
empresa. Em estratégias de marketing, é de
grande dúvida para a empresa quais clientes
abordar numa campanha, ou quais clientes
apresentam maiores chances de evasão. Para
responderem a isto, muitos pesquisadores têm
recorrido a informações de recência, freqüência e
valor do cliente, na mineração de conhecimento
valioso o qual possa ser utilizado. Lógica fuzzy
será um diferencial competitivo na identificação
destes clientes, pois permitirá a criação de um
modelo preciso de classificação, alinhado ao
conhecimento lingüístico explícito do especialista
de marketing.
Palavras-chave:
Análise RFV, lógica fuzzy, data mining,
previsão a churn, lógica nebulosa.
1. Introdução
RFV (ou RFM em algumas literaturas) entende-se
como recência, freqüência e valor monetário do
cliente. Recência como uma medida de quanto
tempo se passou desde a última transação com a
empresa. Freqüência como uma medida de quão
freqüente um cliente efetua transações. E Valor
Monetário como o gasto médio feito por
transação.
Estratégias baseadas em RFV buscam métricas ou
regras para avaliar o comportamento e valor do
cliente para a empresa. Perguntas como “quais
clientes devem ser impactados por uma ação de
marketing” ou “quais clientes são mais valiosos
para a empresa em termos de contribuição
financeira passada e futura” são encontradas
frequentemente por pesquisadores na gestão do
relacionamento com o cliente (Customer
Relationship Management ou CRM).
Nestes casos, a análise de RFV pode conter
informação valiosa para a empresa na resposta a
estes questionamentos. Toda esta informação
necessária para análise encontra-se em histórico
transacional de vendas de clientes, disponíveis nos
bancos de dados de grandes empresas.
São dos mais diversos os estudos envolvendo
RFV. A exemplo, Fader (2005) apresentou um
modelo estocástico para estimar o Valor
Financeiro do Tempo de Vida do Cliente
(Customer Life Time Value ou CLTV), utilizando
como variáveis explicativas RFV em empresas
com vínculo não contratual. Em um segundo
estudo, Colombo (1999) introduz um simples
modelo estocástico baseado em RFV para
responder a quais clientes uma firma deve focar
para fazer uma oferta de produto. Ambos os
estudos levam em comum o mesmo princípio
motivacional: medidas comportamentais de
clientes são indicadores chaves para predizer
comportamento futuro.
Sobre o problema de Colombo, sabemos que as
empresas podem maximizar o retorno de ações e
minimizar custos de marketing se souberem quais
clientes endereçarem uma ação de venda. Estes
clientes podem ser assim considerados de maior
valor para a empresa, pois seu comportamento
passado indica uma intenção positiva de
manutenção do relacionamento.
Por outro lado, clientes menos valiosos seriam
aqueles que não apresentam uma intenção de
recompra futura. Conseqüentemente,
apresentariam baixas chances de resposta a uma
ação de venda marketing, seja ela de cross-selling
ou up-selling (Berry, 115).
No entanto, é importante dizer que não há
garantias de que após um longo período de
inatividade, um cliente considerado no passado
como baixa chance de recompra venha a efetuar
uma transação. Em casos afirmativos, dizemos
que o evento “transação com a empresa”
representa um processo sem memória, de difícil
modelagem, onde a ocorrência depende somente
de um instante de tempo imediatamente anterior
ao ocorrido.
Por estes motivos, empresas não se preocupam em
investigar um comportamento de compra futuro
tão distante, uma vez que a dinâmica de mercados
mais longínquos pode não ter dependência ou
correlação com o presente. Em outras palavras, as
chances de um cliente se tornar de alto valor num
Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
futuro distante, dificilmente encontraria
explicações no comportamento presente.
Numa visão inversa ao problema de Colombo,
poderíamos trabalhar ações de marketing
específicas para clientes com menos chances de
respostas. Tais ações teriam como objetivo a
mudança comportamental em termos de recência,
freqüência e valor, a fim de transformá-los de
maior valor para a empresa.
Como por exemplo, suponha uma empresa
administradora de investimentos na Bolsa de
Valores de São Paulo (BOVESPA). Para clientes
com baixa intenção de manutenção do
relacionamento, poderiam ser oferecidos cursos e
palestras sobre investimentos em ações. Tal ação
teria como objetivo secundário, oferecer aos
clientes ferramental intelectual o suficiente para
que estes possam continuar operando no mercado
de ações pela empresa administradora.
Conseqüentemente, o aumento de lucros pelo
aumento do tempo de relacionamento.
Embora a discriminação de clientes mais e menos
valiosos atenda a múltiplos objetivos, este último
apresentado torna-se mais atraente, pois vai ao
encontro com a retenção de clientes ativos na base
de dados como conseqüência do aumento da
duração do tempo de vida do cliente (Customer
Life Time Duration ou CLTD). Sendo assim, esta
será a principal motivação de nossos estudos nos
próximos capítulos.
A figura a seguir mostra a distinção destes dois
grupos acima discutidos:
Maiores ChancesRecompra.Alto Valor.
Alto CLTD Futuro.
Menores ChancesRecompra.
Baixo Valor.Baixo CLTD Futuro.
(1) (2)
Figura 1 - Tipos de Clientes em Análise de RFV
Para problemas mais simples como a classificação
de dois grupos de clientes, muitas outras técnicas
de menos complexidade, em comparação à
modelagem estocástica, têm sido aplicadas.
Reinartz (2005, p.129-132) destaca o uso da
Regressão Logística e Árvore de Decisão como
solução a problemas envolvendo RFV. Tais
técnicas apresentam suas características, as quais
dividem pesquisadores e acadêmicos na sua
aplicação.
Neste artigo, abordaremos a técnica de Lógica
Fuzzy (Marley apud Lofti Zadeh, 1965) para
problemas de classificação de grupos. Veremos
que esta técnica se apresentará como um
diferencial competitivo, pois permitirá a criação
de um modelo de inferência preciso para
problemas de marketing, considerando o
conhecimento de especialistas sobre o problema
estudado. Isto poderia aumentar a acurácia do
sistema, e por outro lado, permitiria uma
adequação do sistema às atuais práticas da
empresa na identificação de grupos de clientes.
Desta forma, tecnologia, pessoas e processos
poderiam se alinhar de forma a contemplarem este
sistema criado, aumentando lucros e
competitividade no mercado.
2. Customer Life Time Duration (CLTD) e
RFV
O paradigma dos problemas de RFV apresenta-se
como o seguinte: clientes com baixa recência, alta
freqüência, e alto valor, apresentarão um alto
CLTD e conseqüentemente estarão mais dispostos
a manter um vínculo contínuo com a empresa,
respondendo melhor a campanhas de marketing.
Contrariamente, clientes com alta recência, baixa
freqüência e baixo valor, são mais propensos à
interrupção do vínculo empresarial, respondendo
pior a campanhas, pois já sem encontram no fim
do CLTD.
Quando se fala sobre CLTD, nem todas as
relações cliente-empresa são iguais. Dependendo
do tipo de serviço ou produto ofertado, clientes
podem assumir um relacionamento contratual ou
não contratual. Conforme se observa em Kuman
(p.103), casos contratuais constituem a mais
precisa observação do tempo de vida do cliente.
Uma simples medida do tempo decorrido desde o
início do relacionamento (ou início de uma janela
de análise) até o fim do relacionamento (ou fim de
uma janela de análise) pode ser obtida facilmente,
determinando assim o CLTD. Desta forma, um
cliente torna-se inativo quando não ocorre uma
renovação de contrato. Neste caso, dizemos que
ocorreu uma evasão ou “churn” de cliente.
Já em casos não contratuais, onde não há uma
informação explícita sobre o fim de um
relacionamento. Clientes neste mercado não têm
barreiras que os empeçam de continuar ou
interromper o relacionamento quando bem
quiserem, sem alguma comunicação formal à
empresa. Isto nos proporcionará o ambiente ideal
para aplicação de Lógica Fuzzy.
Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
Nestes ambientes não contratuais, a forma mais
utilizada para cálculo do CLTD é emular uma
regra de classificação de clientes em ativos ou
inativos num tempo finito de relacionamento. Por
exemplo, poderíamos definir uma regra baseada
em RFV passado, para classificar clientes ativos e
inativos após três meses de relacionamento,
caracterizando previamente o fim ou manutenção
do CLTD. Isto ofereceria parâmetros suficientes
para que gestores de relacionamento com o cliente
pudessem agir preventivamente na retenção
destes classificados como futuros inativos,
maximizando lucros da empresa pela permanência
prolongada do status ativo. Conforme se observa
em Karine (apud Reichheld & Sasser Jr., 1990),
dependendo do setor de atuação, as empresas
podem rentabilizar seus negócios em lucros de
25% a 85%, reduzindo em apenas 5% a perda de
clientes.
Por estes motivos, ações focadas em grupos com
maiores chances de evasão, consequentemente
menor chance de resposta a uma ação, passaria a
ser bastante atraente, pois vai ao encontro com a
lucratividade futura da empresa e uma série de
outros aspectos como satisfação e lealdade, sendo
assim a estratégia defendida neste artigo.
3. Introdução a Lógica Fuzzy
Seres humanos lidam frequentemente com
processos de decisões complexos a partir de
informações imprecisas ou aproximadas. Esta
decisão tomada por seres humanos também será
de natureza imprecisa, podendo ser expressa
muitas vezes através de conceitos ou conjuntos
lingüísticos. Teoria de conjuntos fuzzy e Lógica
Fuzzy visam traduzir em termos matemáticos,
portanto precisos, esta informação de natureza
imprecisa através de um conjunto de regras
lingüísticas.
O processo de inferência humano pode ser
entendido através de regras do tipo IF... THEN,
onde a parte IF se refere a um conjunto de
atributos preditores ou independentes, e THEN a
um atributo dependente, ou seja, a variável de
aferição. Um modelo de inferência fuzzy baseado
em regras lingüísticas, por sua vez, seria então
tratado através da Teoria de Conjuntos Fuzzy e a
Lógica Fuzzy.
A Teoria de Conjuntos Fuzzy foi concebida por
L.A. Zadeh com o objetivo de fornecer um
ferramental matemático para o tratamento de
informações de caráter impreciso ou vago. A
Lógica Fuzzy que é baseada nesta última teoria foi
construída a partir de conceitos estabelecidos na
lógica clássica. Operadores foram introduzidos à
semelhança dos tradicionais, e conforme estudos
foram feitos na área, novos operadores de
importância prática eram desenvolvidos.
Sistemas fuzzy têm sido aplicados em diversos
campos de ciência. Este artigo trata
explicitamente de um exemplo de mineração de
dados, ou data mining. A descoberta de
conhecimento em grandes bancos de dados, ou
data mining, tem inspirado muitos pesquisadores
nos mais diversos campos da ciência. Uma
dificuldade em processos de descoberta de
conhecimento ou knowledge discover database
(KDD), trata-se da extração do conhecimento
correto, de fácil compreensão, e de grande
utilidade para o usuário. Berry divide em 5 as
responsabilidades atribuídas à mineração de dados
em processos KDD: (1) classificação; (2)
associação de regras; (3) perfilação de clientes; (4)
clusterização; (5) estimação; e (6) predição.
Pode ser dizer que lógica fuzzy esta associada a
todas estas responsabilidades mencionadas,
apresentando ou não a sua vantagem de utilização
em contrapartida a outras técnicas de mineração.
Na aplicação que se seguirá, veremos estritamente
a resolução de um problema de classificação
através de lógica fuzzy. Como já discutido,
Lógica Fuzzy se apresentará como um diferencial,
pois unirá a precisão de um sistema baseado em
classificação, com o conhecimento lingüístico de
profissionais tomadores de decisão, expresso
através de regras de decisão.
Por diversos textos e livros abordarem o assunto
de lógica fuzzy vastamente, trataremos o
problema analiticamente, buscando sempre uma
formalização técnica quando necessário. Para um
melhor entendimento da técnica recomendamos
[12] e [13].
4. A Empresa e o Problema de Churn de
Clientes
A empresa em estudo trata-se de uma
administradora de investimentos com grande
atuação na Bovespa. Clientes que optam por
investir pelo sistema Home Broker executam
ordens na internet, diversificando seus
investimentos em até 4 categorias de
investimentos: (1) compra e venda de ações; (2)
cotas em fundos de investimentos; (3) bolsa de
mercadorias e valores futuros (ou Bm&f); (4) e
títulos do tesouro direto.
Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
O problema da empresa apresenta-se da seguinte
forma: clientes após a inclusão na base de dados e
início das operações no sistema home broker,
apresentam um decréscimo significativo na
atividade até o 4º mês de relacionamento,
identificado pela não intenção de continuar
investindo. É comprovado para a empresa que
após o 4º mês de relacionamento clientes que
decidem por continuar suas operações na bolsa ou
outro tipo de investimento o fazem continuamente
ao longo de um horizonte de 12 meses ou mais.
Para que isto fique claro, apresentaremos o gráfico
a seguir. Para tanto, separamos 12 safras mensais
de entrada de cliente ao longo do ano de 2006, e
verificou-se o status do cliente, mês a mês, por um
período seguinte de 12 meses. Quando no mês de
análise, após a inclusão no cadastro da empresa,
não era verificada nenhuma operação no sistema
home broker, o cliente era marcado como inativo.
Contrariamente, recebia a marcação de ativo, caso
viesse a efetuar alguma ordem de investimento no
mês.
0
20
40
60
80
100
1 2 3 4 5 6 7 8 9 10 11 12
Tempo de Relacionamento
% C
lass
e
Ativos Inativos
Gráfico 1 - Curvas de Atividade e Inatividade
Neste tipo de negócio, empresas gestoras de
investimentos geralmente obtêm lucros através de
uma taxa % sobre o valor movimento e/ou uma
constante sobre cada ordem executada. Na
empresa em análise, lucros provêm somente sobre
um valor constante para cada ordem executada.
Desta forma, podemos definir como variável de
Valor, os lucros obtidos por quantidade de ordens
executadas por cada cliente até um instante de
tempo t dado pela função abaixo, onde t é uma
medida mensal:
.1
)( ConstiOrdenst
it
ClienteValor
(1)
Esta última definição de valor seria um problema,
pois pouco explicaria o potencial financeiro do
cliente em questão, uma vez que o montante
movimentado não é considerado no cálculo. Uma
medida mais eficiente para Valor seria “a média
de valor movimento por ordem executada até um
instante de tempo t”, e certamente seria mais
discriminatória que a anterior.
iOrdenst
i
ientadoValorMovimt
it
ClienteValor
1
1)(
(2)
Para Freqüência, definimos como “a média
mensal do número de ordens executadas até um
instante de tempo t”.
t
iOrdenst
it
ClienteFreqüência
1)(
(3)
E por último, Recência, como “o tempo de
decorrido (em dias) até um instante de tempo t,
desde a última ordem executada”.
Sendo assim, para nosso problema,
consideraremos t = 3 representando o terceiro mês
de relacionamento do cliente. Com isto,
buscaremos através de Lógica Fuzzy criar um
sistema que classifiquem futuros clientes inativos
a partir do 4º mês de relacionamento. Desta
forma, a empresa em questão poderá agir
preventivamente através de ações de marketing de
relacionamento, buscando a retenção destes
clientes com maiores chances de evasão,
chamados na literatura de RFV como de menor
valor ou baixo CLTD futuro.
Em mercados como o de investimento, o
comportamento em termos de RFV tem grande
correlação com outras variáveis externas sócio-
econômicas. Desta forma, é de grande
preocupação que o modelo aqui objetivado seja o
menos dependente de comportamentos exógenos à
empresa. Para ilustrarmos nosso raciocínio e
utilizando um mercado hipotético, poderíamos
dizer que um comportamento em termos de
recência do cliente superior a 20 dias sem operar
na bolsa seria típico de um futuro cliente evasivo,
mas que em outra época com menor instabilidade
econômica, isto seria esperado do cliente.
Desta forma, para que o sistema aqui proposto não
fosse dependente à época o qual esta sendo
estudado, optou-se por trabalhar com decis de
valores de recência, freqüência, e valor. Isto vai de
encontro com modelos clássicos de RFV (Kuman,
p.119). Por isso, decis foram criados tendo como
informação de entrada as variáveis definidas no
capítulo 3. Isto permitiria a criação de um modelo
Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
menos frágil a variabilidade econômica no
mercado, menos perecível com o passar dos
meses.
O banco de dados utilizado apresenta uma
amostra de 14.799 clientes (linhas). As variáveis
de RFV (colunas) apresentam o seguinte domínio:
R (dias) pertence ao Dom {0; 90}; F (média de
ordens executadas mês) ao Dom {0,333; 2,86 x
10A}; e V (média de valor executado por ordem)
ao Dom {3,485 x 10B ; 4,085 x 10
C}.
1 Sendo
assim, cada uma das variáveis foi codificada no
intervalo de 1 a 10, conforme os decis de suas
distribuições de freqüência.
R F V
1 1 1
2 2 2
3 3 3
4 4 4
5 5 5
6 6 6
7 7 7
8 8 8
9 9 9
10 10 10
Mais
Recente
Maior
Freqüência
Maior
Valor
Menos
Recente
Menor
Freqüência
Menor
Valor
Figura 2 - Representação dos Decis de RFV
A variável dependente do modelo, Status no 4º
mês de relacionamento, será representada por uma
variável binária, onde 0 representa o status ativo, e
1 o status inativo.
5. Modelagem por Lógica Fuzzy
5.1. O Sistema
No problema em estudo, o processo de tomada de
decisão pode ser entendido da seguinte forma.
Dado um padrão de comportamento do cliente nos
três primeiros meses de relacionamento em termos
de RFV, precisamos prever classificando o futuro
cliente inativo (ou não) a partir do 4º mês de
relacionamento. Neste sentido, usaríamos a lógica
fuzzy manipulando o conhecimento lingüístico
necessário para responder a este tipo de problema
de classificação.
O sistema de inferência pode ser entendido
conforme figura a seguir. Primeiramente, entradas
precisas são fornecidas ao sistema em termos de
RFV. Conjuntos lingüísticos são gerados de
acordo com as funções de pertinência definidas
sobre cada conjunto. O processo de inferência é
efetuado, gerando conjuntos lingüísticos através
1 Por motivos de segurança, os dados de F e V da empresa aqui utilizados, quando mencionados, serão multiplicados por um
escalar de 10 a menos A, B, ou C.
de conjuntos lingüísticos, por regras previamente
estabelecidas e armazenadas no sistema. Feito
isto, ocorre o processo chamado de defuzzificação
gerando uma ação precisa a ser tomada pelo
sistema, a partir de informações até então
lingüísticas. Tais etapas serão detalhadas a seguir.
Entradas PrecisasR F V
FUZZIFICADOR
REGRAS INFERÊNCIA
DEFUZZIFICADOR
Saída PrecisaStatus
Conjunto Nebuloso de Entrada
Conjunto Nebuloso de Saída
Figura 3 – Sistema de Inferência Fuzzy Estudado
5.2. Fuzzificação
O processo de fuzzificação ocorre com a ativação
de conjuntos lingüísticos através de entradas
precisas fornecidas ao sistema. Para tanto, cada
variável de entrada (RFV) precisa ser definida em
termos de funções de pertinência e conjuntos
fuzzy, a ela associados. Para representação destes
conjuntos fuzzy, desejaríamos que este estivesse
estritamente associado à forma com a qual o
analista de marketing toma decisões em seu
negócio.
A forma mais próxima a qual um analista tomaria
uma decisão em seu negócio, de natureza
imprecisa, poderia ser interpretada através de uma
escala Likert (Rocha apud R.Likert, 1932) de 7
pontos. O principal papel da escala trata-se de
mensurar um conceito subjetivo através de níveis
de intensidade numa escala de concordância. A
escala Likert ganhou fama pela sua simplicidade e
é usada atualmente em diversas áreas da ciência.
Em nosso trabalho, entenda que o processo de
concordar e discordar trata-se essencialmente de
um processo impreciso, portanto adequado a
teoria dos conjuntos fuzzy.
Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
Por exemplo, para a variável de valor, o processo
de definir um cliente como sendo de ALTO ou
BAIXO valor pelo analista poderia ser
representado através de uma nota numa escala de
1 até 7, onde a nota 7 representa que
definitivamente concorda que o cliente é de
ALTO valor, e 1 que concorda com a afirmação
de que definitivamente o cliente é de BAIXO
valor.
DiscordoTotalmente
ConcordoTotalmente
Figura 4 – Escala Likert de 7 Pontos
Desta forma, um exemplo de raciocínio humano
completo, portanto, representável em termos de
regra no modelo de inferência fuzzy, poderia ser
entendido da seguinte forma: Se um cliente
apresenta uma nota 5 dada pelo analista sobre o
grau de concordância sobre a afirmação que este
cliente é de alto valor financeiro; e nota 3 sobre a
concordância de que é de alta freqüência; e nota 7
concordando que é de alta recência; então na
prática, concluiríamos que este cliente será futuro
inativo a partir do 4º mês de relacionamento com
nota de concordância 3.
Por estes motivos, será necessário criar para cada
variável de entrada (RFV), 7 conjuntos
lingüísticos, cada qual representado por uma nota
dada pelo analista num processo natural de
inferência humano. Por limitações do software, a
forma destes conjuntos será definida na forma
triangular, com igual interseção de 50% dos
conjuntos fuzzy dentre as variáveis. Percebam que
as variáveis de entrada têm os mesmos limites
máximos e mínimos (decis 1 até 10), e mesmos
números de conjuntos fuzzy (notas 1 até 7 de
concordância), e portanto terão a mesma forma de
função de pertinência.
Sendo assim, dado uma variável de entrada X
qualquer e um conjunto fuzzy Y qualquer, a
função de pertinência )(XY apresentará valores
no intervalo de 0 até 1, conforme forma gráfica
das funções a seguir, onde: o eixo x representa a
entrada precisa do sistema; e EQ_0 até EQ_6
concordâncias mínimas e máximas para cada
variável de entrada :
Figura 5 – Conjuntos Fuzzy de Recência
Figura 6 – Conjuntos Fuzzy de Freqüência
Figura 7 – Conjuntos Fuzzy de Valor
Para fins de exemplificação sobre a forma teórica
de representação triangular, definiremos o
conjunto fuzzy referente à nota 4 da concordância
de que o cliente é de alto valor. Sendo assim,
defini-se:
gV
gVffg
Vg
fVeef
Vf
eV
gfeVTRI
,0
,)(
))(
,)(
)(1
,0
),,,( (4)
Onde e=4,375, g=6,625, e f=5,5. Ou seja, a função
que mapeia V em )(4 V , função de pertinência
de V = 4 na forma triangular. Na forma gráfica,
esta função pode ser visualizada em azul na figura
6.
5.3. Regras e Inferência Fuzzy
Precisamos definir agora quais regras serão
utilizadas no processo de inferência fuzzy. Na
forma com a qual nosso sistema esta programado,
regras precisam estar no seguinte formato: Seja,
RDecil=X, e FDecil=Y, e VDecil=Z, então, Status=W,
Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
onde X, Y, Z e W, valores lingüísticos possíveis
para R, F, V e Status, respectivamente. Sendo
assim, uma regra é definida pela interseção de 3
antecedentes e 1 conseqüente. Percebam que com
isto, teríamos que definir um máximo de até 343
regras (73), cada qual com um único conseqüente.
No entanto, a geração manual de todas estas
regras seria altamente dispendiosa, e por outro
lado, poderia haver regras as quais na prática
nunca seriam utilizadas. Como a base que
dispomos para treinamento é grande, total de
10.000 registros, utilizaremos o procedimento de
geração automática de regras programada no
Fuzzy Rule levando-se em consideração todo este
conjunto de dados.
Em suma, o que este procedimento de geração
automática de regras fará é: (1) determinar os
graus de pertinência que aparecem no domínio de
R, F, V e Status; (2) atribuir a cada valor do
domínio o conjunto fuzzy com maior grau de
pertinência; (3) obter uma regra lingüística para
cada par de entradas RFV e saída Status. Tal
procedimento foi executado e ao final podemos
observar a geração de um total de 303 regras.
O processo de inferência acontece da seguinte
forma: (1) o antecedente da regra é calculado
através da interseção dos conjuntos fuzzy através
do operador mínimo ou produto (definidos pelo
usuário e disponíveis no software). Lembre-se que
para cada conjunto fuzzy ativado, existirá uma
função de pertinência a ele associado; (2) quando
da operação de implicação do resultado do
antecedente, o conseqüente também será
calculado através dos operadores mínimo ou
produto. Com isto, uma regra ativada terá como
saída um conjunto nebuloso com certo grau de
pertinência a ele associado, servindo de resultado
para o processo de defuzzificação.
Neste artigo, testes demonstraram que os
operadores de produto para interseção, e mínimo
para implicação serão mais promissores. Sem
entrar em detalhes sobre os resultados a serem
apresentados no capítulo 6, exemplificaremos
como seria efetuado o cálculo de implicação de
uma regra considerando estes operadores. Seja
),,,(Re
SVFRlação
o valor de pertinência da
função de implicação de RFV em Status, defini-se
laçãoRe como sendo:
)().().(
,)(,
))()),(),(),(((
),,,(Re
VZFYRXefonde
sefmín
sWVZFYRXeff
SVFR
W
lação
(5)
Feito isto, um ajuste ainda é feito no valor de
pertinência geradolaçãoRe
. Cada qual, cálculo
resultante da implicância para cada indivíduo na
amostra, é multiplicado pelo seu peso respectivo.
Um valor variando de 0 a 1 determinando o peso
que aquela regra tem no modelo de inferência.
Sendo assim, teremos então saídas fuzzy para
serem consideradas na próxima etapa.
5.4. Defuzzificação
Tendo em mãos todos os resultados gerados pelas
regras ativadas, conjuntos fuzzy ativados e
funções de pertinência, a próxima etapa será a
defuzzificação para que o sistema possa tomar
uma decisão precisa sobre o problema. Até o
momento dispomos de um ou mais conjuntos
fuzzy para a variável de saída, cada um ativado
com certo grau de pertinência.
Neste artigo serão testados dos tipos de
defuzzificação, o método de altura limite e o
método do centróide. No método de altura limite,
utiliza-se o valor de suporte ou base do máximo
do conjunto, cuja função de pertinência é maior.
Em caso de empate neste último, utilizaríamos o
valor suporte do máximo do conjunto com menor
pertinência. Já no método centróide, o valor
preciso defuzzificado será a média ponderada dos
valores suporte dos máximos dos conjuntos
ativados, multiplicados pelos valores de
pertinência dos mesmos conjuntos ativados.
Como dito anteriormente, para a variável
dependente Status de inatividade no 4º mês,
teremos também 7 conjuntos fuzzy definidos
como a seguir, cada um podendo ser ativado por
uma ou mais regras.
Figura 8 – Conjuntos Fuzzy Status
Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
Suponhamos na figura 8 que o conjunto S_3 tenha
sido ativado com grau de pertinência min(0,45,
S_3) e o conjunto S_4 tenha sido ativado com
grau de pertinência min(0,70,S_4). Pelo método
da altura limite, a saída precisa seria 0,625,
suporte central do conjunto S_4. Já para o método
centróide, o valor de saída seria
(0,45*0,5+0,70*0,625) /(0,45+0,70)= 0,576087. O
gráfico abaixo fornece uma visualização dos
valores suporte utilizado.
0,45
0,70
0,5 0,625
0,576
Figura 9 – Valores Suporte Utilizados para
Defuzzificação
6. Resultados obtidos
Para criação do sistema de inferência fuzzy
utilizamos o software Fuzzy Rules (Vale, 2001).
Nesta etapa, clientes foram separados em dois
grupos de análise. O primeiro consistia numa
amostra equilibrada de 5000 clientes evasivos, e
5000 retidos, os quais foram utilizados em todos
os passos da modelagem do sistema. O segundo
grupo foi usado como controle para avaliação do
potencial de generalização do sistema obtido, e
consistiu numa amostra de 1.085 clientes evasivos
e 3.714 retidos.
Como detalhado em 5.3, 303 regras foram geradas
utilizando somente o grupo de treinamento. No
nosso problema, testamos todas as possíveis
combinações de operadores de interseção,
implicação e fuzzificação. Os resultados obtidos
para a previsão precisa da variável de interesse, a
qual assume valores 0 ou 1, estão a seguir:
Treinam. Controle
Mínimo Mínimo Altura Limite 16,78 7,69
Mínimo Mínimo Centróide 16,33 7,50
Mínimo Produto Altura Limite 16,75 7,67
Mínimo Produto Centróide 16,39 7,54
Produto Mínimo Altura Limite 16,68 7,65
Produto Mínimo Centróide 16,12 7,40
Produto Produto Altura Limite 16,54 7,58
Produto Produto Centróide 16,37 7,53
Diferença % MédiaInterseção Implicação Defuzificação
Tabela 1 – Resultados Obtidos para Combinação
de Operadores
Percebam que o sistema de inferência fuzzy com
operador de interseção produto, implicação de
mínimo, e defuzzificação de centróide, gerou
melhores resultados sendo a configuração do
modelo final adotado neste artigo. Entendam que
o sistema produziu uma saída contínua no
intervalo de 0 até 1. No entando, nosso problema
real é tratado com uma variável de saída binária,
portanto, uma transformação na variável de saída
Status seria conveniente.
Neste sentido, tratamos o valor preciso de 0,5 na
variável fuzzy de saída como sendo o limiar de
separação entre grupos de clientes ativos, nota 0, e
clientes inativos, nota 1. Sendo assim, ao final foi
possível obter um resultado geral para o sistema
de inferência em termos de % de acerto dos
grupos. Nesta etapa, utilizamos somente o
conjunto denominado como controle a fim de
verificarmos a capacidade de generalização do
sistema de inferência. Temos então que:
Valores Inativo Ativo Total
Inativo 812 273 1.085
Ativo 1.413 2.301 3.714
Total 2.225 2.574 4.799
% Linha Inativo Ativo Total
Inativo 74,8% 25,2% 100,0%
Ativo 38,0% 62,0% 100,0%
Total 46,4% 53,6% 100,0%
Ob
serv
ad
os
Preditos (Inferência do Sistema)
Tabela 2 – % Acerto para Classificação de Status
do Grupo de Controle
Sobre as regras geradas para o modelo de
inferência, podemos destar as com maiores peso
conforme tabela abaixo:
Recência Freqüência Valor Status
E0_0 E1_0 E2_0 S_0 1
E0_6 E1_0 E2_0 S_6 1
E0_6 E1_6 E2_0 S_0 1
E0_0 E1_6 E2_6 S_0 1
E0_6 E1_6 E2_6 S_6 1
Conjuntos FuzzyPeso
Tabela 3 – Regras com Maiores Pesos
7. Conclusões e Próximos Passos
Observamos percentuais de acerto para os grupos
de inativos e ativos, respectivamente, de 74,8% e
62%. Para este tipo de negócio – mercado de
compra e venda de ações – a decisão de investir
Relatório técnico do curso de Lógica Fuzzy do Departamento de Engenharia Elétrica da PUC-RJ em 06/2009.
esta estritamente associada a diversos fatores
exógenos ao cliente como instabilidade
econômica, incerteza de mercado, etc. Somando-
se a isto, poderíamos adicionar fatores
psicológicos dos clientes não controlados pelos
analistas como aspectos de aversão a risco,
conservadorismo, estrategismo, etc.
Percebam então que os resultados obtidos são
satisfatórios em termos de % de acerto, dado toda
esta incerteza inerente ao problema. A empresa
em estudo quando desejado aumentar seus índices
de retenção de clientes, poderia focar ações nos
clientes classificados previamente pelo sistema
como futuros inativos. Contrariamente, visando a
rentabilização e manutenção de cliente na base de
dados, poderia fazer ações focadas nos clientes
classificados como futuros ativos,
consequentemente, clientes mais rentáveis.
8. Referências bibliográficas
[1] COLOMBO, Richard; JIANG Weina. A Stochastic
RFM Model. Journal of Interactive Marketing:
Summer 1999.
[2] FADER, Peter; HARDIE, Bruce; LEE, Ka Lok.
RFM and CLV: Using Iso-Value Curves for
Customer Base Analysis. Journal of Marketing
Research: Vol. XLII (November 2005).
[3] PIERSMA, Nanda, et al. Media Planning by
Optimizing Contact Frequencies. Econometric
Institute Report EI 9856/A.
[4] REINARTZ, Werner. KUMAR, V. Customer
Relationship Management, A Database Approach. John Wiley & Sons, June 2005.
[5] HUMBY, Clive; HUNT, Terry; PHILLIPS, Tim.
Scoring Points. 2nd Ed. London: Kogan Page Limited,
2007.
[6] BARTH, Nelson Lerner. Inadimplência:
Construção de Modelos de Previsão. São Paulo:
Nobel Editora, 2004.
[7] BERRY, Michael; LINOFF, Gordon. Data Mining
Techniques for Marketing, Sales, and Customer
Relationship Management. John Wiley & Sons,
Indianapolis, Indiana, 2004. ´
[8] LAROSE, Daniel; Data Mining, Methods and
Models. John Wiley & Sons, New Jersey, Canada,
2006.
[9] SANTOS, Raul; Extração de Regras de Redes
Neurais via Algoritmos Genéticos. IV Congresso
Brasileiro de Redes Neurais, São José dos Campos, SP,
Julho de 1999.
[10] HAYKIN, Simon. Redes Neurais, Princípios e
Práticas. Paulo Matins Engel. 2ed. Porto Alegre:
Bookman, 2001.
[11] BUSSAB, Wilton de O.; MORETTIN, Pedro A..
Estatística Básica. 5ed. São Paulo: Saraiva, 2006.
[12] TANSCHEIT, Ricardo. Sistemas Fuzzy.
Departamento de Engenharia Elétrica da Pontifícia
Universidade Católica, Rio de Janeiro, RJ, 2009.
[13] MENDEL, Jerry M. Fuzzy Logic Systems for
Engineering: A Tutorial. IEEE, Los Angeles, USA,
1995.
[14] ROCHA, Luiz Carlos da. Construindo Escalas de
Atitude. Escola Nacional de Ciências Estatísticas, Rio
de Janeiro, RJ, 2003.
[15] TANSCHEIT, Ricardo. VELLASCO, Marley.
Notas de Aula do Curso Lógica Fuzzy. Pontifícia
Universidade Católica, Rio de Janeiro, RJ, 2009.
[16] MEIER, Andreas; WERRO, Nicolas. A Fuzzy
Classification Model for Online Customers. Informatica, University of Fribourg, Switzerland,
March of 2007.
[17] Faculty of Information Technology, Iran
Telecommunication Research Center (ITRC), Tehran,
Irans. Optimized ICT Project Selection Utilizing
Fuzzy System. World Applied Sciences Journal, 2008.
[18] RUST et al. Modeling Fuzzy Data in Qualitative
Marketing Research. Journal of Marketing Research,
Vol. XXXVII, November, 2000.
[18] SOUZA et al. A Comparative Study of Fuzzy
Target Selection Methods in Direct Marketing. IEEE, 2002.