31
Mineração de dados com Classificação de Dados Um estudo de caso sobre o Churn Rate em serviços de telefonia PROF. JOÃO GABRIEL LIMA @JGABRIEL_LIMA LINKEDIN.COM/IN/JOAOGABRIELLIMA Mineração de dados com RapidMiner - Prof. João Gabriel Lima

Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Embed Size (px)

Citation preview

Page 1: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Mineração dedadoscom

Classificação deDados

Umestudo decaso sobre oChurnRateem serviços detelefonia

PROF. JOÃO GABRIEL L IMA@JGABR IE L_ L IMA

L INKED IN .COM/ IN / JOAOGABR IE L L IMA

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Page 2: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Prof.João GabrielLima

• Pesquisador emMineração dedadoseInteligência Computacional;

• Engenheiro daComputação,especialista em SoftwareeHardware;

• Doutorando em Computação Aplicada;

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Page 3: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Processo deExtração doconhecimento

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Page 4: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Conhecendo nossa basededadosENTENDER ODOMÍNIO EOCONHECIMENTO QUEPODEMOSEXTRAIR

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Page 5: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Serviço detelefoniaNesta basededados,temos os dadosdosclientes deuma empresa detelefonia.

Vamos focar noChurnRate

Oqueé oChurnRate?

◦ Trata-sedeuma métrica queavalia aquantidade declientes queabandonam/cancelam um

determinado serviço.

◦ Parauma empresa expandir é imprescindível queoseu GrowthRate(índice decrescimento)supere o

seu ChurnRate.

◦ Objetivo é criar estratégias paralidar comos clientes demodo acompreender ediminuir oChurnRate.

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Page 6: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Serviço detelefoniaNesta basetemos asseguintes informações:

- TECNOLOGIA:4G,Telefone Móvel,Telefone Fixo,Fibra

- IDADE

- DATADEADESÃO

- LIGACOES_SUPORTE_ULTIMO_ANO:quantidade totaldeligações feitas paraaosuporte

- MEDIA_FATURA_MENSAL

- TAXA_DE_CHURN:probabilidade decancelamento

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Page 7: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Qual oobjetivo chave?EM MINERAÇÃO DEDADOS,TRAÇAR OOBJETIVO É OPRIMEIROPASSO.É FUNDAMENTAL!

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Page 8: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Classificar eprever oChurnRatedeacordo comoperfil ecomportamentodosclientes.

Mineração dedadoscomRapidMiner - Prof.João GabrielLima

Page 9: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Ótimo!Vamos aos negócios!

Page 10: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Conhecendo nossaferramenta!

Page 11: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

AWESOMEDATAMINETOOL

Page 12: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 1– Abrindo nossos dadosna ferramentaAbra oarquivo telefonia_churn_rate.csv comocomponente LoadData.

Page 13: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 2– ETLepreparação dedadosPrecisamos marcar acoluna queserá oalvo

dasanálises (TAXA_DE_CANCELAMENTO)e

convetê-ladenumérica parabinária.

Componentes:

- SetRule

- NumericaltoBinomial

Page 14: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 3– Preparando avalidação domodeloValidar seu modelo é achave dosucesso.Ocross-validationsepara oconjunto dedadosem

consjunto detreinamento edeteste.

Componente:

*X-Validation

Page 15: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 3.1– Preparando ogrupo detreinamentoA maioria dos clientes querem ficar com umserviço ao invés de abandoná-lo (rsrsr)

Para isso precisamos equilibrar nossoconjunto de treinamento para focar sobre ocaso que estamos interessados. Como seestivéssemos colocando uma lupa sobre ataxa de cancelamento.

Componentes:

- Sample

Page 16: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 3.1– Preparando ogrupo detreinamento

Page 17: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 3.2– Preparando ogrupo detreinamentoEm vez de apenas fazer a configuração manual, vamos otimizá-lo.

Utilizando o modelo Wisdom of the Crowd para uma árvore de decisão nós vamos otimizar aprofundidade máxima no intervalo [20-29]

Componente:

- Optimize Parameters (Grid)

Page 18: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 4– Preparando nosso classificadorAbrindo o ”Otimizador de Parâmetros”, o modelo será treinado e avaliado.Leitura recomendada:

Wisdom of the Crowd

Componentes:

- Decision Tree; Apply Model; Performance

Page 19: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 3.3– Configurando ootimizador

Page 20: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 3.2– Preparando ogrupo detesteO modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados

Componentes:

- Apply Model

- Performance (Binominal Classification)

Page 21: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 3.3– Preparando ogrupo detesteO modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados

Componentes:

- Apply Model

- Performance (Binominal Classification)

Page 22: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Passo 3.3– Preparando ogrupo detesteO modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados

Componentes:

- Apply Model

- Performance (Binominal Classification)

Page 23: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Interpretando osresultadosENTENDENDO OPODER DENOSSA MODELAGEM

Page 24: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Interpretando assaídas- Ummodelodeárvore(treinadocomosdados),queanalisaocomportamentodochurn epodeseraplicadaaqualquerclienteindividualparaestimaraprobabilidadedechurn.

- Osdadosdeentradaoriginal

- Aestimativa(istoécross-validado)dodesempenhodomodelo.

Page 25: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Utilizando omodeloQueremos prever ocomportamento denovos clientes.Paraisso vamos utilizar odataset:telefonia_churn_rate_final.csv

Componentes:

- ReadCSV

- NominaltoDate

- SetRole

ApplyModel

Page 26: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Analisando osResultados

Page 27: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Analisando os Resultados

Page 28: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Mano…queloucoisso!

Page 29: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Agoraéminha vez!

Page 30: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Atividade

Apartir deuma basededadosdesua escolha,com,nomínimo 100.000registros,aplique aclassificação dedadosdemodo queseja possível prever ocomportamento doseu objeto de

estudo,destacando ainterpretação dosresultados.

Devem apresentar deacordo comoexporto em sala deaula.

Page 31: Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

Mineração dedadoscom

Classificação deDados

Umestudo decaso sobre oChurnRateem serviços detelefonia

PROF. JOÃO GABRIEL L IMA@JGABR IE L_ L IMA

L INKED IN .COM/ IN / JOAOGABR IE L L IMA

Mineração dedadoscomRapidMiner - Prof.João GabrielLima