Upload
joao-gabriel-lima
View
290
Download
0
Embed Size (px)
Citation preview
Mineração dedadoscom
Classificação deDados
Umestudo decaso sobre oChurnRateem serviços detelefonia
PROF. JOÃO GABRIEL L IMA@JGABR IE L_ L IMA
L INKED IN .COM/ IN / JOAOGABR IE L L IMA
Mineração dedadoscomRapidMiner - Prof.João GabrielLima
Prof.João GabrielLima
• Pesquisador emMineração dedadoseInteligência Computacional;
• Engenheiro daComputação,especialista em SoftwareeHardware;
• Doutorando em Computação Aplicada;
Mineração dedadoscomRapidMiner - Prof.João GabrielLima
Processo deExtração doconhecimento
Mineração dedadoscomRapidMiner - Prof.João GabrielLima
Conhecendo nossa basededadosENTENDER ODOMÍNIO EOCONHECIMENTO QUEPODEMOSEXTRAIR
Mineração dedadoscomRapidMiner - Prof.João GabrielLima
Serviço detelefoniaNesta basededados,temos os dadosdosclientes deuma empresa detelefonia.
Vamos focar noChurnRate
Oqueé oChurnRate?
◦ Trata-sedeuma métrica queavalia aquantidade declientes queabandonam/cancelam um
determinado serviço.
◦ Parauma empresa expandir é imprescindível queoseu GrowthRate(índice decrescimento)supere o
seu ChurnRate.
◦ Objetivo é criar estratégias paralidar comos clientes demodo acompreender ediminuir oChurnRate.
Mineração dedadoscomRapidMiner - Prof.João GabrielLima
Serviço detelefoniaNesta basetemos asseguintes informações:
- TECNOLOGIA:4G,Telefone Móvel,Telefone Fixo,Fibra
- IDADE
- DATADEADESÃO
- LIGACOES_SUPORTE_ULTIMO_ANO:quantidade totaldeligações feitas paraaosuporte
- MEDIA_FATURA_MENSAL
- TAXA_DE_CHURN:probabilidade decancelamento
Mineração dedadoscomRapidMiner - Prof.João GabrielLima
Qual oobjetivo chave?EM MINERAÇÃO DEDADOS,TRAÇAR OOBJETIVO É OPRIMEIROPASSO.É FUNDAMENTAL!
Mineração dedadoscomRapidMiner - Prof.João GabrielLima
Classificar eprever oChurnRatedeacordo comoperfil ecomportamentodosclientes.
Mineração dedadoscomRapidMiner - Prof.João GabrielLima
Ótimo!Vamos aos negócios!
Conhecendo nossaferramenta!
AWESOMEDATAMINETOOL
Passo 1– Abrindo nossos dadosna ferramentaAbra oarquivo telefonia_churn_rate.csv comocomponente LoadData.
Passo 2– ETLepreparação dedadosPrecisamos marcar acoluna queserá oalvo
dasanálises (TAXA_DE_CANCELAMENTO)e
convetê-ladenumérica parabinária.
Componentes:
- SetRule
- NumericaltoBinomial
Passo 3– Preparando avalidação domodeloValidar seu modelo é achave dosucesso.Ocross-validationsepara oconjunto dedadosem
consjunto detreinamento edeteste.
Componente:
*X-Validation
Passo 3.1– Preparando ogrupo detreinamentoA maioria dos clientes querem ficar com umserviço ao invés de abandoná-lo (rsrsr)
Para isso precisamos equilibrar nossoconjunto de treinamento para focar sobre ocaso que estamos interessados. Como seestivéssemos colocando uma lupa sobre ataxa de cancelamento.
Componentes:
- Sample
Passo 3.1– Preparando ogrupo detreinamento
Passo 3.2– Preparando ogrupo detreinamentoEm vez de apenas fazer a configuração manual, vamos otimizá-lo.
Utilizando o modelo Wisdom of the Crowd para uma árvore de decisão nós vamos otimizar aprofundidade máxima no intervalo [20-29]
Componente:
- Optimize Parameters (Grid)
Passo 4– Preparando nosso classificadorAbrindo o ”Otimizador de Parâmetros”, o modelo será treinado e avaliado.Leitura recomendada:
Wisdom of the Crowd
Componentes:
- Decision Tree; Apply Model; Performance
Passo 3.3– Configurando ootimizador
Passo 3.2– Preparando ogrupo detesteO modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados
Componentes:
- Apply Model
- Performance (Binominal Classification)
Passo 3.3– Preparando ogrupo detesteO modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados
Componentes:
- Apply Model
- Performance (Binominal Classification)
Passo 3.3– Preparando ogrupo detesteO modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados
Componentes:
- Apply Model
- Performance (Binominal Classification)
Interpretando osresultadosENTENDENDO OPODER DENOSSA MODELAGEM
Interpretando assaídas- Ummodelodeárvore(treinadocomosdados),queanalisaocomportamentodochurn epodeseraplicadaaqualquerclienteindividualparaestimaraprobabilidadedechurn.
- Osdadosdeentradaoriginal
- Aestimativa(istoécross-validado)dodesempenhodomodelo.
Utilizando omodeloQueremos prever ocomportamento denovos clientes.Paraisso vamos utilizar odataset:telefonia_churn_rate_final.csv
Componentes:
- ReadCSV
- NominaltoDate
- SetRole
ApplyModel
Analisando osResultados
Analisando os Resultados
Mano…queloucoisso!
Agoraéminha vez!
Atividade
Apartir deuma basededadosdesua escolha,com,nomínimo 100.000registros,aplique aclassificação dedadosdemodo queseja possível prever ocomportamento doseu objeto de
estudo,destacando ainterpretação dosresultados.
Devem apresentar deacordo comoexporto em sala deaula.
Mineração dedadoscom
Classificação deDados
Umestudo decaso sobre oChurnRateem serviços detelefonia
PROF. JOÃO GABRIEL L IMA@JGABR IE L_ L IMA
L INKED IN .COM/ IN / JOAOGABR IE L L IMA
Mineração dedadoscomRapidMiner - Prof.João GabrielLima