Mineração de Dados

  • View
    184

  • Download
    0

Embed Size (px)

Text of Mineração de Dados

  • Data Mining Insights sobre dados e

    descoberta de conhecimento

    Joo G. Gutheil

    Outubro/2016

  • Joo G. Gutheil jgutheil@gmail.com Cincia da Computao - Feevale

    Especializao em Gesto do Conhecimento e Int. Estratgica - UCS

    Analista de TI AGCO

    Analista de TI Grupo RBS

    Vice-Coordenador do GUBI (Grupo de Usurios de BI) Sucesu RS

    reas de interesse

    Ferramentas de Minerao de Dados

    Ferramentas e aplicaes de BI

    Tecnologias NoSQL e Analytics

    Yosemite

    Apresentao

    mailto:jgutheil@gmail.com

  • Qual a motivao?

    Onde DM se posiciona? Afinal, BI ou no?

    Onde posso aplicar DM?

    Quais aplicativos ou ferramentas?

  • Compras

    Vendas

    Financeiro

    Produo

    Contbil

    RH

    Custos

    Fiscal

    Logistica Engenharia

    Planejamento

    Marketing

    Integrao entre reas de negcio Industria hipottica

    CRM

    Dados, informaes

    ?

    ?

    Dados, informaes

  • Compras

    Vendas

    Financeiro

    Produo

    Contbil

    RH

    Custos

    Fiscal

    Logistica Engenharia

    Planejamento

    Marketing

    Relaes, padres, tendncias, excees...

    CRM

    ?

    ?

    Dados, informaes

    Dados, informaes

  • Data Mining

  • O que envolve? Estatstica (muita) Bancos de dados Inteligncia artificial

    O que no ? OLAP ou anlise multidimensional (Cubos) Processamento dedutivo de consultas (Achmetro)

    O que ? Conjunto de tcnicas para descoberta de padres,

    tendncias e relaes nos BD para apoio a tomada de deciso Um componente da plataforma de BI

  • O que aconteceria se?

    O que ir acontecer?

    Por que aconteceu?

    BI

    Analytics

    Relatrios e dashboards

    Minerao de Dados O que aconteceu?

    Informao

    Anlise descritiva

    Anlise e diagnsticos

    Anlise preditiva

    Anlise prescritiva

    Simulao e IA

    Minerao de Dados

    Impacto sobre o business

    Melhores decises

    Com

    ple

    xid

    ade

  • Aprendizagem supervisionada o Estimar o preo de uma casa

    Atributos: Tamanho, posio solar, material Classe: Preo (Regresso)

    Aprendizagem No-supervisionada o Dado um conjunto de itens comprados num determinado Perodo, identificar os padres de compra o Dado histrico de pagamento de clientes, identificar o padro de comportamento (perfil de bons ou maus pagadores)

  • Mtodo Definio Exemplo

    Associao Avaliar valores que ocorrem juntos em transaes ou eventos

    Case fralda & cerveja

    Correlao Similaridade entre duas variveis numricas

    Numero de promoes X aumento de clientes

    Regresso e modelos de predio

    Correlao entre duas ou mais variveis

    Previso do tempo

    Deteco de desvios (Outliers) Anlise do que est fora dos padres

    Indcios de fraude

    Sries temporais Repeties de sries numricas ao longo do tempo

    Comportamento da bolsa de valores

    Classificao (Ex: Arvores de deciso, redes Bayesianas)

    Categorizar elementos ; predio

    Churn/cancelamento de assinantes

    Agrupamento (Clustering) Identificar classes a partir de um grupo de elementos

    Definir o perfil de clientes

  • Etapas do processo de DM CRISP-DM CRoss Industry Standard Process for Data Mining

    https://pt.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining

    Otimizao de estoque

    Pedidos/vendas, items, Geo

    Ex: Categorizar perodos

    Modelo de predio

    Pea: Quando, onde?

  • rea Exemplo de Aplicao

    Comrcio Qual o conjunto de produtos mais vendidos em determinado dia da semana e qual o perfil do cliente?

    Qual o perfil dos meus clientes mais rentveis?

    Sistemas de recomendao

    Planos de Sade Avaliar perfil da carteira de beneficirios Deteco de fraudes

    CRM Quais eventos levam um prospect a fechar ou cancelar um negcio?

    Financeiro Anlise de crdito Previso de fluxo de caixa Deteco de fraudes

    Database Marketing Avaliar a qualidade de incorporaes Quais produtos oferecer para um

    determinado perfil Aes antecipativas para reteno de

    clientes

  • rea Exemplo de Aplicao

    RH Perfil de funcionrio X produtividade Anlise de absentesmo

    Transportes Anlise e otimizao de rotas Otimizao de cargas

    Sade Definio e efetividade de tratamentos Probabilidade de diagnsticos (Ex.

    Diabetes, cncer)

    Segurana da informao Deteco de intrusos Deteco de fraudes

    Text Mining Identificar conceitos (contexto, tema ou assunto) em um texto

  • R Orange DM SSAS (MS) SPSS (IBM) Weka

    Apache Mahout Scikit (Python) Oracle DM (Option) SAS

    Knime Rapid Miner

  • Data Mining automtico? No. um processo interativo e requer superviso

    Investimentos em DM so recuperados de forma rpida?

    Depende de diversos fatores. Qualidade e volume de informaes, por exemplo

    Data Mining pode identificar problemas no negcio?

    Pode encontrar padres, fenmenos e co-relaes. Pode levar a dedues que indicam determinadas causa

  • Perguntas