MB 756 PESQUISA OPERACIONAL APLICADA À rodrigo/Disciplinas/MB756/S03.pdf · Abordagens em modelos

  • View
    212

  • Download
    0

Embed Size (px)

Text of MB 756 PESQUISA OPERACIONAL APLICADA À rodrigo/Disciplinas/MB756/S03.pdf · Abordagens em modelos

  • MB 756

    PESQUISA OPERACIONAL

    APLICADA PRODUO

    Professor: Rodrigo A. Scarpel

    rodrigo@ita.br

    www.mec.ita.br/~rodrigo

    mailto:rodrigo@ita.brhttp://www.mec.ita.br/~rodrigo

  • Programa do curso:

    Semana Contedo

    1

    Princpios de POAP :

    1. O processo decisrio no mbito da produo e da pesquisa operacional;

    2. Abordagens de pesquisa operacional para suportar o processo decisrio:

    2.1. Criao de Modelos de Previso

    2.2. Extrao de Conhecimento de Bases de Dados

    2.3. Otimizao

    2.4. Simulao

    2

    Mtodos de Previso em POAP :

    1. Propsitos da Previso

    2. Processo de Criao de Modelos de previso

    2.1. Previso por sries temporais

    2.2. Previso por modelos causais

    2.3. Previso para variveis categricas

    3

    Extrao de Conhecimento de Bases de Dados em POAP :

    1. Aplicaes do Processo ECBD em problemas de Produo

    2. O Processo de Extrao de Conhecimento de Bases de Dados (ECBD):

    2.1. Reduo de dimenso e visualizao

    2.2. Segmentao

    2.3. Classificao

    4

    Otimizao em POAP :

    1. Aplicao de mtodos de Otimizao em problemas da Cadeia de Suprimentos:

    1.1. Planejamento logstico: transporte e distribuio, localizao e cobertura, caminho mais curto.

    1.2. Planejamento da Produo: planejamento agregado, otimizao em mltiplos perodos, dimensionamento de

    estoques.

    1.3. Avaliao de eficincia: anlise de envoltria de dados

    1.4. Gerenciamento de projetos: seleo de projetos, problema do caminho crtico.

    5 Prova: 04/12/14

  • Aplicao do processo de ECBD em Produo:

  • Abordagens em modelos para ECBD:

    1. Processo de ECBD:

    2. CRISP-DM (Cross Industry Standard Process for Data Mining): 3. SEMMA:

  • Abordagem em modelos para extrao de

    conhecimento de bases de dados:

    Observaes:

    um processo sequncial com possibilidade de retorno

    As etapas de seleo, pr-processamento e transformao dos

    dados consomem cerca de 80% do tempo.

  • Objetivos da seleo:

    Criar um sub-conjunto dos dados em funo dos objetivos da

    anlise

    Colocar dados no formato analtico:

    Observaes (linhas): uma linha por instncia

    Atributos ou variveis (colunas)

    Operaes necessrias:

    Transposio,

    Sumarizao,

    Etapa 1: Seleo dos dados

  • Objetivos do pr-processamento:

    Colocar dados no formato analtico: observaes (linhas) e

    atributos (colunas)

    Verificar a qualidade dos dados

    Fatores que degradam a qualidade dos dados:

    Dados com erro: respostas falsas, erros na tabulao das

    respostas,

    Outliers: observaes que aparentemente so inconsistentes

    quando comparadas s outras observaes.

    Dados faltantes (missing values)

    Etapa 2: Pr-processamento dos dados

  • Etapa 2: Pr-processamento dos dados

    DETECO DE OUTLIERS:

    Origem: dados com erro ou observao pertencente a outra

    populao.

    Critrio: O critrio para a definio de outliers varia muito conforme os

    autores. De maneira geral, considera-se outlier uma medida

    acima ou abaixo de 2,5 desvios-padro da mdia.

    Forma de deteco: estatsticas de sumarizao, histogramas,

    boxplot.

    Tratamento: eliminao dos outliers

    ou transformao dos dados

  • Etapa 2: Pr-processamento dos dados

    DADOS FALTANTES (MISSING VALUES)

    Missing values zero (no ocorreu) ou falta de informao

    (no sei se ocorreu)?

    Deve-se tomar cuidado no tratamento dos missing values.

    Tratar? Eliminar a varivel? Eliminar a observao?

    ?

    ?

    ? ?

    ? ?

    ?

    ?

    observaes

    variveis Apenas 8 dos 144 valores so

    missing (5,55%), porm apenas

    6 observaes seriam utilizadas.

  • Etapa 2: Pr-processamento dos dados

    DADOS FALTANTES (MISSING VALUES)

    Tratamento: depende de quantos dados esto faltando (percentual de

    missing values) e de sua distribuio.

    Alternativas:

    Omitir observaes: aceitvel quando os dados faltantes esto

    concentrados em algumas observaes.

    Omitir variveis: aceitvel quando os dados faltantes esto

    concentrado em algumas variveis.

    Atribuir valores:

    Substituir pela mdia

    Mtodo analtico.

  • Objetivos da transformao dos dados:

    Criao de ndices e taxas: so amplamente utilizados em

    gerenciamento.

    Padronizao e normalizao dos dados: para eliminar efeitos de

    escala ou adequar os dados s hipteses do modelo.

    Eliminar outliers:

    Log (ou Ln), Raiz,

    Categorizao

    Etapa 3: Transformao dos dados

  • Etapa 4: Minerao dos dados

    Objetivos da minerao dos dados:

    1. Anlise de associao (link analysis)

    2. Anlise de sequncia

    3. Sumarizao (por Visualizao)

    4. Modelagem de dependncia

    5. Formao de agrupamentos (clustering)

    6. Classificao

    7. Previso: Criar um mapeamento dos dados a uma varivel

    contnua

  • Minerao dos dados: Sumarizao

    Objetivo: Descrever um conjunto de dados considerando

    Conjunto de variveis existentes e suas relaes

    Instncias ou observaes

    Alternativa:

    Usar tcnicas multivariadas de visualizao:

    Anlise de correspondncia

    Wordclouds

    Anlise de Homogeneidade

  • Minerao dos dados: Sumarizao

    Uso de tcnicas multivariadas de visualizao:

  • Minerao dos dados: Sumarizao

    Exemplo 1: Anlise de Correspondncia (cdigo.1)

  • Minerao dos dados: Sumarizao

    Anlise de correspondncia:

    Baseada na decomposio em valores singulares (SVD) da matriz

    de dados. Exemplo:

    Posicionamento de cinco airlines

    AA UA US Con SW

    Convenience 5 8 3 3 3

    Punctuality 6 5 5 4 8

    Overall_service 8 7 5 4 6

    Comfort 6 6 4 4 3

  • Minerao dos dados: Sumarizao

    Exemplo 2: Wordcloud (cdigo.2)

  • MD: Modelagem de Dependncia

    Objetivo: Descrever as relaes de um conjunto de variveis

    Alternativas:

    Usar tcnicas multivariadas de visualizao:

    Anlise de correspondncia mltipla (MJCA)

    BIPLOT

    Estabelecer uma funo que relacione as variveis:

    Anlise Fatorial Exploratria

  • MD: Modelagem de Dependncia

    Exemplo 1: Pesquisa de mercado Cervejas (cdigo.3)

    162 respondentes

    Atributos:

    Marca: Brahma, Antrctica

    Faixa de Renda: AB, C, DE

    Sexo: Masculino, Feminino

    Faixa de idade: 18-29, 30-39, 40-49, 50+

    Tipo: Regular (Pilsen), Chopp, Outras

  • Minerao dos dados: Sumarizao

    Anlise de componentes principais / Biplot:

    X1

    X2

    X1

    X2

    21,211,11 XwXwCP

    211,21,1

    2

    2

    2

    1,2

    2

    1

    2

    1,1

    1,2

    1,1

    2212

    2111

    1,21,1

    2

    wwww

    w

    wwwVMax

    1

    ..

    2

    1,2

    2

    1,1 ww

    AS

    Formulao

  • Minerao dos dados: Sumarizao

    Princpios de Anlise Fatorial:

    Objetivo: mensurar fatores no observveis (tambm chamados de

    constructos)

    Experimento de Spearman (1904):

    Desta forma, esperavasse que o desempenho dos alunos, em cada

    disciplina, dependesse de um fator comum e de um fator especfico.

    MATEMTICA

    (M)

    FSICA

    (F)

    QUMICA

    (Q)

    INGLS

    (I)

    HISTRIA

    (H)

    L. PORTUGUESA

    (L)

    FATOR

    ()

    eM eF eQ eI eH eL

    M F Q I

    H L

  • Minerao dos dados: Sumarizao

    Princpios de Anlise Fatorial:

    Formulao do problema da anlise fatorial:

    No exemplo:

    jixxAS

    MinouMaxOF

    jiji

    p

    i

    p

    i

    ii

    ,,..

    1..

    1 1

    22

    MATEMTICA

    (M)

    FSICA

    (F)

    QUMICA

    (Q)

    INGLS

    (I)

    HISTRIA

    (H)

    L. PORTUGUESA

    (L)

    FATOR

    ()

    eM eF eQ eI eH eL

    MF Q I

    HL

    MATEMTICA

    (M)

    FSICA

    (F)

    QUMICA

    (Q)

    INGLS

    (I)

    HISTRIA

    (H)

    L. PORTUGUESA

    (L)

    FATOR

    ()

    FATOR

    ()

    eMeM eFeF eQeQ eIeI eHeH eLeL

    MF Q I

    HL

    =0,8

    =0,7 0,9= =0,6 =0,5

    =0,65

    0,36 0,51 0,19 0,64 0,75 0,58

    Varincia explicada (comum) = 2,973 (49,5%)

  • MD: Modelagem de Dependncia

    Exemplo 3: Anlise Financeira de empresas (cdigo.4)

    172 Empresas de capital aberto (com aes na Bovespa)

    ndices financeiros:

    Margem de lucro lquido (MLL)

    Retorno sobre o ativo total (ROA)

    Giro do ativo total (GA)

    Endividamento Geral (EG)

    Endividamento Financeiro (EG)

    Liquidez corrente (LC)

  • MD: Formao de Agrupamentos

    Objetivo: Agrupar observaes e/ou atributos, de acordo com

    algum critrio de similaridade.

    Alternativas:

    Utilizao de mtodos hierrquicos:

    Mtodo do vizinho mais prximo

    Mtodo do centride

    Mtodo de Ward

    Utilizao de mtodos no-hierrquicos: K-mdias

    Utilizao de mtodos baseados em inteligncia artificial: SOM

  • Clientes desenvolvem preferncias por marcas que atendem melhor

    suas necessidades e entregam mais valor

    Segmentation

    Identificar segmento