Click here to load reader

Primeira apr

  • View
    185

  • Download
    2

Embed Size (px)

Text of Primeira apr

  • Estatstica Multivariada

    Anlise Descritiva - Dados: Autenticao de Notas

    Vanessa Souza Santos

    Universidade Federal do Amazonas

    Programa de Ps Graduao em Matemtica

    2 de junho de 2014

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 1 / 40

  • Contedo

    1

    Introduo

    2

    Autenticao de Notas

    Base de Dados

    3

    Resultados

    Anlise Descritiva Multivariada

    Anlise Descritiva Univariada

    Dados Padronizados

    4

    Referncias

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 2 / 40

  • INTRODUO

    Introduo

    A analise multivariada refere-se a um conjunto de mtodos estatsticos

    que torna possvel a analise simultnea de medidas mltiplas para

    individuo, objeto ou fenmeno observado.

    O propsito da anlise multivariada medir, explicar e predizer o grau

    de relao entre as variveis estudada.

    A seguir ser realizado um estudo, atravs de uma anlise descritiva

    multivariada, sobre uma amostra de dados que contm variveis que

    ajudam na identicao de cdulas de dinheiro.

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 3 / 40

  • INTRODUO

    Representao dos dados multivariados - p variveis medidas em nindivduos.

    Variveis

    Indivduo 1 2 p1 x11

    x12

    x1p

    2 x21

    x22

    x2p.

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    n xn1 xn2 xnp

    Na forma matricial

    X =

    x11

    x12

    x1p

    x21

    x22

    x2p.

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    xn1 xn2 xnp

    ,

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 4 / 40

  • INTRODUO

    Distribuio Normal Multivariada

    A densidade normal multivariada uma generalizao da densidade

    normal univariada.

    Se X tem distribuio normal multivariada, ento sua funo

    densidade denida da seguinte forma

    fX

    (x) =1

    (2pi)p/2||1/2 exp{(x )t ||1(x )/2} ,onde < xi

  • INTRODUO

    Vetor de Mdias

    Seja n observaes de um vetor em Rp, tal que x i = (xi1, xi2, . . . , xip),i = 1, 2, . . . , n. A mdia amostral para cada varivel

    xj =1

    n

    ni=1

    xij , j = 1, 2, . . . , p

    onde o vetor de mdias da seguinte forma

    x =

    x

    1

    x

    2

    .

    .

    .

    xp

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 6 / 40

  • INTRODUO

    Matriz de Covaricia

    Seja n observaes de um vetor em Rp, tal que x i = (xi1, xi2, . . . , xip),i = 1, 2, . . . , n. Por denio, a varincia amostral dada por

    sjj =1

    n 1n

    i=1

    (xij xj)2 j = 1, 2, 3, . . . , p

    Dessa forma, a covarincia amostral dada por

    sjk =1

    n 1n

    i=1

    (xij xj)(xik xk) k 6= j

    Logo, a matriz de covarincia amostral

    s =

    s11

    s12

    s1p

    s21

    s22

    s2p.

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    sp1 sp2 spp

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 7 / 40

  • INTRODUO

    Coeciente de correlao amostral uma medida de associao linear

    entre duas variveis no depende da unidade de mensurao.

    O coeciente de correlao amostral, denido por:

    rjk =

    ni=1(xij xj)(xik xk)n

    i=1(xij xj)2n

    i=1(xik xk)2, k 6= j

    A matriz de correlao amostral dada por:

    R =

    1 r12

    r1p

    r21

    1 r2p.

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    rp1 rp2 1

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 8 / 40

  • AUTENTICAO DE NOTAS Base de Dados

    Descrio da base de dados

    Os dados foram extrados de imagens que foram retiradas amostras de

    notas, classicadas como verdadeiras e falsas;

    Para digitalizao, utilizou-se uma cmera industrial geralmente

    utilizada para inspeo de impresso;

    As imagens nais tm 400 x 400 pixels;

    Foram utilizada uma resoluo de 660 dpi na escala cinza;

    Ferramenta de transformao de leves ondulaes foram usadas para

    extrair recursos de imagens;

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 9 / 40

  • AUTENTICAO DE NOTAS Base de Dados

    Descrio da base de dados

    Informaes de atributo:

    1. variao da imagem (contnua)

    2. distoro da imagem (contnua)

    3. curtose da imagem (contnua)

    4. a entropia da imagem (contnua)

    5. classe 0 : Nota Verdadeira

    1 : Nota Falsicada

    Total de Observaes: n = 1372

    Total de Observaes para Classe 0: n0

    = 762

    Total de Observaes para Classe 1: n1

    = 610

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 10 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Vetor de Mdias Amostral

    Varivel Geral Classe 0 Classe 1

    Variacao 0.434 2.277 -1.868

    Distorcao 1.922 4.257 -0.994

    Curtose 1.398 0.797 2.148

    Entropia -1.192 -1.148 -1.247

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 11 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Matriz de Covarincia Amostral

    1

    1

    Geral

    Varivel Variao Distoro Curtose Entropia

    Variao 8.081 4.405 -4.664 1.653

    Distoro 4.406 34.446 -19.905 -6.490

    Curtose -4.664 -19.905 18.577 2.887

    Entropia 1.653 -6.490 2.887 4.414

    Classe 0

    Variao 4.078 -2.352 -2.159 1.786

    Distoro -2.352 26.407 -12.499 -7.365

    Curtose -2.159 -12.499 10.497 2.854

    Entropia 1.786 -7.365 2.854 4.516

    Classe 1

    Variao 3.539 0.749 -4.691 1.262

    Distoro 0.749 29.213 -25.245 -5.697

    Curtose -4.691 -25.245 27.687 3.008

    Entropia 1.262 -5.697 3.008 4.289

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 12 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Matriz de Correlao Amostral

    2

    2

    Geral

    Variao 1.000 0.264 -0.382 0.277

    Distoro 0.264 1.000 -0.787 -0.527

    Curtose -0.382 -0.787 1.000 0.319

    Entropia 0.277 -0.527 0.319 1.000

    Classe 0

    Variao 1.000 -0.227 -0.330 0.416

    Distoro -0.227 1.000 -0.751 -0.674

    Curtose -0.330 -0.751 1.000 0.415

    Entropia 0.416 -0.674 0.415 1.000

    Classe 1

    Variao 1.000 0.074 -0.474 0.324

    Distoro 0.074 1.000 -0.888 -0.509

    Curtose -0.474 -0.888 1.000 0.276

    Entropia 0.324 -0.509 0.276 1.000

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 13 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Matriz de Disperso por classe

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 14 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Matriz de Disperso por classe

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 15 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Matriz de Disperso por classe

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 16 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Matriz de Disperso por classe

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 17 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Grco da Matriz de Correlao - Geral

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 18 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Grco da Matriz de Correlao - Classe 0

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 19 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Grco da Matriz de Correlao - Classe 1

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 20 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Grcos da Densidade Bidimensional

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 21 / 40

  • RESULTADOS ANLISE DESCRITIVA MULTIVARIADA

    Vericando a Normalidade Conjunta

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 22 / 40

  • RESULTADOS ANLISE DESCRITIVA UNIVARIADA

    Estatsticas - Varivel: Variao da Imagem

    Estatsticas Geral Classe 0 Classe 1

    Mnimo -7.042 -4.286 -7.042

    Mximo 6.825 6.825 2.392

    1

    o

    Quartil -1.773 0.883 -3.061

    3

    o

    Quartil 2.821 3.884 -0.542

    Mdia 0.434 2.277 -1.868

    Mediana 0.496 2.553 -1.806

    Lim Inf 0.283 2.133 -2.018

    Lim Sup 0.584 2.420 -1.719

    Variancia 8.081 4.078 3.539

    Desvio 2.843 2.019 1.881

    Assimetria -0.149 -0.491 -0.300

    Curtose -0.756 -0.368 -0.193

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 23 / 40

  • RESULTADOS ANLISE DESCRITIVA UNIVARIADA

    Vericando Normalidade - Varivel: Variao da Imagem

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 24 / 40

  • RESULTADOS ANLISE DESCRITIVA UNIVARIADA

    Grco de Disperso e Box Plot - Variao da Imagem

    Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 25 / 40

  • RESULTADOS ANLISE DESCRITIVA UNIVARIADA

    Estatsticas - Distoro da Imagem

    Estatsticas Geral Classe 0 Classe 1

    Mnimo -13.773 -6.932 -13.773

    Mximo 12.952 12.952 9.601

    1

    o

    Quartil -1.708 0.450 -5.810

    3

    o

    Quartil 6.815 8.692 3.189

    Mdia 1.922 4.257 -0.994

    Mediana 2.320 5.669 0.