Click here to load reader
View
185
Download
2
Embed Size (px)
Estatstica Multivariada
Anlise Descritiva - Dados: Autenticao de Notas
Vanessa Souza Santos
Universidade Federal do Amazonas
Programa de Ps Graduao em Matemtica
2 de junho de 2014
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 1 / 40
Contedo
1
Introduo
2
Autenticao de Notas
Base de Dados
3
Resultados
Anlise Descritiva Multivariada
Anlise Descritiva Univariada
Dados Padronizados
4
Referncias
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 2 / 40
INTRODUO
Introduo
A analise multivariada refere-se a um conjunto de mtodos estatsticos
que torna possvel a analise simultnea de medidas mltiplas para
individuo, objeto ou fenmeno observado.
O propsito da anlise multivariada medir, explicar e predizer o grau
de relao entre as variveis estudada.
A seguir ser realizado um estudo, atravs de uma anlise descritiva
multivariada, sobre uma amostra de dados que contm variveis que
ajudam na identicao de cdulas de dinheiro.
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 3 / 40
INTRODUO
Representao dos dados multivariados - p variveis medidas em nindivduos.
Variveis
Indivduo 1 2 p1 x11
x12
x1p
2 x21
x22
x2p.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
n xn1 xn2 xnp
Na forma matricial
X =
x11
x12
x1p
x21
x22
x2p.
.
.
.
.
.
.
.
.
.
.
.
xn1 xn2 xnp
,
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 4 / 40
INTRODUO
Distribuio Normal Multivariada
A densidade normal multivariada uma generalizao da densidade
normal univariada.
Se X tem distribuio normal multivariada, ento sua funo
densidade denida da seguinte forma
fX
(x) =1
(2pi)p/2||1/2 exp{(x )t ||1(x )/2} ,onde < xi
INTRODUO
Vetor de Mdias
Seja n observaes de um vetor em Rp, tal que x i = (xi1, xi2, . . . , xip),i = 1, 2, . . . , n. A mdia amostral para cada varivel
xj =1
n
ni=1
xij , j = 1, 2, . . . , p
onde o vetor de mdias da seguinte forma
x =
x
1
x
2
.
.
.
xp
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 6 / 40
INTRODUO
Matriz de Covaricia
Seja n observaes de um vetor em Rp, tal que x i = (xi1, xi2, . . . , xip),i = 1, 2, . . . , n. Por denio, a varincia amostral dada por
sjj =1
n 1n
i=1
(xij xj)2 j = 1, 2, 3, . . . , p
Dessa forma, a covarincia amostral dada por
sjk =1
n 1n
i=1
(xij xj)(xik xk) k 6= j
Logo, a matriz de covarincia amostral
s =
s11
s12
s1p
s21
s22
s2p.
.
.
.
.
.
.
.
.
.
.
.
sp1 sp2 spp
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 7 / 40
INTRODUO
Coeciente de correlao amostral uma medida de associao linear
entre duas variveis no depende da unidade de mensurao.
O coeciente de correlao amostral, denido por:
rjk =
ni=1(xij xj)(xik xk)n
i=1(xij xj)2n
i=1(xik xk)2, k 6= j
A matriz de correlao amostral dada por:
R =
1 r12
r1p
r21
1 r2p.
.
.
.
.
.
.
.
.
.
.
.
rp1 rp2 1
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 8 / 40
AUTENTICAO DE NOTAS Base de Dados
Descrio da base de dados
Os dados foram extrados de imagens que foram retiradas amostras de
notas, classicadas como verdadeiras e falsas;
Para digitalizao, utilizou-se uma cmera industrial geralmente
utilizada para inspeo de impresso;
As imagens nais tm 400 x 400 pixels;
Foram utilizada uma resoluo de 660 dpi na escala cinza;
Ferramenta de transformao de leves ondulaes foram usadas para
extrair recursos de imagens;
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 9 / 40
AUTENTICAO DE NOTAS Base de Dados
Descrio da base de dados
Informaes de atributo:
1. variao da imagem (contnua)
2. distoro da imagem (contnua)
3. curtose da imagem (contnua)
4. a entropia da imagem (contnua)
5. classe 0 : Nota Verdadeira
1 : Nota Falsicada
Total de Observaes: n = 1372
Total de Observaes para Classe 0: n0
= 762
Total de Observaes para Classe 1: n1
= 610
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 10 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Vetor de Mdias Amostral
Varivel Geral Classe 0 Classe 1
Variacao 0.434 2.277 -1.868
Distorcao 1.922 4.257 -0.994
Curtose 1.398 0.797 2.148
Entropia -1.192 -1.148 -1.247
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 11 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Matriz de Covarincia Amostral
1
1
Geral
Varivel Variao Distoro Curtose Entropia
Variao 8.081 4.405 -4.664 1.653
Distoro 4.406 34.446 -19.905 -6.490
Curtose -4.664 -19.905 18.577 2.887
Entropia 1.653 -6.490 2.887 4.414
Classe 0
Variao 4.078 -2.352 -2.159 1.786
Distoro -2.352 26.407 -12.499 -7.365
Curtose -2.159 -12.499 10.497 2.854
Entropia 1.786 -7.365 2.854 4.516
Classe 1
Variao 3.539 0.749 -4.691 1.262
Distoro 0.749 29.213 -25.245 -5.697
Curtose -4.691 -25.245 27.687 3.008
Entropia 1.262 -5.697 3.008 4.289
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 12 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Matriz de Correlao Amostral
2
2
Geral
Variao 1.000 0.264 -0.382 0.277
Distoro 0.264 1.000 -0.787 -0.527
Curtose -0.382 -0.787 1.000 0.319
Entropia 0.277 -0.527 0.319 1.000
Classe 0
Variao 1.000 -0.227 -0.330 0.416
Distoro -0.227 1.000 -0.751 -0.674
Curtose -0.330 -0.751 1.000 0.415
Entropia 0.416 -0.674 0.415 1.000
Classe 1
Variao 1.000 0.074 -0.474 0.324
Distoro 0.074 1.000 -0.888 -0.509
Curtose -0.474 -0.888 1.000 0.276
Entropia 0.324 -0.509 0.276 1.000
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 13 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Matriz de Disperso por classe
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 14 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Matriz de Disperso por classe
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 15 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Matriz de Disperso por classe
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 16 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Matriz de Disperso por classe
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 17 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Grco da Matriz de Correlao - Geral
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 18 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Grco da Matriz de Correlao - Classe 0
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 19 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Grco da Matriz de Correlao - Classe 1
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 20 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Grcos da Densidade Bidimensional
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 21 / 40
RESULTADOS ANLISE DESCRITIVA MULTIVARIADA
Vericando a Normalidade Conjunta
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 22 / 40
RESULTADOS ANLISE DESCRITIVA UNIVARIADA
Estatsticas - Varivel: Variao da Imagem
Estatsticas Geral Classe 0 Classe 1
Mnimo -7.042 -4.286 -7.042
Mximo 6.825 6.825 2.392
1
o
Quartil -1.773 0.883 -3.061
3
o
Quartil 2.821 3.884 -0.542
Mdia 0.434 2.277 -1.868
Mediana 0.496 2.553 -1.806
Lim Inf 0.283 2.133 -2.018
Lim Sup 0.584 2.420 -1.719
Variancia 8.081 4.078 3.539
Desvio 2.843 2.019 1.881
Assimetria -0.149 -0.491 -0.300
Curtose -0.756 -0.368 -0.193
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 23 / 40
RESULTADOS ANLISE DESCRITIVA UNIVARIADA
Vericando Normalidade - Varivel: Variao da Imagem
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 24 / 40
RESULTADOS ANLISE DESCRITIVA UNIVARIADA
Grco de Disperso e Box Plot - Variao da Imagem
Vanessa Souza Santos (UFAM) Estatstica Multivariada 2 de junho de 2014 25 / 40
RESULTADOS ANLISE DESCRITIVA UNIVARIADA
Estatsticas - Distoro da Imagem
Estatsticas Geral Classe 0 Classe 1
Mnimo -13.773 -6.932 -13.773
Mximo 12.952 12.952 9.601
1
o
Quartil -1.708 0.450 -5.810
3
o
Quartil 6.815 8.692 3.189
Mdia 1.922 4.257 -0.994
Mediana 2.320 5.669 0.