View
216
Download
0
Category
Preview:
Citation preview
7/30/2019 analise de dados multivariado
1/44
1Captulo 7 Anlise Factorial (SPSS)
Anlise Factorial
7/30/2019 analise de dados multivariado
2/44
Captulo 7 Anlise Factorial (SPSS) 2
Anlise Factorial
Passos num estudo de Anlise Factorial
Exerccio de Aplicao
Anexo: Conceito de Valor Prprio (eigenvalue)
Conceito de Componentes Principais
Conceito de Anlise Factorial
Rotao de Factores
7/30/2019 analise de dados multivariado
3/44
Captulo 7 Anlise Factorial (SPSS) 3
Anlise Factorial
Com a Anlise Factorial pretende-se essencialmente analisar
a relao de interdependncia entre um conjunto de variveisquantitativas de modo a:
Reduzir o nmero de variveis.
Examinar as relaes subjacentes ou latentes entre as variveis
7/30/2019 analise de dados multivariado
4/44
Captulo 7 Anlise Factorial (SPSS) 4
Anlise Factorial- Exemplo -
Uma empresa de retalho identificou 95 caractersticas diferentes
mencionadas pelos seus clientes quando da compra dos artigos.
A empresa quer perceber como que os clientes decidem, mas sente
que no consegue avaliar as 95 caractersticas separadamente ou
desenvolver planos de aco para tantas variveis por serem
demasiado especficas.
Alternativamente, a empresa prefere saber se os clientes decidem
baseados em termos mais genricos. Por exemplo, grau de
atendimento, qualidade, preo,
Para tentar perceber melhor o problema e eventualmente reduzir asua dimenso, a empresa pode optar por fazer um inqurito sobre
aquelas 95 caractersticas e, recorrendo Anlise Factorial, tentar
compreende-las melhor e possivelmente reduzi-las a um conjunto
de factores (dimenses) relativamente pequeno.
7/30/2019 analise de dados multivariado
5/44
Captulo 7 Anlise Factorial (SPSS) 5
Anlise Factorial- PASSOS-
Geralmente o estudo da Anlise Factorial envolve as seguintespassos:
Excluir as variveis no relevantes
Verificar se a Anlise Factorial adequada
Escolher o mtodo de extraco dos factores
Seleccionar o nmero de factores
Escolher o mtodo de rotao dos factores
Interpretar os factores
7/30/2019 analise de dados multivariado
6/44
Captulo 7 Anlise Factorial (SPSS) 6
Anlise Factorial- PASSOS-
Excluir as variveis no relevantes
A estatstica de Kaiser-Meyer-Olkin (KMO) indica a proporo da
varincia das variveis que explicada pelos factores. O valor de
KMO deve ser superior a 0,5 para a varivel no ser excluda.
No SPSS, a diagonal principal da matriz anti-image correlationcontm os valores de KMO para cada varivel.
Caso existam pelo menos duas variveis com KMO
7/30/2019 analise de dados multivariado
7/44
Captulo 7 Anlise Factorial (SPSS) 7
Anlise Factorial- PASSOS-
Verificar se a Anlise Factorial adequada
Excludas as variveis no relevantes, o recurso Anlise Factorial s
vlido se:
A estatstica de KMO aplicada totalidade das variveis for superior a 0,5.
Quanto mais prximo de 1 melhor.
For rejeitada a hiptese nula do teste de esferacidade de Bartlett .
A hiptese nula deste teste diz que as variveis tm uma correlao muito fraca.
7/30/2019 analise de dados multivariado
8/44
Captulo 7 Anlise Factorial (SPSS) 8
Anlise Factorial- PASSOS-
Escolher o mtodo de extraco dos factores
Existem vrios mtodos de extraco dos factores
No nosso caso recorreremos ao mtodo das ComponentesPrincipais
um mtodo mais flexvel teoricamente
No h evidncia que os outros mtodos sejam superiores
7/30/2019 analise de dados multivariado
9/44
Captulo 7 Anlise Factorial (SPSS) 9
Anlise Factorial- PASSOS-
Seleccionar o nmero de factores
Em princpio pretende-se com o menor nmero possvel de factores
explicar o mximo de varincia
Uma boa estratgia consiste em comear por escolher os factores
cujos valores prprios (eigenvalues) sejam superiores a 1.
Se a varincia explicada for elevada ento pode-se encarar a
possibilidade de reduzir o nmero de factores.
Se a varincia explicada for baixa ento deve-se admitir a possibilidade
de aumentar o nmero de factores
7/30/2019 analise de dados multivariado
10/44
Captulo 7 Anlise Factorial (SPSS) 10
Anlise Factorial- PASSOS-
Escolher o mtodo de rotao dos factores
Existem dois tipos de mtodos: Ortogonais e Oblquos
Nos mtodos ortogonais os factores no esto correlacionadossendo mais fcil a sua interpretao. VarimaxMinimiza o nmero de variveis com pesos (loadings)
elevados em cada factor. Este mtodo facilita a interpretao dosfactores.
QuartimaxMinimiza o nmero de factores necessrios explicaode cada varivel. Facilita a interpretao das variveis.
EquamaxCombinao do Varimax e do Quartimax.
Nos mtodos oblquos os factores esto correlacionados sendonalguns casos um recurso mais realista.
7/30/2019 analise de dados multivariado
11/44
Captulo 7 Anlise Factorial (SPSS) 11
Anlise Factorial- PASSOS-
Interpretar os factores
Para a interpretao dos factores necessrio identificar para
cada factor as variveis mais correlacionadas. Essas variveis
so as que tm pesos (loadings) superiores a 0,5 ( em termos
absolutos).
As variveis identificadas iro ajudar a denominar os factores.
A interpretao dos factores mais fcil quando existe uma
estrutura simples, isto , quando uma varivel s est
fortemente correlacionada com um factor.
7/30/2019 analise de dados multivariado
12/44
Captulo 7 Anlise Factorial (SPSS) 12
Anlise Factorial- Problema -
Suponha que se pretende identificar as actividades
principais que caracterizam os pases.
Para o efeito obteve-se uma amostra aleatria constitudapelos pases constantes no ficheiro paises.sav.
Para cada pas indicada a percentagem de trabalhadores
afectos a cada actividade.
7/30/2019 analise de dados multivariado
13/44
Captulo 7 Anlise Factorial (SPSS) 13
Metodologia com o SPSS
Para se aceder Anlise Factorial em SPSS, necessrio
efectuar os seguintes passos:
1. Entrar no menu: Analyze
2. Entrar no submenu: Dimension Reduction
3. Seleccionar:Factor ...
7/30/2019 analise de dados multivariado
14/44
Captulo 7 Anlise Factorial (SPSS) 14
Metodologia com o SPSS- Introduo dos Dados -
7/30/2019 analise de dados multivariado
15/44
Captulo 7 Anlise Factorial (SPSS) 15
Metodologia com o SPSS- Quadros de input -
7/30/2019 analise de dados multivariado
16/44
Captulo 7 Anlise Factorial (SPSS) 16
Metodologia com o SPSS- Quadros de input -
1.- Para extraco dos factores escolheu-se o
mtodo das componentes principais.
2.- Os factores seleccionados tero um valor
prprio (eigenvalue) superior a 1.
7/30/2019 analise de dados multivariado
17/44
Captulo 7 Anlise Factorial (SPSS) 17
Metodologia com o SPSS- Quadros de input -
O mtodo Varimax foi o mtodo
de rotao escolhido.
7/30/2019 analise de dados multivariado
18/44
Captulo 7 Anlise Factorial (SPSS) 18
Metodologia com o SPSS- Quadros de input -
Com o mtodo Anderson-Rubin, os scores
no esto correlacionados e so
padronizados (mdia 0 e desvio-padro 1).
7/30/2019 analise de dados multivariado
19/44
Captulo 7 Anlise Factorial (SPSS) 19
Metodologia com o SPSS- Excluir as variveis no relevantes
Na diagonal principal da matriz anti.image
correlation a Construo , das variveis com
valor inferior a 0.5 a que tem menor valor
(0.085). Logo, ser a primeira a ser excluda.
7/30/2019 analise de dados multivariado
20/44
Captulo 7 Anlise Factorial (SPSS) 20
Metodologia com o SPSS- Excluir as variveis no relevantes
Tirou-se a varivel Construo
7/30/2019 analise de dados multivariado
21/44
Captulo 7 Anlise Factorial (SPSS) 21
Metodologia com o SPSS- Excluir variveis no relevantes
Na diagonal principal da matriz anti.imagecorrelation a Manufacturao , das variveis
com valor inferior a 0.5 a que tem menor valor
(0.197). Logo, ser a primeira a ser excluda.
7/30/2019 analise de dados multivariado
22/44
Captulo 7 Anlise Factorial (SPSS) 22
Metodologia com o SPSS- Excluir as variveis no relevantes
Tirou-se a varivel Manufacturao
7/30/2019 analise de dados multivariado
23/44
Captulo 7 Anlise Factorial (SPSS) 23
Metodologia com o SPSS- Excluir as variveis no relevantes
Na diagonal principal da matriz anti.imagecorrelation a Energia , das variveis com
valor inferior a 0.5 a que tem menor valor
(0.197). Logo, ser a primeira a ser excluda.
7/30/2019 analise de dados multivariado
24/44
Captulo 7 Anlise Factorial (SPSS) 24
Metodologia com o SPSS- Excluir as variveis no relevantes
Tirou-se a varivel Energia
7/30/2019 analise de dados multivariado
25/44
Captulo 7 Anlise Factorial (SPSS) 25
Metodologia com o SPSS- Verificar se a Anlise Factorial adequada
1.-No h na matriz anti-image correlation
variveis com valor inferior a 0,5.
2.- A estatstica KMO superior a 0,5 (0,617).
3.- A hiptese nula do teste de esferacidade de
Bartlett rejeitada (Sig=0).
Logo, pode-se continuar com o estudo.
7/30/2019 analise de dados multivariado
26/44
Captulo 7 Anlise Factorial (SPSS) 26
Metodologia com o SPSS- Interpretar os factores
7/30/2019 analise de dados multivariado
27/44
Captulo 7 Anlise Factorial (SPSS) 27
Metodologia com o SPSS- Interpretar os factores
7/30/2019 analise de dados multivariado
28/44
Captulo 7 Anlise Factorial (SPSS) 28
Metodologia com o SPSS- Interpretar os factores
1.- Os dois primeiros factores explicam 72,3%
da varincia total.
2.- Depois da rotao, a importncia dos
factores ficou mais equilibrada.
Exceptuando as Minas, as variveis tm a sua
varincia bem explicada pelos factores.
Ex: Agricultura 90%, Transportes 86,8%.
7/30/2019 analise de dados multivariado
29/44
Captulo 7 Anlise Factorial (SPSS) 29
Metodologia com o SPSS- Interpretar os factores
O grfico Scree Plot mostra a importncia
relativa dos factores.
No nosso exemplo, s dois factores tm
eigenvalues superiores a 1.
7/30/2019 analise de dados multivariado
30/44
Captulo 7 Anlise Factorial (SPSS) 30
Metodologia com o SPSS- Interpretar os factores
A rotao dos factores tornou a
interpretao mais clara:
1.- O factor 1 est associado positivamente
aos Servio Sociais e aos Transportes e
negativamente Agricultura.
2.- O factor 2 est associado positivamenteaos Servios e s Finanas e
negativamente s Minas.
Nota: Consideram-se significativos os
pesos superiores a 0.5 em mdulo.
1.- A soma, em linha, dos quadrados dos
pesos das componentes igual s
comunalidades.
Ex: (-.928)^2 + (-.199)^2 = .900 que a
comunalidade da Agricultura.
2.- A soma, em coluna, dos quadrados dos
pesos das componentes igual ao
eigenvalue dos factores.
Ex: (-.928)^2 + + (.379)^2 = 2,712
7/30/2019 analise de dados multivariado
31/44
Captulo 7 Anlise Factorial (SPSS) 31
Metodologia com o SPSS- Interpretar os factores
LoadingsPositivos
LoadingsNegativos
Factor 1 Serv. Sociais
Transportes
Agricultura
Factor 2 Servios
Finanas
Minas
Nota: Este quadro, feito com base nos dados a bold identificados na
Rotated Component Matrix, permite uma melhor interpretao dos factores.
7/30/2019 analise de dados multivariado
32/44
Captulo 7 Anlise Factorial (SPSS) 32
Metodologia com o SPSS- Interpretar os factores
Factor1
Factor2
7/30/2019 analise de dados multivariado
33/44
Captulo 7 Anlise Factorial (SPSS) 33
Metodologia com o SPSS- Interpretar os factores
Para cada pas (caso) o score de um dado factor o resultado da soma dos
produtos de cada coeficiente pelas variveis originais padronizadas.
Ex: Para a Blgica, o score do Factor1 ser:
((-,348) x (2,6 12,183) / 12,3088) + ((-,060 x (,23,113) / 7,6542) + = ,73901
7/30/2019 analise de dados multivariado
34/44
Captulo 7 Anlise Factorial (SPSS) 34
Metodologia com o SPSS- Interpretar os factores
Pases do Leste
7/30/2019 analise de dados multivariado
35/44
Captulo 7 Anlise Factorial (SPSS) 35
Metodologia com o SPSS- Interpretar os factores
O grfico anterior obtido da seguinte forma:
Graphs =>
Legacy Dialogs =>
Scatter/Dot =>
Simple Scatterplot
Metodologia com o SPSS
7/30/2019 analise de dados multivariado
36/44
Captulo 7 Anlise Factorial (SPSS) 36
Metodologia com o SPSS- Interpretar os factores
Das 9 variveis iniciais, 3 no so relevantes (isto , so
independentes):
Construo, Manufacturao e Energia
As restantes 6 variveis podem ser agregadas em dois factores que
explicam 73% da varincia
O primeiro factor pode ser intitulado de Servios versus Agriculturae o segundo Finanas versus Indstria Extractiva
A representao grfica dos pases baseada nos seus scores indica
um aglomerado para os pases de leste e outro para os de oeste.
Existem 3 outliers:
Albnia, Turquia e Gibraltar
Concluso:
7/30/2019 analise de dados multivariado
37/44
37
Captulo 7 Anlise Factorial (SPSS)
ANEXO
7/30/2019 analise de dados multivariado
38/44
Captulo 7 Anlise Factorial (SPSS) 38
Conceito de Valor Prprio
colunavectores1618eematrizuma
321-4
sendo,
16
18x
32
1-4
:matricialformaseguintena
dorepresentaserpode1632
184linearesequaesdesistemaoexemplo,Por
coluna.ou vectorlinhavectorse-dizcoluna,oulinhaumatemsmatrizaQuando
regras.certasaobedecendoerectoparntesisentrecolocadosordem,certa
numacolunas,elinhasemdispostosnmerosdeconjuntoumamatrizse-Chama
yx
y
x
yx
yx
7/30/2019 analise de dados multivariado
39/44
Captulo 7 Anlise Factorial (SPSS) 39
Conceito de Valor Prprio
0
.. .
.. ... .
.. .
.. .
)((1)
Ento
0..
0
0
0e
.. .
X,
.. ... .
...
.. .
e,constante)(umaescalarumqueemse-Considere
2
1
21
22221
11211
2
1
21
22221
11211
nnnnn
n
n
nnnnn
n
n
x
x
x
aaa
aaa
aaa
XAIAXX
x
x
x
aaa
aaa
aaa
A
XAX
7/30/2019 analise de dados multivariado
40/44
Captulo 7 Anlise Factorial (SPSS) 40
Conceito de Valor Prprio
nnn
i
n
aaaA
A
prpriovector
prpriosvaloresnnA
AI
.. ... .)(Trao
.matrizdaprincipal)
diagonaldaelementosdos(somatraoaoigualprpriosvaloresdossomatriooquese-Demonstra
or).(eigenvectpor
designadodeste,mltiploqualquerou(1),equaesdesistemadosoluodavectoro,dadoumPara
ues).(eingelvalchamadossoquee(2)verificamque),...,,(deesparticularvaloresathaverento,dimensodequadradamatrizumaforaSe
0(2)
se,sesetriviaisnosoluesadmite(1)homogneaslinearesequaesdesistemaoquese-Demonstra
212211
21
7/30/2019 analise de dados multivariado
41/44
Captulo 7 Anlise Factorial (SPSS) 41
Conceito de Componentes Principais
j
ppp
jj
jpjj
pjpjjj
j
pp
p
p
Zprpriovector
XVarXVarXVarZVarZVarZVar
ZVarprpriovalor
sedemonstra
aaa
pjXaXaXaZ
ZVar
XXXZVarZVarZVar
ZZZ
XXXpprincipaisscomponente
deescoeficientossoadoelementosos
quee
)(.. .)()()(.. .)()(.. .,
sendo
)(igualo
:queoriginais,variveisdasascovarincidasmatrizabasecomoTendo
nadoscorrelacionondicesosestandoe1.. .com
),.. .,2,1(.. .
sendo,)(maximizaremconsistendicesdosclculoO
restantes.osse-desprezarportantopodendondices,primeirosdossvarinciaasseroivassignificatmais
,...,,originaisvariveisasnadascorrelacioestiveremmaisQuanto).(.. .)()(so
svarinciasuasasquetaloordenamentseuoedadosdosdimenses""diferentesmedemndicesos,lacionados-correestaremnoPordados.dosvariaoadescrevamqueenadoscorrelaciono,...,,ndicesproduzam
quescombinaeencontrar,...,,variveisdepartiradeodasobjectivoO
j
212121
22
2
2
1
2211
2121
21
21
7/30/2019 analise de dados multivariado
42/44
Captulo 7 Anlise Factorial (SPSS)42
Conceito de Anlise Factorial
.. .
:serFactorialAnlisedemodeloorotaoa
os.relacionadestosegundonoenadoscorrelacioestonofactoresos
casoprimeiroNooblqua.ouortogonalserpodequese-recorremodelo,doexplanaoamelhorarPara
)(com.. .
:rotaodafactorialmodeloose-obtendofactores,os
paraexigidocomo1varinciae0mdiatenhamPrincipaissComponenteasquese-garanteFazendo
originais)variveisas(sendo.. .
:apenasretendoPrincipaissComponenteasutilizarse-podeminiciais,factoresdosobtenoPara
Normal.odistribuicom
resduoumepesosseusosunitria,varinciae0mdiacomnadoscorrelacionocomunsfactoressendo
.. .
:formaseguinteatemFactorialAnlisedegeralmodeloO
**
22
*
11
2211
2211
2211
imimiii
jijijimimiii
j
j
j
iimimiii
iijj
imimiii
eFgFgFgX
Aps
rotao
baeFaFaFaX
antes
ZF
XeZbZbZbX
m
eaF
eFaFaFaX
R t O t l d F t
7/30/2019 analise de dados multivariado
43/44
Captulo 7 Anlise Factorial (SPSS)43
Rotao Ortogonal de Factores
No Rodado
Factor II
No Rodado
Factor I
Rodado
Factor I
Rodado Factor II
-1.0 -.50 0 +.50 +1.0
-.50
-1.0
+1.0
+.50
V1
V2
V3V
4
V5
Rotao Oblqua de Factores
7/30/2019 analise de dados multivariado
44/44
44
No Rodado
Factor II
No Rodado
Factor I
RotaoOblqua:Factor I
Rotao Ortogonal:Factor II
-1.0 -.50 0 +.50 +1.0
-.50
-1.0
+1.0
+.50
V1
V2
V3
V4
V5
Rotao Ortogonal:Factor I
Rotao Oblqua:Factor II
Rotao Oblqua de Factores
Recommended