analise de dados multivariado

Embed Size (px)

Citation preview

  • 7/30/2019 analise de dados multivariado

    1/44

    1Captulo 7 Anlise Factorial (SPSS)

    Anlise Factorial

  • 7/30/2019 analise de dados multivariado

    2/44

    Captulo 7 Anlise Factorial (SPSS) 2

    Anlise Factorial

    Passos num estudo de Anlise Factorial

    Exerccio de Aplicao

    Anexo: Conceito de Valor Prprio (eigenvalue)

    Conceito de Componentes Principais

    Conceito de Anlise Factorial

    Rotao de Factores

  • 7/30/2019 analise de dados multivariado

    3/44

    Captulo 7 Anlise Factorial (SPSS) 3

    Anlise Factorial

    Com a Anlise Factorial pretende-se essencialmente analisar

    a relao de interdependncia entre um conjunto de variveisquantitativas de modo a:

    Reduzir o nmero de variveis.

    Examinar as relaes subjacentes ou latentes entre as variveis

  • 7/30/2019 analise de dados multivariado

    4/44

    Captulo 7 Anlise Factorial (SPSS) 4

    Anlise Factorial- Exemplo -

    Uma empresa de retalho identificou 95 caractersticas diferentes

    mencionadas pelos seus clientes quando da compra dos artigos.

    A empresa quer perceber como que os clientes decidem, mas sente

    que no consegue avaliar as 95 caractersticas separadamente ou

    desenvolver planos de aco para tantas variveis por serem

    demasiado especficas.

    Alternativamente, a empresa prefere saber se os clientes decidem

    baseados em termos mais genricos. Por exemplo, grau de

    atendimento, qualidade, preo,

    Para tentar perceber melhor o problema e eventualmente reduzir asua dimenso, a empresa pode optar por fazer um inqurito sobre

    aquelas 95 caractersticas e, recorrendo Anlise Factorial, tentar

    compreende-las melhor e possivelmente reduzi-las a um conjunto

    de factores (dimenses) relativamente pequeno.

  • 7/30/2019 analise de dados multivariado

    5/44

    Captulo 7 Anlise Factorial (SPSS) 5

    Anlise Factorial- PASSOS-

    Geralmente o estudo da Anlise Factorial envolve as seguintespassos:

    Excluir as variveis no relevantes

    Verificar se a Anlise Factorial adequada

    Escolher o mtodo de extraco dos factores

    Seleccionar o nmero de factores

    Escolher o mtodo de rotao dos factores

    Interpretar os factores

  • 7/30/2019 analise de dados multivariado

    6/44

    Captulo 7 Anlise Factorial (SPSS) 6

    Anlise Factorial- PASSOS-

    Excluir as variveis no relevantes

    A estatstica de Kaiser-Meyer-Olkin (KMO) indica a proporo da

    varincia das variveis que explicada pelos factores. O valor de

    KMO deve ser superior a 0,5 para a varivel no ser excluda.

    No SPSS, a diagonal principal da matriz anti-image correlationcontm os valores de KMO para cada varivel.

    Caso existam pelo menos duas variveis com KMO

  • 7/30/2019 analise de dados multivariado

    7/44

    Captulo 7 Anlise Factorial (SPSS) 7

    Anlise Factorial- PASSOS-

    Verificar se a Anlise Factorial adequada

    Excludas as variveis no relevantes, o recurso Anlise Factorial s

    vlido se:

    A estatstica de KMO aplicada totalidade das variveis for superior a 0,5.

    Quanto mais prximo de 1 melhor.

    For rejeitada a hiptese nula do teste de esferacidade de Bartlett .

    A hiptese nula deste teste diz que as variveis tm uma correlao muito fraca.

  • 7/30/2019 analise de dados multivariado

    8/44

    Captulo 7 Anlise Factorial (SPSS) 8

    Anlise Factorial- PASSOS-

    Escolher o mtodo de extraco dos factores

    Existem vrios mtodos de extraco dos factores

    No nosso caso recorreremos ao mtodo das ComponentesPrincipais

    um mtodo mais flexvel teoricamente

    No h evidncia que os outros mtodos sejam superiores

  • 7/30/2019 analise de dados multivariado

    9/44

    Captulo 7 Anlise Factorial (SPSS) 9

    Anlise Factorial- PASSOS-

    Seleccionar o nmero de factores

    Em princpio pretende-se com o menor nmero possvel de factores

    explicar o mximo de varincia

    Uma boa estratgia consiste em comear por escolher os factores

    cujos valores prprios (eigenvalues) sejam superiores a 1.

    Se a varincia explicada for elevada ento pode-se encarar a

    possibilidade de reduzir o nmero de factores.

    Se a varincia explicada for baixa ento deve-se admitir a possibilidade

    de aumentar o nmero de factores

  • 7/30/2019 analise de dados multivariado

    10/44

    Captulo 7 Anlise Factorial (SPSS) 10

    Anlise Factorial- PASSOS-

    Escolher o mtodo de rotao dos factores

    Existem dois tipos de mtodos: Ortogonais e Oblquos

    Nos mtodos ortogonais os factores no esto correlacionadossendo mais fcil a sua interpretao. VarimaxMinimiza o nmero de variveis com pesos (loadings)

    elevados em cada factor. Este mtodo facilita a interpretao dosfactores.

    QuartimaxMinimiza o nmero de factores necessrios explicaode cada varivel. Facilita a interpretao das variveis.

    EquamaxCombinao do Varimax e do Quartimax.

    Nos mtodos oblquos os factores esto correlacionados sendonalguns casos um recurso mais realista.

  • 7/30/2019 analise de dados multivariado

    11/44

    Captulo 7 Anlise Factorial (SPSS) 11

    Anlise Factorial- PASSOS-

    Interpretar os factores

    Para a interpretao dos factores necessrio identificar para

    cada factor as variveis mais correlacionadas. Essas variveis

    so as que tm pesos (loadings) superiores a 0,5 ( em termos

    absolutos).

    As variveis identificadas iro ajudar a denominar os factores.

    A interpretao dos factores mais fcil quando existe uma

    estrutura simples, isto , quando uma varivel s est

    fortemente correlacionada com um factor.

  • 7/30/2019 analise de dados multivariado

    12/44

    Captulo 7 Anlise Factorial (SPSS) 12

    Anlise Factorial- Problema -

    Suponha que se pretende identificar as actividades

    principais que caracterizam os pases.

    Para o efeito obteve-se uma amostra aleatria constitudapelos pases constantes no ficheiro paises.sav.

    Para cada pas indicada a percentagem de trabalhadores

    afectos a cada actividade.

  • 7/30/2019 analise de dados multivariado

    13/44

    Captulo 7 Anlise Factorial (SPSS) 13

    Metodologia com o SPSS

    Para se aceder Anlise Factorial em SPSS, necessrio

    efectuar os seguintes passos:

    1. Entrar no menu: Analyze

    2. Entrar no submenu: Dimension Reduction

    3. Seleccionar:Factor ...

  • 7/30/2019 analise de dados multivariado

    14/44

    Captulo 7 Anlise Factorial (SPSS) 14

    Metodologia com o SPSS- Introduo dos Dados -

  • 7/30/2019 analise de dados multivariado

    15/44

    Captulo 7 Anlise Factorial (SPSS) 15

    Metodologia com o SPSS- Quadros de input -

  • 7/30/2019 analise de dados multivariado

    16/44

    Captulo 7 Anlise Factorial (SPSS) 16

    Metodologia com o SPSS- Quadros de input -

    1.- Para extraco dos factores escolheu-se o

    mtodo das componentes principais.

    2.- Os factores seleccionados tero um valor

    prprio (eigenvalue) superior a 1.

  • 7/30/2019 analise de dados multivariado

    17/44

    Captulo 7 Anlise Factorial (SPSS) 17

    Metodologia com o SPSS- Quadros de input -

    O mtodo Varimax foi o mtodo

    de rotao escolhido.

  • 7/30/2019 analise de dados multivariado

    18/44

    Captulo 7 Anlise Factorial (SPSS) 18

    Metodologia com o SPSS- Quadros de input -

    Com o mtodo Anderson-Rubin, os scores

    no esto correlacionados e so

    padronizados (mdia 0 e desvio-padro 1).

  • 7/30/2019 analise de dados multivariado

    19/44

    Captulo 7 Anlise Factorial (SPSS) 19

    Metodologia com o SPSS- Excluir as variveis no relevantes

    Na diagonal principal da matriz anti.image

    correlation a Construo , das variveis com

    valor inferior a 0.5 a que tem menor valor

    (0.085). Logo, ser a primeira a ser excluda.

  • 7/30/2019 analise de dados multivariado

    20/44

    Captulo 7 Anlise Factorial (SPSS) 20

    Metodologia com o SPSS- Excluir as variveis no relevantes

    Tirou-se a varivel Construo

  • 7/30/2019 analise de dados multivariado

    21/44

    Captulo 7 Anlise Factorial (SPSS) 21

    Metodologia com o SPSS- Excluir variveis no relevantes

    Na diagonal principal da matriz anti.imagecorrelation a Manufacturao , das variveis

    com valor inferior a 0.5 a que tem menor valor

    (0.197). Logo, ser a primeira a ser excluda.

  • 7/30/2019 analise de dados multivariado

    22/44

    Captulo 7 Anlise Factorial (SPSS) 22

    Metodologia com o SPSS- Excluir as variveis no relevantes

    Tirou-se a varivel Manufacturao

  • 7/30/2019 analise de dados multivariado

    23/44

    Captulo 7 Anlise Factorial (SPSS) 23

    Metodologia com o SPSS- Excluir as variveis no relevantes

    Na diagonal principal da matriz anti.imagecorrelation a Energia , das variveis com

    valor inferior a 0.5 a que tem menor valor

    (0.197). Logo, ser a primeira a ser excluda.

  • 7/30/2019 analise de dados multivariado

    24/44

    Captulo 7 Anlise Factorial (SPSS) 24

    Metodologia com o SPSS- Excluir as variveis no relevantes

    Tirou-se a varivel Energia

  • 7/30/2019 analise de dados multivariado

    25/44

    Captulo 7 Anlise Factorial (SPSS) 25

    Metodologia com o SPSS- Verificar se a Anlise Factorial adequada

    1.-No h na matriz anti-image correlation

    variveis com valor inferior a 0,5.

    2.- A estatstica KMO superior a 0,5 (0,617).

    3.- A hiptese nula do teste de esferacidade de

    Bartlett rejeitada (Sig=0).

    Logo, pode-se continuar com o estudo.

  • 7/30/2019 analise de dados multivariado

    26/44

    Captulo 7 Anlise Factorial (SPSS) 26

    Metodologia com o SPSS- Interpretar os factores

  • 7/30/2019 analise de dados multivariado

    27/44

    Captulo 7 Anlise Factorial (SPSS) 27

    Metodologia com o SPSS- Interpretar os factores

  • 7/30/2019 analise de dados multivariado

    28/44

    Captulo 7 Anlise Factorial (SPSS) 28

    Metodologia com o SPSS- Interpretar os factores

    1.- Os dois primeiros factores explicam 72,3%

    da varincia total.

    2.- Depois da rotao, a importncia dos

    factores ficou mais equilibrada.

    Exceptuando as Minas, as variveis tm a sua

    varincia bem explicada pelos factores.

    Ex: Agricultura 90%, Transportes 86,8%.

  • 7/30/2019 analise de dados multivariado

    29/44

    Captulo 7 Anlise Factorial (SPSS) 29

    Metodologia com o SPSS- Interpretar os factores

    O grfico Scree Plot mostra a importncia

    relativa dos factores.

    No nosso exemplo, s dois factores tm

    eigenvalues superiores a 1.

  • 7/30/2019 analise de dados multivariado

    30/44

    Captulo 7 Anlise Factorial (SPSS) 30

    Metodologia com o SPSS- Interpretar os factores

    A rotao dos factores tornou a

    interpretao mais clara:

    1.- O factor 1 est associado positivamente

    aos Servio Sociais e aos Transportes e

    negativamente Agricultura.

    2.- O factor 2 est associado positivamenteaos Servios e s Finanas e

    negativamente s Minas.

    Nota: Consideram-se significativos os

    pesos superiores a 0.5 em mdulo.

    1.- A soma, em linha, dos quadrados dos

    pesos das componentes igual s

    comunalidades.

    Ex: (-.928)^2 + (-.199)^2 = .900 que a

    comunalidade da Agricultura.

    2.- A soma, em coluna, dos quadrados dos

    pesos das componentes igual ao

    eigenvalue dos factores.

    Ex: (-.928)^2 + + (.379)^2 = 2,712

  • 7/30/2019 analise de dados multivariado

    31/44

    Captulo 7 Anlise Factorial (SPSS) 31

    Metodologia com o SPSS- Interpretar os factores

    LoadingsPositivos

    LoadingsNegativos

    Factor 1 Serv. Sociais

    Transportes

    Agricultura

    Factor 2 Servios

    Finanas

    Minas

    Nota: Este quadro, feito com base nos dados a bold identificados na

    Rotated Component Matrix, permite uma melhor interpretao dos factores.

  • 7/30/2019 analise de dados multivariado

    32/44

    Captulo 7 Anlise Factorial (SPSS) 32

    Metodologia com o SPSS- Interpretar os factores

    Factor1

    Factor2

  • 7/30/2019 analise de dados multivariado

    33/44

    Captulo 7 Anlise Factorial (SPSS) 33

    Metodologia com o SPSS- Interpretar os factores

    Para cada pas (caso) o score de um dado factor o resultado da soma dos

    produtos de cada coeficiente pelas variveis originais padronizadas.

    Ex: Para a Blgica, o score do Factor1 ser:

    ((-,348) x (2,6 12,183) / 12,3088) + ((-,060 x (,23,113) / 7,6542) + = ,73901

  • 7/30/2019 analise de dados multivariado

    34/44

    Captulo 7 Anlise Factorial (SPSS) 34

    Metodologia com o SPSS- Interpretar os factores

    Pases do Leste

  • 7/30/2019 analise de dados multivariado

    35/44

    Captulo 7 Anlise Factorial (SPSS) 35

    Metodologia com o SPSS- Interpretar os factores

    O grfico anterior obtido da seguinte forma:

    Graphs =>

    Legacy Dialogs =>

    Scatter/Dot =>

    Simple Scatterplot

    Metodologia com o SPSS

  • 7/30/2019 analise de dados multivariado

    36/44

    Captulo 7 Anlise Factorial (SPSS) 36

    Metodologia com o SPSS- Interpretar os factores

    Das 9 variveis iniciais, 3 no so relevantes (isto , so

    independentes):

    Construo, Manufacturao e Energia

    As restantes 6 variveis podem ser agregadas em dois factores que

    explicam 73% da varincia

    O primeiro factor pode ser intitulado de Servios versus Agriculturae o segundo Finanas versus Indstria Extractiva

    A representao grfica dos pases baseada nos seus scores indica

    um aglomerado para os pases de leste e outro para os de oeste.

    Existem 3 outliers:

    Albnia, Turquia e Gibraltar

    Concluso:

  • 7/30/2019 analise de dados multivariado

    37/44

    37

    Captulo 7 Anlise Factorial (SPSS)

    ANEXO

  • 7/30/2019 analise de dados multivariado

    38/44

    Captulo 7 Anlise Factorial (SPSS) 38

    Conceito de Valor Prprio

    colunavectores1618eematrizuma

    321-4

    sendo,

    16

    18x

    32

    1-4

    :matricialformaseguintena

    dorepresentaserpode1632

    184linearesequaesdesistemaoexemplo,Por

    coluna.ou vectorlinhavectorse-dizcoluna,oulinhaumatemsmatrizaQuando

    regras.certasaobedecendoerectoparntesisentrecolocadosordem,certa

    numacolunas,elinhasemdispostosnmerosdeconjuntoumamatrizse-Chama

    yx

    y

    x

    yx

    yx

  • 7/30/2019 analise de dados multivariado

    39/44

    Captulo 7 Anlise Factorial (SPSS) 39

    Conceito de Valor Prprio

    0

    .. .

    .. ... .

    .. .

    .. .

    )((1)

    Ento

    0..

    0

    0

    0e

    .. .

    X,

    .. ... .

    ...

    .. .

    e,constante)(umaescalarumqueemse-Considere

    2

    1

    21

    22221

    11211

    2

    1

    21

    22221

    11211

    nnnnn

    n

    n

    nnnnn

    n

    n

    x

    x

    x

    aaa

    aaa

    aaa

    XAIAXX

    x

    x

    x

    aaa

    aaa

    aaa

    A

    XAX

  • 7/30/2019 analise de dados multivariado

    40/44

    Captulo 7 Anlise Factorial (SPSS) 40

    Conceito de Valor Prprio

    nnn

    i

    n

    aaaA

    A

    prpriovector

    prpriosvaloresnnA

    AI

    .. ... .)(Trao

    .matrizdaprincipal)

    diagonaldaelementosdos(somatraoaoigualprpriosvaloresdossomatriooquese-Demonstra

    or).(eigenvectpor

    designadodeste,mltiploqualquerou(1),equaesdesistemadosoluodavectoro,dadoumPara

    ues).(eingelvalchamadossoquee(2)verificamque),...,,(deesparticularvaloresathaverento,dimensodequadradamatrizumaforaSe

    0(2)

    se,sesetriviaisnosoluesadmite(1)homogneaslinearesequaesdesistemaoquese-Demonstra

    212211

    21

  • 7/30/2019 analise de dados multivariado

    41/44

    Captulo 7 Anlise Factorial (SPSS) 41

    Conceito de Componentes Principais

    j

    ppp

    jj

    jpjj

    pjpjjj

    j

    pp

    p

    p

    Zprpriovector

    XVarXVarXVarZVarZVarZVar

    ZVarprpriovalor

    sedemonstra

    aaa

    pjXaXaXaZ

    ZVar

    XXXZVarZVarZVar

    ZZZ

    XXXpprincipaisscomponente

    deescoeficientossoadoelementosos

    quee

    )(.. .)()()(.. .)()(.. .,

    sendo

    )(igualo

    :queoriginais,variveisdasascovarincidasmatrizabasecomoTendo

    nadoscorrelacionondicesosestandoe1.. .com

    ),.. .,2,1(.. .

    sendo,)(maximizaremconsistendicesdosclculoO

    restantes.osse-desprezarportantopodendondices,primeirosdossvarinciaasseroivassignificatmais

    ,...,,originaisvariveisasnadascorrelacioestiveremmaisQuanto).(.. .)()(so

    svarinciasuasasquetaloordenamentseuoedadosdosdimenses""diferentesmedemndicesos,lacionados-correestaremnoPordados.dosvariaoadescrevamqueenadoscorrelaciono,...,,ndicesproduzam

    quescombinaeencontrar,...,,variveisdepartiradeodasobjectivoO

    j

    212121

    22

    2

    2

    1

    2211

    2121

    21

    21

  • 7/30/2019 analise de dados multivariado

    42/44

    Captulo 7 Anlise Factorial (SPSS)42

    Conceito de Anlise Factorial

    .. .

    :serFactorialAnlisedemodeloorotaoa

    os.relacionadestosegundonoenadoscorrelacioestonofactoresos

    casoprimeiroNooblqua.ouortogonalserpodequese-recorremodelo,doexplanaoamelhorarPara

    )(com.. .

    :rotaodafactorialmodeloose-obtendofactores,os

    paraexigidocomo1varinciae0mdiatenhamPrincipaissComponenteasquese-garanteFazendo

    originais)variveisas(sendo.. .

    :apenasretendoPrincipaissComponenteasutilizarse-podeminiciais,factoresdosobtenoPara

    Normal.odistribuicom

    resduoumepesosseusosunitria,varinciae0mdiacomnadoscorrelacionocomunsfactoressendo

    .. .

    :formaseguinteatemFactorialAnlisedegeralmodeloO

    **

    22

    *

    11

    2211

    2211

    2211

    imimiii

    jijijimimiii

    j

    j

    j

    iimimiii

    iijj

    imimiii

    eFgFgFgX

    Aps

    rotao

    baeFaFaFaX

    antes

    ZF

    XeZbZbZbX

    m

    eaF

    eFaFaFaX

    R t O t l d F t

  • 7/30/2019 analise de dados multivariado

    43/44

    Captulo 7 Anlise Factorial (SPSS)43

    Rotao Ortogonal de Factores

    No Rodado

    Factor II

    No Rodado

    Factor I

    Rodado

    Factor I

    Rodado Factor II

    -1.0 -.50 0 +.50 +1.0

    -.50

    -1.0

    +1.0

    +.50

    V1

    V2

    V3V

    4

    V5

    Rotao Oblqua de Factores

  • 7/30/2019 analise de dados multivariado

    44/44

    44

    No Rodado

    Factor II

    No Rodado

    Factor I

    RotaoOblqua:Factor I

    Rotao Ortogonal:Factor II

    -1.0 -.50 0 +.50 +1.0

    -.50

    -1.0

    +1.0

    +.50

    V1

    V2

    V3

    V4

    V5

    Rotao Ortogonal:Factor I

    Rotao Oblqua:Factor II

    Rotao Oblqua de Factores