Manual Amostragem Introdução SPSS

Embed Size (px)

DESCRIPTION

Síntese dos diferentes tipos de amostragem

Citation preview

  • 7/21/2019 Manual Amostragem Introduo SPSS

    1/79

    Manual de Amostragem e deIntroduo ao SPSS

  • 7/21/2019 Manual Amostragem Introduo SPSS

    2/79

    2

    Manual Amostragem e de Introduo ao SPSS

    Ficha Tcnica

    Autor:

    ------------

    Resumo biogrfico:

    ------------

    Ttulo do manual:

    Manual de Amostragem e de Introduo ao SPSS

    Ms e Ano de elaborao:Novembro de 2008

  • 7/21/2019 Manual Amostragem Introduo SPSS

    3/79

    3

    ndicePg.

    Estruturao dos captulos 5Introduo 6

    Captulo 1 Amostragem 7

    Objectivos 7

    Palavras-chave 7

    Contedo temtico

    1.1. Noes de amostragem 8

    1.2. Mtodos de amostragem 10

    1.3. Seleco das unidades amostrais 11

    1.4. Margens de erro e intervalos de confiana 12

    Avaliao 15

    Bibliografia 15

    Captulo 2 Introduo ao SPSS 16

    Objectivos 16

    Palavras-chave 16

    Contedo temtico

    2.1. Editor de dados do SPSS 17

    2.2. Output do SPSS 18

    2.3. Menus SPSS 19

    2.4. Criao de bases de dados 22

    2.5. Tratamento Preliminar de dados 22

    2.5.1. Transformao algbrica de variveis 23

    2.5.2. Transformao lgica de variveis 28

    2.5.3. Inverso da escala de uma varivel 29

    2.5.4. Variveis de contagem de ocorrncias 30

    2.6. Seleco de casos 31

    Avaliao 35

    Referncias 36

  • 7/21/2019 Manual Amostragem Introduo SPSS

    4/79

    4

    Pg.Captulo 3 Estatstica aplicada com SPSS 37

    Objectivos 37

    Palavras-chave 37

    Contedo temtico3.1. Anlise de dados univariada 38

    3.1.1. Frequncias 38

    3.1.2. Estatsticas descritivas e grficos de perfil 41

    3.1.3. Testes de aderncia (para 1 amostra) 44

    3.1.3.1. 2(Qui-quadrado) 44

    3.1.3.2. Kolmogorov-Smirnov 45

    3.1.3.3 Teste tde Student 46

    3.2. Anlise de dados bivariada 47

    3.2.1. Cruzamentos e teste de independncia 2(Qui-quadrado) 47

    3.2.2. Testes no paramtricos procedimento Non Parametric Tests 50

    3.2.2.1. Duas amostras independentes (Mann-Whitney e Kolmogorov-Smirnov) 50

    3.2.2.2. K amostras independentes (Kruskal-Wallis) 52

    3.2.3. Testes no paramtricos procedimento Compare Means 54

    3.2.3.1. Duas amostras emparelhadas (t de Studentamostras emparelhadas) 54

    3.2.3.2. Duas amostras independentes (t de Studentde independncia) 55

    3.2.3.3. k amostras independentes (Anlise de Varincia Simples Paramtrica -ANOVA) 56

    3.2.4. Correlao linear simples 59

    3.3. Modelos de previso 61

    3.3.1. Anlise de Regresso Simples 61

    3.3.2. Anlise de Regresso Mltipla 63

    3.4. Anlise de dados multivariada 66

    3.4.1. Anlise das Componentes Principais 66

    3.4.2. Anlise de Clusters 71

    3.4.2.1. Anlise hierrquica de Clusters 72

    3.4.2.2. Anlise no hierrquica de Clusters mtodo de optimizao (K-Means) 76

    3.4.3. Articulao entre a Anlise das Componentes Principais r a Anlise deClusters 76

    Avaliao 79

    Bibliografia 79

    Anexo 1: Testes de inferncia estatstica mais utilizados em Anlise bivariada 80

    Anexo 2: European Social Survey (round 1 - 2002) - Questionrio adaptado 83

  • 7/21/2019 Manual Amostragem Introduo SPSS

    5/79

    5

    Estruturao dos captulos

    Em cada captulo ou contedo temtico, o(a) aluno(a) visualizar uma estrutura que apresentar

    as seguintes subdivises, a saber:

    Objectivos

    Objectivo(s) especfico(s), no qual cada participante conhecer a propostade aprendizagem a ser alcanada no final dessa mesma (sub)temtica e queservir de referncia para a auto-avaliao;

    Palavras

    Palavras-chave, que pela sua relevncia para a temtica e como realce daateno do(a) aluno(a) para determinada designao ou conceito, que ter asua definio e explicitao, no final do captulo, no espao reservado emGlossrio.

    Contedo

    Contedo programtico, onde se procurar desenvolver, de modo claro,objectivo e com rigor tcnico, a (sub)temtica em apreo, referenciando-seos elementos de substncia, julgados mais significativos e de interesse paraa aprendizagem do(a) aluno(a).

    Avaliao

    Avaliao. Neste espao ser indicada a forma de avaliao do captulo eincluda a respectiva ficha de exerccio.

    Referncias

    Referncias. Nesta subdiviso poder-se- encontrar uma lista de elementosbibliogrficos referentes: s citaes efectuadas ao longo do texto; s obrasconsultadas pelo autor, i. , livros, artigos, monografias, trabalhosacadmicos, endereos electrnicos, etc., que podero ajudar no trabalhode pesquisa ou de aprofundamento de saberes de cada aluno(a).

  • 7/21/2019 Manual Amostragem Introduo SPSS

    6/79

    6

    Introduo

    O Manual de Amostragem e Introduo ao SPSS tem como objectivo principal orientar os alunosna utilizao do SPSS, constituindo-se simultaneamente como um guio da matria leccionada ede uma ficha tcnica para realizao dos exerccios propostos no mbito do da cadeira deInformtica Aplicada.

    Pretende-se, deste modo, disponibilizar aos alunos um guio que lhes permita acompanhar asequncia dos pontos do programa e as respectivas aulas. Nesse sentido, este manual nodispensa a necessidade de se tirar apontamentos nas aulas, nem a leitura e consulta de outra

    bibliografia, que permitir o aprofundamento dos temas, na medida em que aqui se situamapenas os principais tpicos e as balizas das matrias abordadas.

    Procurou-se por isso apresentar o contedo dos vrios pontos de uma forma clara, simples esinttica, de maneira a que o essencial seja captado neste manual, podendo ser aprofundado apartir das referncias indicadas.

    De acordo com o programa, este manual divide-se em trs captulos, que esto obviamenterelacionados intimamente:

    - O primeiro pretende fornecer aos alunos elementos que lhes permitam construir umaamostra representativa e proceder seleco aleatria das unidades amostrais.

    - O segundo tem como objectivo familiarizar os formandos com o SPSS, permitindo-lhes

    criar, importar e manipular bases de dados, bem como proceder ao tratamento preliminardos dados, recodificar variveis e construir novas variveis a partir das variveisoriginais.

    - O terceiro tem como objectivo dotar os formandos de competncias tcnicas e estatsticasque lhes permitam proceder anlise de dados univariada, bivariada e multrivariada,com SPSS.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    7/79

    Captulo 1 Amostragem

    No final deste captulo os alunos devero ser capazes de:

    1. seleccionar os tipos de amostra mais adequados a cada contexto;2. calcular a dimenso da amostra e a margem de erro;3. seleccionar as unidades amostrais.

    - Amostra- Erro amostral- Unidades amostrais

    Captulo

    1Objectivos

    Palavras

  • 7/21/2019 Manual Amostragem Introduo SPSS

    8/79

    8

    1.1. Noes de amostragem

    Em Estatstica1, amostra o conjunto de elementos extrados de um conjuntomaior, chamado Populao. um conjunto constitudo de indivduos (famlias ou outrasorganizaes), acontecimentos ou outros objectos de estudo que o investigador pretende descreverou para os quais pretende generalizar as suas concluses ou resultados.

    Principais razes para se trabalhar com uma amostra:

    - A populao infinita, ou considerada como tal, no podendo portanto ser analisadana ntegra;

    - Custo excessivo do processo de recolha e tratamento dos dados, como resultado dagrande dimenso da populao ou da complexidade do processo de caracterizao detodos os elementos da populao;

    - Tempo excessivo do processo de recolha e tratamento dos dados, conduzindo obteno de informao desactualizada;

    - As populaes so dinmicas, de onde resulta que os elementos ou objectos dapopulao esto em constante renovao, de onde resulta a impossibilidade de

    analisar todos os elementos desta populao;

    Se a constituio da amostra obedecer a determinadas condies, a anlise das caractersticas daamostra pode servir para se fazerem inferncias sobre a populao.

    Nota:A dimenso da amostra significativamente inferior dimenso da populao, de forma ajustificar a constituio da amostra. A amostragem , por sua vez, um conjunto deprocedimentos atravs dos quais se selecciona uma amostra de uma populao. Pode-sedividir as tcnicas de amostragem em vrio tipos:

    - Amostragem probabilstica - procedimento em que todos os elementos da populaotm uma probabilidade conhecida e superior a zero de integrar a amostra;

    - Amostragem no probabilstica:- Amostragem intencional - amostragem no probabilstica subordinada a objectivos

    especficos do investigador;- Amostragem no intencional - amostragem no probabilstica regida por critrios de

    convenincia e/ou de disponibilidade dos inquiridos.

    1Amostra (estatstica) . In Infopdia [Em linha]. Porto: Porto Editora, 2003-2008. [Consult. 2008-01-15]. Disponvel na www:.

    Contedo

  • 7/21/2019 Manual Amostragem Introduo SPSS

    9/79

    9

    Questes prQuestes prvias ao processo de amostragemvias ao processo de amostragemde natureza quantitativade natureza quantitativa

    1. Definio clara dosobjectivos do estudo

    O que se pretende saber/conhecer

    melhor/compreender

    2. Quem dever serentrevistado

    Populao alvo* e populao a

    inquirir

    3. Quantos devero serentrevistados

    Dimenso da amostra

    4. Como seroseleccionados

    Mtodo de seleco da amostra

    (escolha das unidades amostrais)

    *Designa-se por populao alvo a totalidade dos elementos sobre os quais se deseja obter determinado tipode informao

    7

    Amostra, n(unidades de observao)

    Universo ou Populao, N(finito)

    Unidades que poderiam serobservadas

    Conjunto de unidades existentes squais se aplica a teoria

    Universo Hipottico(praticamente infinito)

    * in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 1989

    RepresentaRepresentao de uma Amostra*o de uma Amostra*

    8

  • 7/21/2019 Manual Amostragem Introduo SPSS

    10/79

    10

    Desenvolvimento de um planoDesenvolvimento de um plano amostral*amostral*

    * in: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999

    Populao alvo

    Populao a inquirir

    Processo amostral

    Dimenso da amostra

    Mtodo de recolha

    de dados

    Amostra final

    9

    1.2. Mtodos amostrais

    MMtodos de selectodos de seleco da amostra*o da amostra*

    * in: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999

    Mtodos probabilsticos(amostragem casual)

    Amostragem aleatria simples

    Amostragem sistemtica

    Amostragem estratificada

    Amostragem por clusters

    Amostragem multi-etapas

    Amostragem multifsica

    Mtodos no

    probabilsticos(amostragem dirigida)

    Amostragem por convenincia

    Amostragem intencional

    Amostragem snowballAmostragem sequencial

    Amostragem por quotas

    10

  • 7/21/2019 Manual Amostragem Introduo SPSS

    11/79

    11

    1.3. Seleco das unidades amostrais

    MMtodos de selectodos de seleco da amostrao da amostra ((contcont))**

    * in: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999

    Mtodos probabilsticos - amostragem aleatria

    Cada elemento da populao tem a mesma probabilidade de serseleccionado

    Aleatria simples

    Clculo do rcio K=N/n; seleco aleatria do primeiro elementoda populao e sequencial dos restantes

    Casualsistemtica

    Separao dos elementos da populao em estratos e selecoaleatria dos elementos dentro de cada estrato

    Estratificada

    A populao encontra-se dividida em clusters que soseleccionados aleatoriamente, constituindo as unidades amostraisClusters

    Idntico ao anterior mas em que as unidades amostrais soseleccionadas aleatoriamente dentro de cada cluster

    Multi-etapas

    Numa 1 fase recolhem-se dados sobre determinadascaractersticas dos respondentes (comportamentos e frequncia deconsumos, variveis demogrficas, etc.) e da sua disponibilidadepara responder novamente a um inqurito. ento retirada destafase uma sub-amostra que ser inquirida na 2 fase.

    Multi-fsica

    11

    12

    rea

    6500610184013902 660Total24501706006101070Produto D27001907005501260Produto C5005023070150Produto B850200310160

    180Produto A

    TotalOutros(Restantesdistritos)

    Sul(Lisboa,Setbal eSantarm)

    Centro(Coimbra,Aveiro eLeiria)

    Norte(Braga ePorto)Sector

    Amostra estratificada*Amostra estratificada*

    * Adaptado de: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999

    Uni v

    er

    so

    rea

    65061184139266Total245176061107Produto D270197055126Produto C50523715Produto B8520311618Produto A

    TotalOutros(Restantesdistritos)

    Sul(Lisboa,Setbal eSantarm)

    Centro(Coimbra,Aveiro eLeiria)

    Norte(Braga ePorto)Sector

    Am

    ostr

    a(10

    %

    da

    populao

    )

  • 7/21/2019 Manual Amostragem Introduo SPSS

    12/79

    12

    MMtodos de selectodos de seleco da amostrao da amostra ((contcont))**

    * in: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999

    A amostra seleccionada em funo da disponibilidade eacessibilidade dos elementos que constituem a populao alvo

    Amostragem porconvenincia

    A escolha dos elementos a incluir na amostra baseia-se na opiniode uma ou mais pessoas que conhecem muito bem ascaractersticas especficas da populao em estudo, que sepretende analisar

    Amostragemintencional

    Numa 1 fase os inquiridos so escolhidos aleatoriamente, sendo,numa segunda fase, os inquiridos adicionais escolhidos com basena informao dos primeiros

    Amostragemsnowball

    Semelhante ao mtodo multi-fsico. A realizao da fase seguintes decidida depois de analisados os resultados da fase anterior.

    Amostragemsequencial

    Equivalente amostragem aleatria estratificada. As proporesdos vrios sub-grupos reflectem a sua distribuio dentro dapopulao. Cada entrevistador dispe das caractersticas que os

    entrevistados devero satisfazer, terminando as entrevistasquando as quotas estiverem preenchidas.

    Amostragem por

    quotas

    Mtodos no probabilsticos - amostragem dirigida

    13

    1.4. Erro amostral

    DeterminaDeterminao da margem de erro em funo da margem de erro em funo do no do n de elementos*de elementos*

    in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 198914

  • 7/21/2019 Manual Amostragem Introduo SPSS

    13/79

    13

    DeterminaDeterminao no n de elementos em funde elementos em funo da margem de erro *o da margem de erro *

    in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 1989 15

    DeterminaDeterminao no n de elementos em funde elementos em funo da margem de erro e dao da margem de erro e dadimenso da populadimenso da populao *o *

    in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 1989 16

  • 7/21/2019 Manual Amostragem Introduo SPSS

    14/79

    14

    A avaliao deste captulo consiste num exerccio escrito, de resposta sseguintes questes

    Exerccio de avaliao:

    1) Depois de se identificar os dados que devero ser recolhidos e o instrumento (questionrioestruturado, por exemplo) a utilizar para essa recolha, o passo seguinte consiste em definir um

    processo de amostragem adequado ao tipo de dados e ao instrumento de anlise2

    Diga, sucintamente em que consistem os seguintes mtodos de mostragem:- Amostra aleatria simples;

    - Amostra Estratificada;- Amostra por quotas.

    2)O problema da Inferncia Indutiva , do ponto de vista da Estatstica, encarado da seguinteforma: a finalidade da investigao descobrir algo sobre determinada populao ou universo.3

    Comente a frase e diga quais os procedimentos para seleccionar as unidades amostrais (sujeitos)numa amostra estratificada.

    - Bravo, R. S. (1988), Tcnicas de investigacin social, 5 ed.corregida e ampliada, Madrid, Paraninfo (Seco 1).

    - Reis, E., P. Melo; R. Andrade e T. Calapez (1999) EstatsticaAplicada volume 2, Lisboa, Slabo, 3 edio revista.

    - Vicente, P.; E. Reis; F. Ferro (2002), Sondagens-A amostragemcomo factor decisivo de qualidade, Lisboa, Edies Slabo.

    2Reis, E., P. Melo; R. Andrade e T. Calapez (1999)Estatstica Aplicada volume 2, Lisboa, Slabo, 3 edio revista.3Idem.

    Avaliao

    Referncias

  • 7/21/2019 Manual Amostragem Introduo SPSS

    15/79

    15

    Captulo 2 Introduo ao SPSS

    O objectivo geral deste captulo o de familiarizar os alunos com o SPSS,nomeadamente no que se refere:

    - Janelas e menus;

    - Criao e manipulao de bases de dados;- Tratamento preliminar dos dados.

    - Varivel- Nvel de medida

    Captulo

    2Objectivos

    Palavras

  • 7/21/2019 Manual Amostragem Introduo SPSS

    16/79

    16

    2.1. Editor de dados do SPSS

    O package estatstico SPSS para Windows um poderoso sistema de anlises

    estatsticas e manuseamento de dados, em que a utilizao mais frequente, para amaioria das anlises a efectuar, se resume seleco das respectivas opes emmenus e caixas de dilogo

    O editor de dados do SPSS (Data Editor) composto por duas janelassobrepostas:Data Viewe Variable View. A funo da primeira Data View a de introduzir osdados e da segunda - Variable View criar a estrutura da base de dados.

    Muda-se de uma para outra clicando no respectivo separador.

    OData Editordo SPSS um programa do tipo de folha de clculo que permite facilmente criar ou

    editar ficheiros de dados. Abre automaticamente quando se entra no SPSS.O seu aspecto o seguinte:

    JanelaData View:

    Contedo

  • 7/21/2019 Manual Amostragem Introduo SPSS

    17/79

    17

    Janela Variable View:

    2.2. Outputdo SPSS (Output Viewer)

    nesta janela que so apresentados todos os resultados estatsticos. Abre automaticamente sempreque um determinado procedimento gera resultados. possvel editar as tabelas e grficos

    produzidos, clicando duas vezes com a tecla esquerda do rato e modificar a sua aparncia.

    Janela Output Viewer:

  • 7/21/2019 Manual Amostragem Introduo SPSS

    18/79

    18

    2.3. Menus do SPSS

    Os menus das janelas principais Data Editor e Outpur Viewer - so idnticos e tm o seguinteaspecto visual:

    Principais funcionalidades dos menus

    FileCriar, abrir, ler, exportar, gravar e imprimirficheiros.

    EditConfigurao/parametrizao do SPSS

    (Options), inserir novas variveis e novos casos.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    19/79

    19

    ViewActivar/desactivar barras de comandos, fontes,grelha, barra de status e mostrar etiquetas(labels) definidas.

    Data

    Alterao global dos dados;Ordenar a base;Juntar ficheiros (Merge Files);

    Dividir a anlise por grupos (Split File);Criar subconjuntos de casos para anlise (SelectCases);Activar ponderadores (Weight Cases).

    TransformCriar novas variveis com base nas variveisoriginais;Recodificar variveis.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    20/79

    20

    Analyse Procedimentos de anlise estatstica.

    Graphs Criar grficos.

    Utilities Informao sobre as variveis.

    WindowComuta entre janelas;Minimizar janelas

    HelpAjuda em linha;Tutorial.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    21/79

    21

    2.4. Criao de bases de dados

    As bases de dados so criadas na janela Variable View,devendo a estrutura das variveis obedecers seguintes regras:

    Name

    - Mximo 64 caracteres (verses anteriores 13, apenas 8);- Deve comear por uma letra; os restantes caracteres podem ser letras(maisculas ou minsculas so iguais), algarismos, ou os smbolos @, #, _, $.

    - No se podem usar espaos em branco, nem os seguintes caracteres: !, ?, , , *,+, -, %, vrgula, ponto e vrgula, \, /, >, 65 anos.a) Criao da varivel idade:

    4A base de dados original est disponvel em http://www.europeansocialsurvey.org/.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    22/79

    22

    A varivel idade acrescentou-se base de dados. Vamos agora proceder sua recodificao,criando uma nova varivel idade2 com 4 escales5:

    A varivel idade2 acrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos value labels.

    O resultado ser o seguinte:

    Idade

    341 22.6 22.6 22.6

    505 33.4 33.4 56.0

    315 20.8 20.8 76.8

    350 23.2 23.2 100.0

    1511 100.0 100.0

    At 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    Total

    ValidFrequency Percent Valid Percent

    CumulativePercent

    5 Nota: na recodificao de variveis recomendvel manter as variveis originais e criar novas variveis recodificadas,escolhendo para o efeito a opoInto diferent variable.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    23/79

    23

    b) Recodificao da varivel escolaridade:

    Pretende-se recodificar a varivel escolaridade (f7) criando uma nova varivel (escol) com 3escales: at 9 anos; 10 12 anos e > 12 anos.

    A varivel escolacrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos value labels.

    O resultado ser o seguinte:

    Escolaridade

    1046 69.2 69.2 69.2

    251 16.6 16.6 85.8

    212 14.0 14.0 99.9

    2 .1 .1 100.0

    1511 100.0 100.0

    At 9 anos

    10 - 12 anos

    > 12 anos

    NR

    Total

    ValidFrequency Percent Valid Percent

    CumulativePercent

  • 7/21/2019 Manual Amostragem Introduo SPSS

    24/79

    24

    c) Recodificao da varivel autoposicionamento poltico:

    Pretende-se recodificar a varivel autoposicionamento poltico (b28) criando uma nova varivel(b28r) com 3 escales: esquerda; centro e direita.

    A varivelb28racrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos value labels.

    O resultado ser o seguinte:

    Autoposic ionamento pol tico

    296 19.6 24.5 24.5

    620 41.0 51.2 75.7

    294 19.4 24.3 100.0

    1211 79.9 100.0

    304 20.1

    1515 100.0

    Esquerda

    Centro

    Direita

    Total

    Valid

    SystemMissing

    Total

    Frequency Percent Valid Percent

    Cumulative

    Percent

  • 7/21/2019 Manual Amostragem Introduo SPSS

    25/79

    25

    Exemplo 2: criao de ndices sintticos

    Pretende-se criar dois ndices sintticos: Confiana social(variveis a8, a9e a10) e Confianainstitucional(variveisb7,b8,b9eb10).

    As 2 variveis acrescentaram-se base6:

    Os resultados so os seguintes:

    Descriptive Statistics

    1480 .0 10.0 4.316 1.7469

    1338 .0 9.3 4.097 1.7603

    1319

    ndice sinttico de Confiana social

    ndice sinttico de Confiana institucional

    Valid N (listwise)

    N Minimum Maximum Mean Std. Deviation

    6Nota: tratando-se de variveis rcio, devero ter casas decimais (1 ou 2).

  • 7/21/2019 Manual Amostragem Introduo SPSS

    26/79

    26

    2.5.2. Transformao lgica de variveis

    Exemplo: pretende-se criar uma varivel -sexid- atravs da transformao lgica das variveisf2e idade2, com 4 categorias: homens at 30 anos, homens com mais de 30 anos,mulheres at 30 anos e mulheres com mais de 30 anos.

    Nota: repetir o comando para as restantes categorias, cujas expresses numricas so as seguintes:Categoria 2:f2= 1 & idade2> 2

    Categoria 3:f2= 2 & idade2= 3Categoria 4:f2= 2 & idade2> 4

    A varivel sexid acrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos label e value labels.

    O resultado o seguinte:

    Sexo e Idade

    158 10.5 10.5 10.5

    472 31.2 31.2 41.7

    183 12.1 12.1 53.8

    698 46.2 46.2 100.0

    1511 100.0 100.0

    Homens at 30 anos

    Homens com mais de 30 anos

    Mulheres at 30 anos

    Mulheres com mais de 30 anos

    Total

    ValidFrequency Percent Valid Percent

    Cumulative

    Percent

  • 7/21/2019 Manual Amostragem Introduo SPSS

    27/79

    27

    2.5.3. Inverso da escala de uma varivel

    Exemplo: pretende-se criar uma nova varivel (ib1) com a inverso da escala da varivel interessepela poltica (b1) de modo a que 1 corresponda a nenhum interesse e 4 a muitointeresse:

    O resultado o seguinte:

    b1

    Qual o seu interesse pela poltica

    117 7.7 7.8 7.8

    456 30.2 30.3 38.1

    441 29.2 29.3 67.5

    489 32.4 32.5 100.0

    1503 99.5 100.0

    6 .4

    2 .1

    8 .5

    1511 100.0

    Muito interesse

    Algum interesse

    Pouco interesse

    Nenhum interesse

    Total

    Valid

    Recusa

    No sabe

    Total

    Missing

    Total

    Frequency Percent Valid PercentCumulative

    Percent

    ib1

    Qual o seu i nteresse pela poltica

    489 32.4 32.5 32.5

    441 29.2 29.3 61.9

    456 30.2 30.3 92.2

    117 7.7 7.8 100.0

    1503 99.5 100.0

    2 .1

    6 .4

    8 .5

    1511 100.0

    Nenhum interesse

    Pouco interesse

    Algum interesse

    Muito interesse

    Total

    Valid

    No sabe

    Recusa

    Total

    Missing

    Total

    Frequency Percent Valid PercentCumulative

    Percent

  • 7/21/2019 Manual Amostragem Introduo SPSS

    28/79

    28

    2.5.4. Variveis de contagem de ocorrncias

    Exemplo: pretende-se criar uma varivel partciv que traduza o ndice de participao cvica,que integre (conte) apenas os inquiridos que responderam sim (1) s questes b15a

    b24.

    A varivelpartcivacrescentar-se- base.

    O resultado o seguinte:

    ndice sinttico de Participao cvica

    1174 77.7 77.7 77.7

    145 9.6 9.6 87.3

    85 5.6 5.6 92.9

    39 2.6 2.6 95.5

    30 2.0 2.0 97.5

    16 1.1 1.1 98.5

    9 .6 .6 99.1

    11 .7 .7 99.9

    1 .1 .1 99.91 .1 .1 100.0

    1511 100.0 100.0

    0

    1

    2

    3

    4

    5

    6

    7

    910

    Total

    ValidFrequency Percent Valid Percent

    CumulativePercent

    A interpretao a seguinte: 77,7% (1174) inquiridos no assinalaram nenhum indicador, 9,6%(145) assinalaram apenas 1, 5,6% (85) assinalaram 2, etc.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    29/79

    29

    2.6. Seleco de casos

    Exemplo 1: seleco de uma sub-amostraPretende-se seleccionar (filtrar) apenas os inquiridos da regio de Lisboa e Vale do Tejo(regiao=3).

    Na base de dados (Data View) os registos no seleccionados (filtrados) aparecem tracejados,mantendo-se assim at que se anule a seleco (filtro). A barra de status informa que a base estfiltrada:

    Nota muito importante:no esquecer de desactivar o filtro quando no for necessrio:

  • 7/21/2019 Manual Amostragem Introduo SPSS

    30/79

    30

    Exemplo 2: Seleco de uma amostra aleatria simplesPretende-se seleccionar uma amostra de 5% dos casos, aproximadamente:

    Na base de dados (Data View) os registos no seleccionados (filtrados) aparecem tracejados,

    mantendo-se assim at que se anule a seleco (filtro). A barra de status informa que a base estfiltrada:

    Nota muito importante:no esquecer de desactivar o filtro quando no for necessrio:

    Exemplo 3: Separar a anlise por grupos

    Pretende-se separar a anlise pelas 4 categorias (sub-amostras) da varivel sexid(sexo e idade). possvel obter os resultados na mesma tabela, seleccionando a opo Compare groupsou emtabelas diferentes, com a opo Output by groups:

    No primeiro caso, os resultados so os seguintes:Descriptive Statistics

    156 1.0 9.0 4.859 1.4670

    147 .0 8.5 4.248 1.7428

    145

    456 .0 10.0 4.259 1.8100

    440 .0 9.3 4.066 1.8441

    430

    182 .0 9.3 4.604 1.6277

    168 .0 8.0 4.116 1.6234

    167

    686 .0 10.0 4.153 1.7629

    583 .0 9.3 4.075 1.7401577

    ndice sinttico de Confiana social

    ndice sinttico de Confiana institucional

    Valid N (listwise)

    ndice sinttico de Confiana social

    ndice sinttico de Confiana institucional

    Valid N (listwise)

    ndice sinttico de Confiana social

    ndice sinttico de Confiana institucional

    Valid N (listwise)

    ndice sinttico de Confiana social

    ndice sinttico de Confiana institucionalValid N (listwise)

    Sexo e Idade

    Homens at 30 anos

    Homens com maisde 30 anos

    Mulheres at 30anos

    Mulheres com maisde 30 anos

    N Minimum Maximum Mean Std. Deviation

  • 7/21/2019 Manual Amostragem Introduo SPSS

    31/79

    31

    No segundo caso seriam produzidas 4 tabelas, uma por cada categoria da varivel colocada emsplit:

    Descriptive Statisticsa

    156 1.0 9.0 4.859 1.4670

    147 .0 8.5 4.248 1.7428

    145

    ndice sinttico deConfiana social

    ndice sinttico deConfiana institucional

    Valid N (listwise)

    N Minimum Maximum Mean Std. Deviation

    Sexo e Idade = Homens at 30 anosa.

    Descriptive Statisticsa

    456 .0 10.0 4.259 1.8100

    440 .0 9.3 4.066 1.8441

    430

    ndice sinttico deConfiana social

    ndice sinttico deConfiana institucional

    Valid N (listwise)

    N Minimum Maximum Mean Std. Deviation

    Sexo e Idade = Homens com mais de 30 anosa.

    Descript ive Statisti csa

    182 .0 9.3 4.604 1.6277

    168 .0 8.0 4.116 1.6234

    167

    ndice sinttico deConfiana social

    ndice sinttico deConfiana institucional

    Valid N (listwise)

    N Minimum Maximum Mean Std. Deviation

    Sexo e Idade = Mulheres at 30 anosa.

    Descript ive Statisti csa

    686 .0 10.0 4.153 1.7629

    583 .0 9.3 4.075 1.7401

    577

    ndice sinttico deConfiana social

    ndice sinttico deConfiana institucional

    Valid N (listwise)

    N Minimum Maximum Mean Std. Deviation

    Sexo e Idade = Mulheres com mais de 30 anosa.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    32/79

    32

    Avaliao deste mdulo consiste em criar uma base de dados para o excerto doseguinte questionrio:

    - Pereira, A. (1999), SPSS-Guia Prtico de Utilizao, Anlise deDados para Cincias Sociais e Psicologia, Lisboa, Edies Slabo, 6edio revista e corrigida.

    - Vinacua, B. V. (2002), Anlisis Estadstico con SPSS para Windows. Volumen I.Estadstica bsica, Madrid, McGraw-Hill, 2 edicin.

    Avaliao

    Referncias

  • 7/21/2019 Manual Amostragem Introduo SPSS

    33/79

    33

    Captulo 3 Estatstica aplicada com SPSSO objectivo geral deste captulo o de proceder anlise estatstica de dados, nomeadamente:

    o Anlise univariada frequncias e distribuies;o Anlise bivariada Cruzamentos, testes de hipteses e inferncia

    estatstica;o Anlise multivariada:

    Previso - Regresso linear simples e mltipla; Detectar dimenses latentes - Anlise das componentes

    principais;

    Segmentao: Anlise de Clusters

    Frequncias Cruzamentos Testes de hipteses Inferncia estatstica Margem de erro Intervalo de confiana Significncia estatstica

    3.1. Anlise de dados univariada3.1. 1. Frequncias

    a) Utilizando o comandoFrequencies7

    Variveis de caracterizao social:

    7 Nota: as tabelas geradas pelo procedimento Frequencies so em formato rascunho destinando-se apenas aocontrolo e validao da base de dados, com o objectivo de eliminar erros de introduo de dados.

    Captulo

    Objectivos

    Palavras

    Contedo

  • 7/21/2019 Manual Amostragem Introduo SPSS

    34/79

    34

    Os resultados so os seguintes:

    Sexo

    630 41.7 41.7 41.7

    881 58.3 58.3 100.01511 100.0 100.0

    Masculino

    FemininoTotal

    ValidFrequency Percent Valid Percent

    CumulativePercent

    Idade

    341 22.6 22.6 22.6

    505 33.4 33.4 56.0

    315 20.8 20.8 76.8

    350 23.2 23.2 100.0

    1511 100.0 100.0

    At 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    Total

    ValidFrequency Percent Valid Percent

    CumulativePercent

    Anos de esc olar idade concl udos

    1046 69.2 69.3 69.3

    251 16.6 16.6 86.0

    212 14.0 14.0 100.0

    1509 99.9 100.0

    2 .1

    1511 100.0

    At 9 anos

    10 - 12 anos> 12 anos

    Total

    Valid

    NRMissing

    Total

    Frequency Percent Valid PercentCumulative

    Percent

    b) Utilizando o comando Tables

  • 7/21/2019 Manual Amostragem Introduo SPSS

    35/79

    35

    Os resultados so os seguintes8:

    630 41.7

    881 58.3

    1511 100.0

    341 22.6

    505 33.4

    315 20.8

    350 23.2

    1511 100.0

    1046 69.2

    251 16.6

    212 14.0

    2 .1

    1511 100.0

    Masculino

    Feminino

    TotalSexo

    At 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    Total

    Idade

    At 9 anos

    10 - 12 anos

    > 12 anos

    NR

    Total

    Anos deescolaridadeconcludos

    N %

    c) Quadro de frequncias (%) dos indicadores das questes d18 a d24

    8Nota: o quadro foi modificado no respectivo editor, a que se acede clicando duas vezes sobre o mesmo.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    36/79

    36

    O resultado o seguinte:

    11.7 41.3 15.1 25.4 6.5 100.0

    14.1 46.1 19.4 16.2 4.3 100.0

    13.7 53.7 16.7 12.3 3.6 100.0

    14.3 42.3 22.1 16.2 5.2 100.0

    25.9 54.0 12.5 6.0 1.6 100.0

    43.3 40.1 9.3 6.2 1.0 100.0

    26.6 38.5 19.0 13.2 2.7 100.0

    As pessoas que vm viver e trabalhar para c fazemcom que os salrios baixem

    As pessoas que vm viver e trabalhar para c, em

    regra, prejudicam mais as expectativas econmicasdos pobres do que dos ricos

    As pessoas que vm viver e trabalhar para cajudam a preencher lugares em que h falta detrabalhadores

    Se as pessoas que vieram viver e trabalhar para cestiverem desempregadas por muito tempo deviamser obrigadas a ir embora

    As pessoas que vieram viver para c devem ter osmesmos direitos do que todas as outras pessoas

    As pessoas que vieram viver para c cometerem umcrime grave, devem ser obrigadas a ir embora

    As pessoas que vieram viver para c cometeremqualquer crime, devem ser obrigadas a ir embora

    Concordatotalmente Concorda

    Nemconcorda Discorda

    Discordatotalmente Total

  • 7/21/2019 Manual Amostragem Introduo SPSS

    37/79

    37

    3.1. 2. Estatsticas descritivas e grfico de perfil

    Nota muito importante: A anlise estatstica, excepto nos quadros de frequncias,deve incidir apenas nas respostas vlidas. Assim, antes de efectuar qualquer anliseestatstica, torna-se necessrio definir e activar os respectivos missing values (no

    responde/no sabe/no se aplica) na colunamissingda base de dados.a) Utilizando o comandoDescriptives9

    Indicadores das questesd10ad17:

    Os resultados so os seguintes:

    Descriptive Statistics

    1448 0 10 7.46 2.241

    1449 0 10 7.11 2.442

    1447 0 10 6.81 2.807

    1454 0 10 6.48 2.425

    1416 0 10 6.06 2.536

    1466 0 10 6.05 2.633

    1440 0 10 3.79 2.971

    1451 0 10 2.85 2.874

    1330

    Ter qualificaes profissionais de que o pas precisa

    Querer adaptar-se ao mesmo modo de vida do pas

    Ser rico

    Ter familiares prximos a viver c

    Ter boas qualificaes acadmicas

    Saber falar a lngua oficial do pas

    Ter formao crist

    Ser branco

    Valid N (listwise)

    N Minimum Maximum Mean Std. Deviation

    9 Nota: as tabelas geradas pelo procedimento Descriptives so em formato rascunho destinando-se apenas aocontrolo e validao da base de dados, com o objectivo de eliminar erros de introduo de dados.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    38/79

    38

    b) Utilizando o comando Tables

    Os resultados so os seguintes:

    6.1 2.5

    6.5 2.4

    6.1 2.63.8 3.0

    2.8 2.9

    6.8 2.8

    7.5 2.2

    7.1 2.4

    Ter boas qualificaes acadmicas

    Ter familiares prximos a viver c

    Saber falar a lngua oficial do pasTer formao crist

    Ser branco

    Ser rico

    Ter qualificaes profissionais de que o pas precisa

    Querer adaptar-se ao mesmo modo de vida do pas

    Mdia Desvio-padro

  • 7/21/2019 Manual Amostragem Introduo SPSS

    39/79

    39

    c) Grfico de perfil10:

    0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0

    Ter boas qualificaes acadmicas

    Ter familiares prximo s a viver c

    Saber falar a lngua ofic ial do p as

    Ter formao crist

    Ser branco

    Ser rico

    Ter qualificaes profissionais d e que o pas precisa

    Querer adaptar-se ao mesmo modo de v ida do pas

    6.1

    6.5

    6.1

    3.8

    2.8

    6.8

    7.5

    7.1

    Nenhuma importncia Muita importncia

    10Para obter um grfico interactivo de linhas, o procedimento o seguinte: Graph/Interactive/Line, seleccionam-se

    todas as variveis em simultneopressionando a tecla Ctrl e arrastam-se para horizontal.O grfico do exemplo foi editado e transformado, tendo-se alterado a escala para o formato real e a cor da linha eacrescentado as etiquetas (valores e mnimo e mximo), a grelha e a linha de referncia.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    40/79

    40

    3.1.3. Testes de aderncia (para 1 amostra)

    3.1.3.1. 2 (Qui-quadrado)

    Exemplo 1: Pretende-se testar se a classe social (classe2) tem uma distribuio uniforme11no

    universo.

    Como a varivel nominal, o procedimento consiste em realizar o teste de adernciado 2(All categories equal):

    O resultado o seguinte:

    Classes so ciais (ACM) prprio

    175 256.6 -81.6

    191 256.6 -65.6

    81 256.6 -175.6

    413 256.6 156.4

    423 256.6 166.4

    1283

    Empresrios, dirigentese profissionais liberais

    Profissionais tcnicos ede enquadramento

    Trabalhadoresindependentes

    Empregados executantes

    Operrios

    Total

    Observed N Expected N ResidualTest Statisti cs

    366.123

    4

    .000

    Chi-Squarea

    df

    Asymp. Sig.

    Classessociais (ACM)

    prprio

    0 cells (.0%) have expected frequencies less than5. The minimum expected cell frequency is 256.6.

    a.

    Interpretao: A varivel classe social no segue uma distribuio uniforme no universo

    (2

    (4)=366,123;p=0,000).

    11Testando se as frequncias observadas so iguais s frequncias esperadas.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    41/79

    41

    3.1.3.2. Kolmogorov-Smirnov

    Exemplo:Pretende-se testar se o interesse pela poltica (ib1) segue uma distribuio normal ouuniforme no universo.

    Como a varivel ordinal, o procedimento consiste em realizar o teste de adernciade Kolmogorov-Smirnov para as duas distribuies:

    O resultado o seguinte:

    One-Sample Kolmogo rov-Smirnov Test

    1503

    2.13

    .961

    .206

    .206

    -.198

    8.001

    .000

    N

    Mean

    Std. Deviation

    Normal Parametersa,b

    Absolute

    Positive

    Negative

    Most ExtremeDifferences

    Kolmogorov-Smirnov Z

    Asymp. Sig. (2-tailed)

    Qual o seuinteresse

    pela poltica

    Test distribution is Normal.a.

    Calculated from data.b.

    One-Sample Kol mogorov-Smirnov Test 2

    1503

    1

    4

    .325

    .325

    -.078

    12.613

    .000

    N

    Minimum

    Maximum

    Uniform Parametersa,b

    Absolute

    Positive

    Negative

    Most ExtremeDifferences

    Kolmogorov-Smirnov Z

    Asymp. Sig. (2-tailed)

    Qual o seuinteresse

    pela poltica

    Test distribution is Uniform.a.

    Calculated from data.b.

    Interpretao: A varivel interesse pela poltica no segue uma distribuio normal(K-S=8,001;p=0,000) nem uniforme (K-S=12,613;p=0,000) no universo.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    42/79

    42

    3.1.3.3 Teste t de Student

    Exemplo:Pretende-se testar se a confiana social adere mdia que corresponde ao centro daescala (5)12dos indicadores que compem a varivel (confsoc).

    Como a varivel quantitativa, o procedimento consiste em realizar o teste t deaderncia (One-Sample T-Test), comparando se a mdia observada diferesignificativamente de 5:

    O resultado o seguinte:

    One-Sample Statistics

    1480 4.316 1.7469 .0454ndice sinttico deConfiana social

    N Mean Std. Deviation Std. ErrorMean

    One-Sample Test

    -15.073 1479 .000 -.684 -.774 -.595ndice sinttico deConfiana social

    t df Sig. (2-tailed)Mean

    Difference Lower Upper

    95% ConfidenceInterval of the Difference

    Test Value = 5

    Interpretao: A mdia observada 4,3, diferindo significativamente da mdia de referncia(t(1479)= -15,073;p=0,000).

    12A escala de medida dos indicadores de confiana social varia entre 0=nenhuma e 10=toda.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    43/79

    43

    3.2. Anlise de dados bivariada3.2.1. Cruzamentos e teste de independncia 2(Qui-quadrado)

    Exemplo 1:Pretende-se saber se h relao entre o sexo e o facto de ter comprado produtos por

    razes de ordem poltica, tica ou ambiental.

    O procedimento consiste em cruzar as variveis sexo (f2) e (b22) e solicitar o testede independncia do 2*.

    a) Utilizando o comando Crosstabs

    O resultado o seguinte:

    Sexo * Comprou produtos por razes de ordem poltica,tica ou ambiental Crosstabulation

    % within Sexo

    7.2% 92.8% 100.0%

    7.7% 92.3% 100.0%

    7.5% 92.5% 100.0%

    Masculino

    Feminino

    Sexo

    Total

    Sim No

    Comprou produtos porrazes de ordempoltica, tica ou

    ambiental

    Total

    Chi-Square Tests

    .121b 1 .728

    .062 1 .804

    .122 1 .727

    .766 .404

    .121 1 .728

    1495

    Pearson Chi-Square

    Continuity Correction a

    Likelihood Ratio

    Fisher's Exact Test

    Linear-by-LinearAssociation

    N of Valid Cases

    Value df Asymp. Sig.

    (2-sided)Exact Sig.(2-sided)

    Exact Sig.(1-sided)

    Computed only for a 2x2 tablea.

    0 cells (.0%) have expected count less than 5. The minimum expected count is46.75.

    b.

    Interpretao: As mulheres compram ligeiramente mais que os homens mas as diferenas noso estatisticamente significativas (2(1)=0,121;p>0,05).

    *Para a seleco dos testes estatsticos, ver o Anexo 1.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    44/79

    44

    b) Utilizando o comando Tables

    O resultado o seguinte:

    7.2 92.8 100.0

    7.7 92.3 100.0

    7.5 92.5 100.0

    Masculino

    Feminino

    Total

    SexoSim No Total

    Comprou produtos por razes deordem poltica, tica ou ambiental

    Pearson Chi-Square Tests

    .121

    1

    .728

    Chi-square

    df

    Sig.

    Sexo

    Comprouprodutos por

    razes de

    ordempoltica, ticaou ambiental

    Results are based on nonempty rows andcolumns in each innermost subtable.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    45/79

    45

    3.2.2. Testes no paramtricos (procedimento Non Parametric Tests)

    3.2.2.1. Duas amostras independentes

    (Mann-Whitney eKolmogorov-Smirnov)

    Exemplo 1: Pretende-se testar se h relao entre o sexo (f2) e o interesse pela poltica (ib1).

    O procedimento consiste na realizao do teste no paramtrico para 2 amostrasindependentes (Mann-Whitney)13.

    O resultado o seguinte:

    Ranks

    628 815.82 512336.00

    875 706.19 617920.00

    1503

    SexoMasculino

    Feminino

    Total

    Qual o seu interessepela poltica

    N Mean Rank Sum of Ranks

    Test Statisticsa

    234670.000

    617920.000

    -5.058

    .000

    Mann-Whitney U

    Wilcoxon W

    Z

    Asymp. Sig. (2-tailed)

    Qual o seuinteresse

    pela poltica

    Grouping Variable: Sexoa.

    Interpretao: a mdia das ordenaes (Mean Rank) superior nos homens. Ou seja, os homensreferem que tm mais interesse pela poltica do que as mulheres. As diferenas soestatisticamente significativas (M-W=234670;p=0,000).

    13Consultar o Anexo 1.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    46/79

    46

    Exemplo 2: Pretende-se testar se h relao entre o sexo (f2) e o grau de escolaridade (escol).

    O procedimento consiste na em fazer o cruzamento entre as 2 variveis e realizar doteste no paramtrico para duas amostras independentes (Kolmogorov-Smirnov)14.

    14Consultar o Anexo 1.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    47/79

    47

    O resultado o seguinte:

    67.9 18.9 13.2 100.0

    70.3 15.0 14.7 100.069.3 16.6 14.0 100.0

    Masculino

    FemininoTotal

    SexoAt 9 anos 10 - 12 > 12 anos Total

    Anos de escolaridade concludos

    Test Statisticsa

    .025

    .025

    -.014

    .476

    .977

    Absolute

    Positive

    Negative

    Most ExtremeDifferences

    Kolmogorov-Smirnov Z

    Asymp. Sig. (2-tailed)

    Escolaridade

    Grouping Variable: Sexoa.

    Interpretao: Tanto no grau de escolaridade intermdio como no superior, verifica-se que hmais homens do que mulheres, observando-se o inverso no grau de escolaridade mais baixo. Noentanto, as diferenas no so estatisticamente significativas (K-S=0,476;p>0,05).

    3.2.2.2. K amostras independentes (Kruskal-Wallis)

    Exemplo: Pretende-se testar se h relao entre a idade (idade2) e o interesse pela poltica (ib1).

    O procedimento consiste na realizao do teste no paramtrico para k amostrasindependentes (Kruskal-Wallis)15.

    O resultado o seguinte:

    15Consultar o Anexo 1.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    48/79

    48

    27.4 33.6 31.9 7.1 100.0

    28.0 28.8 32.9 10.3 100.0

    30.7 30.4 29.7 9.3 100.0

    45.8 25.1 25.6 3.5 100.0

    32.5 29.3 30.3 7.8 100.0

    At 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    Total

    Idade

    Nenhuminteresse

    Poucointeresse

    Alguminteresse

    Muitointeresse Total

    Qual o seu interesse pela poltica

    Ranks

    339 777.35

    504 803.46

    313 768.74

    347 637.38

    1503

    IdadeAt 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    Total

    Qual o seu interessepela poltica

    N Mean Rank

    Test Statisticsa,b

    36.088

    3

    .000

    Chi-Square

    df

    Asymp. Sig.

    Qual o seuinteresse

    pela poltica

    Kruskal Wallis Testa.

    Grouping Variable: Idadeb.

    Interpretao: A mdia das ordenaes (Mean Rank) mais elevada nos que tm entre 31 e 50 anos,sendo este escalo, por conseguinte, que refere ter mais interesse pela poltica, enquanto os maisvelhos so os que revelam menos interesse. As diferenas so estatisticamente significativas (K-W(3)=36,088;p=0,000).

  • 7/21/2019 Manual Amostragem Introduo SPSS

    49/79

    49

    3.2.3. Testes paramtricos (procedimento Compare Means)

    3.2.3.1. Duas amostras emparelhadas (t de Student para amostras

    emparelhadas)

    Exemplo: Pretende-se testar se a mdia da confiana social (confsoc) idntica, ou no, mdia

    da confiana institucional (confinst).

    O procedimento consiste na realizao do teste paramtrico para duas amostrasemparelhadas (Paired-Samples T-Test)16.

    O resultado o seguinte:

    Paired Samples Statistics

    4.313 1319 1.7165 .0473

    4.087 1319 1.7606 .0485

    ndice sinttico deConfiana social

    ndice sinttico deConfiana institucional

    Pair 1Mean N Std. Deviation

    Std. ErrorMean

    Paired Samples Correlations

    1319 .310 .000

    ndice sinttico deConfiana social &ndice sinttico deConfiana institucional

    Pair 1N Correlation Sig.

    Paired Samples Test

    .225 2.0428 .0562 .115 .336 4.009 1318 .000ndice sinttico deConfiana social -ndice sinttico deConfiana institucional

    Pair 1

    Mean Std. DeviationStd. Error

    Mean Lower Upper

    95%Confidence

    Interval of theDifference

    Paired Differences

    t df Sig. (2-tailed)

    Interpretao: A mdia da confiana social (4,313) ligeiramente superior mdia da confianainstitucional (4,087). A correlao entre as duas variveis mdia fraca (0,310) e estatisticamentesignificativa (p=0,000), sendo igualmente estatisticamente significativa a diferena entre as duasmdias (t (1318)=4,009;p=0,000).

    16Consultar o Anexo 1.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    50/79

    50

    3.2.3.2. Duas amostras independentes

    (t de Student de independncia)

    Exemplo: Pretende-se testar se h relao entre o sexo (f2) e a confiana social (confsoc).

    O procedimento consiste na realizao do teste paramtrico para duas amostrasindependentes (Independent-Samples T-Test)17.

    O resultado o seguinte:

    Group Statistics

    612 4.412 1.7476 .0706

    868 4.248 1.7442 .0592

    SexoMasculino

    Feminino

    ndice sinttico deConfiana social

    N Mean Std. Deviation

    Std. Error

    Mean

    Independent Samples Test

    .182 .669 1.781 1478 .075 .164 .0921 -.0167 .3448

    1.780 1313.926 .075 .164 .0922 -.0167 .3449

    Equal variances assumed

    Equal variances notassumed

    ndice sinttico deConfiana social

    F Sig.

    Levene's Testfor Equality of

    Variances

    t df Sig. (2-tailed)Mean

    DifferenceStd. ErrorDifference Lower Upper

    95%Confidence

    Interval of theDifference

    t-test for Equality of Means

    Interpretao: Os homens (4,412) revelam mais confiana social que as mulheres (4,248)18,embora a diferena no seja estatisticamente significativa, (t (1480)=1,808;p> 0,05).

    17Consultar o Anexo 1.18O ndice de confiana social varia entre 0=nenhuma confiana e 10=toda a confiana.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    51/79

    51

    3.2.3.3. k amostras independentes (Anlise de Varincia Simples Paramtrica -ANOVA)

    Exemplo: Pretende-se testar se h relao entre a idade (idade2) e a confiana social (confsoc).

    O procedimento consiste na realizao da Anlise de Varincia Simples Paramtrica(One-way Anova)19.

    O resultado o seguinte:

    Descriptives

    ndice sinttico de Confiana social

    338 4.722 1.5585 .0848 4.555 4.889 .0 9.3

    497 4.058 1.6747 .0751 3.911 4.206 .0 9.3

    312 4.068 1.8340 .1038 3.864 4.273 .0 10.0

    333 4.519 1.8500 .1014 4.319 4.718 .0 10.0

    1480 4.316 1.7469 .0454 4.226 4.405 .0 10.0

    At 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    Total

    N Mean Std. Deviation Std. Error Lower Bound Upper Bound

    95% Confidence Interval forMean

    Minimum Maximum

    Test of Homogeneity of Variances

    ndice sinttico de Confiana social

    4.050 3 1476 .007

    LeveneStatistic df1 df2 Sig.

    ANOVA

    ndice sinttico de Confiana social

    121.466 3 40.489 13.607 .000

    4391.954 1476 2.976

    4513.420 1479

    Between Groups

    Within Groups

    Total

    Sum ofSquares df Mean Square F Sig.

    19Consultar o Anexo 1.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    52/79

    52

    Interpretao: So os mais novos (4,722), seguidos dos mais velhos (4,519) que mais confiam.Os escales intermdios 31-50 anos (4,058) e 51-65 anos ( (4,068) confiam um pouco menos. Asdiferenas so estatisticamente significativas (F (3)=13,787;p=0,000).

    Nota: sendo as diferenas estatisticamente significativas, importa saber quais os grupos quediferem uns dos outros. Para o efeito realiza-se um teste posteriori (Post Hoc). O SPSSdisponibiliza vrios testes para este fim, sendo os mais utilizados, o teste de Scheffe20, no caso deas varincias serem iguais, e o teste Games-Howellno caso de serem diferentes.

    Neste caso, uma vez que se rejeita a hiptese de as varincias serem iguais (p=0,007), vamossolicitar o teste Games-Howell:

    O resultado o seguinte:

    Multiple Comparisons

    Dependent Variable: ndice sinttico de Confiana social

    Games-Howell

    .664* .1133 .000 .372 .955

    .654* .1340 .000 .308 .999

    .203 .1321 .415 -.137 .544

    -.664* .1133 .000 -.955 -.372

    -.010 .1282 1.000 -.340 .320

    -.460* .1262 .002 -.785 -.135-.654* .1340 .000 -.999 -.308

    .010 .1282 1.000 -.320 .340

    -.450* .1451 .011 -.824 -.076

    -.203 .1321 .415 -.544 .137

    .460* .1262 .002 .135 .785

    .450* .1451 .011 .076 .824

    (J) IdadeAt 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    At 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anosAt 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    At 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    (I) IdadeAt 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    MeanDifference (I-J) Std. Error Sig. Lower Bound Upper Bound

    95% Confidence Interval

    The mean difference is significant at the .05 level.*.

    20Que tambm o mais conservador,

  • 7/21/2019 Manual Amostragem Introduo SPSS

    53/79

    53

    Interpretao: os grupos que diferem estatisticamente entre si esto assinalados com um *. Oquadro seguinte sintetiza as diferenas significativas entre os quatro escales etrios

    At 30 anos 31-50 anos 51-65 anos > 65 anosAt 30 anos X X31-50 anos X X51-65 anos X X> 65 anos X X

    3.2.4. Correlao linear simples

    A correlao linear simples permite obter uma medida (coeficiente de correlao r de Pearson)atravs da qual se determina a fora ou intensidade de uma associao linear entre duas ou maisvariveis quantitativas ou tratadas como tal (escalas tipoLikert).

    O coeficiente de correlao varia entre 1 e 121e deve ser interpretado da seguinte forma:0: ausncia de correlao;+/- ]0 0,25]: correlao muito fraca;+/- ]0,25 0,40] correlao fraca;+/- ]0,40 0,60] correlao mdia;+/- ]0,60 0,75] correlao mdia forte;+/- ]0,75 0,90] correlao forte;+/- ]0,90 1[ correlao muito forte;+/- 1 correlao perfeita

    Exemplo: Correlao entre as variveis satisfao com a vida (b29), com a economia (b30), com oGoverno (b31), com a democracia (b32), com a educao (b33) e com os servios desade (b34):

    21O sinal significa uma correlao negativa e a ausncia de sinal uma correlao positiva.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    54/79

    54

    O resultado o seguinte:

    Correlations

    .339**

    .000

    1441

    .280** .578**

    .000 .000

    1413 1392

    .348** .403** .507**

    .000 .000 .000

    1371 1353 1339

    .205** .361** .289** .300**

    .000 .000 .000 .000

    1429 1389 1367 1338

    .195** .396** .340** .294** .537**

    .000 .000 .000 .000 .000

    1489 1440 1412 1370 1433

    Pearson Correlation

    Sig. (2-tailed)N

    Pearson Correlation

    Sig. (2-tailed)

    N

    Pearson Correlation

    Sig. (2-tailed)

    N

    Pearson Correlation

    Sig. (2-tailed)

    N

    Pearson Correlation

    Sig. (2-tailed)

    N

    Pearson Correlation

    Sig. (2-tailed)

    N

    Satisfao com a

    vida em geral

    Economia

    Governo

    Democracia

    Educao

    Servios de Sade

    Satisfaocom a vidaem geral Economia Governo Democracia Educao

    Serviosde Sade

    Correlation is significant at the 0.01 level (2-tailed).**.

    Interpretao: as correlaes so positivas e significativas entre todas as variveis ; (p=0,000),sendo a menor entre a satisfao com a vida e com a educao (0,209e a maior entre a satisfaocom o Governo e com a economia (0,577

  • 7/21/2019 Manual Amostragem Introduo SPSS

    55/79

    55

    3.3. Modelos de previso3.3.1. Anlise de Regresso Simples

    A regresso linear, como referem Bryman e Cramer, um poderoso instrumento para resumir anatureza da associao entre variveis e para fazer previses acerca dos valores da varivel

    dependente.22

    Na regresso linear simples, o objectivo sintetizar a associao entre duas variveis(independente e dependente), produzindo uma linha (recta de regresso) que se aproxime dosdados recolhidos. Ou seja, prever Y (varivel dependente) a partir de X (varivel independente).

    Exemplo: pretende-se saber em que medida que a confiana social (confsoc) varivelindependente explica a confiana institucional (confinst) varivel dependente.

    O procedimento consiste na realizao da Anlise de regresso linear simples entre asduas variveis:

    22Alan Bryman e Duncan Cramer, op.cit.: 212

  • 7/21/2019 Manual Amostragem Introduo SPSS

    56/79

    56

    O resultado o seguinte:

    Model Summary

    .310a .096 .095 1.6746

    Model

    1

    R R SquareAdjustedR Square

    Std. Error ofthe Estimate

    Predictors: (Constant), ndice sinttico de Confianasocial

    a.

    ANOVAb

    392.354 1 392.354 139.912 .000a

    3693.263 1317 2.804

    4085.617 1318

    Regression

    Residual

    Total

    Model1

    Sum ofSquares df Mean Square F Sig.

    Predictors: (Constant), ndice sinttico de Confiana sociala.

    Dependent Variable: ndice sinttico de Confiana institucionalb.

    Coefficients a

    2.716 .125 21.778 .000

    .318 .027 .310 11.828 .000

    (Constant)

    ndice sinttico deConfiana social

    Model1

    B Std. Error

    UnstandardizedCoefficients

    Beta

    StandardizedCoefficients

    t Sig.

    Dependent Variable: ndice sinttico de Confiana institucionala.

    Interpretao: A correlao entre as variveis fraca (R=0,310) e o coeficiente de determinao

    muito fraco (R2=0,096)23. Ou seja, apenas 9,6% da variao da confiana institucional variveldependente explicada pela variao da confiana social varivel independente.

    O teste F (quadro Anova) d-nos informao sobre a adequabilidade do modelo, testando ahiptese do coeficiente de determinao R2 ser 0 na populao. Neste caso (F (1)=141,178;

    p=0,000), rejeita-se a hiptese de isso acontecer.

    Os testes t (no quadro dos Coefficients), testam a nulidade dos coeficientes. No primeiro caso(t=115,605;p=0,000) testa a probabilidade de a constante (recta de regresso na origem) ser 0, eno segundo caso testa a probabilidade do coeficiente de regresso ser 0.A recta da regresso24, neste caso, a seguinte: Confiana institucional = 2,716 + 0,318 confianasocial.

    23O coeficiente de determinao quantifica a percentagem de variao da varivel dependentes que explicada pela

    variao da varivel independente.24A equao simplificada da recta da regresso a seguinte: Yi= 0+ 1Xi, em que Yi a varivel dependente, 0 aordenada na origem, 1 o coeficiente de regresso e Xi a varivel independente.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    57/79

    57

    3.3.2. Anlise de Regresso Mltipla

    A regresso, como referem Bryman e Cramer, um poderoso instrumento para resumir anatureza da associao entre variveis e para fazer previses acerca dos valores da varivel

    dependente.

    25

    No nosso exemplo vamos usar a anlise de regresso mltipla em concreto a linear paramodelar a relao entre as variveis independentes e a varivel dependente26.

    Exemplo: com base nos dados do ESS, pretende-se saber se os nveis de satisfao com o estadoda Economiaportuguesa(b30), com a forma como o Governotem governado(b31),com a qualidade da Democracia (b32), com o estado da Educao (b33) e com osServios de Sade (b33) so, ou no, predictores da satisfao com a vida em geral(b29):

    Varivel dependente

    Variveis independentes(b30, b31, b32, b33 e b34)

    Mtodo: Stepwise(Neste mtodo entram no modeloapenas as variveis independentescom significncia estatstica, porordem de importncia.)Nota: habitual usar-se o mtodoENTER quando se pretende

    testar um modelo e o mtodoStepwise em contextosexploratrios, como o caso.

    Procedimentos seleccionados:

    Informao sobre a significnciaestatstica da mudana deR2;

    Informao sobremulticolinearidade;

    Intervalo de confiana para cadaum dos coeficientes de regresso

    Resultado:

    25Bryman, A. e D. Cramer,Anlise de Dados em Ciencias Sociais, Oeiras, Celta, 2003.26

    Quando se associa s variveis o estatuto de independentes e dependente pretende-se analisar mais do que aassociao entre elas (entenda-se variao conjunta), descrever e explicar uma relao de dependencia que deverser tericamente fundamentada.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    58/79

    58

    Variables Entered/Removed a

    Democracia .Stepwise (Criteria: Probability-of-F-to-enter= .100).

    Economia .

    Stepwise (Criteria: Probability-of-F-to-enter

    = .100).

    Model1

    2

    VariablesEntered

    VariablesRemoved Method

    Dependent Variable: Satisfao com a vida em gerala.

    Variveis queentraram nosmodelos

    ANOVAc

    760.940 1 760.940 174.812 .000a

    5610.899 1289 4.353

    6371.839 1290

    1051.123 2 525.562 127.224 .000b

    5320.716 1288 4.131

    6371.839 1290

    Regression

    Residual

    Total

    Regression

    Residual

    Total

    Model1

    2

    Sum ofSquares df Mean Square F Sig.

    Predictors: (Constant), Democraciaa.

    Predictors: (Constant), Democracia, Economiab.Dependent Variable: Satisfao com a vida em geralc.

    O objectivo do teste F verificar se a varivelindependente influencia avarivel dependente nouniverso. O que equivale adetectar se o modeloajustado ou nosignificativo.Permite inferir sobre aadequabilidade do modelo

    linear para explicar a relaoentre as duas variveis.

    Model Summary

    .346a .119 .119 2.086 .119 174.812 1 1289 .000

    .406b .165 .164 2.032 .046 70.245 1 1288 .000

    Model1

    2

    R R SquareAdjustedR Square

    Std. Error ofthe Estimate

    R SquareChange F Change df1 df2 Sig. F Change

    Change Statistics

    Predictors: (Constant), Democraciaa.

    Predictors: (Constant), Democracia, Economiab.

    Coeficiente de correlaomltipla em mdulo % de variao da satisfaocom a vida em geral explicadapelas variveis independentesque entraram no modeloNota: Em modelos com mas do que 1varivel independente deve interprtar-se o R2ajustado

    Contributo das variveisindependentes para amudana verificada noR2;

    Teste F erespectivasignificnciaestatstica

    Coefficientsa

    4.221 .133 31.764 .000 3.960 4.481

    .350 .026 .346 13.222 .000 .298 .402 1.000 1.000

    3.841 .137 28.013 .000 3.572 4.110.254 .028 .251 9.002 .000 .199 .309 .835 1.197

    .276 .033 .234 8.381 .000 .212 .341 .835 1.197

    (Constant)

    Democracia

    Economia

    (Constant)Democracia

    Economia

    Model1

    2

    B Std. Error

    UnstandardizedCoefficients

    Beta

    StandardizedCoefficients

    t Sig. Lower Bound Upper Bound

    95% Confidence Interval forB

    Tolerance VIF

    CollinearityStatistics

    Dependent Variable: Satisfao com a vida em gerala.

    Coeficientes de regresso standardizados e nostandardizados que permitem escrever a equao darecta:Satisfao com a vida = 3,841 + 0,254 satisfao com ademocracia + 0,276 satisfao com a economia.

    Quando a tolerncia baixa, a correlaomltipla elevada e existe a possibilidade demulticolinearidade. Com estes valores, aprobabilidade de isso acontecer baixa.Varia entre [0, 1] e quanto mais perto de 0 maiorser a multicolinearidade entre certa varivelindependente e as outras variveis independentes.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    59/79

    59

    3.4. Anlise de dados multivariada3.4.1. Anlise das Componentes Principais

    A Anlise das Componentes Principais um dos mtodos de reduo de dados mais comum no

    marketing e em pesquisas de mercado. uma tcnica de anlise exploratria multivariada quetransforma um conjunto de variveis correlacionadas entre si num conjunto menor de variveisindependentes, combinaes lineares das variveis originais, designadas por componentes

    principais27. No essencial, o seu objectivo identificar novas variveis, em nmero menor que oconjunto inicial, mas sem perda significativa da informao contida neste conjunto28.

    No nosso exemplo, pretendemos identificar as componentes principais latentes nos 8indicadores relativos s atitudes face imigrao (d10 + d11 + d12 +d13 + d14 +d15 + d16 +

    d17).

    Vamos comear por solicitar uma ACP com a extraco das componentes por defeito (critrio de

    Kaiser: valor prprio das componentes a 1).

    Seleco dasvariveis;

    Kaiser-Meyer-Olkin: quantificao nvel de intercorrelaes entre

    as variveis; Testa a hiptese de a matriz decorrelaes na populao ser amatriz identidade.

    27

    Moroco, J.Anlise Estatstica com utilizao do SPSS, Lisboa, Slabo, 2003: 231.28Reis, E., Anlise factorial das componentes principais: um mtodo de reduzir sem perder informao, LisboaGiesta/Iscte, 1990.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    60/79

    60

    Critrio de Kaiser deextraco das componentesque o SPSS usa por defeito.So extradas ascomponentes com valores

    prprias superiores a 1.Cada componente devecontribuir para a varincia,como se de uma varivel deinput se tratasse.

    Rotao das componentes erespectiva matriz.

    Nota: tem o objectivo de ajudar ainterpretar as componentes

    Ordena a matriz rodada por ordemdecrescente da contribuio de

    cada varivel para a componente;

    Adequabilidade da ACP:

    KMO and Bartl ett's Test

    .812

    3474.721

    28

    .000

    Kaiser-Meyer-Olkin Measure of Sampling

    Adequacy.

    Approx. Chi-Square

    df

    Sig.

    Bartlett's Test ofSphericity

    KMO Qualidade da ACP1 0,9 Muito boa

    0,8 0,9 Boa

    0,7 0,8 Mdia

    0,6 0,7 Razovel

    0,5 0,6 M

    >0,5 Inaceitvel

    De acordo com os resultados da estatstica KMO (0,812) e do teste de esfericidade de Bartlett(p=0,000), a adequabilidade da ACP boa.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    61/79

    61

    Total Variance Explained

    3.518 43.975 43.975 3.518 43.975 43.975 3.007 37.587 37.587

    1.283 16.043 60.018 1.283 16.043 60.018 1.795 22.432 60.018

    .978 12.230 72.248

    .539 6.739 78.987

    .493 6.165 85.153

    .419 5.244 90.396

    .391 4.885 95.282

    .377 4.718 100.000

    Component1

    2

    3

    4

    56

    7

    8

    Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %

    Initial Eigenvalues Extract ion Sums of Squared Loadings Rotation Sums of Squared Loadings

    Extraction Method: Principal Component Analysis.

    Como podemos observar, por defeito foram extradas duas componentes, que explicam cerca de60% da varincia total.

    Verificando-se que a terceira componente tem uma valor prprio prximo de 1 (0,984) e queaumenta a varincia explicada em 12,3%, vamos forar a sua extraco e gravar as trs

    componentes extradas como novas variveis:

    Cria novas variveis compostas pelosscores factoriais das componentesextradas.

    Os resultados so os seguintes:

    Descriptive Statistics

    6.11 2.527 1330

    6.44 2.407 1330

    6.01 2.615 1330

    3.77 2.906 1330

    2.82 2.825 1330

    6.77 2.812 1330

    7.45 2.247 13307.07 2.448 1330

    Ter boas qualificaes acadmicas

    Ter familiares prximos a viver c

    Saber falar a lngua oficial do pas

    Ter formao crist

    Ser branco

    Ser rico

    Ter qualificaes profissionais de que o pas precisaQuerer adaptar-se ao mesmo modo de vida do pas

    MeanStd.

    DeviationAnalysis

    N KMO and Bartlett's Test

    .812

    3474.721

    28

    .000

    Kaiser-Meyer-Olkin Measure of SamplingAdequacy.

    Approx. Chi-Square

    df

    Sig.

    Bartlett's Test ofSphericity

  • 7/21/2019 Manual Amostragem Introduo SPSS

    62/79

    62

    Communalities

    1.000 .590

    1.000 .788

    1.000 .719

    1.000 .756

    1.000 .786

    1.000 .7221.000 .749

    1.000 .669

    Ter boas qualificaes acadmicas

    Ter familiares prximos a viver c

    Saber falar a lngua oficial do pas

    Ter formao crist

    Ser branco

    Ser ricoTer qualificaes profissionais de que o pas precisa

    Querer adaptar-se ao mesmo modo de vida do pas

    Initial Extraction

    Extraction Method: Principal Component Analysis.

    As Comunalidadesrepresentam aproporo de varincia da varivelexplicada pelas componentes.Variveis com comunalidadesreduzidas (0,3 ou inferior) so

    pouco explicadas pelascomponentes e contribuem pouco

    para a sua definio.

    Total Variance Explained

    3.518 43.975 43.975 3.518 43.975 43.975 2.152 26.898 26.898

    1.283 16.043 60.018 1.283 16.043 60.018 1.951 24.389 51.287

    .978 12.230 72.248 .978 12.230 72.248 1.677 20.961 72.248

    .539 6.739 78.987

    .493 6.165 85.153

    .419 5.244 90.396

    .391 4.885 95.282

    .377 4.718 100.000

    Component1

    2

    3

    4

    5

    6

    78

    Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %

    Initial Eigenvalues Extract ion Sums of Squared Loadings Rotat ion Sums of Squared Loadings

    Extraction Method: Principal Component Analysis.

    Rotated Component Matrixa

    .785 .361 -.053

    .775 .244 .089

    .771 -.014 .358

    .110 .880 .047

    .260 .741 .319

    .487 .587 .090

    .124 .011 .878

    .094 .305 .809

    Ter qualificaes profissionais de que o pas precisa

    Querer adaptar-se ao mesmo modo de vida do pas

    Ser rico

    Ter familiares prximos a viver c

    Saber falar a lngua oficial do pas

    Ter boas qualificaes acadmicas

    Ser branco

    Ter formao crist

    1 2 3

    Component

    Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.

    Rotation converged in 4 iterations.a.

    Foram extradas 3 componentes (factores), que explicam 72,25% da varincia total.

    A matriz rodada29

    ajuda-nos a identificar e a designar as componentes: Componente 1: recursos profissionais e econmicos; Componente 2: facilidades de integrao; Componente 3: caractersticas raciais e religiosas. Caracterizao social das trs Componentes Principais

    29O SPSS utiliza vrias formas de rotao, sendo a mais usada a rotao Varimax, de modo a permitir uma mais fcilinterpretao dos factores, pois torna os loadings elevados ainda mais elevados e os loadings baixos ainda maisbaixos. Para a interpretao das componentes consideram-se os loadings mais correlacionados com as mesmas.

    Em geral, consideram-se bons os loadings maiores ou iguais a 0,5, por serem pelo menos responsveis por 25% davarincia. (cfr. Pestana e Gageiro, Anlise de Dados para as Cincias Sociais A complementaridade do SPSS,Lisboa, Slabo, 3 edio, 2003: 504.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    63/79

    63

    Masculino

    Feminino

    Sexo

    Recursos profissionais e econmicosFacilidades de integrao

    Caractersticas raciais e religiosas

    -0,05

    0,00

    0,05

    m

    dia

    At 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    Idade

    Recursos profissionais e econmicosFacilidades de integrao

    Caractersticas raciais e religiosas

    -0,20

    0,00

    0,20

    mdia

    At 9 anos

    10 - 12 anos> 12 anos

    Escolaridade

    Recursos profissionais e econmicosFacilidades de integrao

    Caractersticas raciais e religiosas

    -0,40

    -0,30

    -0,20

    -0,10

    0,00

    0,10

    mdia

    Esquerda

    CentroDireita

    Au top os ic ion ament o po lt ico

    Recursos profissionais e econmicosFacilidades de integrao

    Caractersticas raciais e religiosas

    -0,10

    0,00

    0,10

    mdia

    Anlise de Clusters

    De acordo com Moroco,30 a anlise de Clusters uma tcnica multivariada que no possuislidos fundamentos tericos e que procura agrupar objectos mais ou menos homogneos segundocritrios mais ou menos heursticos.

    A classificao dos sujeitos em cada um dos clusters , regra geral, mais rigorosa nos mtodosno-hierrquicos do que nos hierrquicos, podendo a validade das solues obtidas com osmtodos hierrquicos segundo Elizabeth Reis tornar-se bastante limitada. Alguns autores

    propem, por isso, a utilizao de mtodos no-hierrquicos de optimizao que permitam apartio dos indivduos num nmero pr definido de grupos.

    A questo de determinao do nmero de grupos pr definido , no entanto, um dos principaisproblemas a resolver numa anlise de clusters. Uma forma simples a anlise do Dendrograma

    30Cfr. Reis, Elizabeth,A Anlise de Clusters e as Aplicaes s Cncias Empresariais: Uma Viso Crtica da Teoria

    dos Grupos Estratgicos, in Elizabeth Reis e Manuel Alberto M. Ferreira (eds.) Temas em Mtodos Quantitativos1, Lisboa, Slabo, 2000: 206-238 e Moroco, Joo, Anlise Estatstica com utilizao do SPSS, Lisboa, Slabo,2003

  • 7/21/2019 Manual Amostragem Introduo SPSS

    64/79

    64

    que, no entanto, s est disponvel no mtodo hierrquico, resumindo-se a sua utilidade apenas emamostras de pequena dimenso. Quando no esse o caso, ou se se pretende usar um mtodo no-hierrquico, poder-se- utilizar primeiro um mtodo hierrquico aglomerativo para determinaodo nmero de grupos e depois utilizar um mtodo no-hierrquico para optimizar a soluoencontrada.

    Uma forma de obviar limitao do dendrograma na determinao do nmero de grupos, proceder representao grfica dos coeficientes de aglomerao mais elevados31, que denotam,por conseguinte, maiores distncias, onde a escolha ptima do nmero de grupos coincidir comuma marcada horizontalidade da curva32.

    3.4.2.1. Anlise hierrquica de Clusters (Hierarquical Cluster)

    Exemplo: pretende-se seleccionar e criar clusters com base nos 8 indicadores relativos s atitudesface imigrao (d10 +d11 +d12 +d13 +d14 +d15 +d16 +d17)

    Seleco das variveis; Para obter os coeficientes de

    aglomerao Desactivar Plots, pois o

    Dendrogramaseria demasiadoextenso para poder serinterpretado.

    Escolha do MtodoBetwen-groups linkage(Distncia mdia entre grupos): adistncia do 1 cluster aos restantes objectos a mdia dasdistncias de cada um dos elementos que constituem ocluster a cada um dos restantes objectos. Melhor performance com dados com grande disperso; Influenciado por outliers; Tendncia para produzir clusters com varincias

    homogneas.Within-groups linkage: Este mtodo semelhante Distncia mdia entre grupos mas os clusters so unidosde modo a que a variabilidade dentro dos grupos sejamnima.

    Nearest Neighbor(Vizinho mais prximo): a distncia do1 cluster aos restantes objectos, a menor das distnciasde cada um dos elementos que constituem o cluster a cadaum dos restantes objectos. Tendncia para formar clusters alongados; Menos influenciado por outliers;Furthest Neighbor(Vizinho mais distante): a distncia do1 cluster aos restantes objectos, a maior das distnciasde cada um dos elementos que constituem o cluster a cadaum dos restantes objectos. Menos influenciado por outliers;

    31

    Estes coeficientes so o valor numrico para o qual vrios indivduos ou grupos se unem para formarem um novogrupo e so disponibilizados pelo SPSS no mtodo hierrquico (Aglomeration Schedule).32Reis, op.cit.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    65/79

    65

    Escolhemos o Wards method, pois, sendo umdos mtodos mais usado, tem tendncia paraconstituir grupos com dimenses idnticas.

    Centroid clustering: a distncia entre dois grupos adiferena entre as suas mdias para todas as variveis. Pior performance com dados com grande disperso Menos influenciado por outliers;Median clustering(Distncia mediana): A distncia entredois objectos a mediana das distncias de cada um doselementos que constituem o cluster a cada um dos restantesobjectos.

    Wards method: optimiza a varincia mnima dentro dosgrupos, agrupando os objectos que provoquem umaumento mnimo da soma dos quadrados dos erros. Boa performance com dados com grande disperso; Influenciado por outliers Tendncia para produzir clusters com dimenso

    semelhante.

    Para a identificao do n de clusters, vamos representar graficamente (em Excel) as diferenasentre os 30 coeficientes de aglomerao com valor mais elevado, produzidos pelo SPSS(Agglomeration schedule).

  • 7/21/2019 Manual Amostragem Introduo SPSS

    66/79

    66

    Optamos por uma soluo de 4 clusters.33

    Deveremos agora repetir os procedimentos anteriores no SPSS, desactivar Statistics34e solicitar aopo Save, assinalando o n de clusters que pretendemos:

    A varivel CLU4-1 (primeira soluo com 4 clusters) acrescentou-se base de dados, tendo sidocompletada com os respectivos label.

    O n de elementos em cada cluster o seguinte:

    CLU4_1 Clusters d10 a d17 (Ward Method)

    498 33.0 37.4 37.4

    299 19.8 22.5 59.9

    423 28.0 31.8 91.7

    110 7.3 8.3 100.0

    1330 88.0 100.0

    181 12.0

    1511 100.0

    Cluster 1

    Cluster 2

    Cluster 3

    Cluster 4

    Total

    Valid

    SystemMissing

    Total

    Frequency Percent Valid PercentCumulative

    Percent

    33Pois so os que apresentam maior distncia entre si. No entanto, seria sempre possvel ensaiar solues com mais

    clusters. No essencial, mais clusters significam mais homogeneidade entre os seus elementos e menos clustersmenos homogeneidade.34Uma vez que j no necessitamos dos coeficientes de aglomerao.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    67/79

    67

    3.4.2.2. Anlise no-hierrquica de Clusters - Mtodo de optimizao

    (K-Means Cluster)

    Exemplo: pretende-se seleccionar e criar clusters com base nos 8 indicadores relativos s atitudes

    face imigrao (d10 +d11 +d12 +d13 +d14 +d15 +d16 +d17)

    1.Seleco dasvariveis;

    2.Indicao do n deClusters

    pretendidos (vamosindicar 4, de acordocom o processoanterior)

    3.Criao de umanova varivel queregista a pertenade cada observaoao clusterrespectivo

    A varivel QCL_1 (primeira soluo com 4 clusters) acrescentou-se base de dados, tendo sido

    completada com os respectivos label.

    O resultado o seguinte:

    QCL_1 Clusters d10 a d17 (K-Means)

    334 22.1 25.1 25.1459 30.4 34.5 59.6

    324 21.4 24.4 84.0

    213 14.1 16.0 100.0

    1330 88.0 100.0

    181 12.0

    1511 100.0

    Cluster 1Cluster 2

    Cluster 3

    Cluster 4

    Total

    Valid

    SystemMissing

    Total

    Frequency Percent Valid PercentCumulative

    Percent

  • 7/21/2019 Manual Amostragem Introduo SPSS

    68/79

    68

    3.4.3. Articulao entre a Anlise das Componentes Principais e a

    Anlise de Clusters

    Para este exemplo interessa saber, no entanto, que a anlise de clusters uma tcnica

    multivariada que no possui slidos fundamentos tericos e que procura agrupar objectos mais oumenos homogneos segundo critrios mais ou menos heursticos35.

    Exemplo: Pretende-se criar trs clusters (grupos homogneos) com base nas trs componentesprincipais obtidas no exerccio anterior.

    Trata-se de um mtodo de classificao (classifica indivduos), cujo procedimento, que vai serdescrito detalhadamente no captulo 5, o seguinte:

    a) Criao dos clusters

    Acrescentou-se base de dados uma nova varivel com 3 categorias, que designmos de Cluster 1,Cluster 2 e Cluster 3, que agrupa os indivduos com valores semelhantes nas trs Componentes36

    35

    Moroco, J.Anlise Estatstica com utilizao do SPSS, Lisboa, Slabo, 2003.36Nota: como se torna evidente, os valores so mais ou menos semelhantes quantos mais ou menos clusters criarmos.Ou seja, mais clusters significa mais homogeneidade entre os clusters.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    69/79

    69

    O n de elementos em cada cluster o seguinte:

    Clusters Fac1_1+Fac1_2+Fac1_3 (Ward Method)

    480 31.8 36.1 36.1

    624 41.3 46.9 83.0

    226 15.0 17.0 100.0

    1330 88.0 100.0

    181 12.0

    1511 100.0

    Cluster 1

    Cluster 2

    Cluster 3

    Total

    Valid

    SystemMissing

    Total

    Frequency Percent Valid PercentCumulative

    Percent

    b) Caracterizao dos clusters segundo as variveis de input

    Cluster 1

    Cluster 2

    Cluster 3

    Recursos profissionais e econmicosFacilidades de integrao

    Caractersticas raciais e religiosas

    -1.50

    -1.00

    -0.50

    0.00

    0.50

    1.00

    (Mdias)

    Interpretao:

    Cluster 1: d importncia abaixo da mdia aos recursos profissionais e econmicos e scaractersticas raciais e religiosas e acima da mdia s facilidades de integrao;

    Cluster 2: d importncia acima da mdia aos recursos profissionais e econmicos e scaractersticas raciais e religiosas e mdia s facilidades de integrao;

    Cluster 3: d importncia mdia aos recursos profissionais e econmicos e abaixo damdia s facilidades de integrao e s caractersticas raciais e religiosas.

  • 7/21/2019 Manual Amostragem Introduo SPSS

    70/79

    70

    c) Caracterizao social dos clusters

    211 44.0 252 40.4 106 46.9 569 42.8

    269 56.0 372 59.6 120 53.1 761 57.2

    480 100.0 624 100.0 226 100.0 1330 100.0148 30.8 117 18.8 51 22.6 316 23.8

    179 37.3 197 31.6 93 41.2 469 35.3

    88 18.3 147 23.6 44 19.5 279 21.0

    65 13.5 163 26.1 38 16.8 266 20.0

    480 100.0 624 100.0 226 100.0 1330 100.0

    272 56.7 470 75.4 150 66.4 892 67.1

    100 20.8 102 16.4 39 17.3 241 18.1

    108 22.5 51 8.2 37 16.4 196 14.7

    480 100.0 623 100.0 226 100.0 1329 100.0

    111 27.3 117 22.5 47 27.6 275 25.1

    211 52.0 265 50.9 89 52.4 565 51.5

    84 20.7 139 26.7 34 20.0 257 23.4406 100.0 521 100.0 170 100.0 1097 100.0

    Masculino

    Feminino

    Total

    Sexo

    At 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    Total

    Idade

    At 9 anos

    10 - 12 anos

    > 12 anos

    Total

    Anos deescolaridadeconcludos

    Esquerda

    Centro

    DireitaTotal

    Autoposic ionamento

    poltico

    N %

    Cluster 1

    N %

    Cluster 2

    N %

    Cluster 3

    N %

    Total

    d) Distribuio dos indivduos pelos clusters, segundo caractersticas scio-demogrficas

    211 37.1 252 44.3 106 18.6 569 100.0

    269 35.3 372 48.9 120 15.8 761 100.0

    480 36.1 624 46.9 226 17.0 1330 100.0

    148 46.8 117 37.0 51 16.1 316 100.0

    179 38.2 197 42.0 93 19.8 469 100.0

    88 31.5 147 52.7 44 15.8 279 100.0

    65 24.4 163 61.3 38 14.3 266 100.0

    480 36.1 624 46.9 226 17.0 1330 100.0

    272 30.5 470 52.7 150 16.8 892 100.0

    100 41.5 102 42.3 39 16.2 241 100.0

    108 55.1 51 26.0 37 18.9 196 100.0

    480 36.1 623 46.9 226 17.0 1329 100.0

    111 40.4 117 42.5 47 17.1 275 100.0

    211 37.3 265 46.9 89 15.8 565 100.0

    84 32.7 139 54.1 34 13.2 257 100.0

    406 37.0 521 47.5 170 15.5 1097 100.0

    Masculino

    Feminino

    TotalSexo

    At 30 anos

    31 - 50 anos

    51 - 65 anos

    > 65 anos

    Total

    Idade

    At 9 anos

    10 - 12 anos

    > 12 anos

    Total

    Anos deescolaridadeconcludos

    Esquerda

    Centro

    Direita

    Total

    Autoposic ionamentopoltico

    N %

    Cluster 1

    N %

    Cluster 2

    N %

    Cluster 3

    N %

    Total

  • 7/21/2019 Manual Amostragem Introduo SPSS

    71/79

    71

    A avaliao deste captulo consiste na avaliao da participaonas aulas e da realizao dos exerccios que compem o seucontedo.

    Aranaz, M. F. (2001), SPSS para Windows. Anlise Estadstico,Madrid, McGraw-Hill.

    Bryman, A. e D. Cramer (2003), Anlise de Dados em Cincias

    Sociais Introduo s Tcnicas Utilizando o SPSS paraWindows, Lisboa, Celta (3 edio). Moroco, J. (2003) Anlise Estatstica com utilizao do SPSS,

    Lisboa, Edies Slabo, 3 edio. Pereira, A. (1999), SPSS-Guia Prtico de Utilizao, Anlise de Dados para Cincias

    Sociais e Psicologia, Lisboa, Edies Slabo, 6 edio revista e corrigida. Pestana, M. H. e J. N. Gageiro (2000), Anlise de Dados para as Cincias Sociais A

    Complementaridade do SPSS, Lisboa, Slabo, 2 edio revista e aumentada. Rada, Vidal Daz (2002), Tcnicas de Anlise Multivariante para Investigacin Social

    e Comercial, Madrid, RA-MA. Reis, E., Anlise factorial das componentes principais: um mtodo de reduzir sem

    perder informao, Lisboa Giesta/Iscte, 1990. Vaus, D (2004),Analysing Social Science Data, London, Sage Publications. Vinacua, B. V. (2002), Anlisis Estadstico con SPSS para Windows. Volumen I.

    Estadstica bsica, Madrid, McGraw-Hill, 2 edicin. Vinacua, B. V. e J. C. M Canas (2002),Anlisis Estadstico con SPSS para Windows.

    Volumen II. Estadstica multivariante, Madrid, McGraw-Hill, 2 edicin.

    Avaliao

    Referncias

  • 7/21/2019 Manual Amostragem Introduo SPSS

    72/79

    72

    ANEXO 1

    Testes de inferncia estatstica mais uti lizados

    em

    Anlise de dados bivariada

  • 7/21/2019 Manual Amostragem Introduo SPSS

    73/79

  • 7/21/2019 Manual Amostragem Introduo SPSS

    74/79

  • 7/21/2019 Manual Amostragem Introduo SPSS

    75/79

    ANEXO 2

    European Social Survey(round 1 - 2002)

    Questionrio adaptado

    http://www.europeansocialsurvey.org/

  • 7/21/2019 Manual Amostragem Introduo SPSS

    76/79

    76

  • 7/21/2019 Manual Amostragem Introduo SPSS

    77/79

    77

  • 7/21/2019 Manual Amostragem Introduo SPSS

    78/79

    78

  • 7/21/2019 Manual Amostragem Introduo SPSS

    79/79