Manual Amostragem Introdução SPSS

7/21/2019 Manual Amostragem Introduo SPSS

1/79

Manual de Amostragem e deIntroduo ao SPSS


2/79

2

Manual Amostragem e de Introduo ao SPSS

Ficha Tcnica

Autor:

------------

Resumo biogrfico:

------------

Ttulo do manual:

Manual de Amostragem e de Introduo ao SPSS

Ms e Ano de elaborao:Novembro de 2008


3/79

3

ndicePg.

Estruturao dos captulos 5Introduo 6

Captulo 1 Amostragem 7

Objectivos 7

Palavras-chave 7

Contedo temtico

1.1. Noes de amostragem 8

1.2. Mtodos de amostragem 10

1.3. Seleco das unidades amostrais 11

1.4. Margens de erro e intervalos de confiana 12

Avaliao 15

Bibliografia 15

Captulo 2 Introduo ao SPSS 16

Objectivos 16

Palavras-chave 16

Contedo temtico

2.1. Editor de dados do SPSS 17

2.2. Output do SPSS 18

2.3. Menus SPSS 19

2.4. Criao de bases de dados 22

2.5. Tratamento Preliminar de dados 22

2.5.1. Transformao algbrica de variveis 23

2.5.2. Transformao lgica de variveis 28

2.5.3. Inverso da escala de uma varivel 29

2.5.4. Variveis de contagem de ocorrncias 30

2.6. Seleco de casos 31

Avaliao 35

Referncias 36


4/79

4

Pg.Captulo 3 Estatstica aplicada com SPSS 37

Objectivos 37

Palavras-chave 37

Contedo temtico3.1. Anlise de dados univariada 38

3.1.1. Frequncias 38

3.1.2. Estatsticas descritivas e grficos de perfil 41

3.1.3. Testes de aderncia (para 1 amostra) 44

3.1.3.1. 2(Qui-quadrado) 44

3.1.3.2. Kolmogorov-Smirnov 45

3.1.3.3 Teste tde Student 46

3.2. Anlise de dados bivariada 47

3.2.1. Cruzamentos e teste de independncia 2(Qui-quadrado) 47

3.2.2. Testes no paramtricos procedimento Non Parametric Tests 50

3.2.2.1. Duas amostras independentes (Mann-Whitney e Kolmogorov-Smirnov) 50

3.2.2.2. K amostras independentes (Kruskal-Wallis) 52

3.2.3. Testes no paramtricos procedimento Compare Means 54

3.2.3.1. Duas amostras emparelhadas (t de Studentamostras emparelhadas) 54

3.2.3.2. Duas amostras independentes (t de Studentde independncia) 55

3.2.3.3. k amostras independentes (Anlise de Varincia Simples Paramtrica -ANOVA) 56

3.2.4. Correlao linear simples 59

3.3. Modelos de previso 61

3.3.1. Anlise de Regresso Simples 61

3.3.2. Anlise de Regresso Mltipla 63

3.4. Anlise de dados multivariada 66

3.4.1. Anlise das Componentes Principais 66

3.4.2. Anlise de Clusters 71

3.4.2.1. Anlise hierrquica de Clusters 72

3.4.2.2. Anlise no hierrquica de Clusters mtodo de optimizao (K-Means) 76

3.4.3. Articulao entre a Anlise das Componentes Principais r a Anlise deClusters 76

Avaliao 79

Bibliografia 79

Anexo 1: Testes de inferncia estatstica mais utilizados em Anlise bivariada 80

Anexo 2: European Social Survey (round 1 - 2002) - Questionrio adaptado 83


5/79

5

Estruturao dos captulos

Em cada captulo ou contedo temtico, o(a) aluno(a) visualizar uma estrutura que apresentar

as seguintes subdivises, a saber:

Objectivos

Objectivo(s) especfico(s), no qual cada participante conhecer a propostade aprendizagem a ser alcanada no final dessa mesma (sub)temtica e queservir de referncia para a auto-avaliao;

Palavras

Palavras-chave, que pela sua relevncia para a temtica e como realce daateno do(a) aluno(a) para determinada designao ou conceito, que ter asua definio e explicitao, no final do captulo, no espao reservado emGlossrio.

Contedo

Contedo programtico, onde se procurar desenvolver, de modo claro,objectivo e com rigor tcnico, a (sub)temtica em apreo, referenciando-seos elementos de substncia, julgados mais significativos e de interesse paraa aprendizagem do(a) aluno(a).

Avaliao

Avaliao. Neste espao ser indicada a forma de avaliao do captulo eincluda a respectiva ficha de exerccio.

Referncias

Referncias. Nesta subdiviso poder-se- encontrar uma lista de elementosbibliogrficos referentes: s citaes efectuadas ao longo do texto; s obrasconsultadas pelo autor, i. , livros, artigos, monografias, trabalhosacadmicos, endereos electrnicos, etc., que podero ajudar no trabalhode pesquisa ou de aprofundamento de saberes de cada aluno(a).


6/79

6

Introduo

O Manual de Amostragem e Introduo ao SPSS tem como objectivo principal orientar os alunosna utilizao do SPSS, constituindo-se simultaneamente como um guio da matria leccionada ede uma ficha tcnica para realizao dos exerccios propostos no mbito do da cadeira deInformtica Aplicada.

Pretende-se, deste modo, disponibilizar aos alunos um guio que lhes permita acompanhar asequncia dos pontos do programa e as respectivas aulas. Nesse sentido, este manual nodispensa a necessidade de se tirar apontamentos nas aulas, nem a leitura e consulta de outra

bibliografia, que permitir o aprofundamento dos temas, na medida em que aqui se situamapenas os principais tpicos e as balizas das matrias abordadas.

Procurou-se por isso apresentar o contedo dos vrios pontos de uma forma clara, simples esinttica, de maneira a que o essencial seja captado neste manual, podendo ser aprofundado apartir das referncias indicadas.

De acordo com o programa, este manual divide-se em trs captulos, que esto obviamenterelacionados intimamente:

- O primeiro pretende fornecer aos alunos elementos que lhes permitam construir umaamostra representativa e proceder seleco aleatria das unidades amostrais.

- O segundo tem como objectivo familiarizar os formandos com o SPSS, permitindo-lhes

criar, importar e manipular bases de dados, bem como proceder ao tratamento preliminardos dados, recodificar variveis e construir novas variveis a partir das variveisoriginais.

- O terceiro tem como objectivo dotar os formandos de competncias tcnicas e estatsticasque lhes permitam proceder anlise de dados univariada, bivariada e multrivariada,com SPSS.


7/79

Captulo 1 Amostragem

No final deste captulo os alunos devero ser capazes de:

1. seleccionar os tipos de amostra mais adequados a cada contexto;2. calcular a dimenso da amostra e a margem de erro;3. seleccionar as unidades amostrais.

- Amostra- Erro amostral- Unidades amostrais

Captulo

1Objectivos

Palavras


8/79

8

1.1. Noes de amostragem

Em Estatstica1, amostra o conjunto de elementos extrados de um conjuntomaior, chamado Populao. um conjunto constitudo de indivduos (famlias ou outrasorganizaes), acontecimentos ou outros objectos de estudo que o investigador pretende descreverou para os quais pretende generalizar as suas concluses ou resultados.

Principais razes para se trabalhar com uma amostra:

- A populao infinita, ou considerada como tal, no podendo portanto ser analisadana ntegra;

- Custo excessivo do processo de recolha e tratamento dos dados, como resultado dagrande dimenso da populao ou da complexidade do processo de caracterizao detodos os elementos da populao;

- Tempo excessivo do processo de recolha e tratamento dos dados, conduzindo obteno de informao desactualizada;

- As populaes so dinmicas, de onde resulta que os elementos ou objectos dapopulao esto em constante renovao, de onde resulta a impossibilidade de

analisar todos os elementos desta populao;

Se a constituio da amostra obedecer a determinadas condies, a anlise das caractersticas daamostra pode servir para se fazerem inferncias sobre a populao.

Nota:A dimenso da amostra significativamente inferior dimenso da populao, de forma ajustificar a constituio da amostra. A amostragem , por sua vez, um conjunto deprocedimentos atravs dos quais se selecciona uma amostra de uma populao. Pode-sedividir as tcnicas de amostragem em vrio tipos:

- Amostragem probabilstica - procedimento em que todos os elementos da populaotm uma probabilidade conhecida e superior a zero de integrar a amostra;

- Amostragem no probabilstica:- Amostragem intencional - amostragem no probabilstica subordinada a objectivos

especficos do investigador;- Amostragem no intencional - amostragem no probabilstica regida por critrios de

convenincia e/ou de disponibilidade dos inquiridos.

1Amostra (estatstica) . In Infopdia [Em linha]. Porto: Porto Editora, 2003-2008. [Consult. 2008-01-15]. Disponvel na www:.

Contedo


9/79

9

Questes prQuestes prvias ao processo de amostragemvias ao processo de amostragemde natureza quantitativade natureza quantitativa

1. Definio clara dosobjectivos do estudo

O que se pretende saber/conhecer

melhor/compreender

2. Quem dever serentrevistado

Populao alvo* e populao a

inquirir

3. Quantos devero serentrevistados

Dimenso da amostra

4. Como seroseleccionados

Mtodo de seleco da amostra

(escolha das unidades amostrais)

*Designa-se por populao alvo a totalidade dos elementos sobre os quais se deseja obter determinado tipode informao

7

Amostra, n(unidades de observao)

Universo ou Populao, N(finito)

Unidades que poderiam serobservadas

Conjunto de unidades existentes squais se aplica a teoria

Universo Hipottico(praticamente infinito)

* in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 1989

RepresentaRepresentao de uma Amostra*o de uma Amostra*

8


10/79

10

Desenvolvimento de um planoDesenvolvimento de um plano amostral*amostral*

* in: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999

Populao alvo

Populao a inquirir

Processo amostral

Dimenso da amostra

Mtodo de recolha

de dados

Amostra final

9

1.2. Mtodos amostrais

MMtodos de selectodos de seleco da amostra*o da amostra*


Mtodos probabilsticos(amostragem casual)

Amostragem aleatria simples

Amostragem sistemtica

Amostragem estratificada

Amostragem por clusters

Amostragem multi-etapas

Amostragem multifsica

Mtodos no

probabilsticos(amostragem dirigida)

Amostragem por convenincia

Amostragem intencional

Amostragem snowballAmostragem sequencial

Amostragem por quotas

10


11/79

11

1.3. Seleco das unidades amostrais

MMtodos de selectodos de seleco da amostrao da amostra ((contcont))**


Mtodos probabilsticos - amostragem aleatria

Cada elemento da populao tem a mesma probabilidade de serseleccionado

Aleatria simples

Clculo do rcio K=N/n; seleco aleatria do primeiro elementoda populao e sequencial dos restantes

Casualsistemtica

Separao dos elementos da populao em estratos e selecoaleatria dos elementos dentro de cada estrato

Estratificada

A populao encontra-se dividida em clusters que soseleccionados aleatoriamente, constituindo as unidades amostraisClusters

Idntico ao anterior mas em que as unidades amostrais soseleccionadas aleatoriamente dentro de cada cluster

Multi-etapas

Numa 1 fase recolhem-se dados sobre determinadascaractersticas dos respondentes (comportamentos e frequncia deconsumos, variveis demogrficas, etc.) e da sua disponibilidadepara responder novamente a um inqurito. ento retirada destafase uma sub-amostra que ser inquirida na 2 fase.

Multi-fsica

11

12

rea

6500610184013902 660Total24501706006101070Produto D27001907005501260Produto C5005023070150Produto B850200310160

180Produto A

TotalOutros(Restantesdistritos)

Sul(Lisboa,Setbal eSantarm)

Centro(Coimbra,Aveiro eLeiria)

Norte(Braga ePorto)Sector

Amostra estratificada*Amostra estratificada*

* Adaptado de: Reis, Melo, Andrade e Calapez: Estatstica aplicada, vol. 2, Lisboa, Slabo, 1999

Uni v

er

so

rea

65061184139266Total245176061107Produto D270197055126Produto C50523715Produto B8520311618Produto A

TotalOutros(Restantesdistritos)

Sul(Lisboa,Setbal eSantarm)

Centro(Coimbra,Aveiro eLeiria)

Norte(Braga ePorto)Sector

Am

ostr

a(10

%

da

populao

)


12/79

12

MMtodos de selectodos de seleco da amostrao da amostra ((contcont))**


A amostra seleccionada em funo da disponibilidade eacessibilidade dos elementos que constituem a populao alvo

Amostragem porconvenincia

A escolha dos elementos a incluir na amostra baseia-se na opiniode uma ou mais pessoas que conhecem muito bem ascaractersticas especficas da populao em estudo, que sepretende analisar

Amostragemintencional

Numa 1 fase os inquiridos so escolhidos aleatoriamente, sendo,numa segunda fase, os inquiridos adicionais escolhidos com basena informao dos primeiros

Amostragemsnowball

Semelhante ao mtodo multi-fsico. A realizao da fase seguintes decidida depois de analisados os resultados da fase anterior.

Amostragemsequencial

Equivalente amostragem aleatria estratificada. As proporesdos vrios sub-grupos reflectem a sua distribuio dentro dapopulao. Cada entrevistador dispe das caractersticas que os

entrevistados devero satisfazer, terminando as entrevistasquando as quotas estiverem preenchidas.

Amostragem por

quotas

Mtodos no probabilsticos - amostragem dirigida

13

1.4. Erro amostral

DeterminaDeterminao da margem de erro em funo da margem de erro em funo do no do n de elementos*de elementos*

in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 198914


13/79

13

DeterminaDeterminao no n de elementos em funde elementos em funo da margem de erro *o da margem de erro *

in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 1989 15

DeterminaDeterminao no n de elementos em funde elementos em funo da margem de erro e dao da margem de erro e dadimenso da populadimenso da populao *o *

in: Bravo, Sierra: Tcnicas de Investigacin Social, Madrid, Editorial Paraninfo, 1989 16


14/79

14

A avaliao deste captulo consiste num exerccio escrito, de resposta sseguintes questes

Exerccio de avaliao:

1) Depois de se identificar os dados que devero ser recolhidos e o instrumento (questionrioestruturado, por exemplo) a utilizar para essa recolha, o passo seguinte consiste em definir um

processo de amostragem adequado ao tipo de dados e ao instrumento de anlise2

Diga, sucintamente em que consistem os seguintes mtodos de mostragem:- Amostra aleatria simples;

- Amostra Estratificada;- Amostra por quotas.

2)O problema da Inferncia Indutiva , do ponto de vista da Estatstica, encarado da seguinteforma: a finalidade da investigao descobrir algo sobre determinada populao ou universo.3

Comente a frase e diga quais os procedimentos para seleccionar as unidades amostrais (sujeitos)numa amostra estratificada.

- Bravo, R. S. (1988), Tcnicas de investigacin social, 5 ed.corregida e ampliada, Madrid, Paraninfo (Seco 1).

- Reis, E., P. Melo; R. Andrade e T. Calapez (1999) EstatsticaAplicada volume 2, Lisboa, Slabo, 3 edio revista.

- Vicente, P.; E. Reis; F. Ferro (2002), Sondagens-A amostragemcomo factor decisivo de qualidade, Lisboa, Edies Slabo.

2Reis, E., P. Melo; R. Andrade e T. Calapez (1999)Estatstica Aplicada volume 2, Lisboa, Slabo, 3 edio revista.3Idem.

Avaliao

Referncias


15/79

15

Captulo 2 Introduo ao SPSS

O objectivo geral deste captulo o de familiarizar os alunos com o SPSS,nomeadamente no que se refere:

- Janelas e menus;

- Criao e manipulao de bases de dados;- Tratamento preliminar dos dados.

- Varivel- Nvel de medida

Captulo

2Objectivos

Palavras


16/79

16

2.1. Editor de dados do SPSS

O package estatstico SPSS para Windows um poderoso sistema de anlises

estatsticas e manuseamento de dados, em que a utilizao mais frequente, para amaioria das anlises a efectuar, se resume seleco das respectivas opes emmenus e caixas de dilogo

O editor de dados do SPSS (Data Editor) composto por duas janelassobrepostas:Data Viewe Variable View. A funo da primeira Data View a de introduzir osdados e da segunda - Variable View criar a estrutura da base de dados.

Muda-se de uma para outra clicando no respectivo separador.

OData Editordo SPSS um programa do tipo de folha de clculo que permite facilmente criar ou

editar ficheiros de dados. Abre automaticamente quando se entra no SPSS.O seu aspecto o seguinte:

JanelaData View:

Contedo


17/79

17

Janela Variable View:

2.2. Outputdo SPSS (Output Viewer)

nesta janela que so apresentados todos os resultados estatsticos. Abre automaticamente sempreque um determinado procedimento gera resultados. possvel editar as tabelas e grficos

produzidos, clicando duas vezes com a tecla esquerda do rato e modificar a sua aparncia.

Janela Output Viewer:


18/79

18

2.3. Menus do SPSS

Os menus das janelas principais Data Editor e Outpur Viewer - so idnticos e tm o seguinteaspecto visual:

Principais funcionalidades dos menus

FileCriar, abrir, ler, exportar, gravar e imprimirficheiros.

EditConfigurao/parametrizao do SPSS

(Options), inserir novas variveis e novos casos.


19/79

19

ViewActivar/desactivar barras de comandos, fontes,grelha, barra de status e mostrar etiquetas(labels) definidas.

Data

Alterao global dos dados;Ordenar a base;Juntar ficheiros (Merge Files);

Dividir a anlise por grupos (Split File);Criar subconjuntos de casos para anlise (SelectCases);Activar ponderadores (Weight Cases).

TransformCriar novas variveis com base nas variveisoriginais;Recodificar variveis.


20/79

20

Analyse Procedimentos de anlise estatstica.

Graphs Criar grficos.

Utilities Informao sobre as variveis.

WindowComuta entre janelas;Minimizar janelas

HelpAjuda em linha;Tutorial.


21/79

21

2.4. Criao de bases de dados

As bases de dados so criadas na janela Variable View,devendo a estrutura das variveis obedecers seguintes regras:

Name

- Mximo 64 caracteres (verses anteriores 13, apenas 8);- Deve comear por uma letra; os restantes caracteres podem ser letras(maisculas ou minsculas so iguais), algarismos, ou os smbolos @, #, _, $.

- No se podem usar espaos em branco, nem os seguintes caracteres: !, ?, , , *,+, -, %, vrgula, ponto e vrgula, \, /, >, 65 anos.a) Criao da varivel idade:

4A base de dados original est disponvel em http://www.europeansocialsurvey.org/.


22/79

22

A varivel idade acrescentou-se base de dados. Vamos agora proceder sua recodificao,criando uma nova varivel idade2 com 4 escales5:

A varivel idade2 acrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos value labels.

O resultado ser o seguinte:

Idade

341 22.6 22.6 22.6

505 33.4 33.4 56.0

315 20.8 20.8 76.8

350 23.2 23.2 100.0

1511 100.0 100.0

At 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

Total

ValidFrequency Percent Valid Percent

CumulativePercent

5 Nota: na recodificao de variveis recomendvel manter as variveis originais e criar novas variveis recodificadas,escolhendo para o efeito a opoInto diferent variable.


23/79

23

b) Recodificao da varivel escolaridade:

Pretende-se recodificar a varivel escolaridade (f7) criando uma nova varivel (escol) com 3escales: at 9 anos; 10 12 anos e > 12 anos.

A varivel escolacrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos value labels.


Escolaridade

1046 69.2 69.2 69.2

251 16.6 16.6 85.8

212 14.0 14.0 99.9

2 .1 .1 100.0

1511 100.0 100.0

At 9 anos

10 - 12 anos

> 12 anos

NR

Total


CumulativePercent


24/79

24

c) Recodificao da varivel autoposicionamento poltico:

Pretende-se recodificar a varivel autoposicionamento poltico (b28) criando uma nova varivel(b28r) com 3 escales: esquerda; centro e direita.

A varivelb28racrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos value labels.


Autoposic ionamento pol tico

296 19.6 24.5 24.5

620 41.0 51.2 75.7

294 19.4 24.3 100.0

1211 79.9 100.0

304 20.1

1515 100.0

Esquerda

Centro

Direita

Total

Valid

SystemMissing

Total

Frequency Percent Valid Percent

Cumulative

Percent


25/79

25

Exemplo 2: criao de ndices sintticos

Pretende-se criar dois ndices sintticos: Confiana social(variveis a8, a9e a10) e Confianainstitucional(variveisb7,b8,b9eb10).

As 2 variveis acrescentaram-se base6:

Os resultados so os seguintes:

Descriptive Statistics

1480 .0 10.0 4.316 1.7469

1338 .0 9.3 4.097 1.7603

1319

ndice sinttico de Confiana social

ndice sinttico de Confiana institucional

Valid N (listwise)

N Minimum Maximum Mean Std. Deviation

6Nota: tratando-se de variveis rcio, devero ter casas decimais (1 ou 2).


26/79

26

2.5.2. Transformao lgica de variveis

Exemplo: pretende-se criar uma varivel -sexid- atravs da transformao lgica das variveisf2e idade2, com 4 categorias: homens at 30 anos, homens com mais de 30 anos,mulheres at 30 anos e mulheres com mais de 30 anos.

Nota: repetir o comando para as restantes categorias, cujas expresses numricas so as seguintes:Categoria 2:f2= 1 & idade2> 2

Categoria 3:f2= 2 & idade2= 3Categoria 4:f2= 2 & idade2> 4

A varivel sexid acrescentar-se- base e dever ser completada com a alterao do nvel demedida (scalepara ordinal) e a definio dos respectivos label e value labels.

O resultado o seguinte:

Sexo e Idade

158 10.5 10.5 10.5

472 31.2 31.2 41.7

183 12.1 12.1 53.8

698 46.2 46.2 100.0

1511 100.0 100.0

Homens at 30 anos

Homens com mais de 30 anos

Mulheres at 30 anos

Mulheres com mais de 30 anos

Total


Cumulative

Percent


27/79

27

2.5.3. Inverso da escala de uma varivel

Exemplo: pretende-se criar uma nova varivel (ib1) com a inverso da escala da varivel interessepela poltica (b1) de modo a que 1 corresponda a nenhum interesse e 4 a muitointeresse:


b1

Qual o seu interesse pela poltica

117 7.7 7.8 7.8

456 30.2 30.3 38.1

441 29.2 29.3 67.5

489 32.4 32.5 100.0

1503 99.5 100.0

6 .4

2 .1

8 .5

1511 100.0

Muito interesse

Algum interesse

Pouco interesse

Nenhum interesse

Total

Valid

Recusa

No sabe

Total

Missing

Total

Frequency Percent Valid PercentCumulative

Percent

ib1

Qual o seu i nteresse pela poltica

489 32.4 32.5 32.5

441 29.2 29.3 61.9

456 30.2 30.3 92.2

117 7.7 7.8 100.0

1503 99.5 100.0

2 .1

6 .4

8 .5

1511 100.0

Nenhum interesse

Pouco interesse

Algum interesse

Muito interesse

Total

Valid

No sabe

Recusa

Total

Missing

Total


Percent


28/79

28

2.5.4. Variveis de contagem de ocorrncias

Exemplo: pretende-se criar uma varivel partciv que traduza o ndice de participao cvica,que integre (conte) apenas os inquiridos que responderam sim (1) s questes b15a

b24.

A varivelpartcivacrescentar-se- base.


ndice sinttico de Participao cvica

1174 77.7 77.7 77.7

145 9.6 9.6 87.3

85 5.6 5.6 92.9

39 2.6 2.6 95.5

30 2.0 2.0 97.5

16 1.1 1.1 98.5

9 .6 .6 99.1

11 .7 .7 99.9

1 .1 .1 99.91 .1 .1 100.0

1511 100.0 100.0

0

1

2

3

4

5

6

7

910

Total


CumulativePercent

A interpretao a seguinte: 77,7% (1174) inquiridos no assinalaram nenhum indicador, 9,6%(145) assinalaram apenas 1, 5,6% (85) assinalaram 2, etc.


29/79

29

2.6. Seleco de casos

Exemplo 1: seleco de uma sub-amostraPretende-se seleccionar (filtrar) apenas os inquiridos da regio de Lisboa e Vale do Tejo(regiao=3).

Na base de dados (Data View) os registos no seleccionados (filtrados) aparecem tracejados,mantendo-se assim at que se anule a seleco (filtro). A barra de status informa que a base estfiltrada:

Nota muito importante:no esquecer de desactivar o filtro quando no for necessrio:


30/79

30

Exemplo 2: Seleco de uma amostra aleatria simplesPretende-se seleccionar uma amostra de 5% dos casos, aproximadamente:

Na base de dados (Data View) os registos no seleccionados (filtrados) aparecem tracejados,

mantendo-se assim at que se anule a seleco (filtro). A barra de status informa que a base estfiltrada:

Nota muito importante:no esquecer de desactivar o filtro quando no for necessrio:

Exemplo 3: Separar a anlise por grupos

Pretende-se separar a anlise pelas 4 categorias (sub-amostras) da varivel sexid(sexo e idade). possvel obter os resultados na mesma tabela, seleccionando a opo Compare groupsou emtabelas diferentes, com a opo Output by groups:

No primeiro caso, os resultados so os seguintes:Descriptive Statistics

156 1.0 9.0 4.859 1.4670

147 .0 8.5 4.248 1.7428

145

456 .0 10.0 4.259 1.8100

440 .0 9.3 4.066 1.8441

430

182 .0 9.3 4.604 1.6277

168 .0 8.0 4.116 1.6234

167

686 .0 10.0 4.153 1.7629

583 .0 9.3 4.075 1.7401577



Valid N (listwise)



Valid N (listwise)



Valid N (listwise)


ndice sinttico de Confiana institucionalValid N (listwise)

Sexo e Idade

Homens at 30 anos

Homens com maisde 30 anos

Mulheres at 30anos

Mulheres com maisde 30 anos



31/79

31

No segundo caso seriam produzidas 4 tabelas, uma por cada categoria da varivel colocada emsplit:

Descriptive Statisticsa

156 1.0 9.0 4.859 1.4670

147 .0 8.5 4.248 1.7428

145

ndice sinttico deConfiana social

ndice sinttico deConfiana institucional

Valid N (listwise)


Sexo e Idade = Homens at 30 anosa.

Descriptive Statisticsa

456 .0 10.0 4.259 1.8100

440 .0 9.3 4.066 1.8441

430



Valid N (listwise)


Sexo e Idade = Homens com mais de 30 anosa.

Descript ive Statisti csa

182 .0 9.3 4.604 1.6277

168 .0 8.0 4.116 1.6234

167



Valid N (listwise)


Sexo e Idade = Mulheres at 30 anosa.

Descript ive Statisti csa

686 .0 10.0 4.153 1.7629

583 .0 9.3 4.075 1.7401

577



Valid N (listwise)


Sexo e Idade = Mulheres com mais de 30 anosa.


32/79

32

Avaliao deste mdulo consiste em criar uma base de dados para o excerto doseguinte questionrio:

- Pereira, A. (1999), SPSS-Guia Prtico de Utilizao, Anlise deDados para Cincias Sociais e Psicologia, Lisboa, Edies Slabo, 6edio revista e corrigida.

- Vinacua, B. V. (2002), Anlisis Estadstico con SPSS para Windows. Volumen I.Estadstica bsica, Madrid, McGraw-Hill, 2 edicin.

Avaliao

Referncias


33/79

33

Captulo 3 Estatstica aplicada com SPSSO objectivo geral deste captulo o de proceder anlise estatstica de dados, nomeadamente:

o Anlise univariada frequncias e distribuies;o Anlise bivariada Cruzamentos, testes de hipteses e inferncia

estatstica;o Anlise multivariada:

Previso - Regresso linear simples e mltipla; Detectar dimenses latentes - Anlise das componentes

principais;

Segmentao: Anlise de Clusters

Frequncias Cruzamentos Testes de hipteses Inferncia estatstica Margem de erro Intervalo de confiana Significncia estatstica

3.1. Anlise de dados univariada3.1. 1. Frequncias

a) Utilizando o comandoFrequencies7

Variveis de caracterizao social:

7 Nota: as tabelas geradas pelo procedimento Frequencies so em formato rascunho destinando-se apenas aocontrolo e validao da base de dados, com o objectivo de eliminar erros de introduo de dados.

Captulo

Objectivos

Palavras

Contedo


34/79

34


Sexo

630 41.7 41.7 41.7

881 58.3 58.3 100.01511 100.0 100.0

Masculino

FemininoTotal


CumulativePercent

Idade

341 22.6 22.6 22.6

505 33.4 33.4 56.0

315 20.8 20.8 76.8

350 23.2 23.2 100.0

1511 100.0 100.0

At 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

Total


CumulativePercent

Anos de esc olar idade concl udos

1046 69.2 69.3 69.3

251 16.6 16.6 86.0

212 14.0 14.0 100.0

1509 99.9 100.0

2 .1

1511 100.0

At 9 anos

10 - 12 anos> 12 anos

Total

Valid

NRMissing

Total


Percent

b) Utilizando o comando Tables


35/79

35

Os resultados so os seguintes8:

630 41.7

881 58.3

1511 100.0

341 22.6

505 33.4

315 20.8

350 23.2

1511 100.0

1046 69.2

251 16.6

212 14.0

2 .1

1511 100.0

Masculino

Feminino

TotalSexo

At 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

Total

Idade

At 9 anos

10 - 12 anos

> 12 anos

NR

Total

Anos deescolaridadeconcludos

N %

c) Quadro de frequncias (%) dos indicadores das questes d18 a d24

8Nota: o quadro foi modificado no respectivo editor, a que se acede clicando duas vezes sobre o mesmo.


36/79

36


11.7 41.3 15.1 25.4 6.5 100.0

14.1 46.1 19.4 16.2 4.3 100.0

13.7 53.7 16.7 12.3 3.6 100.0

14.3 42.3 22.1 16.2 5.2 100.0

25.9 54.0 12.5 6.0 1.6 100.0

43.3 40.1 9.3 6.2 1.0 100.0

26.6 38.5 19.0 13.2 2.7 100.0

As pessoas que vm viver e trabalhar para c fazemcom que os salrios baixem

As pessoas que vm viver e trabalhar para c, em

regra, prejudicam mais as expectativas econmicasdos pobres do que dos ricos

As pessoas que vm viver e trabalhar para cajudam a preencher lugares em que h falta detrabalhadores

Se as pessoas que vieram viver e trabalhar para cestiverem desempregadas por muito tempo deviamser obrigadas a ir embora

As pessoas que vieram viver para c devem ter osmesmos direitos do que todas as outras pessoas

As pessoas que vieram viver para c cometerem umcrime grave, devem ser obrigadas a ir embora

As pessoas que vieram viver para c cometeremqualquer crime, devem ser obrigadas a ir embora

Concordatotalmente Concorda

Nemconcorda Discorda

Discordatotalmente Total


37/79

37

3.1. 2. Estatsticas descritivas e grfico de perfil

Nota muito importante: A anlise estatstica, excepto nos quadros de frequncias,deve incidir apenas nas respostas vlidas. Assim, antes de efectuar qualquer anliseestatstica, torna-se necessrio definir e activar os respectivos missing values (no

responde/no sabe/no se aplica) na colunamissingda base de dados.a) Utilizando o comandoDescriptives9

Indicadores das questesd10ad17:



1448 0 10 7.46 2.241

1449 0 10 7.11 2.442

1447 0 10 6.81 2.807

1454 0 10 6.48 2.425

1416 0 10 6.06 2.536

1466 0 10 6.05 2.633

1440 0 10 3.79 2.971

1451 0 10 2.85 2.874

1330

Ter qualificaes profissionais de que o pas precisa

Querer adaptar-se ao mesmo modo de vida do pas

Ser rico

Ter familiares prximos a viver c

Ter boas qualificaes acadmicas

Saber falar a lngua oficial do pas

Ter formao crist

Ser branco

Valid N (listwise)


9 Nota: as tabelas geradas pelo procedimento Descriptives so em formato rascunho destinando-se apenas aocontrolo e validao da base de dados, com o objectivo de eliminar erros de introduo de dados.


38/79

38



6.1 2.5

6.5 2.4

6.1 2.63.8 3.0

2.8 2.9

6.8 2.8

7.5 2.2

7.1 2.4



Saber falar a lngua oficial do pasTer formao crist

Ser branco

Ser rico



Mdia Desvio-padro


39/79

39

c) Grfico de perfil10:

0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0


Ter familiares prximo s a viver c

Saber falar a lngua ofic ial do p as

Ter formao crist

Ser branco

Ser rico

Ter qualificaes profissionais d e que o pas precisa

Querer adaptar-se ao mesmo modo de v ida do pas

6.1

6.5

6.1

3.8

2.8

6.8

7.5

7.1

Nenhuma importncia Muita importncia

10Para obter um grfico interactivo de linhas, o procedimento o seguinte: Graph/Interactive/Line, seleccionam-se

todas as variveis em simultneopressionando a tecla Ctrl e arrastam-se para horizontal.O grfico do exemplo foi editado e transformado, tendo-se alterado a escala para o formato real e a cor da linha eacrescentado as etiquetas (valores e mnimo e mximo), a grelha e a linha de referncia.


40/79

40

3.1.3. Testes de aderncia (para 1 amostra)

3.1.3.1. 2 (Qui-quadrado)

Exemplo 1: Pretende-se testar se a classe social (classe2) tem uma distribuio uniforme11no

universo.

Como a varivel nominal, o procedimento consiste em realizar o teste de adernciado 2(All categories equal):


Classes so ciais (ACM) prprio

175 256.6 -81.6

191 256.6 -65.6

81 256.6 -175.6

413 256.6 156.4

423 256.6 166.4

1283

Empresrios, dirigentese profissionais liberais

Profissionais tcnicos ede enquadramento

Trabalhadoresindependentes

Empregados executantes

Operrios

Total

Observed N Expected N ResidualTest Statisti cs

366.123

4

.000

Chi-Squarea

df

Asymp. Sig.

Classessociais (ACM)

prprio

0 cells (.0%) have expected frequencies less than5. The minimum expected cell frequency is 256.6.

a.

Interpretao: A varivel classe social no segue uma distribuio uniforme no universo

(2

(4)=366,123;p=0,000).

11Testando se as frequncias observadas so iguais s frequncias esperadas.


41/79

41

3.1.3.2. Kolmogorov-Smirnov

Exemplo:Pretende-se testar se o interesse pela poltica (ib1) segue uma distribuio normal ouuniforme no universo.

Como a varivel ordinal, o procedimento consiste em realizar o teste de adernciade Kolmogorov-Smirnov para as duas distribuies:


One-Sample Kolmogo rov-Smirnov Test

1503

2.13

.961

.206

.206

-.198

8.001

.000

N

Mean

Std. Deviation

Normal Parametersa,b

Absolute

Positive

Negative

Most ExtremeDifferences

Kolmogorov-Smirnov Z

Asymp. Sig. (2-tailed)

Qual o seuinteresse

pela poltica

Test distribution is Normal.a.

Calculated from data.b.

One-Sample Kol mogorov-Smirnov Test 2

1503

1

4

.325

.325

-.078

12.613

.000

N

Minimum

Maximum

Uniform Parametersa,b

Absolute

Positive

Negative




Qual o seuinteresse

pela poltica

Test distribution is Uniform.a.

Calculated from data.b.

Interpretao: A varivel interesse pela poltica no segue uma distribuio normal(K-S=8,001;p=0,000) nem uniforme (K-S=12,613;p=0,000) no universo.


42/79

42

3.1.3.3 Teste t de Student

Exemplo:Pretende-se testar se a confiana social adere mdia que corresponde ao centro daescala (5)12dos indicadores que compem a varivel (confsoc).

Como a varivel quantitativa, o procedimento consiste em realizar o teste t deaderncia (One-Sample T-Test), comparando se a mdia observada diferesignificativamente de 5:


One-Sample Statistics

1480 4.316 1.7469 .0454ndice sinttico deConfiana social

N Mean Std. Deviation Std. ErrorMean

One-Sample Test

-15.073 1479 .000 -.684 -.774 -.595ndice sinttico deConfiana social

t df Sig. (2-tailed)Mean

Difference Lower Upper

95% ConfidenceInterval of the Difference

Test Value = 5

Interpretao: A mdia observada 4,3, diferindo significativamente da mdia de referncia(t(1479)= -15,073;p=0,000).

12A escala de medida dos indicadores de confiana social varia entre 0=nenhuma e 10=toda.


43/79

43

3.2. Anlise de dados bivariada3.2.1. Cruzamentos e teste de independncia 2(Qui-quadrado)

Exemplo 1:Pretende-se saber se h relao entre o sexo e o facto de ter comprado produtos por

razes de ordem poltica, tica ou ambiental.

O procedimento consiste em cruzar as variveis sexo (f2) e (b22) e solicitar o testede independncia do 2*.

a) Utilizando o comando Crosstabs


Sexo * Comprou produtos por razes de ordem poltica,tica ou ambiental Crosstabulation

% within Sexo

7.2% 92.8% 100.0%

7.7% 92.3% 100.0%

7.5% 92.5% 100.0%

Masculino

Feminino

Sexo

Total

Sim No

Comprou produtos porrazes de ordempoltica, tica ou

ambiental

Total

Chi-Square Tests

.121b 1 .728

.062 1 .804

.122 1 .727

.766 .404

.121 1 .728

1495

Pearson Chi-Square

Continuity Correction a

Likelihood Ratio

Fisher's Exact Test

Linear-by-LinearAssociation

N of Valid Cases

Value df Asymp. Sig.

(2-sided)Exact Sig.(2-sided)

Exact Sig.(1-sided)

Computed only for a 2x2 tablea.

0 cells (.0%) have expected count less than 5. The minimum expected count is46.75.

b.

Interpretao: As mulheres compram ligeiramente mais que os homens mas as diferenas noso estatisticamente significativas (2(1)=0,121;p>0,05).

*Para a seleco dos testes estatsticos, ver o Anexo 1.


44/79

44



7.2 92.8 100.0

7.7 92.3 100.0

7.5 92.5 100.0

Masculino

Feminino

Total

SexoSim No Total

Comprou produtos por razes deordem poltica, tica ou ambiental

Pearson Chi-Square Tests

.121

1

.728

Chi-square

df

Sig.

Sexo

Comprouprodutos por

razes de

ordempoltica, ticaou ambiental

Results are based on nonempty rows andcolumns in each innermost subtable.


45/79

45

3.2.2. Testes no paramtricos (procedimento Non Parametric Tests)

3.2.2.1. Duas amostras independentes

(Mann-Whitney eKolmogorov-Smirnov)

Exemplo 1: Pretende-se testar se h relao entre o sexo (f2) e o interesse pela poltica (ib1).

O procedimento consiste na realizao do teste no paramtrico para 2 amostrasindependentes (Mann-Whitney)13.


Ranks

628 815.82 512336.00

875 706.19 617920.00

1503

SexoMasculino

Feminino

Total

Qual o seu interessepela poltica

N Mean Rank Sum of Ranks

Test Statisticsa

234670.000

617920.000

-5.058

.000

Mann-Whitney U

Wilcoxon W

Z


Qual o seuinteresse

pela poltica

Grouping Variable: Sexoa.

Interpretao: a mdia das ordenaes (Mean Rank) superior nos homens. Ou seja, os homensreferem que tm mais interesse pela poltica do que as mulheres. As diferenas soestatisticamente significativas (M-W=234670;p=0,000).

13Consultar o Anexo 1.


46/79

46

Exemplo 2: Pretende-se testar se h relao entre o sexo (f2) e o grau de escolaridade (escol).

O procedimento consiste na em fazer o cruzamento entre as 2 variveis e realizar doteste no paramtrico para duas amostras independentes (Kolmogorov-Smirnov)14.



47/79

47


67.9 18.9 13.2 100.0

70.3 15.0 14.7 100.069.3 16.6 14.0 100.0

Masculino

FemininoTotal

SexoAt 9 anos 10 - 12 > 12 anos Total

Anos de escolaridade concludos

Test Statisticsa

.025

.025

-.014

.476

.977

Absolute

Positive

Negative




Escolaridade

Grouping Variable: Sexoa.

Interpretao: Tanto no grau de escolaridade intermdio como no superior, verifica-se que hmais homens do que mulheres, observando-se o inverso no grau de escolaridade mais baixo. Noentanto, as diferenas no so estatisticamente significativas (K-S=0,476;p>0,05).

3.2.2.2. K amostras independentes (Kruskal-Wallis)

Exemplo: Pretende-se testar se h relao entre a idade (idade2) e o interesse pela poltica (ib1).

O procedimento consiste na realizao do teste no paramtrico para k amostrasindependentes (Kruskal-Wallis)15.




48/79

48

27.4 33.6 31.9 7.1 100.0

28.0 28.8 32.9 10.3 100.0

30.7 30.4 29.7 9.3 100.0

45.8 25.1 25.6 3.5 100.0

32.5 29.3 30.3 7.8 100.0

At 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

Total

Idade

Nenhuminteresse

Poucointeresse

Alguminteresse

Muitointeresse Total

Qual o seu interesse pela poltica

Ranks

339 777.35

504 803.46

313 768.74

347 637.38

1503

IdadeAt 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

Total

Qual o seu interessepela poltica

N Mean Rank

Test Statisticsa,b

36.088

3

.000

Chi-Square

df

Asymp. Sig.

Qual o seuinteresse

pela poltica

Kruskal Wallis Testa.

Grouping Variable: Idadeb.

Interpretao: A mdia das ordenaes (Mean Rank) mais elevada nos que tm entre 31 e 50 anos,sendo este escalo, por conseguinte, que refere ter mais interesse pela poltica, enquanto os maisvelhos so os que revelam menos interesse. As diferenas so estatisticamente significativas (K-W(3)=36,088;p=0,000).


49/79

49

3.2.3. Testes paramtricos (procedimento Compare Means)

3.2.3.1. Duas amostras emparelhadas (t de Student para amostras

emparelhadas)

Exemplo: Pretende-se testar se a mdia da confiana social (confsoc) idntica, ou no, mdia

da confiana institucional (confinst).

O procedimento consiste na realizao do teste paramtrico para duas amostrasemparelhadas (Paired-Samples T-Test)16.


Paired Samples Statistics

4.313 1319 1.7165 .0473

4.087 1319 1.7606 .0485



Pair 1Mean N Std. Deviation

Std. ErrorMean

Paired Samples Correlations

1319 .310 .000

ndice sinttico deConfiana social &ndice sinttico deConfiana institucional

Pair 1N Correlation Sig.

Paired Samples Test

.225 2.0428 .0562 .115 .336 4.009 1318 .000ndice sinttico deConfiana social -ndice sinttico deConfiana institucional

Pair 1

Mean Std. DeviationStd. Error

Mean Lower Upper

95%Confidence

Interval of theDifference

Paired Differences

t df Sig. (2-tailed)

Interpretao: A mdia da confiana social (4,313) ligeiramente superior mdia da confianainstitucional (4,087). A correlao entre as duas variveis mdia fraca (0,310) e estatisticamentesignificativa (p=0,000), sendo igualmente estatisticamente significativa a diferena entre as duasmdias (t (1318)=4,009;p=0,000).



50/79

50

3.2.3.2. Duas amostras independentes

(t de Student de independncia)

Exemplo: Pretende-se testar se h relao entre o sexo (f2) e a confiana social (confsoc).

O procedimento consiste na realizao do teste paramtrico para duas amostrasindependentes (Independent-Samples T-Test)17.


Group Statistics

612 4.412 1.7476 .0706

868 4.248 1.7442 .0592

SexoMasculino

Feminino


N Mean Std. Deviation

Std. Error

Mean

Independent Samples Test

.182 .669 1.781 1478 .075 .164 .0921 -.0167 .3448

1.780 1313.926 .075 .164 .0922 -.0167 .3449

Equal variances assumed

Equal variances notassumed


F Sig.

Levene's Testfor Equality of

Variances

t df Sig. (2-tailed)Mean

DifferenceStd. ErrorDifference Lower Upper

95%Confidence

Interval of theDifference

t-test for Equality of Means

Interpretao: Os homens (4,412) revelam mais confiana social que as mulheres (4,248)18,embora a diferena no seja estatisticamente significativa, (t (1480)=1,808;p> 0,05).

17Consultar o Anexo 1.18O ndice de confiana social varia entre 0=nenhuma confiana e 10=toda a confiana.


51/79

51

3.2.3.3. k amostras independentes (Anlise de Varincia Simples Paramtrica -ANOVA)

Exemplo: Pretende-se testar se h relao entre a idade (idade2) e a confiana social (confsoc).

O procedimento consiste na realizao da Anlise de Varincia Simples Paramtrica(One-way Anova)19.


Descriptives


338 4.722 1.5585 .0848 4.555 4.889 .0 9.3

497 4.058 1.6747 .0751 3.911 4.206 .0 9.3

312 4.068 1.8340 .1038 3.864 4.273 .0 10.0

333 4.519 1.8500 .1014 4.319 4.718 .0 10.0

1480 4.316 1.7469 .0454 4.226 4.405 .0 10.0

At 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

Total

N Mean Std. Deviation Std. Error Lower Bound Upper Bound

95% Confidence Interval forMean

Minimum Maximum

Test of Homogeneity of Variances


4.050 3 1476 .007

LeveneStatistic df1 df2 Sig.

ANOVA


121.466 3 40.489 13.607 .000

4391.954 1476 2.976

4513.420 1479

Between Groups

Within Groups

Total

Sum ofSquares df Mean Square F Sig.



52/79

52

Interpretao: So os mais novos (4,722), seguidos dos mais velhos (4,519) que mais confiam.Os escales intermdios 31-50 anos (4,058) e 51-65 anos ( (4,068) confiam um pouco menos. Asdiferenas so estatisticamente significativas (F (3)=13,787;p=0,000).

Nota: sendo as diferenas estatisticamente significativas, importa saber quais os grupos quediferem uns dos outros. Para o efeito realiza-se um teste posteriori (Post Hoc). O SPSSdisponibiliza vrios testes para este fim, sendo os mais utilizados, o teste de Scheffe20, no caso deas varincias serem iguais, e o teste Games-Howellno caso de serem diferentes.

Neste caso, uma vez que se rejeita a hiptese de as varincias serem iguais (p=0,007), vamossolicitar o teste Games-Howell:


Multiple Comparisons

Dependent Variable: ndice sinttico de Confiana social

Games-Howell

.664* .1133 .000 .372 .955

.654* .1340 .000 .308 .999

.203 .1321 .415 -.137 .544

-.664* .1133 .000 -.955 -.372

-.010 .1282 1.000 -.340 .320

-.460* .1262 .002 -.785 -.135-.654* .1340 .000 -.999 -.308

.010 .1282 1.000 -.320 .340

-.450* .1451 .011 -.824 -.076

-.203 .1321 .415 -.544 .137

.460* .1262 .002 .135 .785

.450* .1451 .011 .076 .824

(J) IdadeAt 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

At 30 anos

31 - 50 anos

51 - 65 anos

> 65 anosAt 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

At 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

(I) IdadeAt 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

MeanDifference (I-J) Std. Error Sig. Lower Bound Upper Bound

95% Confidence Interval

The mean difference is significant at the .05 level.*.

20Que tambm o mais conservador,


53/79

53

Interpretao: os grupos que diferem estatisticamente entre si esto assinalados com um *. Oquadro seguinte sintetiza as diferenas significativas entre os quatro escales etrios

At 30 anos 31-50 anos 51-65 anos > 65 anosAt 30 anos X X31-50 anos X X51-65 anos X X> 65 anos X X

3.2.4. Correlao linear simples

A correlao linear simples permite obter uma medida (coeficiente de correlao r de Pearson)atravs da qual se determina a fora ou intensidade de uma associao linear entre duas ou maisvariveis quantitativas ou tratadas como tal (escalas tipoLikert).

O coeficiente de correlao varia entre 1 e 121e deve ser interpretado da seguinte forma:0: ausncia de correlao;+/- ]0 0,25]: correlao muito fraca;+/- ]0,25 0,40] correlao fraca;+/- ]0,40 0,60] correlao mdia;+/- ]0,60 0,75] correlao mdia forte;+/- ]0,75 0,90] correlao forte;+/- ]0,90 1[ correlao muito forte;+/- 1 correlao perfeita

Exemplo: Correlao entre as variveis satisfao com a vida (b29), com a economia (b30), com oGoverno (b31), com a democracia (b32), com a educao (b33) e com os servios desade (b34):

21O sinal significa uma correlao negativa e a ausncia de sinal uma correlao positiva.


54/79

54


Correlations

.339**

.000

1441

.280** .578**

.000 .000

1413 1392

.348** .403** .507**

.000 .000 .000

1371 1353 1339

.205** .361** .289** .300**

.000 .000 .000 .000

1429 1389 1367 1338

.195** .396** .340** .294** .537**

.000 .000 .000 .000 .000

1489 1440 1412 1370 1433

Pearson Correlation

Sig. (2-tailed)N

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Satisfao com a

vida em geral

Economia

Governo

Democracia

Educao

Servios de Sade

Satisfaocom a vidaem geral Economia Governo Democracia Educao

Serviosde Sade

Correlation is significant at the 0.01 level (2-tailed).**.

Interpretao: as correlaes so positivas e significativas entre todas as variveis ; (p=0,000),sendo a menor entre a satisfao com a vida e com a educao (0,209e a maior entre a satisfaocom o Governo e com a economia (0,577


55/79

55

3.3. Modelos de previso3.3.1. Anlise de Regresso Simples

A regresso linear, como referem Bryman e Cramer, um poderoso instrumento para resumir anatureza da associao entre variveis e para fazer previses acerca dos valores da varivel

dependente.22

Na regresso linear simples, o objectivo sintetizar a associao entre duas variveis(independente e dependente), produzindo uma linha (recta de regresso) que se aproxime dosdados recolhidos. Ou seja, prever Y (varivel dependente) a partir de X (varivel independente).

Exemplo: pretende-se saber em que medida que a confiana social (confsoc) varivelindependente explica a confiana institucional (confinst) varivel dependente.

O procedimento consiste na realizao da Anlise de regresso linear simples entre asduas variveis:

22Alan Bryman e Duncan Cramer, op.cit.: 212


56/79

56


Model Summary

.310a .096 .095 1.6746

Model

1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), ndice sinttico de Confianasocial

a.

ANOVAb

392.354 1 392.354 139.912 .000a

3693.263 1317 2.804

4085.617 1318

Regression

Residual

Total

Model1


Predictors: (Constant), ndice sinttico de Confiana sociala.

Dependent Variable: ndice sinttico de Confiana institucionalb.

Coefficients a

2.716 .125 21.778 .000

.318 .027 .310 11.828 .000

(Constant)


Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: ndice sinttico de Confiana institucionala.

Interpretao: A correlao entre as variveis fraca (R=0,310) e o coeficiente de determinao

muito fraco (R2=0,096)23. Ou seja, apenas 9,6% da variao da confiana institucional variveldependente explicada pela variao da confiana social varivel independente.

O teste F (quadro Anova) d-nos informao sobre a adequabilidade do modelo, testando ahiptese do coeficiente de determinao R2 ser 0 na populao. Neste caso (F (1)=141,178;

p=0,000), rejeita-se a hiptese de isso acontecer.

Os testes t (no quadro dos Coefficients), testam a nulidade dos coeficientes. No primeiro caso(t=115,605;p=0,000) testa a probabilidade de a constante (recta de regresso na origem) ser 0, eno segundo caso testa a probabilidade do coeficiente de regresso ser 0.A recta da regresso24, neste caso, a seguinte: Confiana institucional = 2,716 + 0,318 confianasocial.

23O coeficiente de determinao quantifica a percentagem de variao da varivel dependentes que explicada pela

variao da varivel independente.24A equao simplificada da recta da regresso a seguinte: Yi= 0+ 1Xi, em que Yi a varivel dependente, 0 aordenada na origem, 1 o coeficiente de regresso e Xi a varivel independente.


57/79

57

3.3.2. Anlise de Regresso Mltipla

A regresso, como referem Bryman e Cramer, um poderoso instrumento para resumir anatureza da associao entre variveis e para fazer previses acerca dos valores da varivel

dependente.

25

No nosso exemplo vamos usar a anlise de regresso mltipla em concreto a linear paramodelar a relao entre as variveis independentes e a varivel dependente26.

Exemplo: com base nos dados do ESS, pretende-se saber se os nveis de satisfao com o estadoda Economiaportuguesa(b30), com a forma como o Governotem governado(b31),com a qualidade da Democracia (b32), com o estado da Educao (b33) e com osServios de Sade (b33) so, ou no, predictores da satisfao com a vida em geral(b29):

Varivel dependente

Variveis independentes(b30, b31, b32, b33 e b34)

Mtodo: Stepwise(Neste mtodo entram no modeloapenas as variveis independentescom significncia estatstica, porordem de importncia.)Nota: habitual usar-se o mtodoENTER quando se pretende

testar um modelo e o mtodoStepwise em contextosexploratrios, como o caso.

Procedimentos seleccionados:

Informao sobre a significnciaestatstica da mudana deR2;

Informao sobremulticolinearidade;

Intervalo de confiana para cadaum dos coeficientes de regresso

Resultado:

25Bryman, A. e D. Cramer,Anlise de Dados em Ciencias Sociais, Oeiras, Celta, 2003.26

Quando se associa s variveis o estatuto de independentes e dependente pretende-se analisar mais do que aassociao entre elas (entenda-se variao conjunta), descrever e explicar uma relao de dependencia que deverser tericamente fundamentada.


58/79

58

Variables Entered/Removed a

Democracia .Stepwise (Criteria: Probability-of-F-to-enter= .100).

Economia .

Stepwise (Criteria: Probability-of-F-to-enter

= .100).

Model1

2

VariablesEntered

VariablesRemoved Method

Dependent Variable: Satisfao com a vida em gerala.

Variveis queentraram nosmodelos

ANOVAc

760.940 1 760.940 174.812 .000a

5610.899 1289 4.353

6371.839 1290

1051.123 2 525.562 127.224 .000b

5320.716 1288 4.131

6371.839 1290

Regression

Residual

Total

Regression

Residual

Total

Model1

2


Predictors: (Constant), Democraciaa.

Predictors: (Constant), Democracia, Economiab.Dependent Variable: Satisfao com a vida em geralc.

O objectivo do teste F verificar se a varivelindependente influencia avarivel dependente nouniverso. O que equivale adetectar se o modeloajustado ou nosignificativo.Permite inferir sobre aadequabilidade do modelo

linear para explicar a relaoentre as duas variveis.

Model Summary

.346a .119 .119 2.086 .119 174.812 1 1289 .000

.406b .165 .164 2.032 .046 70.245 1 1288 .000

Model1

2

R R SquareAdjustedR Square

Std. Error ofthe Estimate

R SquareChange F Change df1 df2 Sig. F Change

Change Statistics

Predictors: (Constant), Democraciaa.

Predictors: (Constant), Democracia, Economiab.

Coeficiente de correlaomltipla em mdulo % de variao da satisfaocom a vida em geral explicadapelas variveis independentesque entraram no modeloNota: Em modelos com mas do que 1varivel independente deve interprtar-se o R2ajustado

Contributo das variveisindependentes para amudana verificada noR2;

Teste F erespectivasignificnciaestatstica

Coefficientsa

4.221 .133 31.764 .000 3.960 4.481

.350 .026 .346 13.222 .000 .298 .402 1.000 1.000

3.841 .137 28.013 .000 3.572 4.110.254 .028 .251 9.002 .000 .199 .309 .835 1.197

.276 .033 .234 8.381 .000 .212 .341 .835 1.197

(Constant)

Democracia

Economia

(Constant)Democracia

Economia

Model1

2

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Lower Bound Upper Bound

95% Confidence Interval forB

Tolerance VIF

CollinearityStatistics

Dependent Variable: Satisfao com a vida em gerala.

Coeficientes de regresso standardizados e nostandardizados que permitem escrever a equao darecta:Satisfao com a vida = 3,841 + 0,254 satisfao com ademocracia + 0,276 satisfao com a economia.

Quando a tolerncia baixa, a correlaomltipla elevada e existe a possibilidade demulticolinearidade. Com estes valores, aprobabilidade de isso acontecer baixa.Varia entre [0, 1] e quanto mais perto de 0 maiorser a multicolinearidade entre certa varivelindependente e as outras variveis independentes.


59/79

59

3.4. Anlise de dados multivariada3.4.1. Anlise das Componentes Principais

A Anlise das Componentes Principais um dos mtodos de reduo de dados mais comum no

marketing e em pesquisas de mercado. uma tcnica de anlise exploratria multivariada quetransforma um conjunto de variveis correlacionadas entre si num conjunto menor de variveisindependentes, combinaes lineares das variveis originais, designadas por componentes

principais27. No essencial, o seu objectivo identificar novas variveis, em nmero menor que oconjunto inicial, mas sem perda significativa da informao contida neste conjunto28.

No nosso exemplo, pretendemos identificar as componentes principais latentes nos 8indicadores relativos s atitudes face imigrao (d10 + d11 + d12 +d13 + d14 +d15 + d16 +

d17).

Vamos comear por solicitar uma ACP com a extraco das componentes por defeito (critrio de

Kaiser: valor prprio das componentes a 1).

Seleco dasvariveis;

Kaiser-Meyer-Olkin: quantificao nvel de intercorrelaes entre

as variveis; Testa a hiptese de a matriz decorrelaes na populao ser amatriz identidade.

27

Moroco, J.Anlise Estatstica com utilizao do SPSS, Lisboa, Slabo, 2003: 231.28Reis, E., Anlise factorial das componentes principais: um mtodo de reduzir sem perder informao, LisboaGiesta/Iscte, 1990.


60/79

60

Critrio de Kaiser deextraco das componentesque o SPSS usa por defeito.So extradas ascomponentes com valores

prprias superiores a 1.Cada componente devecontribuir para a varincia,como se de uma varivel deinput se tratasse.

Rotao das componentes erespectiva matriz.

Nota: tem o objectivo de ajudar ainterpretar as componentes

Ordena a matriz rodada por ordemdecrescente da contribuio de

cada varivel para a componente;

Adequabilidade da ACP:

KMO and Bartl ett's Test

.812

3474.721

28

.000

Kaiser-Meyer-Olkin Measure of Sampling

Adequacy.

Approx. Chi-Square

df

Sig.

Bartlett's Test ofSphericity

KMO Qualidade da ACP1 0,9 Muito boa

0,8 0,9 Boa

0,7 0,8 Mdia

0,6 0,7 Razovel

0,5 0,6 M

>0,5 Inaceitvel

De acordo com os resultados da estatstica KMO (0,812) e do teste de esfericidade de Bartlett(p=0,000), a adequabilidade da ACP boa.


61/79

61

Total Variance Explained

3.518 43.975 43.975 3.518 43.975 43.975 3.007 37.587 37.587

1.283 16.043 60.018 1.283 16.043 60.018 1.795 22.432 60.018

.978 12.230 72.248

.539 6.739 78.987

.493 6.165 85.153

.419 5.244 90.396

.391 4.885 95.282

.377 4.718 100.000

Component1

2

3

4

56

7

8

Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %

Initial Eigenvalues Extract ion Sums of Squared Loadings Rotation Sums of Squared Loadings

Extraction Method: Principal Component Analysis.

Como podemos observar, por defeito foram extradas duas componentes, que explicam cerca de60% da varincia total.

Verificando-se que a terceira componente tem uma valor prprio prximo de 1 (0,984) e queaumenta a varincia explicada em 12,3%, vamos forar a sua extraco e gravar as trs

componentes extradas como novas variveis:

Cria novas variveis compostas pelosscores factoriais das componentesextradas.



6.11 2.527 1330

6.44 2.407 1330

6.01 2.615 1330

3.77 2.906 1330

2.82 2.825 1330

6.77 2.812 1330

7.45 2.247 13307.07 2.448 1330




Ter formao crist

Ser branco

Ser rico

Ter qualificaes profissionais de que o pas precisaQuerer adaptar-se ao mesmo modo de vida do pas

MeanStd.

DeviationAnalysis

N KMO and Bartlett's Test

.812

3474.721

28

.000

Kaiser-Meyer-Olkin Measure of SamplingAdequacy.

Approx. Chi-Square

df

Sig.

Bartlett's Test ofSphericity


62/79

62

Communalities

1.000 .590

1.000 .788

1.000 .719

1.000 .756

1.000 .786

1.000 .7221.000 .749

1.000 .669




Ter formao crist

Ser branco

Ser ricoTer qualificaes profissionais de que o pas precisa


Initial Extraction


As Comunalidadesrepresentam aproporo de varincia da varivelexplicada pelas componentes.Variveis com comunalidadesreduzidas (0,3 ou inferior) so

pouco explicadas pelascomponentes e contribuem pouco

para a sua definio.

Total Variance Explained

3.518 43.975 43.975 3.518 43.975 43.975 2.152 26.898 26.898

1.283 16.043 60.018 1.283 16.043 60.018 1.951 24.389 51.287

.978 12.230 72.248 .978 12.230 72.248 1.677 20.961 72.248

.539 6.739 78.987

.493 6.165 85.153

.419 5.244 90.396

.391 4.885 95.282

.377 4.718 100.000

Component1

2

3

4

5

6

78

Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %

Initial Eigenvalues Extract ion Sums of Squared Loadings Rotat ion Sums of Squared Loadings


Rotated Component Matrixa

.785 .361 -.053

.775 .244 .089

.771 -.014 .358

.110 .880 .047

.260 .741 .319

.487 .587 .090

.124 .011 .878

.094 .305 .809



Ser rico




Ser branco

Ter formao crist

1 2 3

Component

Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.

Rotation converged in 4 iterations.a.

Foram extradas 3 componentes (factores), que explicam 72,25% da varincia total.

A matriz rodada29

ajuda-nos a identificar e a designar as componentes: Componente 1: recursos profissionais e econmicos; Componente 2: facilidades de integrao; Componente 3: caractersticas raciais e religiosas. Caracterizao social das trs Componentes Principais

29O SPSS utiliza vrias formas de rotao, sendo a mais usada a rotao Varimax, de modo a permitir uma mais fcilinterpretao dos factores, pois torna os loadings elevados ainda mais elevados e os loadings baixos ainda maisbaixos. Para a interpretao das componentes consideram-se os loadings mais correlacionados com as mesmas.

Em geral, consideram-se bons os loadings maiores ou iguais a 0,5, por serem pelo menos responsveis por 25% davarincia. (cfr. Pestana e Gageiro, Anlise de Dados para as Cincias Sociais A complementaridade do SPSS,Lisboa, Slabo, 3 edio, 2003: 504.


63/79

63

Masculino

Feminino

Sexo

Recursos profissionais e econmicosFacilidades de integrao

Caractersticas raciais e religiosas

-0,05

0,00

0,05

m

dia

At 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

Idade



-0,20

0,00

0,20

mdia

At 9 anos

10 - 12 anos> 12 anos

Escolaridade



-0,40

-0,30

-0,20

-0,10

0,00

0,10

mdia

Esquerda

CentroDireita

Au top os ic ion ament o po lt ico



-0,10

0,00

0,10

mdia

Anlise de Clusters

De acordo com Moroco,30 a anlise de Clusters uma tcnica multivariada que no possuislidos fundamentos tericos e que procura agrupar objectos mais ou menos homogneos segundocritrios mais ou menos heursticos.

A classificao dos sujeitos em cada um dos clusters , regra geral, mais rigorosa nos mtodosno-hierrquicos do que nos hierrquicos, podendo a validade das solues obtidas com osmtodos hierrquicos segundo Elizabeth Reis tornar-se bastante limitada. Alguns autores

propem, por isso, a utilizao de mtodos no-hierrquicos de optimizao que permitam apartio dos indivduos num nmero pr definido de grupos.

A questo de determinao do nmero de grupos pr definido , no entanto, um dos principaisproblemas a resolver numa anlise de clusters. Uma forma simples a anlise do Dendrograma

30Cfr. Reis, Elizabeth,A Anlise de Clusters e as Aplicaes s Cncias Empresariais: Uma Viso Crtica da Teoria

dos Grupos Estratgicos, in Elizabeth Reis e Manuel Alberto M. Ferreira (eds.) Temas em Mtodos Quantitativos1, Lisboa, Slabo, 2000: 206-238 e Moroco, Joo, Anlise Estatstica com utilizao do SPSS, Lisboa, Slabo,2003


64/79

64

que, no entanto, s est disponvel no mtodo hierrquico, resumindo-se a sua utilidade apenas emamostras de pequena dimenso. Quando no esse o caso, ou se se pretende usar um mtodo no-hierrquico, poder-se- utilizar primeiro um mtodo hierrquico aglomerativo para determinaodo nmero de grupos e depois utilizar um mtodo no-hierrquico para optimizar a soluoencontrada.

Uma forma de obviar limitao do dendrograma na determinao do nmero de grupos, proceder representao grfica dos coeficientes de aglomerao mais elevados31, que denotam,por conseguinte, maiores distncias, onde a escolha ptima do nmero de grupos coincidir comuma marcada horizontalidade da curva32.

3.4.2.1. Anlise hierrquica de Clusters (Hierarquical Cluster)

Exemplo: pretende-se seleccionar e criar clusters com base nos 8 indicadores relativos s atitudesface imigrao (d10 +d11 +d12 +d13 +d14 +d15 +d16 +d17)

Seleco das variveis; Para obter os coeficientes de

aglomerao Desactivar Plots, pois o

Dendrogramaseria demasiadoextenso para poder serinterpretado.

Escolha do MtodoBetwen-groups linkage(Distncia mdia entre grupos): adistncia do 1 cluster aos restantes objectos a mdia dasdistncias de cada um dos elementos que constituem ocluster a cada um dos restantes objectos. Melhor performance com dados com grande disperso; Influenciado por outliers; Tendncia para produzir clusters com varincias

homogneas.Within-groups linkage: Este mtodo semelhante Distncia mdia entre grupos mas os clusters so unidosde modo a que a variabilidade dentro dos grupos sejamnima.

Nearest Neighbor(Vizinho mais prximo): a distncia do1 cluster aos restantes objectos, a menor das distnciasde cada um dos elementos que constituem o cluster a cadaum dos restantes objectos. Tendncia para formar clusters alongados; Menos influenciado por outliers;Furthest Neighbor(Vizinho mais distante): a distncia do1 cluster aos restantes objectos, a maior das distnciasde cada um dos elementos que constituem o cluster a cadaum dos restantes objectos. Menos influenciado por outliers;

31

Estes coeficientes so o valor numrico para o qual vrios indivduos ou grupos se unem para formarem um novogrupo e so disponibilizados pelo SPSS no mtodo hierrquico (Aglomeration Schedule).32Reis, op.cit.


65/79

65

Escolhemos o Wards method, pois, sendo umdos mtodos mais usado, tem tendncia paraconstituir grupos com dimenses idnticas.

Centroid clustering: a distncia entre dois grupos adiferena entre as suas mdias para todas as variveis. Pior performance com dados com grande disperso Menos influenciado por outliers;Median clustering(Distncia mediana): A distncia entredois objectos a mediana das distncias de cada um doselementos que constituem o cluster a cada um dos restantesobjectos.

Wards method: optimiza a varincia mnima dentro dosgrupos, agrupando os objectos que provoquem umaumento mnimo da soma dos quadrados dos erros. Boa performance com dados com grande disperso; Influenciado por outliers Tendncia para produzir clusters com dimenso

semelhante.

Para a identificao do n de clusters, vamos representar graficamente (em Excel) as diferenasentre os 30 coeficientes de aglomerao com valor mais elevado, produzidos pelo SPSS(Agglomeration schedule).


66/79

66

Optamos por uma soluo de 4 clusters.33

Deveremos agora repetir os procedimentos anteriores no SPSS, desactivar Statistics34e solicitar aopo Save, assinalando o n de clusters que pretendemos:

A varivel CLU4-1 (primeira soluo com 4 clusters) acrescentou-se base de dados, tendo sidocompletada com os respectivos label.

O n de elementos em cada cluster o seguinte:

CLU4_1 Clusters d10 a d17 (Ward Method)

498 33.0 37.4 37.4

299 19.8 22.5 59.9

423 28.0 31.8 91.7

110 7.3 8.3 100.0

1330 88.0 100.0

181 12.0

1511 100.0

Cluster 1

Cluster 2

Cluster 3

Cluster 4

Total

Valid

SystemMissing

Total


Percent

33Pois so os que apresentam maior distncia entre si. No entanto, seria sempre possvel ensaiar solues com mais

clusters. No essencial, mais clusters significam mais homogeneidade entre os seus elementos e menos clustersmenos homogeneidade.34Uma vez que j no necessitamos dos coeficientes de aglomerao.


67/79

67

3.4.2.2. Anlise no-hierrquica de Clusters - Mtodo de optimizao

(K-Means Cluster)

Exemplo: pretende-se seleccionar e criar clusters com base nos 8 indicadores relativos s atitudes

face imigrao (d10 +d11 +d12 +d13 +d14 +d15 +d16 +d17)

1.Seleco dasvariveis;

2.Indicao do n deClusters

pretendidos (vamosindicar 4, de acordocom o processoanterior)

3.Criao de umanova varivel queregista a pertenade cada observaoao clusterrespectivo

A varivel QCL_1 (primeira soluo com 4 clusters) acrescentou-se base de dados, tendo sido

completada com os respectivos label.


QCL_1 Clusters d10 a d17 (K-Means)

334 22.1 25.1 25.1459 30.4 34.5 59.6

324 21.4 24.4 84.0

213 14.1 16.0 100.0

1330 88.0 100.0

181 12.0

1511 100.0

Cluster 1Cluster 2

Cluster 3

Cluster 4

Total

Valid

SystemMissing

Total


Percent


68/79

68

3.4.3. Articulao entre a Anlise das Componentes Principais e a

Anlise de Clusters

Para este exemplo interessa saber, no entanto, que a anlise de clusters uma tcnica

multivariada que no possui slidos fundamentos tericos e que procura agrupar objectos mais oumenos homogneos segundo critrios mais ou menos heursticos35.

Exemplo: Pretende-se criar trs clusters (grupos homogneos) com base nas trs componentesprincipais obtidas no exerccio anterior.

Trata-se de um mtodo de classificao (classifica indivduos), cujo procedimento, que vai serdescrito detalhadamente no captulo 5, o seguinte:

a) Criao dos clusters

Acrescentou-se base de dados uma nova varivel com 3 categorias, que designmos de Cluster 1,Cluster 2 e Cluster 3, que agrupa os indivduos com valores semelhantes nas trs Componentes36

35

Moroco, J.Anlise Estatstica com utilizao do SPSS, Lisboa, Slabo, 2003.36Nota: como se torna evidente, os valores so mais ou menos semelhantes quantos mais ou menos clusters criarmos.Ou seja, mais clusters significa mais homogeneidade entre os clusters.


69/79

69

O n de elementos em cada cluster o seguinte:

Clusters Fac1_1+Fac1_2+Fac1_3 (Ward Method)

480 31.8 36.1 36.1

624 41.3 46.9 83.0

226 15.0 17.0 100.0

1330 88.0 100.0

181 12.0

1511 100.0

Cluster 1

Cluster 2

Cluster 3

Total

Valid

SystemMissing

Total


Percent

b) Caracterizao dos clusters segundo as variveis de input

Cluster 1

Cluster 2

Cluster 3



-1.50

-1.00

-0.50

0.00

0.50

1.00

(Mdias)

Interpretao:

Cluster 1: d importncia abaixo da mdia aos recursos profissionais e econmicos e scaractersticas raciais e religiosas e acima da mdia s facilidades de integrao;

Cluster 2: d importncia acima da mdia aos recursos profissionais e econmicos e scaractersticas raciais e religiosas e mdia s facilidades de integrao;

Cluster 3: d importncia mdia aos recursos profissionais e econmicos e abaixo damdia s facilidades de integrao e s caractersticas raciais e religiosas.


70/79

70

c) Caracterizao social dos clusters

211 44.0 252 40.4 106 46.9 569 42.8

269 56.0 372 59.6 120 53.1 761 57.2

480 100.0 624 100.0 226 100.0 1330 100.0148 30.8 117 18.8 51 22.6 316 23.8

179 37.3 197 31.6 93 41.2 469 35.3

88 18.3 147 23.6 44 19.5 279 21.0

65 13.5 163 26.1 38 16.8 266 20.0

480 100.0 624 100.0 226 100.0 1330 100.0

272 56.7 470 75.4 150 66.4 892 67.1

100 20.8 102 16.4 39 17.3 241 18.1

108 22.5 51 8.2 37 16.4 196 14.7

480 100.0 623 100.0 226 100.0 1329 100.0

111 27.3 117 22.5 47 27.6 275 25.1

211 52.0 265 50.9 89 52.4 565 51.5

84 20.7 139 26.7 34 20.0 257 23.4406 100.0 521 100.0 170 100.0 1097 100.0

Masculino

Feminino

Total

Sexo

At 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

Total

Idade

At 9 anos

10 - 12 anos

> 12 anos

Total


Esquerda

Centro

DireitaTotal

Autoposic ionamento

poltico

N %

Cluster 1

N %

Cluster 2

N %

Cluster 3

N %

Total

d) Distribuio dos indivduos pelos clusters, segundo caractersticas scio-demogrficas

211 37.1 252 44.3 106 18.6 569 100.0

269 35.3 372 48.9 120 15.8 761 100.0

480 36.1 624 46.9 226 17.0 1330 100.0

148 46.8 117 37.0 51 16.1 316 100.0

179 38.2 197 42.0 93 19.8 469 100.0

88 31.5 147 52.7 44 15.8 279 100.0

65 24.4 163 61.3 38 14.3 266 100.0

480 36.1 624 46.9 226 17.0 1330 100.0

272 30.5 470 52.7 150 16.8 892 100.0

100 41.5 102 42.3 39 16.2 241 100.0

108 55.1 51 26.0 37 18.9 196 100.0

480 36.1 623 46.9 226 17.0 1329 100.0

111 40.4 117 42.5 47 17.1 275 100.0

211 37.3 265 46.9 89 15.8 565 100.0

84 32.7 139 54.1 34 13.2 257 100.0

406 37.0 521 47.5 170 15.5 1097 100.0

Masculino

Feminino

TotalSexo

At 30 anos

31 - 50 anos

51 - 65 anos

> 65 anos

Total

Idade

At 9 anos

10 - 12 anos

> 12 anos

Total


Esquerda

Centro

Direita

Total

Autoposic ionamentopoltico

N %

Cluster 1

N %

Cluster 2

N %

Cluster 3

N %

Total


71/79

71

A avaliao deste captulo consiste na avaliao da participaonas aulas e da realizao dos exerccios que compem o seucontedo.

Aranaz, M. F. (2001), SPSS para Windows. Anlise Estadstico,Madrid, McGraw-Hill.

Bryman, A. e D. Cramer (2003), Anlise de Dados em Cincias

Sociais Introduo s Tcnicas Utilizando o SPSS paraWindows, Lisboa, Celta (3 edio). Moroco, J. (2003) Anlise Estatstica com utilizao do SPSS,

Lisboa, Edies Slabo, 3 edio. Pereira, A. (1999), SPSS-Guia Prtico de Utilizao, Anlise de Dados para Cincias

Sociais e Psicologia, Lisboa, Edies Slabo, 6 edio revista e corrigida. Pestana, M. H. e J. N. Gageiro (2000), Anlise de Dados para as Cincias Sociais A

Complementaridade do SPSS, Lisboa, Slabo, 2 edio revista e aumentada. Rada, Vidal Daz (2002), Tcnicas de Anlise Multivariante para Investigacin Social

e Comercial, Madrid, RA-MA. Reis, E., Anlise factorial das componentes principais: um mtodo de reduzir sem

perder informao, Lisboa Giesta/Iscte, 1990. Vaus, D (2004),Analysing Social Science Data, London, Sage Publications. Vinacua, B. V. (2002), Anlisis Estadstico con SPSS para Windows. Volumen I.

Estadstica bsica, Madrid, McGraw-Hill, 2 edicin. Vinacua, B. V. e J. C. M Canas (2002),Anlisis Estadstico con SPSS para Windows.

Volumen II. Estadstica multivariante, Madrid, McGraw-Hill, 2 edicin.

Avaliao

Referncias


72/79

72

ANEXO 1

Testes de inferncia estatstica mais uti lizados

em

Anlise de dados bivariada


73/79


74/79


75/79

ANEXO 2

European Social Survey(round 1 - 2002)

Questionrio adaptado

http://www.europeansocialsurvey.org/


76/79

76


77/79

77


78/79

78


79/79

Documents

Manual Amostragem Introdução SPSS