Exploração e Cruzamento de Variáveis com o SPSS. Exploração de Variáveis Neste capítulo...

Preview:

Citation preview

Exploração e Cruzamento de Variáveis com o SPSS

Exploração de Variáveis

Neste capítulo olharemos para a distribuição de uma variável, visualizando a sua representação gráfica.

 Neste capítulo veremos também como obter

informação adicional sobre a distribuição das variáveis.

Consulte o ficheiro de dados

Resumo de uma distribuição

  Na barra de menus escolher: 

Analyze Descriptive Statistics Explore…   Seleccionar a variável (ou variáveis) que se

pretende explorar e colocá-la na lista de variáveis dependentes.

   Seleccionar a variável que define os grupos de casos e movê-la para a lista de factores.

Resumo de uma distribuição

Preparação do cálculo:

Resumo de uma distribuição

Obtém-se o seguinte resultado :

325 99,4% 2 ,6% 327 100,0%

319 99,7% 1 ,3% 320 100,0%

74 100,0% 0 ,0% 74 100,0%

26 100,0% 0 ,0% 26 100,0%

Emprego outrabalho de casaMuito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeito

Idade dorespondente

N Percent N Percent N PercentValid Missing Total

Cases

Case Processing Summary

Número de casos da opção muito satisfeito.

Número de casos em falta para a mesma opção.

Percentagem de casos em falta.

Resumo de uma distribuição

Verifica-se que há 325 casos na categoria muito satisfeito para os quais a idade está disponível.

 O número de casos em falta é 2. Isto significa que 2 casos muito

satisfeitos não têm um valor válido para a variável idade. Este número representa apenas 0,6% do total de casos, pelo que o seu efeito é de somenos importância.

 O número de casos varia consideravelmente entre os quatro grupos: mais

de 300 indivíduos dizem-se moderadamente satisfeitos; 74 estão um pouco insatisfeitos; e apenas 26 estão muito insatisfeitos.

 As conclusões extraídas sobre os últimos dois grupos têm que ser

cuidadosas, pois são baseadas num número pequeno de casos.

Resumo de uma distribuição

A tabela seguinte apresenta o resultado das estatísticas sobre os grupos de casos.

Idade do respondente

41,50 39,49 40,26 38,5841,05 39,11 39,83 38,19

40,00 39,00 38,00 36,5011,54 10,89 10,72 9,91

19 20 23 2282 75 72 6363 55 49 41

15,50 16,00 14,25 17,00

Mean5% Trimmed Mean

MedianStd. Deviation

MinimumMaximumRangeInterquartile Range

Muitosatisfeito

Moderadamentesatisfeito

Um poucoinsatisfeito

Muitoinsatisfeito

Emprego ou trabalho de casa

Resumo de uma distribuição

Utilize o editor de tabelas, Pivot Table Editor, para modificar a tabela.

 Para esconder linhas ou colunas, fazer Ctrl+Alt+Click sobre o topo

da linha ou coluna. Depois premir o botão direito do rato e escolher Hide Category.

 As médias das idades variam do valor mais elevado de 41,5 no

grupo muito satisfeito, até ao valor mais baixo de 38,58 no grupo muito insatisfeito.

 O valor das medianas é sensivelmente mais baixo para todos os

grupos, porque as distribuições de idade têm caudas nos valores mais elevados de idade.

Resumo de uma distribuição

A média aparada (trimmed mean) evita este problema pois exclui os valores mais elevados, assim como os mais baixos. Na 5% trimmed mean, apenas são considerados 90% dos casos, no centro da distribuição, excluindo-se os 5% do extremo superior e os 5% do extremo inferior.

 O desvio padrão mais elevado pertence ao grupo muito satisfeito,

pois este contém o valor de idade mais elevado: 82 anos. A linha Range dá-nos a amplitude de idades do grupo. O Interquartile range dá-nos a amplitude de idades do grupo,

medida entre os percentis 25 e 75, não sendo por isso afectado pelo valores extremos.

Resumo de uma distribuição

Para identificar os valores extremos, deve premir o botão Statistics na caixa de diálogo Explore e seleccionar a opção Outliers.

Resumo de uma distribuição

A tabela seguinte apresenta os valores extremos para o grupo muito satisfeito.

Emprego ou trabalho de casa: Muito satisfeito

344 82223 78263 77401 77208 73173 19364 20714 20665 21320 21

1234512345

Highest

Lowest

Idade dorespondente

CaseNumber Value

O caso 344 é o indivíduo mais velho, com 82 anos de idade.

O caso 173 é o indivíduo mais novo, com 19 anos de idade.

Resumo de uma distribuição

Com o Explore podem obter-se os percentis para cada grupo. Para isso deve premir o botão Statistics na caixa de diálogo

Explore e seleccionar a opção Percentiles.

Resumo de uma distribuição

Percentis (resultados):

24,00 27,00 33,50 40,00 49,00 57,40 61,00

24,00 26,00 31,00 39,00 47,00 55,00 60,00

25,00 27,00 32,75 38,00 47,00 55,50 60,25

24,10 28,00 30,00 36,50 47,00 51,60 59,5034,00 40,00 49,00

31,00 39,00 47,00

33,00 38,00 47,00

30,00 36,50 47,00

Emprego outrabalho de casaMuito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeitoMuito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeito

Weighted Average(Definition 1)

Tukey's Hinges

5 10 25 50 75 90 95Percentiles

Idade do respondente

10% dos casos têm 27 ou menos anos, no grupo muito satisfeito.

10% dos casos têm 57,4 ou mais anos, no grupo muito satisfeito.

Histograma

Para obter o histograma, deve premir o botão Plots na caixa de diálogo Explore e seleccionar a opção Histogram.

Histograma

Idade do respondente

80,075,0

70,065,0

60,055,0

50,045,0

40,035,0

30,025,0

20,0

Histograma

Para SAT_EMP= Muito satisfeito

Freq

uênc

ia

70

60

50

40

30

20

10

0

Std. Dev = 11,54

Mean = 41,5

N = 325,00

O intervalo com o ponto médio 40 é o que tem mais casos.

O gráfico caule e folhas

Para obter o gráfico caule e folhas, deve premir o botão Plots na caixa de diálogo Explore e seleccionar a opção Stem-and-leaf.

O gráfico caule e folhas

Idade do respondente Stem-and-Leaf Plot paraSAT_EMP= Um pouco insatisfeito  Frequency Stem & Leaf  2,00 2 . 33 13,00 2 . 5556777899999 7,00 3 . 0123334 18,00 3 . 555566666777788899 7,00 4 . 0012234 13,00 4 . 5556666677888 5,00 5 . 02223 5,00 5 . 55679 3,00 6 . 013 1,00 Extremes (>=72)  Stem width: 10 Each leaf: 1 case(s)

Multiplicar o caule pela largura do caule e somar as folhas para obter os valores (60, 61 e 63).

Cinco casos têm 29 anos de idade.

Apenas um caso tem 34 anos de idade.

Se a largura do caule (stem width) fosse 100, então os valores do tronco de valor 6 seriam 600, 610 e 630.

A caixa de bigodes

Para obter a caixa de bigodes, seleccionar a opção Plots, ou Both na caixa de diálogo Explore.

A caixa de bigodes

2674319325N =

Emprego ou trabalho de casa

Muito insatisfeito

Um pouco insatisfeit

Moderadamente satisf

Muito satisfeito

Idad

e do

resp

onde

nte

90

80

70

60

50

40

30

20

10

64389729

277208

401263223

344

Valores isolados.

A caixa estende-se do percentil 25 até ao 75. A linha é a mediana.

As extremidades estendem-se ao maior e menor valor observado até 1,5 do comprimento da caixa.

Cruzamento de Variáveis

Uma tabela de frequências é insuficiente para visualizar o grau de satisfação no emprego, por cada categoria de salário. Para isso há necessidade de recorrer ao cruzamento de variáveis.

        Na barra de menus escolher: 

Analyze Descriptive Statistics Crosstabs… 

       Seleccionar a variável (ou variáveis) que vai ocupar as linhas da tabela e colocá-la em Row(s).

      

Seleccionar a variável (ou variáveis) que vai ocupar as colunas da tabela e colocá-la em Column(s).

Cruzamento de Variáveis

Preparação do cálculo:

Cruzamento de Variáveis

Mova diversas variáveis para as listas de linhas ou colunas, para obter múltiplos cruzamentos bivariados.

 Para visualizar três ou mais variáveis em simultâneo, coloque

as variáveis adicionais em camadas sucessivas (layers).

Cruzamento de Variáveis

Cruzamento de sat_emp com receita4.

Count

53 90 74 110 327

93 79 61 87 320

24 17 14 19 74

4 8 7 7 26174 194 156 223 747

Muito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeito

Empregooutrabalhode casa

Total

24,999ou menos

25,000 to39,999

40,000 to59,999

60,000ou mais

Total de receitas da família em quartis

Total

Emprego ou trabalho de casa * Total de receitas da família em quartis Crosstabulation

Cruzamento de Variáveis

Cruzamento de sat_emp com receita4 e sexo.

Count

30 51 41 57 179

44 44 36 49 173

10 10 7 14 41

2 3 6 4 1586 108 90 124 40823 39 33 53 148

49 35 25 38 147

14 7 7 5 33

2 5 1 3 1188 86 66 99 339

Muito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeito

Empregooutrabalhode casa

TotalMuito satisfeitoModeradamentesatisfeitoUm poucoinsatisfeitoMuito insatisfeito

Empregooutrabalhode casa

Total

Sexo dorespondenteM

F

24,999ou menos

25,000 to39,999

40,000 to59,999

60,000ou mais

Total de receitas da família em quartis

Total

Emprego ou trabalho de casa * Total de receitas da família em quartis * Sexo do respondente

Percentagens de linha e coluna

Para visualizar-se as percentagens das células, deve premir o botão Cells na caixa de diálogo Crosstabs e seleccionar as opções Row, Column ou Total.

Percentagens de linha e coluna

53 90 74 110 327

30,5% 46,4% 47,4% 49,3% 43,8%

93 79 61 87 320

53,4% 40,7% 39,1% 39,0% 42,8%

24 17 14 19 74

13,8% 8,8% 9,0% 8,5% 9,9%

4 8 7 7 26

2,3% 4,1% 4,5% 3,1% 3,5%

174 194 156 223 747

100,0% 100,0% 100,0% 100,0% 100,0%

CountPercentagensna colunaCountPercentagensna colunaCountPercentagensna colunaCountPercentagensna colunaCountPercentagensna coluna

Muito satisfeito

Moderadamentesatisfeito

Um poucoinsatisfeito

Muito insatisfeito

Empregoou trabalhode casa

Total

24,999ou menos

25,000 to39,999

40,000 to59,999

60,000ou mais

Total de receitas da família em quartis

Total

Emprego ou trabalho de casa * Total de receitas da família em quartis Crosstabulation

Todas as colunas somam 100% de percentagem.

Visualização gráfica

Os resultados do cruzamento de variáveis podem ser apresentados graficamente.

        Na barra de menus escolher: 

Graphs Bar…        Escolher Stacked e premir Define.        Escolher a variável receita4 para o eixo das categorias.      Escolher a variável sat_emp para a definição dos

clusters.

Visualização gráfica

Total de receitas da família em quartis

60,000 ou mais

40,000 to 59,999

25,000 to 39,999

24,999 ou menos

Cou

nt300

200

100

0

Emprego ou trabalho

Muito insatisfeito

Um pouco

insatisfeito

Moderadamente

satisfeito

Muito satisfeito

Visualização gráfica

Para apresentar a percentagem de casos, as variáveis devem ser escolhidas por ordem inversa.

 Depois, no editor de gráficos deve fazer-se: 

Series Transpose Data

Visualização gráfica

60,000 ou mais

40,000 to 59,999

25,000 to 39,999

24,999 ou menos

100

90

80

70

60

50

40

30

20

10

0

Emprego ou trabalho

Muito insatisfeito

Um pouco

insatisfeito

Moderadamente

satisfeito

Muito satisfeito

Visualização gráfica

Desta forma consegue-se comparar a distribuição inspeccionando as barras para cada grupo.

 Observa-se que o grupo das pessoas com menor rendimento

é o que possui menor percentagem de indivíduos muito satisfeitos com o seu emprego. Representam também a menor percentagem de indivíduos muito insatisfeitos.

 Pode ver-se que a soma das percentagens dos indivíduos

muito satisfeitos e moderadamente satisfeitos é sensivelmente a mesma para os quatro grupos.

Recommended