Upload
nair-moura
View
225
Download
2
Embed Size (px)
Citation preview
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 1/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 2/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
INTRODUÇÃO ÀS TÉCNICAS UTILlZNDO O SPSS PARA WINDOWS
Título Anólise de dodos em Ciêncios Sociois
ELT
www celtaeditora pt
Ruo Vera Cruz 28 I 2780 305 Oeiras
Apartado 151 12781 901 Oeiras
Tel: 2144174331 Fax: 214467304
Autor Alon Brymon e Duncon Creme r
Distribuidor Rua Rodrigues Sampaio 77 c/v Lisboa
Tel: 213529006/08
I
Fax; 213159259
IS N
972 774 169 X
Preço
28 35
€
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 3/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 4/128
tulo original: QuantitativData nalysis with SPSS Release 10 for Windows
Cuide for Social Scientists
Routledge, 2001
lan Bryman e Duncan Cramer
nálise de Dados em Ciências Sociais: Introdução às Técnicas Utilizando
SPSS
O
para Windows
imeira edição portuguesa: Novembro de 1992
ragem: 1000 Exemplares
gunda edição portuguesa: Novembro de 1993
ragem: 1000 Exemplares
rceira edição portuguesa: Março de 2003
ragem: 1000 Exemplares
adução do inglês: Alexandra Figueiredo de Barros
La
edição) e Diniz Lopes
3.a
edição)
evisão técnica: Luísa Pedroso de Lima
La
edição) e Diniz Lopes 3: edição)
N: 972-774-169-X
epósito legal: 192457/03
BN da edição original: 0-415-24400-5, Londres, Routledge
omposição: Celta Editora, utilizando caracteres Palatino, corpo 10
apa: Mário Vaz
Arranjo: Paula Neves
pressão e acabamentos: Tipografia Lousanense, Lda.
eservados todos os direitos para a língua portuguesa,
acordo com a legislação em vigor, por Celta Editora, Lda.
eIta Editora, Rua Vera Cruz, 2B, 2780-305 Oeiras, Portugal
dereço postal: Apartado 151, 2781-901 Oeiras, Portugal
.: +351) 214 417 433
x: +351) 214467304
ail: mai @celtaeditora.pt
ina: www.celtaeditora.pt
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 5/128
PL NO D O R
Índice de figuras caixas e quadros
Xl
Prefácio xxi
1 A análise de dados e o processo de investigação 1
2 Analisar dados com o computador: os primeiros passos
com o SPSS1 para Windows 19
3 Analisar dados com o computador: dominar melhor
o SPSS1 para Windows 47
4 Os conceitos e a sua medição 63
5 Resumir os dados 81
6 Arnostragem e significância estatística 111
7 Análise bivariada: explorar diferenças entre valores
de duas variáveis 131
8 Análise bivariada: identificar associações entre variáveis 183
9 Análise multivariada: explorar diferenças entre três
ou mais variáveis 225
1 Análise multivariada: caracterizar relações entre três
ou mais variáveis 259
11 Agregar variáveis: análise fadorial exploratória 297
Respostas aos exercícios 313
Referências bibliográficas 325
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 6/128
lano da obra v
dice de figuras caixas e quadros xi
refácio xxi
ANÁLISE DADOS E O PROCESSO DE INVESTIGAÇÃO 1
análise de dados quantitativos e o processo de investigação 2
lano de investigação e causalidade 8
quérito/plano correlacional e causalidade 14
xercícios 16
NALISAR DADOS COM O COMPUTADOR: OS PRIMEIROS
ASSOS COM O SPSS 10 PARA WINDOWS 19
ficheiro de dados 20
omo ter acesso ao SPSS 25
introdução e edição de dados no Data Editor 29
rocedimentos estatísticos 37
uardar e imprimir o Output 40
istema de ajuda 40
erminar uma sessão de trabalho no SPSS 41
xercícios 41
pêndice 2 1 Questionário do Trabalho 43
NALISAR DADOS COM O COMPUTADOR:
OMINAR MELHOR O SPSS 10 PARA WINDOWS 47
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 7/128
viii
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
Dados omissos e cálculo de valores para formar medidas
compostas 57
Exercícios 6
OS CONCEITOS E A SUA MEDIÇÃO 63
Tipos de variáveis 66
Dimensões dos conceitos 7
Validade e fidelidade das medidas 73
Exercícios 78
RESUMIR OS DADOS 81
Distribuições de frequência 81
Medidas de tendência central 92
Medir a dispersão 95
Métodos de apresentação dos dados: diagramas
troncos e folhas e diagramas extremos e quartis 98
A forma de uma distribuição 1 4
Exercícios 1 8
AMOSTRAGEM E SIGNIFICÂNCIA ESTATÍSTICA 111
Amostragem 111
Problemas relacionados com a amostragem 116
Significância estatística 118
A inferência a partir de amostras da população 126
Exercícios 129
ANÁLISE BIVARIADA: EXPLORAR DIFERENÇAS
ENTRE VALORES DE DUAS VARIÁVEIS 131
Critérios para seleccionar testes bivariados de diferenças 132
Testes paramétricos versus não paramétricos 133
Variáveis nominais e testes não paramétricos 136
Variáveis não nominais e testes não paramétricos 147
Variáveis não nominais e testes paramétricos 159
Análise de variância a um factor para três ou mais médias não
relacionadas 165
Análise de variância multivariada para três ou mais médias
relacionadas 174
Exercícios 18
ANÁLISE BIVARIADA: IDENTIFICAR ASSOCIAÇÕES ENTRE
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 8/128
ÍNDICE
ix
Outras abordagens de associações entre duas variáveis 2 7
Regressão 2
Abordagem geral sobre os diferentes tipos de variáveis
e métodos de análise das suas relações 22
Exercícios 222
9 ANÁLISE MULTIVARIADA: EXPLORAR DIFERENÇAS
ENTRE TRÊS OU MAIS VARIÁVEIS 225
Planos de estudo multivariados 225
Análise multi variada 235
Exercícios 256
ANÁLISE MULTIVARIADA: CARACTERIZAR RELAÇÕES
ENTRE TRÊS OU MAIS VARIÁVEIS 259
Análise multivariada através de tabelas de contingência 26
Análise multivariada e correlação 27
Regressão e análise multivariada 275
Path analysis 287
Exercícios 293
AGREGAR VARIÁVEIS: ANÁLISE FACTORIAL
EXPLORATÓRIA 297
Matriz de correlações correlation matrix 299
Componentes principais ou factores? 3
Número de factores a manter 3 3
Rotação de factores 3 5
O procedimento do SPSS para a análise factorial 3 8
Exercícios 3 9
Respostas aos exercícios 3 3
Referências bibliográficas 325
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 9/128
ÍNDICE DE FIGURAS, CAIXAS E QUADROS
Figuras
1 O processo de investigação 3
.2 Uma relação espúria 10
.3 Um estudo experimental 12
.4 Três tipos de planos experimentais 13
.5 Uma relação entre duas variáveis 15
.6 A relação será espúria? 15
.7 Duas possibilidades de interpretação causal de uma relação 16
.1 Decisão da natureza de uma variável 67
.2 Conceitos, dimensões e medidas 71
Gráfico de barras referente à distribuição dos estudantes
por faculdades 83
Histograma para os valores da variável rendim
dados do Questionário do Trabalho) 85
.3 Diagrama de queijo para gpracial dados do Questionário
do Trabalho) 90
.4 Amplitude interquartis 97
.5 Diagrama de troncos-e-folhas para a variável necess 102
Diagrama de extremos-e-quartis
104
.7 Diagrama extremos-e-quartis da variável necess
utput
do SPSS) 104
Duas distribuições normais
106
.9 Média e distribuição normal
106
Propriedades da distribuição normal
107
Distribuições positiva e negativamente enviesada
108
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 10/128
xii
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
6.2
6 3
6.4
7
8.1
8.2
8.3
8.4
8.5
8.6
8.7
8.8
8.9
8 1
8 11
8 12
8.13
8 14
8 15
8 16
8 17
9.1
9.2
9.3
9 4
9.5
9.6
1 1
1 2
10.3
1 4
Distribuição de resultados teóricos similares obtidos por 64
lançamentos de moeda .
Nível de significância de 5 para hipótese unicaudal
ou bicaudal .
Intervalos de confiança .
Uma comparação da distribuição do erro padrão da diferença
de médias para amostras relacionadas .
Diagrama de dispersão mostrando uma associação negativa:
satis por rotina .
Diagrama de dispersão mostrando uma associação positiva .
Uma associação perfeita .
Ausência de associação entre duas variáveis .
Três associações curvilineares .
Duas associações positivas .
Duas associações negativas .
Força e direcção dos coeficientes de correlação .
Tipos de associações entre duas variáveis .
A recta de regressão .
Regressão: uma associação negativa .
Regressão: um ponto de intercepção negativo .
Regressão: uma associação perfeita .
A precisão da recta de regressão .
Diagramas de dispersão correspondentes a dois níveis
de correlação idênticos .
Heterocedasticidade .
Diagrama de dispersão do SPSS com recta de regressão
ados do Questionário de Trabalho) .
Exemplo de uma interacção entre duas variáveis .
Exemplos de outros tipos de interacção entre duas variáveis .
Exemplos de ausência de interacção entre duas variáveis .
Representação esquemática de um efeito significativo
de um factor .
Níveis de depressão pós-teste em mulheres e homens Projecto
Depressão) .
Níveis de depressão pré e pós-teste nos três tratamentos
rojecto Depressão) .
Será que a relação entre a variedade nas funções e a satisfação
no trabalho é espúria? .
Será a relação entre a variedade das funções e a satisfação
no trabalho afectada por uma variável interveniente? .
Será que a relação entre a variedade das funções e a satisfação
no trabalho é moderada pelo sexo? .
Causalidade múltipla .
119
125
128
173
196
197
197
197
198
199
199
2
2 1
213
214
214
215
215
216
217
222
226
227
228
23
239
252
262
265
267
269
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 11/128
ÍNDICE DE FIGURAS, CAIXAS E QUADROS
xiii
0.3 Os efeitos do controlo de uma variável em teste 272
10.6 Diagrama de
path
para satis 288
:0.7 Diagrama
path
para satis, especificando os coeficientes
path
291
:0.8 Diagrama path para absent 292
_1.1 Variância comum e variância única 301
_1.2 Teste
scree
dos valores próprios Questionário do Trabalho 304
Caixas
: 1 A janela de abertura do Windows 95/98 26
_.2
O Editor de Dados Data Editor do SPSS 27
_ 3
O menú
drop down
da opção Data 27
_ A caixa de diálogo Select Cases 28
_ 3
A janela Variable View do Data Editor 30
_.6
A caixa de diálogo Missing values 32
_ 7
A caixa de diálogo Value labels 33
_ 8
O menu
drop down
File 34
_ 9
A caixa de diálogo Save Data As 35
_.10
A caixa de diálogo Open File 36
_.11 A caixa de diálogo Text Import Wizard 37
_.12
A caixa de diálogo Descriptives 38
_ 13
A subcaixa de diálogo Descriptive: Options
39
_.14 A caixa de diálogo Help Topics Content 41
_.15
A caixa de diálogo Help Topics Find 42
_.16 A caixa de informação Help 42
3.1 A caixa de diálogo Select Cases 47
3.2 A subcaixa de diálogo Select Cases: If : 48
3.3 A caixa de diálogo Recode into Different Variables 51
3.4 A subcaixa de diálogo Recode into Different Variables:
Old and New Values 52
3.5 A caixa de diálogo Summarize Cases 53
3.6 A caixa de diálogo Recode into Same Variables 55
3.7 A subcaixa de diálogo Recode into Same Variables:
Old and New Values 55
3.8 A caixa de diálogo Compute Variable 56
4.1 A caixa de diálogo Reliability Analysis 76
-t2 A subcaixa de diálogo Reliability Analysis: Statistics 77
3.1 A recodificação de rendim para rendimgp 87
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 12/128
xiv
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
5 5
5 6
5 7
5 8
5 9
7
7
7 3
7 4
7 5
7 6
7 7
7 8
7 9
7 1
7 11
7 12
7 13
7 14
7 15
7 16
7 17
7 8
7 9
7 2
7 21
7 22
7 23
8
8 2
8 3
8 4
8 5
8 6
A subcaixa de diálogo
Define Simple Bar Summaries
for Groups of Cases
A caixa de diálogo Pie Charts
A subcaixa de diálogo Define Pie Summaries for
Groups of Cases
A caixa de diálogo
Explore
A subcaixa de diálogo Frequencies Statistics
A caixa de diálogo Binomial Test
A caixa de diálogo
Chi Square Test
A caixa de diálogo Crosstabs
A subcaixa de diálogo Crosstabs Cell Display
A subcaixa de diálogo
Crosstabs Statistics
A caixa de diálogo Two Related Samples Tests
A caixa de diálogo
Tests for Several Related Samples
A caixa de diálogo One Sample Kolmogorov Smirnov Test
A caixa de diálogo Two Independent Samples Tests
A subcaixa de diálogo Two Independent Samples
Define Groups
A caixa de diálogo Tests for Several Independent Samples
A subcaixa de diálogo
Several Independent Samples
Define Range
A caixa de diálogo
One Sample T Test
A caixa de diálogo Independent Samples T Test
A subcaixa de diálogo Define Groups
A caixa de diálogo
One Way ANOVA
A subcaixa de diálogo One Way ANOVA
A subcaixa de diálogo
One Way ANOVA Contrasts
A subcaixa de diálogo One Way ANOVA Post Hoc Multiple
Comparisons
A caixa de diálogo
Paired Samples T Test
A caixa de diálogo Repeated Measures Define Factor[s]
A subcaixa de diálogo Repeated Measures
A subcaixa de diálogo
Repeated Measures Options
A caixa de diálogo Crosstabs
A subcaixa de diálogo
Crosstabs Statistics
A subcaixa de diálogo Crosstabs Cell Display
A caixa de diálogo Scatterplot
A subcaixa de diálogo
Simple Scatterplot
A caixa de diálogo Bivariate Correlations
9
9
91
98
1 8
137
139
143
143
144
146
148
149
151
151
152
153
16
163
163
167
168
169
17
173
176
176
177
189
189
19
2 3
2 4
2 4
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 13/128
ÍNDICE DE FIGURAS, CAIXAS E QUADROS
xv
9.2 A subcaixa de diálogo Univariate: Options 237
.3 A subcaixa de diálogo Univariate: Profile Plots 237
.-l A subcaixa de diálogo Univariate: Model 242
9.3 A caixa de diálogo Multivariate 245
9.6 A subcaixa de diálogo Multivariate: Options 246
9.7 A caixa de diálogo Repeated Measures Define Factor[s] 249
9.8 A subcaixa de diálogo Repeated Measures 250
.9 A subcaixa de diálogo Repeated Measures: Options à
9.10 A subcaixa de diálogo Repeated Measures: Profile Plots 251
9.11 A caixa de diálogo completa Repeated Measures:
Define Factor[s] 253
9.12 A subcaixa de diálogo Repeated Measures
análise de plano combinado) 254
10.1 A caixa de diálogo Partial Correlations 274
1.0.2
A subcaixa de diálogo Partial Correlations: Options
274
:0.3 A caixa de diálogo Linear Regression 285
:0.4 A subcaixa de diálogo Linear Regression: Statistics 285
:1.1 A caixa de diálogo Factor Analysis 310
11.2 A subcaixa de diálogo Factor Analysis: Descriptives 310
1.1.3 A subcaixa de diálogo Factor Analysis: Extraction 310
11.4 A subcaixa de diálogo Factor Analysis: Rotation 311
11.5 A subcaixa de diálogo Factor Analysis: Options 311
Quadros
.1 Violência na televisão e agressão 10
_.1 Os dados do Questionário do Trabalho 22
2.2 Nomes e localização das variáveis do Questionário
de Trabalho no SPSS 25
_.3 O
output
do comando Descritptives 38
2.4 O output Mean Descriptive 39
3.1 Idade média dos sujeitos do sexo masculino do Questionário
de Trabalho 49
3.2 O
output
do comando Case Summaries mostrando os valores
recodificados de rsatis2 e rsatis4 54
3.3 O output do comando Case Summaries mostrando os valores
de satisl, rsatis2, satis3, rsatis4 e satis 57
3.4 Os dados transformados do Questionário de Trabalho 61
;.1 Tipo de variáveis 67
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 14/128
xvi
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
5.1 Faculdades a que pertencem cinquenta e seis alunos
Dados Fictícios) 82
5.2 Tabela de frequência referente aos dados apresenados
no quadro 5.1 83
5.3 Distribuição de frequências para os valores de rendim dados
do Questionário do Trabalho) 85
5.4 Tabela de frequências para rendimgp
utput
do SPSS) 88
5.5 Resultados de um teste de aptidão matemática aplicado
aos alunos de dois professores Dados Fictícios) 96
5.6 O
utput do comando Explore para a variável rendim 99
5.7 Percentagem de necessidades satisfeitas pelas autarquias
num período de seis meses em Inglaterra e Escócia,1993-1994.... 101
6.1 Definição de uma amostra estratificada: trabalhadores
não manuais de uma empresa 116
6.2 Os quatro resultados que se podem obter a partir de dois
lançamentos da moeda 118
6.3 Resultados teóricos correspondentes ao lançamento de uma
moeda 64 vezes: probabilidade de resultados similares 120
6.4 Erros do Tipo I e do Tipo II 126
7.1 Testes de diferenças para duas variáveis 134
7.2 Comparação da proporção de homens e mulheres através
do teste binomial Questionário de Trabalho) 138
7.3 Comparação da proporção de brancos e não brancos através
do teste binomial Questionário do Trabalho) 138
7.4 Comparação do número de pessoas em cada um dos grupos
étnicos através do teste de qui-quadrado para uma amostra
Questionário de Trabalho) 140
7.5 Teste de qui-quadrado com número insuficiente de casos
Questionário de Trabalho) 141
7.6 O teste de qui-quadrado efectuado pelo procedimento Crosstabs,
comparando o número de homens e mulheres branco
e não brancos 144
7.7 Os dados do estudo de painel 145
7.8 Teste de McNemar comparando a comparência às reuniões
em dois meses Estudo de Painel) 146
7.9 Teste Q de Cochran comparando a comparência às reuniões
em três meses Estudo de Painel) 149
7.10 Teste de Kolmogorov-Smirnov para uma amostra comparando
a distribuição da qualidade do trabalho
Questionário de Trabalho) 150
7.11 Teste de Kolmogorov-Smirnov para dua :;amostras comparando
a distribuição da qualidade do trabalho em homens e mulheres
Questionário do Trabalho) 152
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 15/128
DICE DE FIGURAS, CAIXAS E QUADROS
xvii
~::>
-23
168
171
167
174
169
168
16
164
165
159
158
154
153
155
157
Teste de medianas comparando a qualidade de trabalho
em homens e mulheres Questionário do Trabalho .
Teste de Mann-Whitney comparando a qualidade do trabalho
em homens e mulheres Questionário do Trabalho .
Teste de Kruskal-Wallis comparando a qualidade do trabalho
entre grupos étnicos Questionário do Trabalho .
Teste dos sinais comparando a qualidade do trabalho em dois
meses Estudo de Painel .
Teste das ordens de Wilcoxon comparando a qualidade
do trabalho nos dois primeiros meses Estudo de Painel .
Teste de Friedman comparando a qualidade do trabalho em
três meses Estudo de Painel .
Teste para uma amostra da qualidade do trabalho
Questionário do Trabalho .
Teste
para amostras não relacionadas comparando a satisfação
no trabalho em homens e mulheres Questionário do Trabalho .
Teste
comparando a qualidade no trabalho em homens
e mulheres Questionário do Trabalho .
Tabela da análise de variância a um factor comparando
a satisfação no trabalho em diferentes grupos étnicos
Questionário do Trabalho .
Estatísticas descritivas grupais numa análise de variância
a um factor comparando a satisfação no trabalho em diferentes
grupos étnicos Questionário do Trabalho .
Teste de homogeneidade de variâncias de Levene
Questionário do Trabalho .
Estatísticas relativas aos contrastes a um factor comparando
a satisfação no trabalho nos grupos 1 e 2
Questionário do Trabalho .
Estatísticas relativas aos testes de Scheffé a um factor
comparando a satisfação no trabalho em diferentes grupos
étnicos Questionário do Trabalho .
Teste para amostras relacionadas comparando a satisfação
no trabalho nos primeiros dois meses Questionário do
Trabalho .
_/ Médias e desvios padrões de medidas repetidas da satisfação no
~
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 16/128
xviii
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
1 Dados relativos à satisfação no trabalho e ao absentismo de 30
empregados 185
2 Quatro combinações possíveis 185
3 A relação entre a satisfação no trabalho e o absentismo 186
4 Dois tipos de associação entre variáveis 186
5 Tabela de contingência especial por sexo output do SPSS 188
6 Nível de especialização dos trabalhadores por sexo 194
7 A matriz de coeficientes de correlação produto-momento
de Pearson
output
do SPSS 205
8 A matriz de coeficientes de correlação rho de Spearman 207
9 O output e ns para s tis por especial 211
10 O impacto dos valores extremos: a associação entre a dimensão
da empresa e o número de funções especializa das 218
11 Análise de regressão: s tis por rotina output do SPSS 221
1 Dados do projecto depressão 234
2 Médias da depressão pós-teste doepos nos três tratamentos
para homens e mulheres Projecto Depressão 238
3 Output dos Homogeneity tests Projecto Depressão 239
4 Testes de significância para efeitos principais e de interacção
num plano factorial não relacionado Projecto Depressão 240
5 Testes de significância para os efeitos da depressão pré-teste
Projecto Depressão 241
6 Resultados da análise de covariância mostrando o teste de
homogeneidade do declive da recta de regressão intra-células
Projecto Depressão 243
7 Análise de covariância Projecto Depressão 244
8 Médias ajustadas de depressão pós-teste nos três tratamentos
Projecto Depressão 244
9 Médias e desvios-padrão dos níveis de depressão pós-teste para
os doentes doepos e informadores infpos para os três
tratamentos Projecto Depressão 247
10 O teste M de Box Projecto Depressão 247
11 O teste de Levene Projecto Depressão 247
12 O teste de esfericidade de Bartlett Projecto Depressão 248
13 Testes multivariados de significância para os efeitos do tratamento
Projecto Depressão 248
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 17/128
l -UICE DE FIGURAS, CAIXAS E QUADROS
xix
Relação entre a covariável idade e as duas variáveis
transformadas (Projecto Depressão) 255
Teste multivariados para a interacção entre tempo, tratamento
e sexo (Projecto Depressão) 255
- 19 Testes univariados para o efeito de interacção entre tempo,
tratamento e sexo (Projecto Depressão) 256
· a
Variáveis transformadas (Projecto Depressão) 2.56
Relação entre variedade e satisfação no trabalho
(Dados Fictícios) 262
Urna relação espúria: a relação entre a variedade das funções
e a satisfação no trabalho controlando a dimensão da amostra
(Dados Fictícios) 263
__ 3 Urna relação não espúria: a relação entre a variedade das funções
e a satisfação no trabalho controlando a dimensão da empresa
(Dados Fictícios) 264
:: - Urna variável interveniente: relação entre a variedade das
funções e a satisfação no trabalho, controlando
a variável interesse pelo trabalho (Dados Fictícios) 265
~_J Urna relação moderada: a relação entre a variedade das funções
e a satisfação no trabalho controlando o sexo (Dados Fictícios) ... 267
: =
ó
Causalidade múltipla: urna relação entre variedade e satisfação
no trabalho controlando a participação no trabalho 269
h
I Rendimento, idade e posição face à economia de mercado
(Dados Fictícios) 273
~o A matriz de coeficientes de correlação parcial (Questionário
do Trabalho) 275
__9 Comparação de coeficientes de regressão não estandardizados
e estandardizados, com s t s corno variável dependente 279
: = 100 ut ut do SPSS para a regressão múltipla
(Questionário do Trabalho) 282
~:E.IRelação entre a concordância com a legislação que defende
a igualdade de salários e sexo dos inquiridos 294
:·:E.2Relação entre a concordância com a legislação que defende
a igualdade de salários e sexo dos inquiridos 294
:~ 1 Matrizes de correlações e níveis de significância para os itens
de satisfação e rotina (Questionário do Trabalho) 300
Comunalidades das componentes principais
(Questionário do Trabalho) 302
~~
Comunalidades dos eixos principais
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 18/128
xx
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
11.5 Pesos dos itens nas duas primeiras componentes principais
Questionário do Trabalho 305
11.6 Pesos dos itens nos dois primeiros eixos principais
Questionário do Trabalho 305
7 Pesos dos itens nas duas primeiras componentes principais
rodadas ortogonalmente Questionário do Trabalho 307
11.8 Pesos dos itens nas duas primeiras componentes principais
rodadas obliquamente Questionário do Trabalho 307
11.9 Correlações entre as duas primeiras componentes principais
rodadas obliquamente Questionário do Trabalho 308
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 19/128
PR FÁ IO
:e livro procura iniciar os leitores nas técnicas fundamentais de análise
3:atistica utilizadas por psicólogos e sociólogos. No entanto, não conside
': =.::10Sue ele seja uma introdução à estatística semelhante ao que é habi-
..:a1; pensamos antes que a sua natureza é diferente, já que não nos preocu
-:-=.::nosm incluir as complexas fórmulas subjacentes aos métodos estatís
:..:uS abordados.
É
frequente os estudantes considerarem essas fórmulas e
:;cálculos que se lhes associam muito assustadores, especialmente quan
:.~ as suas bases matemáticas são mais fracas. Além disso, nos dias de hoje,
~':;?omos de poderosos computadores e de conjuntos de programas esta
'=':;:::(os,parecendo desnecessário confrontar os estudantes com a ansieda
~=:-elacionada com cálculos complexos quando podem ser as máquinas a
:.=sempenhar a maior parte do trabalho. De facto, a maioria dos utilizado
_::-:;dispõe de programas estatísticos que permitem que sejam os computa
- -:-es a efectuar os cálculos havendo, assim, poucas razões para se consi
,_=:-arem as fórmulas e a sua aplicação como um ritu l de p ss gem para os
-s::ldantes de ciências sociais. Acresce ainda que poucos estudantes che
=::....~am compreender plenamente o racional da fórmula que teriam que
-:-:-ender.Na realidade, preferimos a designação análise de dados quan-
-:ativos em vez de estatística , devido à imagem adversa que esta últi-
;: ?alavra suscita em muitos potenciais leitores.
Tendo em conta o facto de termos disponíveis programas de estatística e
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 20/128
xxii
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
mais amplamente utilizado conjunto de programas para análise estatística
nas ciências sociais - o SPSS Statistical Package for the Social Sciences .
Este programa foi criado nos anos 60 e constituiu a primeira grande tenta
tiva de desenvolver software para as ciências sociais, tendo, desde aí, pas
sado por várias revisões e aperfeiçoamentos. As primeiras duas edições
deste livro Bryman Cramer, 1990,1994 referiam-se a versões do SPSS
desenvolvidas para computadores de grande porte maínframe e para o
sistema operativo Microsoft MS-DOS.No entanto, há uns anos atrás, apa
receu uma versão de SPSSdesenvolvida para o ambiente Microsoft Win
dows. Esta passou, também, por algumas revisões. Uma das edições ante
riores deste livro Bryman Cramer, 1997 dizia respeito à versão 6 para
Windows, desenvolvida para o Microsoft Windows 3.11.Após a introdu
ção do Windows 95,uma nova versão do SPSS versão 7 foi desenvolvida
para correr neste sistema operativo. Aúltima versão para o Windows 95é a
versão 10.O presente livro descreve a utilização desta versão, a que nos re
feriremos abreviadamente por SPSS.Autilização das versões 8e 9é descri
ta numa edição anterior desta obra Bryman e Cramer, 1999 .
Para fazer a distinção entre osmétodos de análise de dados e os coman
dos do SPSS,apresentamos osúltimos emnegrito Apresentamos, ainda, da
dos para os estudantes utilizarem, aparecendo os nomes das variáveis tam
bém em negrito [bold] por exemplo, rendim isto é, rendimento . As bases
de dados podem ser retiradas do endereço da editora Routledge na internet;l
http://www.routledge.com/textbooks/ titles/ quant10.html
Na parte final de cada capítulo incluímos exercícioscuja solução seen
contra no fim do livro. Esperamos que estudantes e professores lhes encon
trem utilidade; facilmente poderão ser adaptadas de modo a constituírem
exercícios adicionais.
O facto de termos combinado métodos de análise de dados usados
por psicólogos e por sociólogos prende-se com a nossa crença de que as
necessidades dos estudantes das duas áreas se sobrepõem substancial
mente. No entanto, os professores podem omitir algumas técnicas, se as
sim o entenderem.
Agradecemos a David Stonestreetpelo seu apoio nas edições anteri
ores deste livro, e à nossa presente editora, Vivien Ward, pelo seu apoio
na presente edição. Gostaríamos de agradecer, também, a Louis Cohen,
Max Hunt e Tony Westaway por terem lido omanuscrito da primeira edi
ção deste livro, e por terem feito sugestões para o seu aperfeiçoamento.
Obviamente eles não podem ser responsabilizados por quaisquer erros
que, eventualmente, apareçam neste livro: esses erros serão de nossa
1 Neste endereço, o leitor encontrará asbasesde dados em língua inglesa.Para aceder a es-
tas mesmas bases de dados em versão portuguesa, o leitor deverá dirigir-se a
http://www.celtaeditora.pt/materiais/ adados.
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 21/128
?REFACIO
xxiii
: : t5ivaresponsabilidade apesar de inevitavelmente cada
de nós~CU5aro outro de os ter
cometido 2
lan ryman e Duncan Cramer
Universidade de Loughborough
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 22/128
Capítulo 1
\ NÁLISE DE D DOS EO PRO ESSO DE INVESTIG ÇÃO
1no abrange amplamente o campo que se designa, em geral, por esta
as, como procurámos salientar no prefácio, afastámo-nos em vários
os da forma convencionalmente usada para ensinar este tema a estu
s pré e pós-graduados. Especificando, foi nossa intenção combinar a
se de dados com as competências no domínio da utilização de computa
sem sobrecarregar o leitor com fórmulas. Esta intenção afasta-nos de
s, ou mesmo da maior parte, das formulações deste tema. Preferimos o
análise de dados quantitativos porque a ênfase é posta na compreen-
: na análise de dados e não tanto na natureza das próprias técnicas
Por que razão devem os estudantes de ciências sociais aprender a fa
1álisee dados quantitativos, especialmente numa época em que a in
.gação qualitativa está a assumir, cada vez mais, uma posição diantei
man, 1988a)? Afinal já todos nós ouvimos falar da forma como os
estatísticos podem ser distorcidos, como pode ser ilustrado pelas
ras de Disraeli: Há mentiras, grandes mentiras e estatísticas . Por
notivo se deverão preparar investigadores e estudantes para se envol-
numa actividade que pode ser tão ingrata? Se considerarmos a pri
:-auestão - por que é que os estudantes de ciências sociais devem
:1dera fazer análise de dados quantitativos - devemos lembrar-nos
lIDagrande parte da pesquisa empírica desenvolvida no âmbito das
ias sociais é planeada para gerar dados quantitativos ou apoia-se ne-
ara poderem apreciar o tipo de análises que se utilizou com esses da
para analisarem os seus próprios dados (especialmente porque mui
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 23/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
autores reconhecem que haverá muito a ganhar se se fundirem as duas tra
dições de pesquisa Bryman, 1988a .
Em relação à questão da capacidade dos estatísticos de distorcer as aná
lises que executam, o panorama é substancialmente exagerado por livros com
títulos desconcertantes do género omo mentir com estatísticas Huff, 1973 ,
devendo ser reconhecido que uma compreensão das técnicas abordadas no
nosso livro dará aos leitores uma capacidade acrescida de ver para além das
representações erradas que preocupam tantas pessoas. De facto, a aquisição
de uma capacidade de avaliação da análise de dados quantitativos é benéfica,
face à perspectiva de uma utilização universal de dados estatísticos na vida
quotidiana, já que somos constantemente sujeitos a uma série deles na forma
de resultados de estudos de opinião, estudos de mercado, inventários de ati
tudes, estatísticas de saúde e de criminalidade, etc. O domínio da análise de
dados quantitativos aumenta a nossa capacidade para reconhecermos con
clusões deficientes ou manipulações da informação. Existe, ainda, a hipótese
de uma parte substancial dos nossos leitores virem a desempenhar funções
em que sejam confrontados com a necessidade de analisar ou apresentar da
dos estatísticos. A análise de dados quantitativos não consiste numa aplica
ção mecanizada de técnicas pré-determinadas, sendo, antes, um tema que ali
menta controvérsias e debates, à semelhança do que acontece com as próprias
ciências sociais. Quando for apropriado apresentaremos ao leitor alguns dos
aspectos que fomentam essas discussões.
nálise de d dos qu ntit tivos e o processo de investigação
Nesta secção, vamos explorar a forma como a análise de dados quantitativos
se adequa ao processo de investigação - especificamente o processo de in
vestigação quantitativa. Como veremos, a área de conhecimentos abordada
por este livro não se limita a responder à questão de como lidar com dados
quantitativos, centrando-se também noutros aspectos ligados à investigação
que afectam a análise de dados.
A figura 1.1 ilustra os passos principais da investigação quantitativa.
Embora se possa levantar a questão de se ela, de facto, se conforma sempre a
uma sequência linear bem ordenada Bryman, 1988a; 1998b , os componentes
apresentados na figura 1.1 fornecem um modelo de representação útil. Nesse
modelo, são delineadas as etapas a seguir referenciadas.
Teoria
O ponto de partida do processo é o enquadramento teórico. As teorias, nas
ciências sociais, podem situar-se entre as abordagens abstractas e gerais
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 24/128
A ANÁLISE DE DADOS E O PROCESSO DE INVESTIGAÇÃO
~
Teoria
•
Hipóteses
•
Operacionalização
de conceitos
•
Selecção de sujeitos ou
de respondentes
l
3
Plano correlacionaVlnquérito
1- -Condução de entr e;;stas-I
I ou aplicação de :
~ ..9,,:~i :.n~i~s I
\
lano experimental
--------------1
I Definição de grupos de I
: controlo e de grupos I
I
experimentais
I
I. :
I Realização de observações I
lou aplicação de testes I
I
ou questionários
I
______________ J
Recolha de dados
•
Análise de dados
•
onclusões
~ 1.1 O processo de investigação
_: 0, por exemplo, o funcionalismo) e as abordagens de um nível de abs
-70 inferior que procuram explicar fenómenos específicos (como o com
:?mento de voto, a delinquência ou a agressividade). De um modo geral,
rias que tendem a receber mais atenção directa são as que têm um baixo
::. de generalidade. Merton
(1967)
referiu-se a teorias de médio alcance
designar as construções que se situam entre as teorias gerais e abstractas
. : escobertas empíricas. Hirschi (1969), por exemplo, formulou uma teoria
•_ a delinquência juvenil que propõe que os actos de delinquência são
- ?rováveis quando os laços da criança à sociedade estão quebrados. Esta
- derivou, em grande parte, de outras teorias e de dados de investigação
-onados com a delinquência juvenil.
ipóteses
~;ir do momento em que uma teoria é formulada, é provável que os in
- 5-adores a queiram testar. Será que a teoria continua a revelar-se adequa
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 25/128
4
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
a teoria que já referimos, verificou que as crianças que se encontram ligadas
uma sociedade convencional no sentido em que aderem aos valores con
encionais, participando ou aspirando a participar desses valores) terão me
os probabilidade de cometer actos de delinquência do que as crianças que
ão se encontram nessa situação. Muitas vezes, as hipóteses apresentam-se
mo uma relação entre duas ou mais entidades -neste caso, o envolvimen
com a sociedade convencional e a delinquência juvenil. Essas entidades
o, geralmente, designadas por conceitos - isto é, categorias onde se ar
mam as nossas ideias e observações sobre os elementos comuns do mundo.
natureza dos conceitos será discutida com maior pormenor no capítulo 4.
pesar das hipóteses terem a vantagem de forçar os investigadores a pensar
e forma sistemática sobre o que pretendem estudar e a estruturar os seus
lanos de investigação de acordo com isso, têm uma potencial desvantagem
ue consiste em poderem afastar a atenção do investigador de outras facetas
teressantes dos dados recolhidos.
peracionalização de conceitos
ara se avaliar a validade de uma hipótese é necessário desenvolver formas
e medir os conceitos a que ela se refere. Aeste processo chama-se, geralmen
operacionalização seguindo o exemplo do processo de medida utilizado em
edicina Bridgman, 1927). De facto, o que se passa nesta fase é a tradução
os conceitos em variáveis - isto é, em atributos que estabeleçam diferenças
ntre objectos relevantes indivíduos, empresas, nações, etc.). Hirschi opera
ionalizou de diversas formas a ideia de envolvimento com a sociedade con
encional. Uma dessas formas consistiu em incluir num questionário, que vi
ia a ser aplicado às crianças, um item em que lhes perguntava se gostavam
u não da escola. A delinquência foi medida inquirindo as crianças sobre o
úmero de actos de delinquência que tinham cometido i.e., através do núme
o de actos de delinquência auto-relatados). Amedida de conceitos, em mui
s estudos experimentais no âmbito da psicologia, é consegui da através da
bservação de pessoas e não tanto a partir da aplicação de questionários. Se o
vestigador está interessado na agressão, por exemplo, pode criar uma si
ação laboratorial que permita observar variações no comportamento agres
ivo. Uma outra forma de operacionalizar os conceitos consiste na análise de
statísticas existentes; foi, por exemplo, o que fez Durkheim 1898/1952) na
ua análise das taxas de suicídio. No capítulo 4 discutir-se-ão outros aspectos
gados à medição de conceitos e algumas das propriedades que as medidas
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 26/128
~.;AUSE DE DADOS E O PROCESSO DE INVESTIGAÇÃO
5
.=e 2cçãode inquiridos ou de sujeitos
~er um estudo de opinião, o investigador necessita de encontrar as
-s certas para aplicar o instrumento de medida que se construiu (por
_~o,um questionário de auto-aplicação ou um protocolo de entrevista).
:; considerar, novamente, o caso de Hirschi que seleccionou aleatoria
-=
::aais de
5500
crianças em idade escolar de uma zona da Càlifórnia.
_ :acto da selecção ser feita aleatoriamente é importante porque reflecte
~s
do investigador em chegar a conclusões que se possam generalizar
a: crianças que não tenham participado no estudo. Raramente é possí-
:actar todos os elementos de uma população e, por isso, é imperativo
_Laruma
amostra.
Para que os resultados se possam generalizar a uma
2.çãomais ampla, essa amostra tem que ser uma amostra representativa o
iXc.e ser garantido através de uma escolha aleatória dos sujeitos. Além
::-.uitas das técnicas estatísticas a que nos referiremos ao longo deste li
~encem ao domínio da
estatística inferencíal
que permite ao investiga
- =sde que a amostra constituída seja aleatória, determinar a probabilida-
- .:::::eos resultados que obteve a partir de uma amostra coincidam com os
:-..arn
obtidos para a população de onde a amostra foi retirada. Estes
:;serão abordados no capítulo 6.
;reparação de um plano de investigação
e sociólogos utilizam basicamente dois tipos de planos de investi
primeiros tendem a usar estudos
experimentais
em que o investiga
-:::pula aspectos da situação, quer no laboratório quer no campo, e ob
:;efeitos dessa manipulação nos sujeitos experimentais. Este tipo de es-
~ge, ainda, que exista um grupo de controlo , servindo como base de
~;;ão com o grupo de sujeitos submetidos à manipulação experimental.
/ano correlacíonal ou inquérito o investigador não manipula qualquer
.:::. todos os dados relacionados com todas as variáveis são recolhidos si-
~?:nente. O termo
correlação
também se refere a uma técnica para anali
-6es entre variáveis (ver capítulo 8) mas, no presente contexto, designa
.: .:ieplano de investigação. Nem sempre o investigador pode escolher
:::: --:25 dois tipos de estudos vai utilizar. Hirschi, por exemplo, não podia
:: ?IDas crianças mais envolvidas com a escola e outras menos para ob-
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 27/128
6
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
Locke e Schweiger, 1979 .
importante realçar que, na maior parte dos casos, a
natureza do plano de investigação - experimental ou correlacional- é conhe
cida no princípio da sequência representada na figura LI, de modo que as ca
racterísticas do plano escolhido influenciam várias fases do processo de inves
tigação. A natureza do plano de estudo tem também implicações no tipo de
manipulação estatística que pode ser executada com os dados que dele resul
tam. Na próxima secção, serão abordadas com maior pormenor as diferenças
entre os dois planos de estudo.
A recolha de dados
Nesta fase, o investigador recolhe dados a partir da realização de entrevistas,
da aplicação de questionários, da observação ou de qualquer outro método.
Num livro com as características do nosso não seria pertinente abordar os as
pectos técnicos ligados a esta recolha de dados. No caso do leitor não estar fa
miliarizado com este terna deverá consultar um livro sobre métodos de inves
tigação sociológica e psicológica.
A análise de dados
Esta fase tem urna relação muito directa com o terna deste livro. provável
que o investigador queira descrever os sujeitos com que trabalhou pelo me
nos em termos das variáveis inerentes ao estudo. Pode, por exemplo, estar in
teressado em conhecer qual a proporção de crianças que referem nunca ter co
metido actos de delinquência ou das que referem já ter cometido um ou dois
ou mais deste tipo de comportamentos. As diversas formas de análise e apre
sentação da informação relacionada com uma só variável chamada, por ve
zes,
análise univariada
serão examinadas no capítulo 5. No entanto, a análise
de uma só variável raramente é suficiente e o investigador provavelmente
terá interesse em conhecer a ligação entre essa variável e cada uma das outras
variáveis, i.e., em fazer uma
análise bivariada
O estudo das ligações entre va
riáveis pode ser feito de uma de duas formas. Um investigador que tenha con
duzido uma experiência pode estar interessado em saber qual a magnitude
da diferença entre o grupo experimental e o grupo de controlo em relação a al
gum aspecto. Pode querer saber, por exemplo, se o facto dos sujeitos verem
filmes violentos lhes aumenta a agressividade. O grupo experimental que vê
os filmes violentos e o grupo de controlo que não os vê podem, então, ser
comparados para se avaliar a extensão da diferença existente entre eles. As
técnicas para a verificação destas diferenças serão exploradas no capítulo 7.O
investigador pode, também, estar interessado nas relações existentes entre
variáveis - será que duas variáveis estarão ligadas entre si de forma a que
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 28/128
A A 'ÁLISE DE DADOS E O PROCESSO DE INVESTIGAÇÃO
7
a variar ao mesmo tempo? Hirschi (1969:121), por exemplo, apresen
quadro que ilustra como o facto de gostar da escola e os actos de delin
.a auto-relatados se encontram em interconexão: enquanto apenas 9
;:rianças que diziam gostar da escola referiam ter cometido dois ou mais
- 5
de delinquência, 49 das que diziam não gostar afirmavam estar den-
- --sa mesma condição. Os métodos que permitem analisar as relações en-
_;:-aresde variáveis serão explicados no capítulo 8. Muito frequentemente,
estigador pretende explorar as conexões entre mais que duas variáveis
do a chamada análise multivariada O capítulo 9 aborda esse tipo de
. -se no sentido da exploração das diferenças, enquanto o capítulo
10
se
-=-ana análise multivariada de relações entre mais do que duas variáveis.
,,::nção entre estudar as diferenças e estudar as relações nem sempre é cla
- .xl.eríamos, por exemplo, verificar que os rapazes apresentam, mais fre-
-emente que as raparigas, comportamentos de delinquência concluindo
que os rapazes e as raparigas diferem em relação à tendência para co
em esse tipo de actos ou, em alternativa, que existe uma relação entre o
~o sujeito e a delinquência.
esultados
~álise dos dados recolhidos sugere que uma hipótese é confirmada, es
_saltados podem servir de apoio à teoria que a suscitou. Os próximos in
~dores poder-se-ão interessar quer por reproduzir essa mesma conclu
_::erpor estudar outras implicações da teoria. No entanto, o facto de uma
ser refutada pode ser igualmente importante, já que sugere que a
:. :lão é adequada ou, no mínimo, que precisa de ser revista. Por vezes,
=05 alguns pontos da hipótese são confirmados. Uma análise multivaria
-'e indicar que a relação entre duas variáveis só se verifica para alguns
.~S da amostra mas não para os outros (por exemplo, verifica-se para as
2:'eS
e não para os homens ou para os jovens e não para pessoas mais ve-
:;m resultado deste tipo poderá exigir uma reformulação da teoria.
:od.os os resultados se relacionam directamente com uma hipótese.
_.quérito, por exemplo, o investigador pode recolher dados sobre de
~.ados tópicos cuja relevância poderá só ser evidente num contexto
:or.
orno foi dito atrás, a sequência ilustrada na figura 1.1 constitui um mo
processo de investigação que nem sempre pode ser reproduzido
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 29/128
8
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
bjectivos de muita da investigação quantitativa nas ciências sociais é a
emonstração de c us lid de i.e., de que uma variável tem impacto sobre
utra variável. Os termos v riável independente e v riável dependente são
requentemente, utilizados neste contexto. O primeiro diz respeito a uma
ariável que influencia a segunda, sendo assim esta última um efeito da va
iável independente. Esta relação causal é bastante explorada ao nível das
iências sociais e um dos principais papéis da análise multivariada é, precisa
ente, elucidá-Ia Bryman 1988a). A possibilidade do investigador estabele
er uma relação de causa-efeito é fortemente afectada pela natureza do plano
e investigação que utiliza. sobre este assunto que nos vamos debruçar em
l no de investig ção e c us lid de
omo vimos, no último parágrafo, um dos principais objectivos da investiga
ão quantitativa é estabelecer relações de causalidade. Este facto decorre, em
rande parte, do interesse em estabelecer conclusões semelhantes às das ciên
ias naturais que, frequentemente, tomam a forma de relações de causa-efei
o. Além disso, as conclusões que estabelecem relações deste tipo têm uma
mportância prática considerável: se soubermos que uma coisa afecta outra,
odemos manipular a causa para obter um efeito. Da mesma forma que se de
onstrou que o comportamento de fumar pode provocar um certo número
e doenças, como o cancro de pulmão e certas afecções cardíacas, o investiga
or das ciências sociais, se demonstrar relações de causalidade em contextos
dequados, pode providenciar informações que podem ter importantes apli
ções práticas.
Dizer que uma coisa causa outra não quer dizer que a variável depen
ente o efeito) seja totalmente influenciada pela variável independente a
ausa). Se se fumar não se adquire, necessariamente, uma doença e muitas
as doenças contraídas pelas pessoas que fumam também atingem os não fu
adores. Assim, a palavra causa deve ser encarada como uma forma de re
erir que uma alteração na variável independente conduz a uma alteração na
ariável dependente. Aqueles que fumam muito têm mais probabilidade do
ue aqueles que fumam pouco de contrair uma série de doenças associadas
o tabaco. Os que fumam pouco, por sua vez, têm mais probabilidade de ter
ssas doenças do que aqueles que não fumam. Do mesmo modo, se verificar
os que o facto de ver actos de violência na televisão induz comportamentos
gressivos, isso não significa que só as pessoas que assistem a programas vio
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 30/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 31/128
10 ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
Quadro 1 1 Violência na televisão e agressão
Criança
1
2
3
4
5
6
7
8
9
1
Número de horas de
exposição à violência
filmada
Número de horas semanais de
exposião
à
violência filmada
9.50
9 25
8.75
8.25
8.00
5.50
5.25
4.75
4.50
4.00
Número de actos agressivos
registados
9
8
7
7
6
4
4
5
3
3
Número de actos
agressivos
Figura 1 2 Uma relação espúria
o inverso. De facto um efeito nunca pode preceder a causa. Este critério pode
parecer óbvio e extremamente fácil de testar mas como veremos torna se um
problema importante quando se trabalha com planos de investigação não
experimentais.
l nos experiment is e c us lid de
Um plano de investigação define a estrutura básica do estudo. Embora se
possam delinear vários tipos de planos costuma fazer se uma distinção fun-
damental entre planos experimentais e não experimentais dos quais se desta-
ca o inquérito. Num estudo experimental é fundamental elucidar a relação
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 32/128
A ANÁLISE DE DADOS E O PROCESSO DE INVESTIGAÇÃO
11
:,:- ernaé aquele que aponta, com clareza, a causa e o efeito.Não é, então, surpre
:::1denteque os estudos experimentais sejam especialmente fortes em validade in
zna, já que foram criados especificamente para darem origem a dados que indi
:::5semrelações de causalidade.
Se quisermos demonstrar que o facto das crianças verem violência na te
.2\'isão aumenta a agressão que manifestam, podemos fazer o seguinte estu
: :juntamos um grupo de dez crianças que podem interagir e brincar duran
-2duas horas, Nesse período de tempo, observadores registam o número de
:omportamentos agressivos exibidos por cada criança. Em seguida, as mes
::-..ascrianças assistem a um programa de televisão muito violento - poden
:
designar-se esta condição de exposição à violência filmada por tratamento
~'\perimental- após o que voltam a interagir por duas horas. Os comporta
:: entos agressivos que manifestam são registados tal como na primeira fase
':0 estudo. Na verdade, estamos aqui a seguir uma sequência do tipo:
~:nque OBS1 corresponde à medida inicial do comportamento agressivo (fre
~uentemente designada por pré-teste EXP representa o tratamento experi
:nental em que é introduzida a variável independente e
OBS2
é a medida sub
~quente do comportamento agressivo (frequentemente chamada pós-teste .
Consideremos, agora, que o valor correspondente à
OBS2
é 30 mais
elevado que o relativo à
OBS1,
o que significa que a quantidade de comporta
:nento agressivo aumentou consideravelmente. Será que podemos dizer que
aumento da agressão foi provocado pela violência a que os sujeitos assisti
::'am?De facto, não podemos fazer essa atribuição uma vez que a relação que
=-quiaparece, e que supomos ser causal, pode ter outras explicações alterna ti
as: as crianças podem ter-se tornado mais agressivas apenas como conse
~uência de estarem juntas acabando por se irritarem mutuamente, ou ficaram
de mau humor porque tinham fome ou sede e os experimentadores lhes de
:-ampouca comida ou bebida. Pode até acontecer que os diferentes observa
dores presentes na fase de pré e de pós-teste tenham utilizado critérios dife
:-entes de agressão. Sendo assim, e como não podemos excluir estas explica
.;ões alternativas, não podemos tirar uma conclusão definitiva sobre a causa
o aumento do número de comportamentos agressivos.
Qualquer pessoa que esteja familiarizada com as ciências naturais sabe
:-á que uma experiência bem conduzida deverá ser controlada de forma a mi
:1Ímizar os factores de contaminação. Para os controlar (e, assim, poder rejei
:ar as explicações alternativas), é necessário trabalhar com um
grupo de contro
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 33/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 34/128
·-\ .~ ÁLISE DE DADOS E O PROCESSO DE INVESTIGAÇÃO
13
bs1
istribuição
aleatória
---- Não-Exp
Obs2
EXP1
bs2
istribuição
Obs3
EXP2
bs4
~Obss
EXP3
bs6
ão-exp
bse
bs1
EXP1+Abs2
istribuição
Obs3
EXP1+B
bs4
~ Obss
EXP2+A
bs6XP2+Bbse
rês tipos de planos experimentais
~::J.ono nosso exemplo, tendo mais frequentemente uma menor extensão.
É,
:2.0,
necessário utilizar testes estatísticos que permitam determinar a pro
.0ilidade dessa diferença ocorrer por acaso. Esses testes serão descritos nos
-:-:1ulos7 e 9.
Nesta investigação que imaginámos, cumprem-se os três critérios que
=:m.itemestabelecer a causalidade e, por isso, se de facto verificássemos que
~ ...;ffientona variável dependente tinha sido bastante maior para o grupo ex
.rmental do que para o grupo de controlo, poderíamos afirmar com uma
_~-iançaconsiderável que assistir à violência através da televisão tinha cau
: 0
mais agressão. Em primeiro lugar, verificámos a existência de uma reIa-
demonstrando que os sujeitos expostos à violência filmada exibiram
~ comportamentos agressivos do que aqueles que não assistiram. Em se
_ 1dougar, o facto de termos simultaneamente um grupo de controlo e uma
...5:ribuiçãoaleatória dos sujeitos pelos grupos permite-nos eliminar a hipó
. - da relação ser apenas espúria, uma vez que se houvesse outros factores a
os resultados, eles influenciariam de forma idêntica os dois grupos.
::: terceiro lugar, a ordem temporal das variáveis é demonstrada pelo au-
:ltO do comportamento agressivo após a exposição do grupo experimental
·colência na televisão. Como a variável independente é manipulada pelo
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 35/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 36/128
, > A,....-ALISEDE DADOS E O PROCESSO DE INVESTIGAÇÃO
Satisfação no trabalho
•
• I Produtividade
1 5 Uma relação entre duas variáveis
Satisfação no trabalho
Antiguidade na empresa
1 6 A relação será espúria?
Produtividade
Frequentemente, este tipo de plano de estudo é designado por
plano cor
onal para salientar a sua tendência para revelar relações entre variáveis e
alimitação no que diz respeito à possibilidade de estabelecer processos
;.ais.Precisamente porque neste tipo de investigação as variáveis não são
LÍpuladas(e muitas vezes não são susceptíveis de o ser) a possibilidade do
stigador determinar a causa e o efeito fica limitada. Vamos supor, por
lplo, que estamos a recolher dados sobre os níveis de satisfação com o
alhoe a produtividade dos operários de uma empresa. Podemos verifi
través das técnicas examinadas no capítulo 8, que existe uma forte asso
àoentre as duas variáveis, o que quer dizer que os trabalhadores que ma
tam níveis elevados de satisfação têm também altos valores de produti
de. Podemos, assim, dizer que existe uma associação entre as duas variá
ver figura 1.5),mas como já vimos, isto é apenas um primeiro passo para
monstraçãode que existe causalidade.
É
também necessário provar que a
ão não é espúria. Poderia acontecer que os trabalhadores mais antigos na
fossem, precisamente, os mais satisfeitos e os mais produtivos (ver figu-
6).Os métodos através dos quais se pode verificar a possibilidade da rela
er ou não ser espúria são analisados no capítulo 10.
No entanto, o terceiro obstáculo - estabelecer que a potencial causa
ede o potencial efeito - é extremamente difícil de superar. O problema é
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 37/128
Satisfação no trabalho
Satisfação no trabalho I
ANÁLISE DE DADOS EM CIÊNCIAS soe
Produtividade I
I
Produtividade
1.7
uas possibilidades de interpretação causal de uma relação
roblema é através de uma reconstrução da ordem causal que se supi
ntre as variáveis. Muitas vezes, este processo de inferência pode se
É o que se passa, por exemplo, quando encontramos uma relaçã
aça e o número de anos de escolaridade e inferimos que a segunda
fecta a primeira. Contudo, este modelo de conexões causais prováve
rágil quando não é óbvio qual das variáveis afecta a outra, como é
igação entre satisfação e produtividade. Quando surgem estas dific
ode ser necessário incluir uma nova etapa de recolha de dados rela
esmos sujeitos de modo a verificar, por exemplo, se o impacto da S
om o trabalho na produtividade subsequente é maior que o impact
utividade na subsequente satisfação com o trabalho. Este tipo de p
ignado por
estu o e p inel
Cramer, 1988),mas não é muito comum]
ias sociais. Neste livro, a discussão sobre investigação não experime
rar-se-á, essencialmente, nos planos correlacionais/inquéritos de
m que se recolhem, em simultâneo, dados sobre diferentes variávE
Os métodos relacionados com a possibilidade de fazer inferên
ais, tendo como base dados obtidos através de inquéritos, são analÜ
lO,
onde se aborda a análise multivariada das relações ent
eis. O aspecto principal a reter da discussão anterior é que a inferênc
exões causais entre variáveis pode ser feita, com maior facilidade, S
os perante dados provenientes de investigações em que se utilizou
o experimental, do que se dispusermos de resultados recolhidos a
m plano correlacional.
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 38/128
A ANÁLISE DE DADOS E O PROCESSO DE INVESTIGAÇÃO
são sintetizadas e pouco aprofundadas A hipótese foi confirmada: os
leitores do primeiro tipo de jornais têm urna probabilidade duas vezes
maior de responder correctamente a urna série de questões destinadas a
avaliar os seus conhecimentos de política O investigador conclui que os
diários de qualidade induzem maiores níveis de conhecimentos so-
bre política do que o segundo tipo de jornais Avalie este raciocínio
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 39/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 40/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
A maior vantagem de se utilizar um programa como o SPSSconsiste err
poder registar e analisar dados quantitativos de muitas formas diferentes e
com grande rapidez a partir do momento em que se adquire domínio sobre
programa. Por outras palavras ele será uma grande ajuda para o leitor livran-
do o das intermináveis horas gastas a registar dados e a fazer cálculos e d05
inevitáveis erros que geralmente se cometem durante essas operações. Vai
permitir lhe também a aplicação de técnicas estatísticas mais complexas e
frequentemente mais adequadas que de outro modo não se aventuraria a
usar.
Existe é claro uma forte desvantagem em usar programas de computa-
dor para analisar dados é que temos que aprender a trabalhar com eles
Contudo o tempo gasto nessa aprendizagem será muito menor do que o que
seria necessário para analisar os mesmos dados sem a sua ajuda. Acresce que
ao mesmo tempo que aprende a dominar o programa adquire uma série de
conhecimentos que lhe serão úteis num mundo em que a utilização de com-
putadores se vai tornando cada vez mais generalizada. A possibilidade de fa-
zer o mesmo com maior velocidade e menor esforço torna se também diverti-
da e frequentemente mais fácil do que se supôs no início.
Quando se procura aprender algo de novo é inevitável fazer erros que se
podem revelar frustrantes e desencorajadores. Inclusivamente pode pare-
cer nos que fazemos mais erros quando aprendemos a trabalhar com tur.
computador do que quando desempenhamos qualquer outra actividade. Iss
justifica se porque para que os programas de computador funcionem é neces-
sário que as instruções sejam dadas de um modo muito preciso e muitas vezes
de acordo com uma ordem específica. Esta forma de dar as ordens ao compu-
tador pode parecer nos menos óbvia do que a de concretizarmos outras acti-
vidades que realizamos no dia a dia. importante notar no entanto que os
erros que eventualmente se façam durante a aprendizagem não danificam de
forma alguma o computador ou o programa.
Para conseguir fazer um número mínimo de erros é importante que
nesta fase se sigam exactamente as instruções enunciadas nos exemplos da-
dos neste e nos capítulos subsequentes respeitando os caracteres e os espaços
utilizados para cada ordem. Embora por vezes possam ocorrer falhas é na-
tural que os erros que vierem a surgir sejam resultado de algum engano do
leitor e não de um defeito da máquina ou do programa. O próprio programa
dir lhe á qual o erro cometido se a sua falha tiver sido cometida ao dar as ins-
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 41/128
-=.3.-\R DADOS COM O COMPUTADOR
- cheiro de dados
. ::::>
poder analisar os seus dados, necessita de criar um ficheiro onde
2--ão armazenados. Para ilustrar a maneira de criar esses ficheiros va
---:.un conjunto de dados fictícios que, hipoteticamente, foram recolhi
::-.~-:irde um questionário conhecido como Questionário do Trabalho.
':2.'::05
derivam de duas fontes: um questionário aos empregados que
.::=:na perguntas sobre eles próprios e um questionário aos superviso-
- :-~-pondem a questões sobre cada um dos empregados. As perguntas
=:: apresentadas no apêndice 2.1, no fim deste capítulo, e a codificação
:.açãoou dos dados recolhidos é ilustrada pelo quadro
2.1.
Neste es
,:=-,ectode análise era a pessoa, normalmente designada por
suj ito
pe
:::::::ugose por inquiri o pelos sociólogos. Apesar de se terem usado
;.~=::nplo dados recolhidos através de um questionário, é importante
~u SPSSe os procedimentos de análise de dados descritos neste livro
;:icar-se a outras formas de dados quantitativos, como sejam estatís-
~;:; ou medidas de observação.
o conjunto destes dados é relativamente grande, pode ser mais
..-;.~~:e
pedir a alguém experiente que os introduza num ficheiro apro
= =
::alfor possível, basta criar um simples ficheiro de texto em formato
~ ~gla ASCII significa American Standard for Information Interchan
;::urmato é utilizado, frequentemente, para transferir informação de
_ ..::ador para outro. Uma vez realizada esta tarefa, o SPSS pode ler
. Se não conseguir aceder a ninguém que lhe crie um ficheiro des
_ 3e o conjunto de de dados for pequeno, pode ser mais fácil introdu
?::--amente no SPSS, numa janela chamada t Editor. Tanto um
-:::;,roomo o outro serão discutidos no final deste capítulo.
T: endoa um simples ficheiro de texto, os dados são introduzidos
=~ definido por um grande número de linhas e, na maioria dos com
t ::
~.?Or 80 colunas. Cada coluna em linha pode, apenas, comportar
ou seja, um único dígito. Os dados referentes à mesma variável
::~rroduzidzas na(s) mesma(s) coluna(s) e uma determinada linha
::-'-e:las,s dados relativos a um mesmo objecto de interesse ou
c so
~=:'......cnte, os casos são pessoas mas qualquer entidade de interesse
:::ia, a escola, o hospital, a região, ou o país - pode constituir um
:eresse.
cmais simples analisar dados que sejam representados só por nú
-._c lidar com uma mistura de números e de outros caracteres, como
:etras do alfabeto, todas as variáveis ou respostas ao questioná
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 42/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
s dados do Questionário do Trabalho
6600 29 1O2
22
3O714600 26 5O
1
4
1
8
1
7800 40 54
41121
1
3O1
6400 46
15
1
23
4
2
8600 63
3613513O6000 54
31
1
4
4
1
16600 29
2
3332O7600 35 2
2
33
2
2
7600 33
4
3
1
412
25
2
3800 27
6
3
1
1
4
1
4200 29 421
2
5
3
2
38
1
O9 2
1
2
11
4313
4
18000 55
35
35
1
5
1
7000 29 131
312
O
1
8200 48 831
2
43
4511
5800 32 7323
422
4
1
6600 4814
1
2
2
5
1
513400 18 1
2
5
1
365000 28 2
43
3
4
37600 37
1
2
1411
3
O 43
6
4
,
3
4
267400 39 6
223
1
5
8000 53 5
4
31
532
6000 34
9
3
11
1
4
4
139
7000 43
17
11
24000 21 1
43
3
1
536200 5028
3
15
51
8
2400 31
92
5
1
21
452
O3600 3112
3
11
5
6
2
6400 5221
2
304400 5412
3
42922400 28
10
11
21
4
926600 50
23
33
33
5526000 5221
33
331
4
5000 4021433
2261
1800 19 1
212
3
3
1
7600 38
4
41
31
14
818000 6141
1212
2
4
35600 37 8
25
14
48
13400 3115
25
15
2
5000 4321
2
12O
1
3600 23
3
2
5
1
1
4
184000 27 51
11
451
1
95000 28 7313
2
3
9
3200
O
0
1
25
11
013400 18 123
330600 48
23
1
2383600 2910
14
1
41
4600 421015
4O
8200 5312
15
2
44
15200 3212
1
3323
1
3000 31
2
33511
89000 5519
33
3
313
O4800 26 8
41
3
3
12
32
7200 532214
1
21
O
5600 513133
11
8008
3316
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 43/128
ANALISAR DADOS COM O COMPUTADOR
58
1
3800 488
1
2
1524
2
58 624
35
4I7
I74
57
3
2
233
4I4
78004202
214
3
321
4200
21
23
121
3
I22
O
2 12800 268
I
2
11
3
II4
3600462
51225
21000
9
13354
24200303
431
2
3
2
460029
22133I
5
01
3800
45
3
33
2
916000
53
05125
2
I23800 472251
1
possa ser posto em causa, tal como muitos conceitos das Ciências Sociais, elas
::orrespondem a um tipo de informação que, por vezes, é recolhido nos inqué
:::os e funcionam, aqui, como exemplo de uma variável nominal; ao longo do
lIVro, e para simplificar, passaremos a designar a primeira categoria apenas
por branco ). Sempre que possível, quando se constrói um questionário, é
aconselhável fazer corresponder números às várias respostas previsíveis
para que, depois de recolhidos, não seja preciso trabalhar os dados antes de
os dar a introduzir a outra pessoa. Antes de fazer cópias do questionário,
convém verificar sempre com a pessoa que vai lançar os dados se a cada
resposta foi, de facto, atribuído um número.
É também importante reservar um valor numérico para dados omissos,
ou seja, para as situações em que temos que registar uma resposta que é ambí
gua ou que não é suficientemente clara. Esse número não pode ser igual a
qualquer outro que tenha sido designado para codificar dados reais ou não
omissos. Por exemplo, se se utilizou os valores de 1a 5para representar as res
postas à questão sobre o grupo étnico de pertença, é necessário considerar um
número diferente para as respostas omissas. Neste questionário todos os da
dos omissos, excepto os referentes ao absentismo, foram codificados com um
Ouma vez que esse valor não pode ser confundido com os números escolhi
dos para corresponder aos dados reais. Como houve alguns empregados que
nunca estiveram ausentes do trabalho (i.e., cuja ausência é de Odias), as res
postas omissas a esta pergunta não poderiam ser representadas por um O .
Em vez disso, foram codificadas com 99 já que nenhum empregado se au
sentou por tanto tempo. Como veremos mais tarde, usar o O tem, ainda, a
vantagem de tornar mais fácil o processamento desses dados quando algu
mas variáveis similares são combinadas. Por vezes, poderá ser necessário dis
tinguir vários tipos de respostas omissas como, por exemplo, distinguir uma
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 44/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
quando for necessário, ser mais fácil ter acesso a um determinado caso. Este
número de sujeito deve ser colocado nas primeiras colunas de cada linha.
Corno no nosso exemplo ternos apenas setenta sujeitos, basta-nos ocupar as
colunas 1e 2. Se tivéssemos 100 sujeitos já teríamos que utilizar as três primei
ras colunas para registar essa informação, urna vez que o número correspon
dente ao último sujeito seria constituído por três dígitos. Pode deixar-se
embora não seja necessário - um espaço em branco entre as colunas onde são
introduzidos dados correspondentes a diferentes variáveis.
De acordo com este formato, só precisamos de urna linha para registar
toda a informação sobre um sujeito; assim, essa linha fica reservada para ele e
os dados referentes ao próximo sujeito serão inscritos na linha seguinte. Se
para os dados referentes a cada inquirido forem necessárias mais do que urna
linha, as linhas ocupadas com a informação adicional devem ser as subse
quentes. Neste caso, pode haver vantagem em dar a cada urna das linhas
onde se encontram os dados de um mesmo sujeito, um número de identifica
ção que nos ajude a ler mais rapidamente a informação; chamaríamos, então,
à primeira linha número I, à segunda número 2 e assim por diante. Cada linha
de dados relativos a um sujeito é chamada, no SPSS, um registo recard .
A primeira variável do nosso questionário e do nosso ficheiro de dados
refere-se à origem racial ou étnica dos inquiridos. Corno ela só pode tornar um
de seis valores alternativos se incluirmos a possibilidade de eles não terem
respondido a esta questão), podemos colocar esta informação numa única co
luna. Se deixarmos um espaço entre os dois dígitos correspondentes ao nú
mero de identificação do sujeito e o dígito que representa o número do seu
grupo étnico de pertença, este último dado ficará inscrito na coluna 4. Sendo
também a segunda variável - o sexo - passível de ser codificada apenas
com um dígito, o seu valor será registado na coluna 6. Contudo, a terceira va
riável- rendimento bruto anual- requer que utilizemos cinco colunas para
o seu registo, urna vez que dois sujeitos o 47 e o 65) receberam mais do que
10,000 libras. Deste modo, os dados referentes a esta variável irão ocupar as
colunas 8 a 12, inclusive de notar que, ao introduzir os dados, a vírgula que
sinaliza o separador dos milhões e o símbolo que representa as libras não se
rão considerados).
Urna lista completa das variáveis e das colunas que elas ocupam é forne
cida no quadro 2.2. O ficheiro de dados é designado por
qtb d t
que é urna
abreviatura de questionário q) do trabalho t) dados dat) brutos b) . Corno
o SPSS aceita letras maiúsculas por exemplo, QTB.DAT) ou minúsculas
qtb.dat) é mais simples usar as minúsculas. As restrições e convenções relati
vas ao formato destes nomes serão descritas posteriormente neste capítulo.
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 45/128
ANALISAR DADOS COM O COMPUTADOR
2.2 Nomes e localização das variáveis do Questionário de Trabalho no SPSS
5
da variável
de identificação
racial
ento Anual Bruto
ade na empresa
mento com a empresa
de satisfação no trabalho
1
2
3
4
de autonomia no trabalho
1
2
3
4
de rotina no trabalho
1
2
3
4
ça na reunião
Como ter acesso ao SPSS
Nome no SPSS
id
gpracial
sexo
rendim
idade
anos
envolv
satis1
satis2
satis3
satis4
autonom1
autonom2
autonom3
autonom4
rotina1
rotina2
rotina3
rotina4
reuniao
especial
produtiv
qualid
absent
Colunas em que se localiza
1 2
4
6
8 12
14-15
17 18
24
6
8
3
3
34
36
38
4
4
44
46
48
50
5
54-55
usar O SPSS, é necessário dispor de um computador pessoal. Um compu
r pessoal é constituído por um teclado através do qual se escrevem as ins
um rato, que fornece uma forma alternativa de movimentação no
e de selecção de instruções, e um monitor VDU) ou écran que permite
lizar aquilo que se digitou. Na medida em que a informação apresenta
cada momento, no monitor é, necessariamente, limitada, informação
onal pode ser obtida através da utilização apropriada do teclado ou do
Os computadores pessoais dispõem ainda, habitualmente, de uma im
sora que pode ser utilizada para imprimir informação guardada no com
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 46/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
movimentação de um ponteiro, chamado cursor, cursar este que é operado
através de um teclado ou de um rato. O comando é efectivado pressionando a
tecla ente r ou o botão esquerdo do rato ou ainda, no sistema Windows 95 / 98,
seleccionando a opção next. A selecção de opções com o rato é, pois, mais fácil
do que através do teclado, na medida em que envolve movimentos simples.
Com o teclado, algumas opções são selecciona das através das teclas de cursor
apropriadas, enquanto outras são seleccionadas através da utilização de ou
tras teclas. As teclas de cursor encontram-se, habitualmente, localizadas no
lado direito do teclado, e possuem setas que indicam a direcção para a qual o
cursar é movimentado. Em resumo, o rato pode ser preferível para realizar
determinadas operações, enquanto que o teclado pode ser útil para outras.
Para aceder ao SPSSno ambiente Windows, basta seleccionar o botão .:gfâtf
no fundo do
écr n
o que abre a primeira coluna (ou menú) apresentado na ca
ixa 2.1. Seleccionar Programs neste menú, o que abre o segundo menú (colu
nas 2 e 3 da caixa 2.1). Note-se que, na maior parte dos computadores, estes
menús podem conter menos programas do que os mostrados na caixa 2.1.
~onrneService$:
ta
PUleVoice
ta s,••Up
@Jw~
O eudo .
f 10000000e
'i J
I_EI<I'I ••••
l~ Microsoft Acce<,
~ M 'o,.f'E><eeI
iIi ilM ,osoftO_
~M ,osoftP_
li
MictosoftW ••d
,ia MS.flOS F10mpl
i~
O_El<pIe
Illi S'~l'Iin
~W_EI<l'I<>
m
WIrlTun91
'.~ Wmip32
~ Mictosof tOff lCeT '
'1 ilI MÍCfooof, FrontPege
·:[ta EQSf ••
W_
@l
NortonAntlVlrus
ta QuickTine
'@l USRELf •• Win<:lowo95
ti
SPSS for Windows ~
. ,@J Tine Zooe Corwert ••
,ta QuickTine forWlrldow,
ta Net .cape Communical • •
)oiGa
D•.••
Caixa 2.1
A janela de abertura do Windows 95/98
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 47/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 48/128
ANÁL ISE DE DADOS EM CIÊNCIAS SOCIAIS
Caixa 4
A caixa de diálogo Select Cases
for Windows, que abre sobre o Data Editor cada vez que se acede ao SPSS,
pode ser eliminada seleccionando Don t show this dialog in the future no
fundo desta caixa de diálogo. Em opção, e de forma a introduzir dados direc
tamente nas células do Data Editor, podemos seleccionar Cancel.
No topo da janela do Data Editor encontram-se os nomes de diferentes
procedimentos, tais como File, Edit, ete. Para verificar o conteúdo destes pro
cedimentos basta mover o cursor para uma destas opções e pressionar uma
vez o botão esquerdo do rato. Um menu
rop own
aparecerá, tal como exem
plificado na caixa 2.3 para a opção Data. Para ver as restantes opções, basta
deslocar o cursor até elas.
As opções dos menús rop own seguidas de reticências ... ), tal como
na opção Select Cases ... , indicam que uma caixa de diálogo aparecerá uma
vez selecionada a opção. Por exemplo, se seleccionarmos a opção Select Ca
ses ... , surgirá uma caixa de diálogo com o mesmo nome ver caixa 2.4).
Note-se que este procedimento é conseguido uma vez que alguns dados te
nham sido introduzidos no Data Editor. Para remover esta caixa de diálogo,
carregar no botão Cancel.
A ponta de uma seta apontando para a direita ~) seguida de uma opção,
tal como acontece no procedimento Merge Files, indica que, após selecciona
do, aparecerá um submenu à direita tal como mostrado na caixa 2.8). Uma
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 49/128
ANALISAR DADOS COM O COMPUTADOR
:- ão sem qualquer tipo de sinais significa que não aparecerão novos menus
::>rJ down para seleccionar.
Ainda imediatamente abaixo destas opções existe uma barra de ferra
::-.entas com botões. Estes permitem a realização de procedimentos sem ter
~e passar pela selecção de menus e opções. As funções destes botões são
::-.ostradas colocando o rato sobre cada um deles aparecerá uma caixa amare
...2. e uma descrição da função no seu interior. Esta descrição surge, também, no
:-.:ndo do écran Assim, por exemplo, o primeiro botão diz respeito à opção
Open File. Podem adicionar-se mais botões a esta barra. A opção Help des
=:ra nas pp. 40-41) fornece instruções para realizar este procedimento.
A introdução e edição de dados no Data Editor
-. Íorma mais simples de introduzir dados no SPSS será a de inscreve-los di
=- ,,--tamentea matriz de colunas e de linhas numeradas da janela do Data
~ditor, apresentada na caixa 2.2. Note-se que, neste caso, cada coluna pode
,::mter mais do que um dígito. Quando se acede ao SPSS, o curso r encontra-se
:-2. célula correspondente à primeira linha da primeira coluna. O contorno
::;?stacélula é apresentado a negrito de forma a evidenciar que esta se encon
::-aactiva. Para introduzir um valor em qualquer das células será necessário,
==n
primeiro lugar, torná-las activas movendo as teclas de cursor ou o rato ins
::-evendo, de seguida, o valor e, por último, deslocando o cursor para outra
:;?:ula em que se deseje repetir esta operação. As colunas são consecutiva
::-,ente numeradas uma vez introduzido um valor. Assim, se introduzirmos
::: número na quinta coluna, as colunas 1 a 5 serão númeradas varOOOOla
arOOOOS.ara modificar um valor já introduzido, deslocar o curso r para a cé
. : :aque contém o valor a modificar e introduzir o novo valor. Se quisermos
::::ixaruma célula em branco, basta remover o valor com a tecla Backspace ou
;:}elete emover o cursar para outra célula. Na célula em branco deverá, agora,
=gurar um ponto .), o que denota a presença de um valor omisso.
Nomear variáveis no Data Editor
?:rra dar um nome a uma variável no Data Editor, seleccionamos Variable
lew no canto inferior esquerdo da janela. De seguida, e sob a coluna Name,
_scolhemos a linha onde queremos introduzir o nome da variável por exem
:-;0, e tal como apresentado na caixa 2.5, gpracial na primeira linha).
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 50/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
aixa
2.5
j nel
Variable View do ata Editor
Os
nomes no SPSS
Os nomes usados para designar ficheiros de dados ou quaisquer variáveis
no SPSS têm que estar de acordo com determinadas condições. Não podem
ser formados por mais do que oito caracteres e é preciso que comecem com
uma letra (A-Z). Os restantes caracteres permitidos podem ser letras, núme
ros, pontos,@, ou_.2Nãoépermitido, também, deixar espaços em branco e
os nomes não devem terminar com um ponto nem, de preferência, com _.
Adicionalmente, algumas palavras, as chamadas palavras-chave
key-
words ,
não podem ser utilizadas porque poderiam ser interpretadas pelo
SPSS como se fossem comandos. Por exemplo, estão nesta situação palavras
como
somar , n e ny qualquer , or ou
e
to a .
Se se utilizar, aci
dentalmente, uma dessas palavras como nome, o programa avisar-nos-á
que se trata de um procedimento inválido. Nenhuma das palavras-chave in
clui números, o que significa que um nome de variável que contenha núme
ros será sempre reconhecido como tal. É importante lembrar que não se
2 Os nomes de variáveis não podem incluir caracteres portugueses como o ç ou o ã .
N. do T.
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 51/128
ANALISAR DADOS COM O COMPUTADOR
?ode utilizar o mesmo nome para designar variáveis ou ficheiros diferentes.
_\ssim, não é possível usar a palavra satis para referir as quatro questões re
~ativas à satisfação no trabalho, mas deve-se diferenciá-las de alguma forma,
?odendo, por exemplo, acrescentar o número da pergunta. Nesse caso, o
:1ome das variáveis seria satisl, para a resposta à primeira questão, satis2,
?ara a resposta à segunda, e assim por diante. Os nomes do SPSS dados às va
:iáveis do questionário de trabalho são apresentados no quadro 2.2.
A definição de outros aspectos das variáveis no Data Editor
Para além do seu nome, podemos definir nove tipos de características das va
riáveis presentes no Data Editor. Estas características encontram-se listadas
nas colunas da matriz de dados e variam entre o tipo de variável Type à es
querda e o seu nível de mensuração Measure à direita. Na medida em que
pode não ser possível ver todas estas características de uma só vez no moni
ror, podemos modificar a largura de cada coluna seleccionando a linha adja
cente ao seu nome e colocando-a na posição desejada, tal como fizemos na
caixa 2.5.
As definições previamente existentes à criação de uma base de dados no
SPSSencontram-se apresentadas e são conhecidas como as opções por defei
to. Se desejarmos modificar quaisquer destas definições, podemos seleccio
nar a linha e coluna apropriada e proceder às alterações desejadas. De uma
forma geral, e para aquilo que nos interessa neste momento, a definição mais
importante a alterar é a relativa aos dados omissos Missing values .
A definição de dados omissos missing values
No questionário do Trabalho, existem valores omissos para as avriáveis
rendim casos 12 e 21 , idade caso 45 , satisl casos 1e 2 , satis2 caso 2 ,
produtiv caso 1 e absent caso 31 Assim, teremos que especificar os va
lores omissos apropriados para estas variáveis, e que são
O
para as primei
ras cinco rendim, idade, satisl, satis 2 e produtiv e 99 para a sexta variá
vel absent . Para realizar esta operação, basta seleccionar, no Variable
View do Data Editor, a linha apropriada da coluna Missing, seguida da se
lecção da elipse ou das reticências que aparecem nessa célula. Este último
comando abre a caixa de diálogo Missing Values apresentada na caixa 2.6.
Para as nossas variáveis, escolhemos a opção Discrete Missing Values, in
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 52/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
Missing Values il J
No missing values
ío:l Qiscrete missing values
I~
1
Caixa 2 6
A caixa de diálogo Missing values
Se os dados foram introduzidos por outra pessoa, será conveniente
dar-lhe a conhecer a forma como planeámos a codificação dos dados omissos.
A definição de casas decimais
o
número de casas decimais definidas por defeito pelo SPSSé de duas. Para a
maior parte das utilizações, é mais fácil codificar as variáveis através de nú
meros, tal como fizemos para o Questionário do Trabalho. Como todas os va
lores destas variáveis assumem números inteiros, poderíamos alterar o nú
mero de casas décimais de 2 para Ona coluna DecimaIs da janela Variable
View. Para tal, bastaria seleccionar a linha correspondente a esta coluna uma
linha de cada vez e pressionar o botão com a seta apontando para baixo até
surigir o valor O.
A definição de etiquetas das variáveis e dos seus valores value labels
Os nomes das variáveis no SPSSsão restringidos a 8caracteres, oque significa que,
a maior parte das vezes, teremos que os alterar, tomando o seu significado menos
claro. Usando esta opção, podemos criar etiquetas labels das variáveis que apa
recerão no output. Estas etiquetas podem ser bastante extensas, ainda que a maior
parte dos outputs não as apresentem. Por exemplo, a variável do SPSS gpracial
pode ser etiquetada grupo racial. Para realizar esta operação, introduzimos, na ja
nela Variable View, aquela etiqueta na primeira linha da coluna Labels. Desta for
ma, o nome completo da variável será apresentado nas caixas de diálogo em que
exista listagem de variáveis por exemplo, ver caixa 2.12 , seguido do seu nome
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 53/128
.-\.. lALISAR DADOS COM O COMPUTADOR
33
-. alue Labelss;;;;;;7=.
1
=
Branco
2 = Asiático
3 = Indiano
4
=
Africano
A caixa de diálogo Value labels
Podemos, também, etiquetar os valores de uma dada variável, esco
_- endo a linha apropriada na coluna Values (por exemplo, gpracial), seguido
:a selecção da elipse, ou das reticências, presentes nessa célula. Este procedi
=:ento faz abrir a caixa de diálogo Value Labels apresentada na caixa 2.7. De
:-ois, basta escrever o valor (por exemplo, 1) na caixa designada Value:, a eti
~:leta (por exemplo, branco) na caixa designada Value Label: e seleccionar
Add. As etiquetas dos valores de uma variável podem conter até 60 caracte
:-.:s,ainda que a maior parte dos outputs não os mostrem na íntegra. Para re
:::lOveruma determinada etiqueta basta seleccioná-la e escolher Remove.
?ara modificar uma etiqueta, teremos que seleccioná-la, introduzir as altera
;ões desejadas e escolher Change. Terminadas estas operações, pressiona
::lOSOK para fechar a caixa de diálogo Value Labels.
definição do form to e linh mento d s colun s
=: pouco provável que desejemos modificar a largura de uma coluna do Data
Editor. Contudo, se o quisermos fazer basta seleccionar a linha apropriada na
:oluna Columns e pressionar o botão com as setas apontando para cima e
?ara baixo até obter o valor desejado. Se pretendermos alterar o alinhamento
;:iosdados numa determinada coluna, teremos que seleccionar a linha apro
?riada na coluna Align, pressionar a seta apontando para baixo seguida de
-..unadas duas opções que aparecem na sequência desta operação.
Definir variáveis consecutivas em simultâneo
Sedesejarmos definir o mesmo formato para variáveis consecutivas (como por
exemplo, satis1 a rotina4), teremos que definir a primeira variável ( satis1),
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 54/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
opiar esta linha, seleccionar as linhas subsequentes a modificar (9 a 19), selec
ionar Paste ou Paste Variables ... e renome ar as variáveis de acordo com o
u nome original.
Guardar
os
dados no ata ditor
uando pretendemos encerrar uma sessão de trabalho no SPSS, ou utilizar
utra base de dados numa mesma sessão, devemos guardar os dados, ou
ualquer alteração que tenhamos operado sobre os mesmos, num ficheiro.
odemos, portanto, gravar este ficheiro no disco rígido do computador. Con
do, se outras pessoas utilizam este equipamento podem, inadvertidamen
, apagar o nosso trabalho. Mesmo que mais ninguém utilize o computador,
sempre conveniente fazer uma cópia de segurança do nosso ficheiro numa
u mais disquetes formatadas. Adisquete é, normalmente, inserida numa dri-
do computador.
Para que o ficheiro seja identificável, é necessário dar-lhe um nome. O
ome de um ficheiro consiste de uma prefixo com o máximo de oito caracte
s, seguido de um ponto e de um sufixo (ou extensão) com três caracteres. O
ome do ficheiro refere-se, usualmente, ao seu conteúdo (tal como no nosso
lar
View ºal3LIranslorfl _~naiYzeJàraphs
•.-1ia J iiia
-Dsta ...
fulntax. ..
QutpuL
SJ;<ripl
Olher .
Untilled - SPSS Data Editor
S~itch Server...
RecenUyUsed Da a •.
Recently Used files •.
Ej it
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 55/128
ANALISAR DADOS COM O COMPUTADOR
: Save Data As 6 EJ
35
GjJaldar em: IGi Disquele de 3li (A:)
_orne do ficheiro:
Guardalcorno ipo: SPSS ( .sav)
qúardaít
:eã Siew~
Cãncelar
k.
::aixa 2.9
A caixa de diálogo Save Data As
:.asoqtb refere-se a questionário de trabalho - dados brutos), enquanto que o
:-.orneda extensão refere-se ao tipo de ficheiro. Os ficheiros criados no Data
Editor possuem, por defeito, uma extensão sav. Assim, o nosso ficheiro de da
: ospode tomar o nome de qtb.sav. Nos sistemas operativos mais recentes, as
~·,tensões aparecem representadas sob a forma de símbolos e não de nomes
:al como mostrado na caixa 2.10).
Ao longo desta obra, vamos utilizar uma notação particular para des
:::-everos passos envolvidos num procedimento do SPSS. A selecção de um
-;asso ou de uma opção será indicada por uma seta apontando para a direi-
-2. ?,o que indica as opções dos menus ou caixas de diálogo a serem esco-
_---:idas.Todas as explicações adicionais aos procedimentos serão introdu
.::das entre parêntesis rectos. Os passos referentes a uma caixa de diálogo,
::1 a uma subcaixa de diálogo que é uma caixa que só pode ser acedida
=?Ós ter sido aberta uma caixa de diálogo principal) começam numa linha
- .)\Oa.A totalidade da sequência de procedimentos será identada. Assim, a
- ;)tação dos procedimentos para gravar o ficheiro que referimos anterior-
::-.ente numa disquete introduzi da na drive A é:
? File [apresentado na caixa 2.8] ? Save As ... [abre a caixa de diálogo
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 56/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
Nome do ficheiro: [qtb
Ficheiros do ipo:
I5Ps
5 [ .sav J
Caixa 2.10 A caixa de diálogo Open File
~ii ~ ~ l
l'
Eailte'
Recuperar um ficheiro guardado no Data Editor
Se quisermos recuperar o ficheiro anterior numa fase posterior, vamos utili
zar o procedimento seguinte:
~ File ~ Open Data [abre a caixa de diálogo Open File apresentada na
caixa 2.10f
escrever a:\qtb.sav na caixa situada ao lado de File name: ~ Open
Abrir um ficheiro de dados em ASCII no Data Editor
Se os dados foram guardados numa disquete sob a forma de um ficheiro
ASCII chamado qtb.dat, então teremos que seguir o procedimento seguinte
para abrir este ficheiro no Data Editor:
~ File ~ Read Text Data ... [abre a caixa de diálogo Open File apresen
tada na caixa 2.10]
3 Esta instrução está omissa no original. Contudo, como o leitor pode verificar, o procedi-
mento File seguido de Open exige a escolha de uma opção adicional, isto é, a opção
entre abrir um ficheiro de dados (Data), de sintaxe (Sinta x), de resultados (Output), ete.
N do R
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 57/128
ANALISAR DADOS COM O COMPUTADOR
el
Imporl Wrzard - Slep 1 016
Welcome lo lhe texl impor l wizard
T
hís wizerd wili help you read dale f omyour lexl file end
specify informálion ebout lhe variables.
oes your text fi le match e predefined formei?
CJYes
37
Textfile:
O
I
~~ 66 29 4 3422422223223
2 46 26 52 2322 23444 344
3 78 4 5442452 222 23 434
4 64 46 522 22 22232232334
~
:aixa 2.11 A caixa de diálogo Tex Impor Wizard
Help
escrever a:\qtb.dat na caixa situada ao lado de File name: ~ Open
[abre a caixa de diálogo Text Import Wizard Step 1 of 6apresentada na
caixa 2.11]
~ Next> [abre a caixa de diálogo Text Import Wizard Step 2 of 6]
~ Fixed width ~ Next> [abre a caixa de diálogo Text Import Wizard-
Step 3 of 6]
~ Next> [abre a caixa de diálogo Text Import Wizard Step 4 of 6]
~ Next> [abre a caixa de diálogo Text Import Wizard Step 5 of 6]
~ Next> [abre a caixa de diálogo Text Import Wizard Step 6 of 6]
~ Finish [fecha a caixa de diálogo Text Import Wizard Step 6 of 6 e
apresenta os dados no Data View]
~ Variable View [para definir os dados]
Procedimentos estatísticos
=;.epoisde termos introduzido os dados no Data Editor estamos preparados
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 58/128
38
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
~Descriplives
E
<t> gpracial
<t> sexo
<t> rendim
<t>
anos
<iI )
envolv
<t> satis1
<t> satis2
/ L~atis3
Save standardged values as variables
aixa 2.12 A caixa de diálogo Descriptives
uadro 2.3 O ut ut do comando Descritptives
Descriptive Statistics
)
IDADE
69
8
3
12,32
9
ue calcule a idade média mean da amostra. Podíamos fazê-lo a partir de vá
ios comandos do programa mas vamos usar apenas o que aparece com o
ome de Descriptives Satistics estatísticas descritivas). Este fornece-nos,
ambém, acesso a outras estatísticas descritivas da variável. O procedimento
ara realizar este comando é:
~ Analyze 7 Descriptive Statistics ~ Descriptives ... [abre a caixa de
diálogo Descriptives apresenada na caixa 2.12]
~ variável [por exemplo, idade; note-se que as variáveis encontram-se
listadas por ordem no Data Editor]
~~[botão] [coloca a variável seleccionada na caixa abaixo de Varia
ble[s]:] ~ OK
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 59/128
· - ALISAR DADOS COM O COMPUTADOR
escriplives: Options
D
Help
rlSke~ness
r~~um
_Minimum
C.Ma] imum
riS.&.. mean
.:1ean
rsion
-spla , Order
• VariaQle list
êlphabetic
As.Qending means
Qescending means
: xa 2 13 A subcaixa de diálogo Descriptive: Options
adro 2 4 O
ou pu Mean Descriptive
Descriptive Statistics
IDADE
alid
N
3:atísticas descritivas foram calculadas. Se olharmos para as idades do Qu
:õ:ionáriode Trabalho, podemos confirmar que a idade mínima é, de facto, 18
:'.os(caso número 1),enquanto que a idade máxima é de 63 anos (caso núme
= 3). Devemos notar, também, que a idade de um dos respondentes (caso nú
-.ero45) é omissa, o que faz com que o número total de dados válidos para
3,avariável seja 69 e não 70.
Como se pode observar no quadro 2.3, o
output
apresentado na janela
ewer é sempre precedido pelo nome do procedimento estatístico realizado.
,) presente caso, o procedimento que utilizámos foi o Descriptive. Por ra
~€sde espaço de edição, os
outputs
que apresentaremos ao longo desta obra
o
contêm este tipo de títulos.
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 60/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
?re:emiessemos obter, apenas, a média das idades da nossa amos
ra sem as :-e::. i:ch .tesstatísticas, poderíamos proceder do seguinte modo: se
eccionar Options ... na caixa de diálogo Descriptive: Options apresent~a
a caixa 2.13. Depois, remover a selecção Std. deviation, Minimum e Maxl
um, ffim e: .cio o cursor para as caixas adjacentes a cada uma destas opções.
Oll pl ; corre:,,-pondente a este procedimento é apresentado no quadro 2.4.
Se ::ecessitarmos de voltar ao Data Editor, podemos optar por um de
ois procedimentos: seleccionar qtb-S ... no fundo do écran ou a opção Win
ow segmeia de 1 qtb-SPSS Data Editor do menú drop down Se uma opera
ão do SPSS ioi começa da e não concluída (por exemplo, se todas as caixas de
iálogo r~-peitantes a uma dada operação não foram encerradas), não será
ossí,,:,el percorrer o conteúdo da janela Viewer.
Guardar e imprimir o Output
ara imprimir o conteúdo de uma janela, basta torná-la activa e executar a se
ência seguinte:
~ File ~ Print ... ~ OK
e quisermos guardar os conteúdo de uma janela numa disquete, podemos
eguir os passos seguintes:
~ File ~ Save As ~ janela [abre-se a caixa de diálogo Save As]
~ identificar a drive e nomear o ficheiro na caixa ao lado de File name:
[por exemplo, a:\qtb.spo] ~ Save
nome, por defeito, das extensões dos ficheiros de output é spo, ou seja, a
breviatura de ficheiro spss
output
Estes ficheiros podem ser editados antes
e serem gravados: por exemplo, pode desejar apagar-se determinadas análi
es ou escrever comentários adicionais às análises efectuadas.
Sistema de ajuda
SPSS possui um sistema de ajuda que pode ser muito útil para evitar o re
urso constante a um livro como o presente, ou ao manual do programa.
omo este sistema foi concebido para ser auto-explicativo, o leitor deverá
er capaz de o utilizar depois de adquirida alguma experiência. Para obter
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 61/128
..•..'\lALISAR DADOS COM O COMPUTADOR
' '
. ' ..
.
.
.::I
ue
O..C1:> _odor como, polel<et' llpio, índice remissivo',
'1\
'
• Tliorials
• Dist,;buted Analysis
Data management
• 5 tatistical anal}lsis
• Graphical analysis
• Inleractive charts
Output management
Saving Files
•• Printing Files
.:::.
l~~:~~:e~~r~~~~~o,~ ..__
l
fj
Alíi1r
1I1' ~~llr~1
2.14 A caixa de diálogo Help Topics Content
41
~ Help ~ Topics [abre a janela Help Topics Contents apresentada na
caixa 2.14]
~ Find [abre a janela Help Topics Find apresentada na caixa 2.15] ~ na
primeira caixa escrever o termo a pesquisar, ou o mais próximo possível
do desejado [por exemplo, file] ~ Select some matching topics to nar
row your search [por exemplo, File] ~ Click a topic, then click Display
[por exemplo, Open file] ~ Display [abre a caixa de informação Help
apresentada na caixa 2.16]
~ ? [para minirnizar (Minimise) ou fechar (Close) o sistema de ajuda]
::ecessitarmos de ajuda enquanto se trabalha numa caixa de diálogo, selec
_:.ar a opção Help nessa mesma caixa.
Terminar uma sessão de trabalho no SPSS
-==. terminar uma sessão no SPSS, seleccionar File seguido de Exit. Se tive-
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 62/128
42
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
Lõcaizar
I
~ CiQua num tópico e, em seguida. sobre tAoollar
Add Cases
Add Cases 01Variables: Rename
Add Cases: Dictionary Information
Add Files Command Synla.
Add Variables
AJJding T\,xt
Jmpor
~u
ftecoristruit.u
111X
/
Caixa 2.15
A caixa de diálogo Help Topics Find
Opens lhe selected data file.
O nl~ one dala file can be open ai a lime. T he current dala
file is aulomaticall~ c10sed when a new dala file is opened.
If ~ou wanllo have mulliple data files open ai lhe same
time ~ou can starl mulliple sessions.
Click See Also above for addilional information on
opening data files.
Caixa 2.16
A caixa de informação Help
não existir nenhum ficheiro já previamente gravado). O leitor deve notar bem
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 63/128
ANALISAR DADOS COM O COMPUTADOR
Exercícios
Você pretende recolher informação sobre as preferências religiosas dos
seus inquiridos e lembrou-se das seguintes alternativas: agnóstico,
ateu, budista, católico, hindu, judeu, muçulmano, protestante e taoísta.
Que outra categoria deveria ainda ser incluída?
Você pretende gravar esta informação num ficheiro de dados, para ficar
armazenada num computador. Como deveria codificá-la?
Depois de ter os questionários preenchidos, você repara que num deles
o sujeito não respondeu a esta pergunta. Quando introduzir os dados no
ficheiro de dados, como é que vai referir este facto?
Suponha que um outro sujeito assinalou duas categorias em vez de uma
só. O que faria nesta situação?
Os primeiros dois sujeitos da sua amostra de cinquenta descrevem-se
como agnósticos e os dois seguintes como ateus. As idades destes sujei
tos são, respectivamente, 25, 47, 33 e 18. Como escreveria esta informa
ção no ficheiro de dados?
Quantas colunas de um ficheiro ASCII são necessárias para codificar as
respostas dos sujeitos à pergunta sobre a sua filiação religiosa, se todas
as opções tiverem sido escolhidas pelo menos uma vez?
Como é que o SPSS sabe o que representam os diferentes números que
constituem o ficheiro de dados?
Em cada linha, qual o número de colunas disponível para colocar dados
ou comandos que existe na maior parte dos computadores?
Qual o número máximo de caracteres que podem ser usados para desig
nar uma variável no SPSS?
Apêndice 2 Questionário do Trabalho
uestionário aos mpregados
.stequestionário foi construído para estudar alguns factos sobre si e sobre o
u trabalho. Por favor, responda com sinceridade. Não existem respostas
rtas ou erradas.
Código
Coluna
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 64/128
ANÁLISE DE DADOS EM CJ~NCJAS SOCIAIS
--Indiano 3
-- Africano 4
--outro 5
ual o seu sexo? 6
-- Masculino 1
-- Feminino 2
Actualmente, qual é o seu rendimento anual bruto antes dos descontos
e impostos ?
-€ 8-12
Quantos anos tem?
--anos 14-15
Há quantos anos trabalha nesta empresa?
--anos 17-18
Por favor, indique em relação a cada uma das afirmações seguintes se 1
discorda totalmente, 2 discorda, 3 está indeciso, 4 concorda, ou 5
concorda totalmente. Para cada afirmação, assinale só uma resposta.
a Não deixaria esta empresa mesmo
que pudesse ganhar um pouco mais noutra
1 2 3 4 5 20
b Para mim, o meu emprego é como
um o y 1 2 3 4 5 22
c A maior parte das vezes tenho
que meforçar a ir para o trabalho 1 2 3 4 5 24
d Quase todos os dias me sinto entusiasmado
como meu trabalho 1 2 3 4 5 26
e O meu trabalho émuito desinteressante
1 2 3 4 5 28
f Tenho autorização para executar
o meu trabalho da forma que me
parecer melhor 1 2 3 4 5 30
g Posso tomar decisões sobre a forma
de executar omeu trabalho 1 2 3 4 5 32
h Na secção da empresa onde estou inserido,
as pessoas podem executar o seu trabalho
da forma que mais lhes agradar
1 2 3 4 5 34
i Se eu quiser fazer uma pequena alteração
na minha forma de trabalhar, não preciso
deconsultarosupervisor
1 2 3 4 5 36
j
Faço o meu trabalho praticamente
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 65/128
ANALISAR DADOS COM O COMPUTADOR
Estevepresente na reunião da empresa, estemês?
--sim 1
--não 2
uestionário ao upervisor
45
46
::car-lhe-ía grato se pudesse responder às perguntas que se seguem sobre
~a das pessoas cujo trabalho supervisiona:
_;ome do Empregado.
Por favor, descreva o nível de especialização que lhe parece
exigir o trabalho que essa pessoa desempenha.
Qual das seguintes descrições seria mais adequada?
Assinale uma das alternativas
-- não especializado 1
-- semi-especializado 2
-- bastante especializado 3
-- muito especializado
Como classificaria a sua produtividade? Assinale uma das
alternativas
-- muito fraca 1
--fraca 2
--Média 3
--Boa 4
Muito boa 5
Como classificariaa qualidade do trabalho dele a ?
Assinaleuma das alternativas
-- muito fraca 1
--fraca 2
--Média 3
--boa 4
muito boa 5
Nos últimos doze meses,quantos dias ele a faltou?--dias
48
4
50
54-55
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 66/128
Capítulo 3
ANALISAR DADOS COM O COMPUTADOR
Dominar melhor o SPSS para Windows
-_gora que já sabe como se cria um ficheiro de comandos para o SPSS, pode
apresentar-lhe outros procedimentos que lhe podem vir a ser muito
.::eis Estes procedimentos permitir-lhe-ão fazer o seguinte: seleccionar casos
-pecíficos por exemplo, os homens brancos com menos de 40 anos), para fa
er análises separadas; criar novas variáveis por exemplo, a classificação
..lffia escala de atitudes ou de personalidade) e novos ficheiros de dados
?ara as guardar); criar descrições mais completas das variáveis; e
• Select Cases
S
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 67/128
1 >
gpracial
1 >~
1 >
rendim
1 >
idade
~anos
~envolv
1 >satis
1 >
satis2
< >
satis3
.~ satis4
· to
autonom
.:;jp autonom2
A~
aixa 3.2
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
A subcaixa de diálogo Selecl Cases: 11
crescentar comentários que lhe permitam recordar aquilo que já fez. O SPSS
ode também executar operações que não são descritas neste livro, como seja
ombinar ficheiros de diversas maneiras. Se precisar de utilizar operações
ue não sejam mencionadas neste livro, deverá consultar o menu Help aju
a) ou o Guia do SPSS.
Seleccionar casos
ara seleccionar casos com determinadas características, usa-se o menu Data
a opção Select cases ... , o que abrirá uma caixa de diálogo Select Cases se
ccionar casos) tal como pode ser observado na caixa 3.1. Se quiser descobrir,
or exemplo, a idade média dos homens da amostra que respondeu ao Ques
onário do Trabalho, deverá seleccionar If condition is satisfied se a condi
o for satisfeita), seguido de If, o que abrirá a subcaixa de diálogo Select ca
s: If seleccionar casos: se) apresentada na caixa 3.2. Na caixa em branco de
erá introduzir as condições que deseja que os seus dados satisfaçam para se
m seleccionados. De acordo com o nosso exemplo, vamos introduzir a con
ição sexo
=
1, na medida em que, na base de dados, os homens foram codifi
dos com o número 1. De seguida, seleccionamos Continue continuar) de
rma a fechar a subcaixa de diálogo Select cases: If, e OK para fechar a caixa
e diálogo Select Cases.
Para calcular a média de idades dos homens da amostra, vamos proce
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 68/128
ANALISAR DADOS COM O COMPUTADOR
uadro 3 Idade média dos sujeitos do sexo masculino do Questionário de Trabalho
Descriptive Statistics
IDADE
Valid N
7 idade 7~ [botão] 7 Options [abre a subcaixa de diálogo Descripti
ve: Options apresentada na caixa 2.13]
Std.deviation [para remover a selecção] 7 Minimum 7 Maximum
7 Continue
K
resultado deste procedimento é apresentado no quadro 3.1.
A selecção dos casos mantém-se activa até ser dada uma instrução para
terminar. Se se pretender levar a cabo análises estatísticas com a totalidade
a amostra ou, somente, com mulheres, deve alterar-se a selecção dos casos.
ara realizar análises com a totalidade da amostra deve seleccionar-se All ca
s na caixa de diálogo Select Cases ; se se desejar, apenas, utilizar sujeitos
o sexo feminino deve introduzir-se a condição sexo = 2 na subcaixa de diálo
o Select cases: If.
Operadores relacionais
m operador relacional como = igual compara o valor à sua esquerda por
xemplo, sexo com o da sua direita por exemplo, 1 . Há seis operadores rela
ionais que podem ser representados pelos símbolos que se seguem:
igual a equal to
não igual a not equal to
menor que less than
menor ou igual a less than or equal to
maior que greater than
= maior ou igual a greater than or equal to
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 69/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 70/128
..••..ALISAR DADOS COM O COMPUTADOR
Uma outra forma de fazer esta escolha de sujeitos entre os 30 e os 40 anos
e idade inclusive, consiste em utilizar a função lógica range
amplitude ,
em
?e será seleccionado qualquer caso em que a variável idade apresente um
alor dentro desse intervalo de idades:
~ge(age,30,40)
Recodificar os valores das variáveis
Por vezes, é necessário mudar ou recodificar os valores de algumas variáveis.
_~sim, por exemplo, é recomendável que a-construção das questões que vão
servir para criar uma escala, um índice ou uma medida composta que varie
::eforma a que as pessoas que respondam sim a todas as perguntas ou, pelo
-ontrário, não a todas, não tenham um valor extremo. Repare-se, por exem
?lo, que construímos duas das quatro questões destinadas à avaliação da sa
:isfação no trabalho no Questionário do Trabalho - pergunta 6c ( A maior
?arte das vezes, tenho que me forçar a ir para o trabalho ) e pergunta 6e
( 0
~eu trabalho é muito desinteressante ) - na direcção oposta das outras duas
- pergunta 6b ( Para mim, o meu emprego é como um
hobby
e pergunta 6d
Quase todos os dias sinto-me entusiasmado com o meu trabalho ). A res
?osta a estas questões é dada numa escala de cinco pontos que vai desde 1
discorda totalmente ) até 5 ( concorda totalmente ). Poderíamos inverter a
escala para os itens 6c e 6e, mas talvez os sujeitos percebessem o que nós pre
tendíamos. Assim, é mais simples inverter os códigos quando se analisam os
dados. Se quisermos que a um resultado mais elevado corresponda uma
maior satisfação no trabalho, deveremos recodificar as respostas destes dois
itens, de modo a que o 1 seja o 5, o 2 seja o 4, o 4 seja o 2 e o 5 seja o 1. Para o
• Recode inlo D.f1erenl Vaflables
Ei
,o ......v__ ;
satis2 u> rsatis2
JI
~ame: •••••
I
; Change
. rsalls4 Jrl _
I LabeI:
It
=
~
I
NumericVariable·) OutpulVariable:
() gpracial
~sexo
~rendim
IF>idade
,~ anos
~envolv
~salis1
~salis3
~autonom1
~autonom2
~aulonom3
~aulonom4
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 71/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
aixa 4
A subcaixa de diálogo Recode inlo Differenl Variables: Old and New Values
zermos, poderemos usar o comando Recode recodificar que se encontra
o menu Transform transformar . Podemos recodificar valores utilizando a
esma Into Same Variables ... ou uma variável diferente Into Different
ariables ... .
Se quisermos comparar os valores originais de uma variável com os re
odificados, ou se pretendermos guardar os valores originais, podemos utili
ar a opção Into Different Variables ... , a qual abre a caixa de diálogo Recode
to Different Variables recodificar para uma variável diferente apresenta
a na caixa 3.3. Por exemplo, se pretendermos recodificar as variáveis satis2 e
atis4 noutras variáveis novas rsatis2 e rsatis4, transferimos satis2 para a cai
a intitulada Numeric Variable ~ Output Variable:, escrevendo o nome da
ova variável rsatis2 na caixa Name: e seleccionamos Change. Podemos re
etir esta mesma operação para a variável satis4, recodificando-a para umaova variável rsatis4.
De seguida, seleccionamos Old and New Variables ... , o que abre a sub
aixa de diálogo Recode into Different Variables: Old and New Values apre
entada na caixa 3.4. Na caixa intitulada Value na secção Old Value, onde o v
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 72/128
ANALISAR DADOS COM O COMPUTADOR
• S ummarize Cases
EJ
i
53
(~ rotina1
< >rotina2
< >rotina3
< >rolina4
< >reuniao
(t;> especial
< >produtiv
< >qualid
<:~ absent
< >,rsalis4
< >satis
< t>
ethnigpc
Show ,Çase numbers
~ariables:
< >salis2
< >rsatis2
< >satis4
irouping Variable(s):
Help
aixa 3.5
A caixa de diálogo Summarize Cases
a esquerda para a direita e modificados somente uma vez. Neste sentido,
1
é, inicialmente, recodificado para 5
(1~
5 não é, subsequentemen
e, reconvertido para
1
5 ~
1).
No caso de existirem valores omissos missing
alues , como no presente exemplo, deve seleccionar-se System- or
ser-missing na secção Old Value e System-missing na secção New
Após estes procedimentos, seleccionamos Continue para fechar a sub
aixa de diálogo Recode into Different Variables: Old and New Values e OK
ara fechar a caixa de diálogo Recode into Different Variables. Podemos, en
ão, verificar os valores recodificados nas colunas correspondentes satis2,
satis2, satis4 e rsatis4 do editor de dados Data Editor .
Em alternativa, podemos verificar os valores recodificados de rsa
is2 e rsatis4 seleccionando Summarize Cases, de forma a obter uma lis
agem dos valores de satis2, rsatis2, satis4 e rsatis4 para, por exemplo, os
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 73/128
54 ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
adro 3.2 O ou/pu/ do comando Case Summaries mostrando os valores recodificados de rsatis2 e
rsatis4
Case Summaries
TI ?
3
00
4 00
O
00
4
00
1
00 5
00
4
00 4
00
1
00
5
00
3
00
3
00
3
00
2 00
2
00 1
00
4
00
2
00
3 00 9
0 10
-+ seleccionar variáveis [por exemplo, satis2] -+~ [botão] -+ Limitcases
to first e escrever um número [por exemplo, 10]
-+OK
e não pretendermos guardar os valores originais, podemos seleccionar a
pção Into Same Variables ... que abre a caixa de diálogo Recode Into Same
ariables apresentada na caixa 3.6. Por exemplo, se quisermos recodificar as
riáveis satis2 e satis4 temos que as seleccionar e colocar na caixa intitulada
De seguida, procedemos, como anteriormente, seleccionado Old and
ew Values ... , o que abre a caixa de subdiálogo Recode Into Same Varia
es: Old and New Values apresentada na caixa 3.7. Na caixa intitulada Va
e: na secção Old Value), escrevemos o primeiro valor a recodificar por
emplo, 1), enquanto que na caixa Value na secção New Value) escrevemos
novo valor por exemplo, 5) e seleccionamos Add. Repetimos este procedi
ento consecutivamente para os outros três valores a recodificar 2,4 e 5). Po
mos fazer o mesmo para o valor 3. Se existirem valores omissos missing v -
como é o caso deste exemplo, devemos seleccionar System- or
ser-missing na secção Old Value) e System-missing na secção New
Em alternativa, podemos seleccionar All other values, escrever o valor
na caixa intitulada Value: na secção New Value) e seleccionar Add.
Após este procedimento, seleccionamos Continue para fechar a subcai
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 74/128
ANALISAR DADOS COM O COMPUTADOR
<%> gpracial
< >
sexo
<%> rendim
<%> idade
<%> anos
<t- envolv
' > salis
<%>
satis3
<%>
aulonom
lf...
.Qldand New Values ...
Caixa 3.6
A caixa de diálogo Recode into Same Variables
Aecode ;nlo Same Variables OId and New Values ~
I
O sj->
New:
1 ..> 5
2 ..> 4
4 ..> 2
5 ..> 1
MISSING ..> SYSMIS
.~.k~ ::.~••••••••••••••••••••••••••••••••••••••••••
Caixa 3.7
A subcaixa de diálogo Recode into Same Variables: Old and New Values
podem existir diversos valores originais. Por exemplo, se desejarmos cons
truir uma escala de 3 pontos concordo, discordo, indeciso), podemos faze-lo
recodificando os valores 1 e 2 para 1, 3 para 2, e 4 e 5 para 3. Na medida em que
só podemos introduzir um valor na caixa intitulada Value de cada vez, tere
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 75/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
Senão desejarmos especificar qual o limite inferior do intervalo de valo
s, podemos faze-lo através do comando Range:. Se não desejarmos especifi
r o limite superior do intervalo, podemos seleccionar Range:. Por exemplo,
odemos utilizar estas opções para categorizar a nossa amostra em sujeitos
ima e abaixo dos 40 anos de idade, recodificando lowest through 39 para 1 e
0 through highest para 2.
Se a nossa amostra possuísse idades não expressas em números inteiros,
to é, idades compreendidas entre os 39 e os 40 anos por exemplo, 39,9 , es
s não seriam recodificadas pelo procedimento anterior. Para evitar este pro
lema, podemos especificar limites superiores e inferiores coincidentes no
omando Range, ou seja, lowest through 40 recodificado para 1 e 40 through
ighest para 2. Neste exemplo, todos os sujeitos com idade inferior a 40 anos
riam recodificados para o valor 1. Como os valores são codificados conse
utivamente e de uma vez só, o valor 40 anos não seria recodificado para 2.
Criar uma nova variável
or vezes podemos pretender criar uma nova variável. Por exemplo, usá
os quatro itens para avaliar aspectos ligeiramente diferentes de satisfa
ão no trabalho e, em vez de tratarmos estes itens como medidas separa
as, podemos achar preferível e até mais razoável combiná-los num único
dice, constituindo assim uma medida composta. Para o fazermos deve
os usar o comando Compute no menu Transform, o que abre a caixa de
iálogo Compute Variable apresentada na caixa 3.8. Podemos, assim, cri
r uma variável nova satis que corresponde à somas das variáveis satisl,
satis2, satis3 e rsatis4. Deste modo, começamos por escrever o nome da
<~ rolinal
~rolina2
~ rolina3
~rOlina4
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 76/128
ANALISAR DADOS COM O COMPUTADOR
Quadro 3.3 O output do comando Case Summaries mostrando os valores de satis1, rsatis2, satis3,
rsatis4 e satis
Case SummarieS
1
O
,00
4,00
,00
O
,00,00 4
,00
4
,005,00 2
,00
2
,00
,00 3
,00
4
,004,00
2
,00
3
,00,00
3
,00
2
,001,00
2
,00
4
,004,00
3
,00
2
,002,00
3
,00
3
,003,00 8
010
nova variável satis na caixa intitulada Target Variable:. Depois, seleccio
namos SUM numexpr, numexpr ... na caixa Functions. Esta função será ins
crita na caixa Numeric Expression:. Nesta última caixa, substituímos ?,? por
satis1, rsatis2, satis3, rsatis4 e seleccionamos OK. Se o nome dos itens deri
vasse sempre da palavra satis, bastaria substituir
?,?
pelo primeiro item a so
mar satis1 , seguido do último satis4 .
Se olharmos para os valores de satis no editor de dados Data Editor ,
verificamos que o valor do primeiro caso é 9,00 3+4+2
=
9,00 , 5,00 para o se
gundo 2+3 = 5,00 e 15,00 para o terceiro 4+2+4+5 = 15,00 . Para listar os va
lores desta variável, podemos usar o comando Case Summaries ... O quadro
3.3 apresenta os resultados deste procedimento para os primeiros 10 casos.
Dados omissos e cálculo de valores para formar medidas compostas
Como vimos, faltam o valor satis1 para o primeiro sujeito e o valor satis1 e sa
tis2 para o segundo, Em investigação, é muito frequente que haja alguns da
dos omissos. Os sujeitos podem não responder a algumas questões, podem
assinalar duas respostas diferentes à mesma pergunta, o experimentador
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 77/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
omitir os dados desse sujeito uma vez que pode haver algum problema com a
forma como esses dados foram obtidos. Pode acontecer, por exemplo, que o
sujeito não estivesse a prestar atenção ao que estava a fazer.
Na medida em que os dados disponíveis para construir um índice de ro
tina no trabalho são omissos para alguns indivíduos, não será apropriado uti
lizar a função somatório das respostas para calcular este mesmo índice. De
facto, um sujeito que responda concordo totalmente (codificação 5) nos
quatro itens de rotina no trabalho, terá uma pontuação total de 20, enquan
to que um que concorde totalmente com todos os itens mas que, por algu
ma' razão, não tenha respondido a um deles, terá, apenas, uma pontuação
de 15. Por outras palavras, quando existem valores omissos nos itens que
constituem um índice, necessitamos de tomá-los em consideração. Neste
sentido, um índice mais apropriado para esta situação será calculado com
base na média dos valores não omissos, isto é, cinco para o primeiro caso
(20/4
5) e para o segundo (15/3
5) sujeitos. Outra vantagem de utilizar
a média de uma escala, como a da rotina no trabalho, é a de que o resultado
médio corresponde às respostas dos itens individualmente, ou seja, um re
sultado de 4,17 indica que um sujeito respondeu, de uma forma geral,
concordo a estes itens.
Contudo, não será aconselhável calcular o resultado médio de um sujei
to com um número significativamente grande de dados omissos. Podemos
aplicar, nestes casos, uma regra prática que consiste em verificar se, para um
sujeito, faltam 10 por cento ou mais dos dados referentes a um determinado
índice. Se for esse o caso, então o próprio índice é definido como omisso para
esse sujeito. Se aplicássemos este princípio aos dois primeiros sujeitos do nos
so exemplo, não deveríamos calcular o valor da satisfação no trabalho para
estes indivíduos. Pelo contrário, poderíamos calcular os valores de rotina no
trabalho e de autonomia.
Para calcular o resultado médio utilizamos a função MEAN (numexpr,
numexpr,,,.) que se encontra na caixa de diálogo Compute Variable (secção
Functions). Se quisermos especificar um número mínimo de valores não
omissos para que a média seja calculada, inserimos um ponto final após a fun
ção MEAN seguido do número mínimo de valores. Utilizaremos os quatro
itens da escala satis para ilustrar este procedimento. Com apenas quatro itens
não podemos utilizar um ponto de cut of de exclusão de valores omissos aci
ma dos 10 . Utilizaremos, então, um critério mais leniente de 50 . Semais de
50 (isto é, dois ou mais) das respostas de um sujeito aos itens de satisfação
no trabalho forem omissas, codificaremos a variável satis como omissa para
este sujeito. Por outras palavras, o número mínimo de valores não omissos
para que a média seja calculada é três. Como anteriormente, a nova variável a
criar designa-se satis, mas a expressão numérica a inserir na caixa Numeric
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 78/128
ANALISAR DADOS COM O COMPUTADOR
59
que, para o primeiro caso, ele é de 3,00 9,00/3=3,00),. para o segundo caso
na medida em que só existem dois valores válidos) e 3,75 para o terceiro
15,00/4=3,75).
Para recodificarmos os resultados médios omissos da variável satis para o
valor zero, utilizamos o procedimento Recode into Same Variables, seleccio
nando System-missing na caixa intitulada Old Value e escrevendo zero na caixa
intitulada Value: na secção New Value) e, por fim, seleccionado Add.
Para converter os resultados médios de uma variável em resultados to
tais que consideram o número de resultados válidos variando, portanto, en
tre 3 e 4), multiplicamos cada resultado médio pelo número máximo de itens,
isto é, 4. Assim, utilizamos o procedimento Compute Variable, no qual a
nova variável toma, novamente, o nome de satis e a expressão numérica a in
troduzir é satis*4.
Na medida em que desejamos criar três variáveis novas satisfação no
trabalho, autonomia no trabalho e rotina no trabalho), teremos que repetir o
procedimento Compute Variable para os itens da escala de rotina no trabalho
e de autonomia no trabalho. Ainda que se saiba, de antemão, que não existem
valores omissos neste dois conjuntos de variáveis, podemos ter alguma cau
tela e assumir que, na realidade, podem existir alguns. Se quisermos determi
nar a presença ou ausência destes valores, podemos utilizar o procedimento
Frequences ver capítulo 5).
As medidas compostas de satisfação no trabalho, autonomia no traba
lho e rotina no trabalho, que usaremos nos capítulos seguintes, foram criadas
através da soma dos 4 itens de cada escala, especificando como omisso o re
sultado total da escala baseado em mais de 10 de valores omissos nos itens
correspondentes. Na medida em que dois dos 70 casos do Questionário de
Trabalho possuíam uma ou duas respostas omissas nos itens da escala de sa
tisfação no trabalho, o número de casos para os quais foi possível calcular um
resultado global foram 68. As variáveis que contemplam os resultados totais
das escalas de satisfação no trabalho, autonomia no trabalho e rotina no tra
balho intitulam-se satis, autonom e rotina respectivamente. Uma vez mais,
para a variável satis, por exemplo, calculámos, em primeiro lugar, a média
dos itens da escala através da expressão numérica MEAN.4 satis1 to satis4),1
convertendo-a, em seguida, para um resultado total através da expressão nu
mérica satis*4.
Quando a nossa amostra possui um número elevado de variáveis as
quais, por alguma razão, podemos prescindir, pode revelar-se mais conveni
ente criar um novo ficheiro que contemple, apenas, as variáveis que vamos
sujeitar a análise. Por exemplo, se quisermos analisar, somente, as variáveis
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 79/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
atis, rotina e autonom, e não os itens que as constituem, podemos criar um
ovo ficheiro que contém, apenas, estas variáveis juntamente com outras
ue possamos necessitar . Para tal, apagamos os itens individuais seleccio
ando as variáveis satisl a rotina4 no editor de dados Data Editor e selec
ionando Edit, seguido de eut. Podemos, então, gravar estes dados num
ovo ficheiro, que designaremos por qtt.sav Questionário q do Trabalho t
dados totais t e que utilizaremos em análises subsequentes. Os dados des
e ficheiro são apresentados n~ quadro 3.4.
Exercícios
Qual o comando do SPSS que serve para seleccionar, entre os sujeitos
que responderam ao Questionário do Trabalho, homens e mulheres de
origem africana?
Escreva um comando do SPSS que sirva para seleccionar, entre os sujei-
tos que responderam ao Questionário do Trabalho, mulheres asiáticas
ou das índias ocidentais que tenham 25 anos ou menos.
Para seleccionar sujeitos que não tenham respostas omissas em relação
à satisfação no trabalho no Questionário aplicado, qual o comando do
SPSS que usaria?
Qual o procedimento do SPSSpara recodificar a variável do Questioná-
rio do Trabalho especial na mesma variável, mas de forma a que passe
apenas a duas categorias não especializado / semi-especializado v sus
bastante / muito especializado .
Qual o procedimento do SPSS para recodificar a variável rendim numa
nova variável gprendim, com três grupos: os que ganham menos que
5,000 libras, os que ganham entre 5,000 libras e 10,000 libras e os que ga
nham mais de
ElO,OOO,
considerando os valores omissos como zero.
Usando o operador aritmético
exprima a variável semanas em dias-
por outras palavras, converta o número de semanas no número de dias
correspondente.
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 80/128
dro 4
Os dados transformados do Questionário de Trabalho
gpracial
exo
endim
dade
nos
nvolv
atisutonomotinaeuniao
specialrodutivualid
bsent
1
.300 29
09 2.300 26
51 3.900 40
5
73 3.200 46502 2.300 636
41
8
1
.000 54126
1 1
.300 2919
4
2 3.800 35421
2
.800 3320
2
.900 273851
1
.100 2962 2
9231
4
.000 55534991 1.500 29951 3.100 48431 2.900 32180
2
1.300 484077
1
1.700 1886
1
3.500 28530 3.800 37
1
88
1
1
1
4362
11
32
1
.700 39005
1
.000 5331143 2.000 3442 3.500 4373931 1.000 2134 1.100 50830691 1.200 3172
1
.800 312
1
08 2.200 5212420 1.200 5424059 3.200 28011 2.300 5034432
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 81/128
continuação
34
2.000
52
153301
1
.500 40111092 2.900 1902
2
.800 3864 2.000
61
1569 1.800
37
08 2.700 3192 2.500 4313222 3.800 2371 2.000 27721 1.500 2844 1.600 O016
1
10 3.700 183063 10.300 483339
1.800
2900
7
111 1.300
42
017024 1.100 53296 1.600
32
20
12
31
1
.500 3182
1
1
.500
55
9553 3.400 2654 1.600 53264
1
.800 511239
1
.700 48391 1.900 48802
2
.900 620
1
82 2.700
57
30831
1
.900 42042
1
.100 2121O
3
.400 2601
1
1.800 4602 10.500
59
150 4.100 3009
71
2
1
.300 2928520
3
.900
45
023 3.000
53
007622 1.900 472
2
1611
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 82/128
Capítulo 4
OS ON EITOS E SU MEDIÇÃO
Os conceitos representam um aspecto fundamental na investigação social. As
hipóteses contêm conceitos que são afinal produtos das nossas reflexões so
bre o mundo. Os conceitos exprimem elementos comuns do mundo aos quais
é atribuído um nome. Podemos verificar que algumas pessoas não gostam de
membros de raças diferentes da sua atribuindo-lhes muitas vezes caracte
rísticas negativas. Outros indivíduos apoiam fortemente os outros grupos ra
ciais talvez vendo-os como elementos que podem enriquecer a cultura acres
centando-lhe novos aspectos. Ainda há outros que são apenas tolerantes não
defendendo um ponto de vista radical nem a favor nem contra os outros gru
pos raciais. Por outras palavras é fácil apercebermo-nos de que as pessoas po
dem assumir uma grande diversidade de posições face aos grupos raciais. Po
demos considerar que entre estas atitudes existe algo em comum embora as
atitudes em si possam ser antagónicas. O ponto de contacto entre essas orien
tações diversas é que qualquer delas reflecte uma posição em relação ao pre
conceito racial . Quando atribuímos um nome às diferentes orientações que
as pessoas podem tomar face aos membros de outras raças estamos a tratá-los
como um conceito isto é como uma entidade que está para além das observa
ções sobre a hostilidade e o apoio raciais que desencadearam a formulação de
um nome para essas ob ervações. O conceito de preconceito racial envolve al
guma abstracção que o fa transcender as reflexões que conduziram à sua for
mulação. Assim o conceito e preconceito racial torna-se algo que os outros
podem utilizar para dar forma as suãS-prôprias reflexões sobre o mundo so
cial. Deste modo podem formular-se hipóteses que postulem conexões entre
o preconceito racial e outros conceitos: por exemplo pode supor-se que ele se
relaciona com a classe social ou com o autoritarismo.
Uma vez formulado o conceito ele próprio e os conceitos que se supõe
estarem com ele relacionados como a classe social ou o autoritarismo preci
sam de ser definidos oper ion lmente para que se possa conduzir uma investi
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 83/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
operações) que permitem que as diferenças entre indivíduos em relação a es
es conceitos possam ser especificadas com precisão. Aquilo a que, de facto,
os estamos a referir é à
medição
isto é, ao acto de fazer corresponder núme
os a unidades de análise - sejam elas pessoas, organizações ou nações - a
ue um conceito se refere. Amedição permite que seja possível especificar pe
uenas diferenças entre unidades. Podemos dizer que alguém que, de uma
orma activa, faz afirmações contra membros de outras raças tem um precon
eito racial enquanto alguém que defende activamente esses membros de ou
ros grupos raciais tem um posicionamento oposto, mas é difícil especificar as
iferentes posições entre estes dois extremos que as pessoas podem assumir.
medição proporciona a possibilidade de especificar essas diferenças, per
itindo determinar as diferenças sistemáticas entre pessoas.
Para providenciar definições operacionais dos conceitos são necessá
indi dores
que correspondam a esses conceitos. Pode acontecer que um
nico indicador seja suficiente para medir um conceito, mas em muitos casos
ão o será. Assim, por exemplo, seria suficiente medir o fervor religioso
través de um questionário em que se pedisse às pessoas que dissessem qual
frequência com que vão à missa? Evidentemente que não, uma vez que ir à
issa é apenas uma das formas com que um indivíduo pode exprimir o seu
ervor religioso. Essa medida não contempla a devoção pessoal, o comporta
ento secular coerente com a sua religião, o facto de estar informado sobre a
ua própria religião ou o grau de adesão aos dogmas centrais dessa religião
Glock e Stark, 1965). Estas reflexões implicam que, em muitos casos, para se
edir conceitos seja necessário utilizar vários indicadores; de outra forma,
ode argumentar-se que os resultados da nossa investigação não são exactos
orque apenas considerámos uma das facetas do conceito em análise.
Se vamos analisar mais do que um indicador do conceito, podemos pre
isar de testar hipóteses em relação a cada um desses indicadores. Imagine
os uma hipótese em que o conceito estudado é a dimensão da organiza
ão . Podemos medir i.e., definir operacionalmente) este conceito através do
úmero de funcionários da empresa, do seu movimento comercial ou dos
eus lucros líquidos. Embora estes três potenciais indicadores est .am, prova
elmente, interligados não estabelecerão entre si uma relação per . a Child,
973). Sendo assim, as hipóteses acerca da dimensão da organização m
er que ser testadas usando cada um dos três indicadores. Do mesmo modo,
e quisermos medir o fervor religioso , para além de avaliarmos a frequên
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 84/128
05 CONCEITOS E A SUA MEDIÇÃO
--~;das compostas, que se constroem a partir de uma multiplicidade de
o Questionário do Trabalho a variável satis é um exemplo de medida
,;::csés de múltiplos itens. Obtém-se esta medida perguntando aos sujeitos
::aI é a sua posição face a um certo número de indicadores que, todos juntos,
3c:-:- empara avaliar o conceito. De um modo semelhante, existem quatro in-
~.:adores, quer para
rotina
quer para
autonom
Poder-se-ia testar uma hipó
t::se com cada um dos indicadores. Contudo, se usarmos os dados do Ques
::;:mário do Trabalho para examinar uma hipótese relacionada com a variável
satis e a variável
autonom
uma vez que cada uma delas tem quatro indica
ores - precisaríamos de dezasseis testes diferentes. A maneira de analisar
~-:as medidas constituídas por múltiplos itens é agregar a resposta de cada
:::divíduo a cada questão e tratar a medida total como uma escala em relação
=
qual cada unidade de análise tem um valor. No caso das variáveis satis,
au-
:onom e rotina
é usada uma escala de Likert o que constitui uma abordagem
~ 1abitualquando se trata de criar medidas compostas com base em múltiplos
:ens. Na escala de Likert, apresentam-se aos indivíduos um certo número de
2...c 1nnaçÕesue parecem relacionar-se com um tema comum; em seguida, eles
: ldicamo seu grau de acordo ou desacordo numa escala de cinco ou de sete
?Ontos. A resposta a cada uma das questões que compõem a escala (ou seja, a
.:.adaitem) é quantificada, podendo ir, por exemplo, de 1 para Desacordo To
:al até 5 para Acordo Total se a escala escolhida for de cinco pontos. Os resul
:ados individuais são somados para formar um valor total para cada sujeito .
.-\S escalas com múltiplos itens podem ser muito longas; as quatro questões
referentes a satis foram retiradas de uma escala criada por Brayfield e Rothe
1951) que compreende dezoito questões.
Estas escalas de itens múltiplos são populares por várias razões. Em pri
meiro lugar, é mais provável que se consiga captar a totalidade de um concei
to abrangente como a satisfação no trabalho através de vários itens do que a
partir de uma única pergunta. Em segundo lugar, estas escalas permitem de
linear diferenças mais precisas entre sujeitos. A medida
satis
compreende
quatro questões que podem tomar valores de 1a 5, de forma que os valores to
tais para cada inquirido podem variar entre 4 e
2
Se só se fizesse uma per
gunta a cada um, a variação seria entre 1e 5 - um intervaloJle~ariação possí
el muito mais restrito. Em terceiro lugar~--um--sujeífÔ não compreender
bem alguma questão e se essa pergunta for a única a que ele tem que respon
der, então ele será mal classificado; se se utilizarem várias perguntas, a falta
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 85/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
anifestam. Quando se conduz uma
nálise univ ri d
pretende conhecer-se
forma como os indivíduos se distribuem em relação a uma só variável.
ssim, por exemplo, podemos querer saber quantos casos podem ser encon
ados em cada uma das categorias ou níveis da medida em análise, ou pode
os querer saber qual é a resposta média. Na
nálise biv ri d
o nosso interes
centra-se nas conexões entre duas variáveis ao mesmo tempo. Dessa for
a, por exemplo, podemos pretender saber se as alterações na variável
satis
tão associadas às alterações de uma outra variável como a
autonom
ou se
s homens e as mulheres diferem em relação a essa variável. Em qualquer dos
sos, o foco de interesse é a variação.
ipos de variáveis
m dos mais importantes factores da compreensão das operações estatísticas
a capacidade de avaliar se é possível aplicar determinados testes. Para esta
aliação, é importante a aptidão para reconhecer as diferentes formas que as
ariáveis tomam, porque os diversos testes estatísticos só são aplicáveis a cer
s tipos de variáveis. Este ponto será retomado mais à frente, em capítulos
A maioria dos autores de livros de estatística segue uma distinção cria
a por Stevens (1946) entre níveis de medida ou escalas nominais, ordinais e
e intervalo / proporcionais. A primeira, a escala
nomin l
(também designada
ategorial), conduz à classificação do indivíduo em relação a um conceito. No
uestionário do Trabalho, a variável
gpracial
que classifica os inquiridos
uma de cinco categorias - branco, asiático, indiano, africano ou outro - é
m exemplo de uma variável nominal. Os indivíduos podem ser colocado~
uma categoria, mas a medida não permite mais do que isso; enquanto forma
e medida não há mesmo muito mais a dizer sobre esta escala. Por exemplo
ão podemos sequer utilizá-la para ordenar as categorias de alguma forma
Esta impossibilidade contrasta com as possibilidades oferecidas pela:
iáveis ordin is
que permitem que os indivíduos sejam categorizados ma:
mbém permitem que essas categorias possam ser ordenadas em termos d
ais ou menos face ao conceito abordado. No Questionário do Trabalh
variáveis
especial produtiv e qualid
são ordinais. Se considerarmos a pr:
eira das três, i.e., a variável
especial
podemos verificar que as pessoas n~
e limitam a ser categorizadas numa de quatro categorias - muito especial:
ado, bastante especializado, semi-especializado, não especializado - já q
possível dizer que alguém que é classificado como bastante especializado
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 86/128
OS CONCEITOS E A SUA MEDIÇÃO
Quadro 4 Tipo de variáveis
Tipos Descrição
Nominal Classificação de objectos (pessoas, firmas, nações, etc)
em categorias descontínuas.
Ordinal As categorias associadas à varivel podem ser ordenadas.
Os objectos podem ser ordenados do maior para o menor.
Intervalo (a) Nas verdadeiras variáveis de intervalo, as categorias
associadas à variável podem ser ordenadas, como no caso
das variáveis ordinais, mas as distâncias entre categorias
são iguais.
intervalo (b) São variáveis que, em rigor, são ordinais mas que incluem
um grande número de categorias como
é
o caso das medidas
de múltiplos items em questionários. Assume-se que estas
variáveis têm propriedades similares às verdadeiras variáveis
de intervalo.
Jicotómicas São variáveis que têm apenas duas categorias.
onte: Lazarsfeld (1958); Hall (1968); Snizek (1972).
67
Exemplo nos dados
do Quest. do
Trabalho
gpracial
Envolv
especial
produtiv
qualid
Rendim
idade
anos
absent
Satis
rotina
autonom
Sexo
reuniao
A variável
é
ordinal ~.----
A variável é de intervalo/rácio ••----
Mais do que duas categorias?
A riá l dlootóml . Não~
r
s distâncias entre
s m~r ?
A 1. d .
categonas po em
~m~r?
variável é nominal
Não
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 87/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
pesar de podermos ordenar as categorias que constituem a variável espe-
continuamos a estar limitados em relação àquilo que podemos dizer so
e elas. Assim, por exemplo, não podemos dizer que a diferença entre ser
uito especializado e bastante especializado é igual à que separa a categoria
stante especializado e semi-especializado. Tudo o que nos é possível dizer
que aqueles que forem considerados muito especializados têm uma especi
ização maior do que aqueles que foram classificados como bastante especi
izados e que estes, por sua vez, são mais especializados que os semi-especi
izados e assim por diante. Além disso, embora codifiquemos os semi-espe
alizados com o algarismo 2 e os muito especializados com um 4, não pode
os dizer que as pessoas classificadas como muito especializadas tenham o
obro da especialização das semi-especializadas. Por outras palavras, deve
r-se o cuidado de não atribuir uma qualidade aritmética - que o uso de nú
eros parece implicar - aos números usados para a codificação das categori
de uma escala ordinal.
Com as variáveis de intervalo proporcionais podemos dizer muito mais
relação às suas qualidades aritméticas. De facto, esta categoria compreen
e dois tipos de variáveis - as de intervalo e as proporcionais. Ambos os ti
os se caracterizam por apresentarem iguais diferenças entre categorias
or exemplo, alguém com 20 anos tem mais um ano do que alguém que tem
9 e alguém que tem 50 anos é mais velho um ano do que quem tem 49. Em
ada caso, a diferença entre as categorias é idêntica - um ano. Uma escala é
esignada como escala de intervalo quando os intervalos entre as categorias
ão iguais. As medidas proporcionais, além disso, têm um ponto fixo que
onstitui o zero. Assim, as variáveis
id de bsent e rendim
têm pontos nulos
gicos. Esta característica significa que se pode dizer que alguém que tem 40
nos tem o dobro da idade de quem tem 20 anos. Do mesmo modo, alguém
ue faltou seis vezes no ano ao trabalho faltou três vezes mais do que uma
essoa que só deu duas faltas. Contudo, é habitual que os autores não estabe
çam a distinção entre escalas de intervalo e escalas proporcionais porque,
as ciências sociais, as verdadeiras variáveis de intervalo são, com frequên
ia, também variáveis proporcionais é o caso, por exemplo, do rendimento e
a idade . Neste livro, o termo variável de intervalo será, por vezes, empregue
ara considerar também as variáveis proporcionais.
As variáveis de intervalo/proporcionais correspondem, reconhecida
ente, ao mais elevado nível de medida porque permitem muito mais opera
ões do que os outros dois tipos de variáveis, existindo um leque mais vasto
e testes estatísticos que se lhes aplicam.
importante notar que quando uma
ariável de intervalo/proporcional, como a idade, é agrupada em categorias
como 20-29, 30-39, 40-49,50-59, etc. - torna-se uma variável ordinal. De
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 88/128
OS CONCEITOS E A SUA MEDIÇÃO
pontos em que as pessoas se localizam dentro desses grupos. Por outro
.:.ado,estes agrupamentos de indivíduos são, por vezes, úteis para a apresen
:ação e fácil assimilação da informação. Deve notar-se ainda que a posição
das variáveis di otómi s face a estas três categorias de variáveis é algo ambí
gua. Nestas variáveis há, apenas, duas categorias, como, por exemplo, ho
:: leme mulher para a variável sexo. Habitualmente, pensa-se numa variável
iicotómica como uma variável nominal, mas por vezes ela pode ser conside
:-ada ordinal. Quando, por exemplo, existe uma ordem inerente a essas cate
50rias parecem estar presentes as características inerentes a uma variável or
iinal, como no caso das categorias passar e falhar .
Rigorosamente falando, medidas como satis, autonom e rotina, que de
::\'am de escalas de itens múltiplos, são variáveis ordinais. Assim, por exem
?lo, não sabemos se a diferença entre um valor de
na escala satis e um valor
'::e18é a mesma diferença que existe entre 10 e 8. Isto coloca um problema aos
::n'estigadores, uma vez que a impossibilidade de tratar estas variáveis como
scndo de intervalo, implica que determinados métodos de análise como a
:orrelação e a regressão (ver Capítulo 8), que são métodos conhecidos e
:0rangentes, não possam ser utilizados para avaliar as suas relações por se
:-emapenas aplicáveis a variáveis de intervalo. Por outro lado, muitas das me
.::idas de itens múltiplos criadas pelos investigadores são tratadas por eles
:0mo se fossem variáveis de intervalo, porque essas medidas permitem que
x considere um vasto número de categorias. Quando uma variável compre
:?:1deapenas um pequeno número de categorias ordenadas, como no caso de
envolv, produtiv, especial e qualid no Questionário do Trabalho, em que
:ada uma compreende apenas quatro ou cinco categorias, seria pouco razoá
o'el,aos olhos da maior parte dos analistas, tratá-las como se fossem variáveis
:'e intervalo. Quando o número de categorias é consideravelmente maior,
:omo no caso das variáveis satis, autonom e rotina, em que cada uma pode
:;)rresponder a dezasseis categorias de 5 até
20,
é mais aceitável tratá-las
:;)mo variáveis de intervalo.
Parece haver um certo movimento na direcção deste procedimento mais
~ral em relação às escalas de múltiplos itens, tratando-as como se possuís
xm as características das variáveis de intervalo. No entanto, muitos puristas
::msiderariam esta posição incorrecta. Além disso, não parece haver uma re
~a precisa que permita ao analista decidir se a variável é ordinal ou é de in
'::,:yalo. Contudo, ao longo deste livro, vamos ao encontro da prática corrente
::':rataremos as medidas baseadas em múltiplos itens como é o caso de satis,
tonom e rotina como se fossem escalas de intervalo. Labovitz
(1970)
ainda
:ti
mais longe ao sugerir que quase todas as variáveis ordinais podem e de
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 89/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 90/128
01 11 ••• 1 101I11 nl
Especificação doelecção deormação de
•
ndicadores
•
scalas ou
Associação
stou presente, com
•
scala I
Jf
profissional como
•
egularidade, nas reuniões
referência
profissionais
Penso que a minha profissão,
•
scala 11
•
ais do que qualquer outra,
•
ssencial para a sociedade
Crença na
s meus colegas da mesma
•
scala 111 •
uto-regulação
•
rofissão julgam de forma
•
dequada a competência uns
outros
•
s pessoas desta profissão Escala IV
entem um verdadeiro
•
•
hamamento para a exercer
•
o meu trabalho, tomo as
•
scala V
inhas próprias decisões
m relação ao que vou
dez indicadores por
ensão - um indicador
o exemplo de cada
ra 4 2
Conceitos, dimensões e medidas
s: Lazarsfeld 1958 ; Hall 1968 ; Snizek 1972 .
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 91/128
72
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
odo a que se verifique se inclui diferentes aspectos ou dimensões. A pa
em por este estádio permite reconhecer a complexidade do conceito.
ropõe cinco dimensões do profissionalismo:
O
uso da associação profissional
como uma referência fundamental.
significa que, para o profissional no contexto do seu trabalho, a asse
ção profissional e os colegas da mesma profissão são uma fonte pri
paI de ideias e opiniões.
Acreditar que se está a servir o público. De acordo com este aspecto, a
fissão é vista como indispensável à sociedade.
creditar que existe uma auto-regulação.
Esta noção implica que o trab
de um profissional pode e deve ser julgado apenas por outros meml
da profissão porque só eles têm a qualificação necessária para er
avaliações adequadas.
A sensação de ter vocação para essa função.
O profissional é alguém qt
dedica ao seu trabalho e que, provavelmente, quereria ter essa profi
mesmo que as recompensas materiais fossem menores.
Esta dimensão final indica que o profissional tem que se
paz de tomar decisões e fazer julgamentos sem pressões quer dos c
tes, quer das organizações onde trabalha, quer ainda de pessoas d
tras profissões.
estádio de especificação do conceito não só é útil para se reflectir e apr
er a complexidade dos conceitos, mas também como forma de fazer a p
ntre a formulação geral do conceito e a sua medição, uma vez que o estal
imento de dimensões reduz o grau de abstracção dos conceitos.
O estádio seguinte é o da
selecção de indicadores
em que o investiga
rocura indicadores para cada uma das dimensões. No caso de Hall, f
eleccionados dez indicadores para cada dimensão. Cada indicador foi
retizado numa afirmação que os inquiridos teriam que classificar -
uito correcta, correcta, pouco correcta ou muito pouco correcta - de ao
om a forma como achavam que descrevia o seu comportamento e os
entimentos enquanto membros da sua profissão. Há também uma cate
eutra. A figura 4.2 apresenta as cinco dimensões do profissionalisml
ara cada dimensão, um dos seus dez indicadores. Por fim, Lazarsfeld af
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 92/128
OS CONCEITOS E A SUA MEDIÇÃO
diferentes perfis em relação a essas dimensões - nalgumas, pode ter-se um
esultado elevado nas dimensões 2, 3 e 5,moderado na
e baixo na 4, enquan
o noutras profissões podem aparecer outras combinações.
Para verificar se os indicadores se agrupam da forma proposta pela de
finição
a priari
das dimensões, utiliza-se com frequência a
análise factarial
uma
técnica que será examinada no capítulo A análise factorial permite ao in
estigador verificar se, por exemplo, os dez indicadores criados para avaliar a
autonomia estão, de facto, relacionados uns com os outros e não com os in
dicadores que foram escolhidos para medir outras dimensões. Pode desco
rir-se que um indicador que é suposto medir a autonomia pareça estar asso
ciado com muitos dos indicadores de crença no serviço ao público , enquan
to um ou dois dos indicadores desta última dimensão apareçam relacionados
com os que deveriam corresponder à dimensão crença na auto-regulação , e
assim por diante. De facto, quando se fez uma análise factorial em relação à
escala de profissionalismo de Hall, verificou-se que a correspondência entre
as cinco dimensões e os seus supostos indicadores era fraca (Snizek, 1972;
Bryman, 1985). Contudo, o aspecto fundamental a reter sobre este assunto é
que a especificação de dimensões para os conceitos é, frequentemente, um
passo importante para a formulação de uma definição operacional.
Em psicologia e em sociologia há algumas medidas que são construídas
com pouca (se existe alguma) atenção à questão das dimensões dos conceitos.
Assim, por exemplo, a medida da satisfação no trabalho constituída por de
zoito itens e desenvolvida por Brayfield e Rothe (1951) - que já foi referida
: tãoespecifica dimensões, embora seja possível aplicar a análise factorial para
::eterminar as suas dimensões de facto. O objectivo fulcral desta secção é sa
: :entar que a procura de dimensões pode dar um importante auxílio na com
?reensão da natureza dos conceitos, e que quando elas são identificadas
- Jriari podem constituir um passo significativo no caminho a percorrer des
: e a complexidade e abstracção do conceito até às formas como ele pode ser
=:edido.
lid de e fidelid de d s medid s
-.ceita-se, em geral, que quando um conceito foi definido operacionalmente,
-:::1.dosido proposta uma forma de o medir, o instrumento usado para essa
==dição deve ser fiel e válido.
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 93/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
interna. A fidelidade externa é a noção que se usa mais vulgarmente e refe
re-se ao grau de consistência de uma medida ao longo do tempo. Se tivermos
uma balança de cozinha que registe pesos diferentes cada vez que se pesa o
mesmo saco de açúcar temos uma medida do peso que não tem fidelidade ex
terna, já que o valor obtido flutua ao longo do tempo quando não deviam sur
gir diferenças de acordo com o momento em que o saco é pesado. Da mesma
forma, se aplicarmos um teste de personalidade a um grupo de pessoas, pas
sarmos o mesmo teste às mesmas pessoas pouco tempo depois e houver uma
fraca correspondência entre os valores obtidos nos dois momentos de aplica
ção, provavelmente teremos que considerar que o teste não tem fidelidade ex
terna porque as medidas que proporciona parecem flutuar. Quando avalia
mos a fidelidade externa desta forma, ou seja, administrando o mesmo teste
em duas ocasiões distintas ao mesmo grupo de sujeitos, estamos a avaliar a
-
delidade teste-reteste. Poderíamos prever que as pessoas que, na primeira apli
cação, tivessem valores elevados os teriam, também, na segunda; por outras
palavras, esperamos que a posição relativa do resultado de cada pessoa se
mantenha relativamente constante. O problema de usar este procedimento
consiste na impossibilidade de sabermos se os acontecimentos que medeiam
as duas aplicações podem justificar, pelo menos em parte, a discrepância en
tre os dois conjuntos de resultados. Assim, por exemplo, se a satisfação no tra
balho de um grupo de pessoas for avaliada agora e voltar a ser testada daí a
três meses pode verificar-se que, de um modo geral, os inquiridos tenham
manifestado níveis mais elevados de satisfação na segunda do que da primei
ra vez. Pode acontecer que, no período de intervalo entre as duas avaliações
eles tenham recebido um aumento ou que tenha havido uma alteração na or
ganização do trabalho ou até que, no momento da primeira avaliação, tives
havido algum motivo de descontentamento que entretanto teria sido resolvi
do. Além disso, se o teste e o reteste forem muito próximos no tempo, os sujei
tos podem reproduzir as respostas que tinham dado antes havendo, assim
uma consistência entre os dois testes que é, apenas, aparente. Contudo, a fide
lidade teste-reteste é um dos principais meios de avaliar a fidelidade externa
A fidelidade interna é particularmente importante em relação às escal~
de múltiplos itens. Levanta a questão de se saber se cada escala está a med1:
uma única ideia e se os itens que constituem a escala têm consistência intelTh:.
Existem vários procedimentos para avaliar a fidelidade interna e dois dele
podem ser conduzidos a partir do SPSS. Em primeiro lugar, a avaliação da Í
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 94/128
OS CONCEITOS E A SUA MEDIÇÃO
da mesma maneira que o coeficiente de correlação de Pearson ver o Capítulo
8), na medida em que varia de
O
a 1; quanto mais perto estiver de 1 - ideal
mente, sendo maior ou igual a 0.8 - maior fidelidade interna tem a escala.
Em segundo lugar, o vulgarmente usado
alfa de Cronbach alpha
traduz, es
sencialmente, a média de todos os coeficientes de bi-partição possíveis. Mais
uma vez, a regra básica é que se deve situar entre 0.8 e 1. Esta regra é, também,
usada em relação à fidelidade teste-reteste. Quando um conceito e a sua me
dida compreendem várias dimensões, é habitual calcularem-se os coeficien
tes de fidelidade para cada uma das dimensões subjacentes em vez de calcu
lar um só para a medida no seu todo. De facto, se uma análise factorial confir
ma que existe um certo número de dimensões, a fidelidade interna da escala,
se for considerada na totalidade, terá provavelmente um valor baixo, já que
os coeficientes de bi-partição serão certamente reduzidos.
Os valores alfa ou o coeficiente de bi-partição podem ser, facilmente,
calculados com o SPSS. necessário assegurarmo-nos de que todos os itens
estão codificados na mesma direcção. Assim, no caso da variável satis é preci
so verificar se os itens que estão na forma inversa como o satis2 e o satis4) fo
~amrecodificados utilizando Recode) de modo a que o acordo com a frase in
iique falta de satisfação no trabalho. Estes dois itens já foram recodificados
?ara rsatis2 e rsatis4, e serão utilizados no exemplo seguinte. Para calcular o
:este de fidelidade dos 4 itens que constituem o valor satis, teríamos que reali
2ar este procedimento:
~ Analyze ~ Scale ~ Reliability Analysis ... [abre a caixa de diálogo
Reliability Analysis apresentada na caixa 4.1]
~ Seleccionar satisl, rsatis2, satis3 e rsatis4 enquanto se pressiona a te
cla ctrl [as quatro variáveis devem ficar selecciona das no écran] ~ ~ [bo
tão] [coloca satisl, rsatis2, satis3 e rsatis4 na caixa Items:] ~ Model ~
Alpha no menu drop-down.
~OK
:.::desejarmos determinar a fidelidade através de um coeficiente de bi-parti
~o Spli-half), devemos seleccionar esta opção no menu Model, em vez de
~..ipha.O resultado do cálculo do coeficiente alpha quadro 4.2) sugere que a
:.riável satis é internamente fiável, na medida em que o coeficiente determi
ado é de 0,76. Este valor está pouco abaixo do critério de 0,8, e pode ser consi
-~ado como garante da fidelidade desta variável. Se uma escala çlemonstrar
-:.a
fidelidade interna reduzida, a estratégia a adoptar para esta eventuali-
- - .:iepode passar por retirar um ou mais itens que constituem esta escala e
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 95/128
76
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
: Reliability Analysis EJ
o@> especial
o@>
produtiv
o@> qualid
o@> absent
~satis
o@> ethnigpc
Items:
- o@> sa;is1
o@>
satis3
o@> rsatis2
aixa 4.1 A caixa de diálogo Reliability Analysis
uadro 4.2 O ouput da análise de fidelidade da variável satis Questionário do Trabalho
E L I A B I L I T Y A N A L Y S I S - S C A L E A L P H A
Reliability Caefficients
N af Cases; 68.0 N af Items ; 4
Alpha; .7618
delidade alpha à medida que se vão retirando itens. Como se pode verificar
do este procedimento revela-se desnecessário para a variável satis.
Para além da fidelidade interna e externa é importante mencionar ou
os dois aspectos ligados à fidelidade. Em primeiro lugar quando o material
stá a ser codificado por temas deve testar-se a fidelidade do esquema de co
ificação. Isto pode ocorrer quando o investigador com o intuito de encon
ar temas gerais subjacentes às respostas necessita de codificar as respostas
as pessoas às perguntas de uma entrevista que não chegaram a ser pré-codi
cadas ou quando conduz uma análise de conteúdo de anúncios de jornais
ara estudar a forma como os tópicos das notícias tendem a ser abordados.
m qualquer dos casos deve utilizar-se mais do que um codificador e calcu
afidelidade inter juizes para garantir que o esquema de codificação está
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 96/128
os
CONCEITOS E A SUA MEDIÇÃO
ei bilily
Analysis: Slalislics I I
Continue
Etesl
_~ Friedman chi·s,guare
Cochran chi square
Inter·lle
CorreJations
O.Covarianc~s
HOlellin,g s T-square
In r aclass correlalion coefficienl
escriplives for
lem
.s.cale
~~i~O .(.(í~i.n.:.ª.~i~.í~
-Slnmaries
Means
yariances
CQvariances
Co relations
:.aixa 4.2
A subcaixa de diálogo Reliability Analysis: Statistics
_ 1ter-observações e inter-codificadores, podem utilizar-se métodos de análi
5<? bivariada (ver Capítulo 8). Pode encontrar-se uma discussão de alguns mé
:odos concebidos especificamente para a avaliação destes dois tipos de fideli
i de na obra de Cramer
(1998).
lid de
_-\validade refere-se à avaliação do grau em que uma determinada medida
:::1ede,de facto, o que se pretende medir. Como é que podemos saber que uma
:::1edidade satisfação no trabalho mede mesmo a satisfação no trabalho e não
Jutro conceito qualquer? No mínimo, um investigador que crie uma nova
:::1edida deve garantir que ela tenha
v lid de f cí l
ou seja, que aparente
:::1entea medida reflicta o conteúdo do conceito em questão.
O investigador pode tentar calcular, ainda, a
v lid de concorrente
do con
.:eito. Neste caso, o investigador utiliza um critério que seja reconhecido
.:omo relevante para o conceito em causa e que diferencie as pessoas. Assim,
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 97/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
balho do que as que não estão satisfeitas. Se não se encontrar correspon
ncia, por exemplo, se os que não estão satisfeitos faltarem com a mesma fre
ência que os que estão satisfeitos, podemos ser tentados a interrogar
o-nos sobre se a nossa medida estava realmente a avaliar a satisfação no tra
lho. Outra forma de se avaliar a validade da nova medida é calcular a
vali-
de preditiva caso em que o investigador usa um critério relacionado com o
turo e não com o presente como acontecia na validade concorrente. No caso
validade preditiva, o investigador examinaria a validade da satisfação no
abalho com base no critério de níveis futuros de absentismo.
Alguns autores defendem que o investigador também deve calcular a
lidade de constructo de uma medida Cronbach e Meehl, 1955 . Aqui, o inves
gador é encorajado a deduzir hipóteses que decorram de uma teoria rele
nte para o conceito. A partir das suas noções sobre o impacto da tecnologia
a experiência do trabalho por exemplo, Blauner, 1964 , o investigador pode
tecipar que as pessoas que estão satisfeitas com os seus trabalhos são me
os frequentemente aquelas que têm funções rotineiras; e que aquelas que
ão estão satisfeitos são, com mais frequência, os que têm trabalhos rotinei
s. De acordo com isso, podemos investigar essa dedução teórica examinan
o a relação entre satisfação no trabalho e rotina da função. Por outro lado, é
ecessário ter algum cuidado quando se interpreta a ausência de uma relação
tre a satisfação no trabalho e a rotina da função. Em primeiro lugar, a teoria,
u a dedução que é feita a partir dela, pode não ser correcta. Em segundo lu
ar, a medida criada para a rotina da função pode ser uma forma inválida de
valiar o conceito.
Todas as abordagens da investigação sobre a validade que foram discu
das até agora são procedimentos para avaliar aquilo que Campbell e Fiske
959 designam como validade convergente Em qualquer dos casos, o investi
ador preocupa-se em demonstrar que a medida se harmoniza com outra me
ida. Campbell e Fiske argumentam que este processo, em geral, não vai sufi
ientemente longe, uma vez que o investigador deveria usar diferentes medi
as do mesmo conceito para ver o grau em que existe convergência. Assim,
or exemplo, além de usar uma medida baseada num questionário sobre a ro
na da função, o investigador poderia utilizar observadores que classificas
em as características das funções para distinguir entre os graus de rotina das
unções existentes numa empresa por exemplo, Jenkins
et aI
1975 .A valida
e convergente poderia levar à demonstração de que existe uma convergên
ia entre as duas medidas, embora seja difícil interpretar uma falta de conver
ência já que qualquer das duas medidas pode ser inadequada. Muitos exem
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 98/128
OS CONCEITOS E A SUA MEDIÇÃO
quando sugeriram que se deve ainda demonstrar que uma medida tem
v li-
i de discrimin nte Ainvestigação sobre a validade discriminante implica que
:ambém se deve procurar b ixos níveis de correspondência entre uma medida
e outras medidas que se supõe corresponderem a outros conceitos. Embora a
validade discriminante seja uma importante faceta da validade de uma medi
da, é provavelmente mais importante que o estudante se centre nos diferentes
aspectos, já discutidos, da validade convergente. Para investigar os vários ti
?OS de validade convergente e de validade discriminante, podem utilizar-se
as técnicas abordadas no Capítulo 8 que se centram nas relações entre pares
de variáveis.
Exercícios
1 Qual das afirmações está correcta? Uma escala de Likert é:
a um teste de validade;
b um procedimento que dá origem a medidas de itens múltiplos;
c um teste de fidelidade;
d um método para identificar as dimensões dos conceitos
Por que razão é útil considerar a hipótese de que um conceito compre
ende várias dimensões quando se pretende operacionalizá-Io?
3 Considere as seguintes questões utilizadas num questionário acerca de
hábitos de consumo de bebidas alcoólicas. Decida se cada uma das va
riáveis é nominat ordinat intervalar / proporcional ou dicotómica:
a Alguma vez consumiu bebidas alcoólicas?
Sim__
Não __ siga para a pergunta 5
b Se respondeu sim na questão anterior, qual das seguintes bebidas
alcoólicas consumiu mais frequentemente escolha uma só categoria ?
Cerveja __
Bebidas Brancas __
Vinho __
Licores __
Outras __
c Com que frequência consome bebidas alcoólicas? Assinale
a resposta que mais se aproxima do seu comportamento habitual
Diariamente __
A maior parte dos dias __
Uma ou duas vezes por semana __
Uma ou duas vezes por mês__
Algumas vezes por ano__
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 99/128
ANÁLISE DE DADOS EM CIÊNCIAS 50
Assumimos que o entrevistador pode ajudar os respond
a traduzir aquilo que consomem em unidades de álcool)
Número de unidades __
No Questionário do Trabalho, a variável absent é nominal,
intervalo ou dicotómica?
A fidelidade teste-reteste é um teste da fidelidade interna ou
Que procedimento do SPSSse deveria usar para que o ut ut
sente o alfa de Cronbach para
utonom
O que fez para a pergunta 6 seria um teste da fidelidade
ÍJ
externa?
Um investigador cria uma nova medida de múltiplos itens pa
servadorismo político . Administra amedida a uma amostra
duos e pergunta-lhes, também, como votaram nas últimas el
rais, para validar a sua medida. O investigador relaciona as
dos sujeitos com o seu voto. O que está ele a avaliar? a) a vali
corrente da medida, b) a validade preditiva da medida ou c)
é
discriminante da medida?
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 100/128
Capítulo 5
RESUMIR OS OS
Quando os investigadores são confrontados com um conjunto de dados refe
~entes a cada uma das múltiplas variáveis usadas, necessitam de reduzir a in
:vrmação que recolheram. Se pudermos reduzir grandes quantidades de da
.:10S, torna-se possível detectar padrões e tendências que, de outra forma, fica
:-iamocultos.
É
bastante simples determinar o padrão de uma variável quan
io
temos, por exemplo, dados sobre dez casos. Contudo, se formos além dos
--inte casos começa a tornar-se difícil discriminar esses padrões, a menos que
- 5
dados sejam sintetizados de alguma forma. Além disso, quando queremos
~presentar os dados que recolhemos a outras pessoas, temos que ter consciên
=a de que seria extremamente difícil aos nossos leitores reter a informação re
:e ante. Este capítulo centra-se nos vários procedimentos que se podem utili
::ar para resumir uma variável.
istribuições de frequência
~aginemos que dispomos de dados relativos a cinquenta e seis sujeitos que
: i.dicama que faculdade, de uma determinada Universidade, cada um deles
?-ertence(ver quadro 5.1). A Universidade tem apenas quatro faculdades:
:: lgenharia, Ciências Puras, Arte e Ciências Sociais. Apesar de cinquenta e
~is ser um pequeno número de sujeitos, não é muito fácil ver como esses es
-..:.dantesse distribuem pelas diferentes faculdades. Um p~il~~iro passo que
?0de ser considerado quando se reduzem dados referentes a uma variável
: .)minal como esta (uma vez que cada faculdade corresponde a uma catego
: 2 discreta) é a construção de uma
distribuição de frequências
ou de uma
tabela
.=. Tequências. Uma distribuição de frequências mostra-nos quantos casos ca
: :m em cada categoria. Por frequência entende-se simplesmente o número
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 101/128
82
ANÁLISE DE DADOS EM CIÊNCIAS -
aculdades a que pertencem cinquenta e seis alunos Dados Fictícios
Caso nO
Faculdade
aso nO
a~u.~_rte9
ng
CP
S
CS
P
Eng
2S
Eng
3
rte
CS4
S Arte5
ng
CP6
P
Eng
7
ng
CS8S CS9
rte
CP S
Eng
ng
Arte2
P
Eng
3S CP
4P CS
5
ng
Eng
6
rte
CP7
ng
Arte8P
Eng
9
ng
Eng
rte
CP
S Arte2
ng
Eng
3
rte
CP
4
ng
Arte5S CP
6
S
uma das frequências, i.e,
frequênci rel tiv
O quadro 5.2 mostra-nos :._
número 11 é a frequência com que aparece a categoria Arte, o que sig::
que há onze alunos da amostra que estudam Arte e que esse número c
ponde a 20 por cento do número total de alunos.
O procedimento que permite criar uma distribuição de frequências :
o SPSS será explicado posteriormente, mas entretanto deve ficar compre:;
do que para construir uma tabela de frequências tem apenas que se cor,~
número de casos que cabem dentro de cada categoria. Habitualmente, é .:
também a percentagem que corresponde a cada categoria. Isto fornece-nc-;:
formação sobre a
frequênci rel tiv
da ocorrência de cada categoria nwr_=
riável, o que nos dá uma boa indicação da preponderância relativa COIr.
uma categoria surge numa amostra. O quadro 5.2 mostra-nos a distrib
de frequências dos dados apresentados em 5.1. As percentagens foram
I
dondadas, por defeito ou por excesso, até ao número inteiro correspon .
usando a regra de que 0.5 ou mais corresponde ao número inteiro segui:
que para valores abaixo de 0.5 o número é arredondado por defeito :
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 102/128
RESUMIR OS DADOS
Quadro 5 2 Tabela de frequência referente aos dados apresenados no quadro 5 1
n
ercentagem
8
2
3
3 4
5
56
aJ
18
16
14
12
n 10
8
6
4
2
o Engenharia Ciências Puras Artes Ciências Sociais
83
Figura 5 1
Gráfico de barras referente à distribuição dos estudantes por faculdades
tornar mais fácil a leitura do quadro. A letra
n
é, muitas vezes, utilizada para
referir o número de casos de cada categoria ou seja, a frequência . Uma forma
alternativa de apresentar uma distribuição de frequências referente aos da
dos apresentados em 5.2 consistiria em omitir as frequências de cada catego
ria e apresentar, apenas, as percentagens relativas. Esta abordagem reduz a
quantidade de informação que o utilizador tem de reter. Quando se faz essa
opção,
é
necessário indicar o número total de casos Le, n= 6 por baixo da co
luna das percentagens.
O quadro 5.2 pode ser facilmente adaptado a uma apresentação diagra
mática dos dados. Estes diagramas são, em geral, designados por gráficos de
barras bar chart ou bar diagrams e são frequentemente escolhidos em detri
mento dos quadros por serem de assimilação mais fácil. Um gráfico de barras
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 103/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
ategoria. Não é preciso organizá-las por qualquer tipo de ordem por exem
lo, das maiores para as mais pequenas ou vice-versa . As barras não devem
icar encostadas umas às outras, sendo preferível mantê-las nitidamente se
necessário salientar que o gráfico de barras não fornece mais infor
ação do que o quadro 5.2; de facto, até se perde alguma informação - as
ercentagens. A vantagem principal deste tipo de representação é a facilida
e com que pode ser interpretada, característica que pode ser particularmen
útil quando a apresentação dos dados se dirige a indivíduos pouco familia
izados com material estatístico.
Quando é uma variável intervalar que se pretende apresentar numa ta
ela de frequências, os dados têm que ser agrupados. Deve calcular-se o nú
ero de casos que cabem em cada intervalo. Como exemplo, podemos anali
ar os dados respeitantes à variável r n im do Questionário do Trabalho.
ispomos de dados de sessenta e oito indivíduos faltam os dados de dois ,
as se não agruparmos os dados ficamos com trinta e três categorias de ren
imentos, o que é excessivo para permitir construir uma tabela de frequên
ias. Além disso, as frequências de cada categoria acabariam por ser demasia
o pequenas. No quadro 5.3, apresenta-se a distribuição de frequências dos
alores que a variável r n im assume. Foram utilizadas seis categorias. Na
onstrução destas categorias deve ter-se em conta um certo número de princí
ios. Em primeiro lugar, há autores que sugerem que o número de categorias
onsideradas se deve situar entre seis e vinte, uma vez que um número de
lasses demasiado grande ou demasiado pequeno pode distorcer a forma da
istribuição da variável em análise ver, por exemplo, Bohrnstedt e Knoke,
982 . Contudo, não é necessariamente verdade que o número de categorias
fecte a forma da distribuição. Além disso, quando os casos são poucos o nú
ero de categorias tem que ser inferior a seis, para que em cada categoria cai
a um número razoável de sujeitos. Por outro lado, um grande número de ca
gorias não tornará fácil a assimilação dos dados e, neste aspecto, a regra
rática de Bohrnstedt e Knoke, ao considerar que as categorias podem ser
inte, é um pouco exagerada. Em segundo lugar, as categorias devem ser dis
retas. Nunca se deve agrupar os dados de modo a ter categorias como estas
2.000 ou menos, 12.000-14.000, 14.000-16.000, e assim por diante. Em que ca
goria se incluiria o valor 12.000 ou 14.000 libras? Isto significa que as catego
ias devem ser discretas, como no quadro 5.3, de modo a que não haja qual
uer dúvida em relação ao grupo a que corresponde cada caso. Repare-se que
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 104/128
RESUMIR OS DADOS
85
Quadro 5 3 Distribuição de frequências para os valores de rendim dados do Questionário do
Trabalho
Libras
até 12,000
12,000-13,999
14,000-15,999
16,000-17,999
18,000-19,999
20,000 e mais
Total
Nota: faltam dois casos.
30
20
10
C
::l
o
o O
n
1
16
7
2
68
Percentagem
1,5
23,5
29,4
32,4
10,3
2,9
100,0
/
Figura 5
até
\:12000 1:14000 \:15999 \:18000 1:19999
1:12000 \:13999 \:16000 \:17999 \:20000e mais
GPRENDIM
Histograma para os valores da variável rendim dados do Questionário do Trabalho
houver um grande número de casos omissos relativos a urna determinada
ariável.
A informação dada pelo quadro 5.3 pode com vantagem ser apresenta-
da na forma diagramática através de um
histograma histogram .
Um histogra-
:na é igual a um gráfico de barras excepto no facto de as barras estarem em
.:ontacto urnas com as outras; essa forma de representação pretende eviden-
;:iar a natureza contínua das categorias da variável em questão. A figura 5.2
3.presenta um histograma para os dados relativos à variável rendim As suas
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 105/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
grupar os valores que ela toma. Pode, simplesmente, contar-se o númerc
asos em cada uma das quatro categorias e calcular-se as percentagens cor
É possível utilizar-se um histograma para apresentar os dac
ma vez que as categorias da variável estão ordenadas.
Utilizar o para criar tabelas de frequências e histogramas
ara criar uma distribuição de frequências para a variável rendim do Q1
onário do Trabalho, vamos necessitar de agrupar os dados. Caso contriÍ
bteremos uma frequência e uma percentagem para cada valor da variá
bteremos, também, um gráfico onde cada barra corresponde a um valor
a variável o que, numa amostra de grande dimensão, tornaria este grá
legível. Para agrupar os dados da variável
rendim
vamos utilizar o proo
Reeode.
Assim, vamos criar uma nova variável designada
rendill
isto é, grupos de rendimento). O objectivo desta recodificação é o de agru
s sujeitos da nossa amostra em seis grupos de rendimento: até f 12,000, d
,000-13,999; das
f
14,000-15,999; das
f
16,000-17,999; das
f
18,000-19,95
0,000 e mais. O procedimento seguinte permite realizar esta recodificaç
7 Transform 7 Reeode 7 Into Different Variables ... [abre
a caixé
diálogo
Reeode into Different Variables
apresentada na caixa 5.1]
7 rendim
~ [botão] [transfere a variável
rendim
para a caixa
NU
rie Variable70utput Variable:] 7
caixa abaixo de
Output Vari
Name
escrever
gprendim 7 Change
[tranfere
gprendim
para a C
NumericVariable70utputVariable:] 7 OldanNewValues ...
[ab
subcaixa de diálogo
Reeode into Different Variables: Old and New
lues
apresentada na caixa 5.2]
7 Na caixa à direita de
Value
[na secção
Old Value]
inserir O7 seleC
nar
Value
na secção
New Value
e escrever 0.7 Seleccionar
Range:
west through
e escrever
11999
na caixa a seguir a
through 7
seleccio
Value
na secção
New Value
e escrever 1
7 Add
[onovo valor aparec
na caixa
Old 7 New:] 7
seleccionar
Range:
e escrever
12000,
bem c
13999
na caixa a seguir a
through 7
seleccionar
Value
na secção N
Value e escrever 27 Add 7 seleccionar Range: e escrever 14000,
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 106/128
RESUMIR OS DADOS
• Resode inlo DIHerenl Vallables EI
:t> gpraeial
~ se o
i>
idade
i>
anos
i>
envolv
~satis1
'~sa is2
i> satis3
.:11)
satis4
i>
autonom1
i>
autonom2
:'$)
autonom3
Numeric:- ariable·) OulpulVariable:
Caixa 5 A recodificação de rendim para rendimgp
•• nff~'I~:II ~IJ['i TTIi
-OldValue
r
Yalue:
r ~lem;riúSSing
r
Syslem- or J, ser·missing
r Ra.tJge:
L
r Range:
[i:l.~'l\f'tt~r(jYg·
lo Aall9 l:
120000 L tnrough highest
r
AliQlher alues
:aixa
5.2
A subcaixa de diálogo Recode into Different Variables: Old and New Values
Different Variables: Old and New Values]
~OKl
:)e seguida é necessário definir os rótulos de cada uma das seis categorias da
ariável rendimgp (ver capítulo 2 para uma descrição deste procedimento).
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 107/128
Variable{s}:
.-
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
aixa 5.3
A caixa de diálogo Frequencies
abela de frequências para rendimgp output o SPSS)
GPRENDIM
,
,
I
Cumulative
Percent
até E12000 1
,4 1,5
,5
16
2,9 23,55,0
20
8,6 29,44,4
22
1,4 32,46,8
7
0,0 10,37,1
2
,9 2,900,0
68
7,1 100,0
00
2
,9
7000.0
A sequência seguinte dá origem à tabela de frequencias apresenta
uadro 5.4.
~ Analyze ~ Descriptive Statistics ~ Frequences ... [abre a cai:
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 108/128
llSl.: VIIR OS DADOS
~==Slacked
SLnlI1lariesforgrbups of cases
SLnlI1lariesof se~arate yariables
Values of individual cases
~ ~a 5.4
A caixa de diálogo Bar Charts
:asas (Percent); a frequência associada com cada categoria na forma de uma
?€rcentagem que toma como base todos os casos de cujos dados dispomos
Valid Percent); e a percentagem acumulada (Cumulative Percent).
Para obtermos um histograma da variável rendimgp, devemos realizar
.)procedimento seguinte:
7 Graphs 7 Histogram ... [abre a caixa de diálogo Histogram]
7 rendimgp 7~ [botão] [coloca rendimgp na caixa Variable:] 7 OK
o histograma resultante apresentará barras de rendimento tal como defini-
das pelos critérios por defeito do SPSS.
Para produzir um gráfico de barras para uma variável nominal como
gpracial, podemos realizar o seguinte:
7 Graphs 7 Bar ... [abre a caixa de diálogo Bar Charts apresentada na
caixa 5.4]
7 Simple 7 Summaries for groups of cases 7 Define [abre a subcaixa
de diálogo Define Simple Bar: Summaries for Groups of Cases apre-
sentada na caixa 5.5]
7 gpradal 7 ~ [botão] próximo da caixa Category Axis [coloca gpra-
dal nesta caixa] 7 N of cases por baixo de Bar Represent [se esta opção
não estiver seleccionada, caso contrário proceder sem seleccionar] 7
OK
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 109/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
. Oeline S.mple Bar Summalles fOI GlOupS 01 Cases -
Ei
~ sexo
~rendim
fP idade
~anos
~envolv
· iP
salis1
~salis2
~salis3
i
salis4
~aulonom1
~aulonom2
utonom
~aulonom4
~rolina1
'?> rolina2
aixa 5.5
%of~e
Curo. % 01 cases
A subcaixa de diálogo Define Simple Bar: Summaries for Groups of Cases
Africano
2,9%
Indiano
20,0%
Asiatico
25.7
Branco
51,4%
igura 5.3
Diagrama de queijo para gpracial (dados do Questionário do Trabalho)
ma forma de apresentação de dados muito útil quando o objectivo
é
salien
ar o tamanho relativo de cada fatia em comparação com a totalidade da
mostra. A figura 5.3 apresenta um gráfico de tipo queijo para a variável
pracial gerado pelo SPSS.Para obter este tipo de gráfico devemos proceder
a seguinte forma:
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 110/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 111/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
atia possa ser distinguida de outra. O gráfico da figura 5.3 foi editado a
e dois passos essenciais: a cor branca foi aplicada a todas as fatias e pa
iferentes foram aplicados a cada uma delas. Os procedimentos segt
ermitem realizar este tipo de edições:
~ Duplo dique em qualquer parte do gráfico. Isto abre a caixa
Editor. O gráfico aparecerá no Chart Editor a sombreado
Para encher cada fatia de cor branca:
~ seleccionar cada fatia do gráfico pequenos pontos aparecerão
mite da fatia
~ Format ~ Color ... [uma paleta de cores aparecerão] ~ Fill ~ ,
~ Apply ~ outra fatia e aplicar às restantes, ainda que possa ser
uma fatia numa cor mais escura ~ CIos e
ara criar um padrão diferente em cada fatia:
~ seleccionar cada fatia do gráfico pequenos pontos aparecerão
mite da fatia
~ Format ~ Fill pattern ... [uma palete de padrões aparecerão pa
leccionar] ~ seleccionar padrões ~ Apply ~ outra fatia
~ outro padrão [lembre-se que deve aplicar um padrão diferente
fatia] ~ Apply [continua até que cada fatia branca tenha um padr,
ferente] ~ Close
ote-se que os rótulos dos valores serão necessários para produzir as
as apresentadas na figura 5.3. Podemos adicionar as percentagens da
a que cada fatia representa tal como se pode observar na figura 5.3
uinte forma: quando posicionados no Chart Editor, dicar em Chart e d
m Options ... ; seleccionar Percents [a caixa ao lado de Text deve, tarr
ncontrar-se seleccionada]. Podemos, ainda, criar efeitos no gráfico
omo destacar uma das fatias do círculo de modo a salientar a sua impc
ia. Para fazer isto, dique na fatia pretendida e:
~ Format ~ Explode Slice
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 112/128
RESUMIR OS DADOS
edid s de tendênci centr l
93
Uma das formas mais importantes de sintetizar a distribuição de valores de
urna variável é estabelecer a sua
tendência central-
o vaIar típico da distribui
ção. Perguntamo-nos, por exemplo, onde tendem a concentrar - se os valo
res da distribuição? Para muitos leitores, isto pode significar que se procura a
média de uma distribuição de vaiares. Contudo, quando os estatísticos fa
lam de valores médios referem-se a várias medidas. Discutiremos aqui três
medidas dos valores médios (i.e., medidas de tendência central): a média
aritmética, a mediana e a moda. Sephan J.Gould, um paleontólogo conhecido
pelos seus escritos científicos, ilustra duas destas medidas da seguinte forma:
Um político do partido do poder pode dizer, com algum orgulho: O rendimen
to médio dos nossos cidadãos é de 15,000 por ano . O líder da oposição pode
retorquir: Contudo, metade dos cidadãos ganha menos de 10,000 por ano .
Ambos estão correctos, mas nenhum cita as estatísticas com objectividade. O
primeiro utiliza a média, enquanto o segundo a mediana (Gould, 1991: 473).
~o fundo, este comentário não nos assegura relativamente à possível utiliza
ção indevida das estatísticas, mas ilustra bem as diferentes formas de apre
sentar um resultado médio.
A média aritmética arithmetic mean
Amédia aritmética é um método de calcular a média da distribuição que cor
responde à noção comum de média. Consideremos a seguinte distribuição de
alares:
12 10 7 9 8 15 2 19 7 10 8 16
Determinar a média aritmética consiste em adicionar todos os valores (neste
caso, o resultado é 123) e dividir esse total pelo número de valores (no nosso
exemplo, 12).Neste caso, a média aritmética é 10.25.É este tipo de cálculo que
conduz a afirmações tão bizarras como: o número médio de crianças é
2 37
. :0
entanto, a média aritmética que é, frequentemente, simbolizada por
x
é,
de longe, a mais utilizada medida de tendência central. Muitos dos testes es
:atísticos que serão abordados em capítulos posteriores deste livro relacio
.,am-se directamente com a comparação das médias de diferentes amostras
au grupos de sujeitos (por exemplo, a análise de variância - ver capítulo 7). A
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 113/128
94
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
ixos cujo efeito é, respectivamente, o de aumentar ou diminuir de forma en
nosa a sua magnitude. Isto tende a acontecer particularmente quando se
spõe de relativamente poucos dados; quando se tem muitos dados épreciso
e esteja presente um valor muito exagerado para distorcer o valor da mé
a. Assim, por exemplo, se na distribuição de doze valores que já apresentá
os substituirmos o 19por 59, a média seria 13.58em vez de 10.25, valor subs
ncialmente diferente e que constitui uma fraca representação da amostra no
u todo.
De uma forma semelhante, no quadro 8.10 do capítulo 8, a variável ta
anho da empresa contém um valor extremo (outlier; caso número 20), ou
ja, uma empresa com 2700 empregados. Note-se que a empresa seguinte
ssui, somente, 640.Amédia desta variável é de 499,mas se excluírmos o va
r extremo ela passa para 382,6. Como se depreende deste exemplo, um valor
tremo pode ter um impacto substancial na média aritmética, especialmente
ando o número de casos de uma amostra é pequeno.
A mediana median
mediana é o ponto médio de uma distribuição de valores. Parte uma distri
ição de valores em duas partes. Imaginemos que os valores de uma distri
ição são ordenados de forma crescente - por exemplo, 2, 4, 7, 9, 10: neste
emplo, a mediana é o valor central, isto é, 7. Quando o número de valores é
r, a mediana é a média dos dois valores do meio. Assim, no primeiro grupo
doze valores, para calcular a mediana poderíamos ordená-los deste modo:
2 7 7 8 8 ~ 10 12 15 16 19
este conjunto de valores, tomamos os dois valores sublinhados - o sexto e o
timo - somamo-los e dividimos o total por 2, i.e. (9+10)/2=9.5. Este valor
é
geiramente inferior à média a ritmética de 10.25, o que se deve provavelmen
à presença de três valores elevados no extremo final-15, 16 e 19. Se, em
z do 19 tivéssemos o 59, a média seria 13.58mas a mediana não seria afecta
porque enfatiza o centro da distribuição e ignora os extremos. Por esta ra
o, muitos autores sugerem que, quando existe um valor desviante que dis
rce a média, se deve considerar a mediana por ser um indicador mais repre
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 114/128
RESUMIR OS DADOS
A moda mode
95
~te último indicador de tendência central é raramente utilizado na investi
;ação mas é frequentemente mencionado nos livros. A moda é simplesmen
:e o valor que ocorre com maior frequência numa distribuição. No exemplo
ie distribuição de doze valores que apresentámos há três modas - 7 8 elO .
.-\0 contrário da média que só se pode utilizar com variáveis de intervalo a
::nada pode ser utilizada a qualquer nível de medição. A mediana pode ser
:.:sada para variáveis ordinais e de intervalo mas não para variáveis nominais .
.-\ssim embora a moda pareça um indicador mais flexível é pouco utilizada
?orque não usa todos os valores da distribuição e porque no caso de existir
::1ais do que uma moda na distribuição não é fácil de interpretar.
edir dispersão
?ara além de se interessarem pelo valor típico ou representativo de uma dis
:ribuição de valores os investigadores também procuram conhecer a quanti
dade de variação que a distribuição evidencia.
isto que se designa por dis-
::ersão a extensão da distribuição. A dispersão pode dar-nos informações
:mportantes: por exemplo podemos encontrar duas empresas em que o ren
dimento médio dos trabalhadores manuais seja semelhante. Contudo numa
delas os salários podem ser mais variados com valores consideravelmente su
?eriores e inferiores aos da outra firma. Assim embora a média de salários
seja similar uma das empresas apresenta muito maior dispersão do que a ou
:ra. Pode ser útil acrescentar esta informação aos valores de medida de ten
dência central.
A mais óbvia medida de dispersão consiste em considerar o valor mais
alto e o valor mais baixo da distribuição e subtrair o segundo do primeiro. Ao
esultado assim obtido chama-se amplitude da distribuição range . Embora de
:ácil compreensão tem a desvantagem de ser susceptível à distorção por in
]uência de valores extremos. Isto pode ser ilustrado com os dados fictícios
apresentados pelo quadro 5.5 que mostram as notas numa escala de 100 obti
das por duas classes de vinte alunos num teste de matemática. Cada uma das
classes é orientada por um professor diferente. As duas turmas têm médias
semelhantes mas os padrões das duas distribuições de valores são muito dife
entes. A turma do professor A tem uma distribuição de notas pouco diversi
: icada enquanto que a do professor B apresenta muito maior dispersão.
::nquanto a nota mais baixa obtida na turma do professor A foi 57 a mais bai
xa na turma do professor B foi 45. De facto no caso do professor B há oito no
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 115/128
96
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
dro 5.5 Resultados de um teste de aptidão matemática aplicado aos alunos de dois professore,
Dados Fictícios
édia aritmética
Professor A
65
70
66
59
57
6
66
71
58
67
61
68
63
65
71
69
67
74
7
6
65.55
4.91
66
Professor B
57
49
46
79
72
54
66
65
63
76
45
95
62
68
50
53
58
65
69
72
63.2
12.37
64
arece exagerar essa dispersão. Para o professor A esse intervalo é 74-57,
7. Para B, o intervalo
é
95-45, i.e. 50. Este valor exagera a quantidade de
ersão uma vez que todos os valores excepto três se situam entre 72 e 45, o
plica que para a maioria dos valores o intervalo de variação seja igual a 2
Uma solução para este problema consiste em eliminar os valores ext
os. A amplitude interquartis
inter-quartil range ,
por exemplo, é por ve:
comendada neste sentido (ver figura 5.4). Isto implica organizar os vaIo
uma ordem crescente. O intervalo é dividido em quatro partes iguais,
odo a que os primeiros 25 fiquem na primeira parte e os 25 maiores
uem na última. Estas divisões servem para definir quartis. Consideremo
rimeira distribuição que utilizámos para o cálculo da mediana:
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 116/128
RESUMIR OS DADOS
Mediana
01 02 03
1 1
25 das
observações
t
Valor
mínímo
25 das
observações
25 das
observações
25 das
observações
t
Valor
máximo
Amplitude interquartis
Observações por ordem crescente
Figura 5 4 Amplitude interquartis
é
a diferença entre o primeiro e o terceiro quartis, ou seja, 14.25-7.25
=
7.Como
a figura 5.4 indica, a mediana é o segundo quartil mas não é um componente
:tecessário para o cálculo da amplitude interquartis. A principal vantagem
desta medida de dispersão é eliminar os valores extremos e a sua grande limi
:ação é ignorar 50 dos valores da distribuição, o que significa uma grande
?erda de informação. Um compromisso possível entre estes dois aspectos
?ode ser atingido através da divisão da distribuição em dez partes decis) e
do cálculo da amplitude interdecis. De um modo similar ao que se fazia para a
amplitude interquartis eliminam-se os valores mais altos e os mais baixos.
:\reste caso, só se perde 20 da distribuição.
Sem dúvida que o mais utilizado método de avaliar a dispersão é o des
: io-padrão standart deviation).
Na essência, o desvio-padrão reflecte a quanti
dade média de desvio em relação à média. O seu cálculo é, de algum modo,
mais complicado do que esta definição sugere. No capítulo 7, pode encon
trar-se uma descrição mais pormenorizada do desvio-padrão. O desvio-pa
drão evidencia o grau em que os valores de uma distribuição se afastam da
média aritmética. O seu valor é, em geral, apresentado em conjunto com a mé
dia, uma vez que é difícil compreender o seu significado sem fazer alusão a
esta segunda medida.
Podemos comparar as duas distribuições do quadro 5.5 Apesar das mé
dias serem muito semelhantes o desvio-padrão na turma do professor B
12.37) é muito maior do que o da turma do professor A 4.91). Deste modo, o
desvio-padrão permite a comparação directa dos graus de dispersão quando
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 117/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
nterpretar. O desvio-padrão pode ser afectado pelos valores extremos mas
omo o seu cálculo depende de todos os valores envolvidos a distorção é me
os pronunciada do que no caso da amplitude. Por outro lado não devemos
gnorar a possibilidade de distorção por efeito dos valores extremos. No en
anto a menos que haja boas razões para não querer usar o desvio-padrão a
ua utilização é recomendada sempre que se pretenda obter uma medida de
É uma medida referida em geral nos relatórios de investigação e é
mplamente reconhecida como a principal medida de dispersão.
Anossa abordagem da dispersão destacou as variáveis de intervalo. Só
om esse tipo de variáveis se pode utilizar o desvio-padrão. A amplitude e a
mplitude interquartis podem ser usadas com variáveis ordinais embora
ssa não seja uma prática vulgar. Também com as variáveis nominais é pouco
requente a utilização de testes de dispersão. Provavelmente a melhor mane
ra de avaliar a dispersão das variáveis nominais e ordinais é usar gráficos de
arras histogramas e distribuições de frequências.
edir a tendência central e a dispersão com o S SS
odas estas medidas podem ser geradas no SPSS.Tomando a variável ren im
título de exemplo vamos realizar a seguinte sequência de procedimentos:
~ Analyze ~ Descriptive Statistics ~ Explore ... [abre a caixa de diá
logo Explore apresentada na caixa 5.8]
ren im
[botão] próximo da caixa
epen ent
List [coloca a variá
vel ren im na caixa epen ent List:]
~OK
• Explore
E
Eil
~~:
facto Lisl:
GO
T=_
I
J
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 118/128
RESUMIR OS DADOS
99
uadro 5.6 O output do comando Explore para a variável rendim
es riptives
~t ti<tic
c.
~
ean
15638,2353
42,0376Lower Bound
5155,1261
pper Bound
16121,3444
15582,3529
5600,0000
983590,869995,8935
18001000
200
500,0000370
291
- 294
74
P10t
Leaf
8
448
0244466668888
0022246668
0000246688
00002446666
00244666688
000226
O
6
O
Stem
11
12
13
14
15
16
17
18
19
20
21
1000
1 case s)
RENDIM Stem-and-Leaf
Frequency
1. 00
3.00
13.00
10.00
10.00
11. 00
11. 00
6.00
1. 00
1. 00
1. 00
Stem width:
Each 1eaf:
resultado deste procedimento é apresentado no quadro 5.6; através dele
btemos a média aritmética a mediana a amplitude os valores mínimo emá
imo o desvio-padrão e a amplitude interquartílica da variável rendim.
Métodos de apresentação dos dados: diagramas troncos-e-folhas
e diagramas extremos-e-quartis
:m1977 John Tukey publicou um importante livro com o título Exploratory
ata nalysis em que pretendia apresentar aos leitores uma série de técnicas
ue ele próprio tinha desenvolvido enfatizando o cálculo aritmético simples
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 119/128
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
ntagem, aos procedimentos ortodoxos. Para a presente discussão, são bas
nte relevantes duas representações dia gramáticas dos dados - o diagrama
oncos-e-folhas stem and leaj
e o
diagrama extremos-e-quartis box and whiskers
boxplot .
Método troncos-e-folhas de classificação dos dados
ste tipo de representação é um modo muito simples de apresentar dados re
rentes a uma variável de intervalo, utilizando uma forma semelhante a um
stograma mas sem se sofrer a perda de informação que este último tipo de
áfico implica. Pode ser facilmente construído
à
mão, embora isso seja mais
fícil quando se trabalha com grandes quantidades de dados De forma a
strar a construção de um diagrama de troncos-e-folhas, vamos utilizar os
dos de um indicador de desempenho de uma autoridade local. Durante
certo período de tempo, o governo britânico encarregou uma Comissão
Auditoria com a tarefa de recolher dados relativos ao desempenho de au
ridades locais, de modo a poder comparar o seu desempenho. Um dos crité
os para medir este desempenho era a percentagem de necessidades satisfei
s aos munícipes num período de seis meses. Este critério demonstrou uma
ande variabilidade entre as diversas autarquias, tal como foi salientado, na
tura, por um jornalista do The Times:
Se uma criança em Sunderland necessitasse de educação especial, não teria qu~
quer probabilidade de ver esta necessidade satisfeita nos seis meses mais próxi
mos. Contudo, se esta mesma criança mudasse de residência para Durnham,
cerca de uma ou duas milhas de distância, teria 80 de probabilidade desta ne
cessidade ser satisfeita num curto espaço de tempo (Murray, 1995: 32).
e estes dados medem eficiência ou não é um problema de validade das medi
as utilizadas nesta auditoria (ver capítulo 4), mas não existe margem p~
úvida de que há uma grande variação relativamente à percentagem de ne
ssidades satisfeitas no espaço de seis meses. Como podemos observar r.
uadro 5.7, esta percentagem varia entre Oe 95
A figura 5.5 mostra o diagrama de troncos-e-folhas relativo a esta va.ru
l, que passamos a designar por necess. O gráfico possui duas componen
senciais: em primeiro lugar, os números à esquerda da linha vertical cons::
em o tronco e servem de pontos de partida para a apresentação de cada --
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 120/128
RESUMIR OS DADOS
101
o
5.7
Percentagem de necessidades satisfeitas pelas autarquias num período de seis meses
em Inglaterra e Escócia. 1993-1994
londrinos
ICondados inglesesutoridades metropolitanas
ondados escoceses
1reat Manchester
Clwyd
0
5
olton
9
yfed
67
erkshire
16
ury
16
went
17 14
uckinghamshire
69
anchester
35
wynedd
88
36
Cambridgeshire
7
ldham
50
id Glamorgan
48
6
heshire
25
ochdale
O
powys
80
44
leveland
32
alford
10
outh Glamorgan
45 8
ornwall
3
tockport
16
West Glamorgan
4 4
umbria
35
ameside
16
2
Derbyshire
17
raflord
11
0evon 55
igan
21
' -lamlets
37
orset
33
erseyside
4
urham
72
nowsley
83
ast Susses
8
iverpool
95
Essex
9
t Helens
212
loucestershire
45
elton
37
40
ampshire
12
irral
13
37
Hereford
Worcs
3outh Yorkshire
23
Hertlordshire
61
arnsley
15
24
umberside
14
oncaster
127
I sle of Wight
60
otherham
10
3
Kent
15
heflield
4 2
ancashire
14
Tyne Wear
10
eicestershire
.
ateshead
4
1
incolnshire
36
ewcastle upon Tyne
30 O
orfolk
1
orth
Tyneside
48
gdon
7
orthamptonshire
48
outh Tyneside
5 20
orthumberland
79
underland
O
27
orth Yorkshire
34est Midfands
16
Nottinghamshire
10
irmingham
5
3
xfordshire
22
oventry
20
34
hropshire
15
udley
41
27omerset 50
andwell
1
6
taflordshire
20
olihull
3124
uflolk
27
alsall
3
5
olverhampton
36est Yorkshire 14
radford
250
alderdale
28
7
5
-:e: adaptado do The Times 30 de Março 1995. p. 32.
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 121/128
102
ANÁLISE DE DADOS EM CIÊNCIAS
soe
P10t
Leaf
00011112233333344444
5566778889
00000112234444
555566666777
001122344
555677779
00012344
55667778
014
558888
00
55
013
79
2
>=79
NECESS Stem-and-Leaf
Frequency Stem
20.00 O
10.00 O
14.00 1
12.00 1
10.00 2
9.00 2
8.00 3
8.00 3
3.00 4
6.00 4
2.00 5
2.00 5
3.00 6
2.00 6
1. 00 7
4.00 Extremes
Stem width: 10.00
Each leaf: 1 case s)
igura 5.5
Diagrama de troncos-e-folhas para a variável necess
onto percentual, podemos observar que apenas cinco autoridades
m 10 das necessidades em seis meses. Todos os números à direita
evem ficar alinhados na vertical. Não é necessário que os seus valor
rdenados de O a 9,mas fazê-lo torna a leitura mais fácil. Note-se qU
uição é achatada no fundo. Aapresentação deste diagrama foi contr
rma a que os incrementos nos valores da variável fossem de 10 1.
ercentuais. Podemos pedir, também, que os valores extremos out]
m apresentados separadamente. Os investigadores experientes en
e dados exploratória utilizam um critério específico para a iden
estes valores extremos: os que se posicionam próximo do valor mí
istribuição podem ser identificados através da fórmula seguinte:
primeiro quartil- 1,5 x amplitude interquartílica)
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 122/128
RESUMIR OS DADOS
3
::-onco-e-folhas seguimos o mesmo procedimento do utilizado para produzir
~ medidas de tendência central e de dispersão (ver caixa
5.5):
~ Analyze ~ Descriptive Statistics ~ Explore ... [abre a caixa de diá
logo Explore apresentada na caixa 5.8]
~ necess ~~ [botão] próximo de Dependent List: [tranfere a variável
necess para a caixa Dependent List:]
~ Plots na caixa próximo de Display ~ OK
output
resultante é apresentado na figura 5.5. Os valores da coluna mais à
::-squerda representam a frequência de cada ocorrência. Podemos, também,
= 9servar que existem dados omissos para duas autoridades locais.
Este método proporciona-nos uma apresentação semelhante ao histo
~ama, na medida em que nos dá uma ideia da forma da distribuição (se, por
::xemplo, os valores se centram num extremo), o grau de dispersão que apre
õ-entame a existência ou não de valores extremados. Contudo, ao contrário do
_--.lstograma,mantém toda a informação de modo a que os dados possam ser
.:n-ectamente analisados para se verificar quais os valores predominantes.
Diagrama extremos-e-quartis
-.:,.igura 5.6 mostra-nos a estrutura de um diagrama de extremos-e-quartis. O
-2ctângulo representa os
50
centrais das observações. Assim, o seu extremo
_Lferior,em termos da medida a que se refere, é o primeiro quartil e o seu ex
::-emo superior é o terceiro quartil. Por outras palavras, este diagrama com
:,:-eende a amplitude interquartílica. A linha assinalada é a mediana. As li
:-.hastracejadas dirigem-se para baixo até ao valor mínimo da distribuição e
:-ara cima até ao valor máximo, excluindo valores extremos
outliers
que são
_-:dicados separadamente. Este tipo de apresentação tem um certo número de
u311tagens. Tal como foi discutido anteriormente, este método dá-nos infor
::-:açãosobre a forma e a dispersão da distribuição - por exemplo, o rectân
;..Jloestá mais próximo de um extremo ou do meio? Se se desse o primeiro
~,,-so,sso indicar-nos-ía que os valores tendiam a concentrar-se num pólo. A
:-:-imeira situação mostraria que os valores tendem a concentrar-se no limite
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 123/128
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 124/128
RESUMIR OS DADOS
5
? ocedimento referido na página 103, o SPSSvai gerar um diagrama de tron
:~-folhas e um de extremos-e-quartis.
Qualquer destas técnicas de análise exploratória dos dados pode ser re
:omendada como um passo útil no sentido de conhecer os dados quando co
:::1eçamosa estudá-los. Deverão elas ser utilizadas como alternativa aos histo
~amas e a outras abordagens mais comuns? De facto, elas têm a desvanta
~em de serem pouco conhecidas. Das duas, o diagrama de troncos-e-folhas é,
:alvez, o mais fácil de assimilar, uma vez que o diagrama extremos-e-quartis
:equer a compreensão da noção de quartil e de mediana. Qualquer um deles,
~ for usado para um público pouco familiarizado com estas técnicas, pode
::iar algumas dificuldades; se, pelo contrário, o público os dominar, estes mé
:odos de apresentação dos dados têm muito a seu favor.
form de um distribuição
-á fizémos referência em várias ocasiões à forma da distribuição. Assim, por
exemplo, os valores de uma distribuição podem tender para um dos extremos
)u concentrar-se no centro. Nesta secção, vamos especificar melhor os aspec
:05
ligados à forma da distribuição e introduzir conhecimentos fundamentais
::>araa compreensão de alguns métodos de análise de dados que serão abor
iados em capítulos posteriores.
Os estatísticos descreveram uma série de curvas de distribuição. A mais
:.mportante é sem dúvida, a distribuição norm l A distribuição normal tem a
:orma de um sino. Pode tomar uma variedade de aspectos diferentes, depen
jendo do grau de dispersão dos dados. Na figura
5.8
temos exemplificadas
iu s
curvas características da distribuição normal. O termo normal pode
~'lduzir em erro, porque na realidade é muito raro encontrarem-se distribui
;ões perfeitamente normais. Contudo, os valores da variável podem aproxi
:nar-se da distribuição normal e, quando isso acontece, tendemos a pensar
:ceIes como se tivessem, de facto, as propriedades da distribuição normal.
~.luitas das técnicas estatísticas mais comuns usadas nas ciências sociais pre
5umem que as variáveis analisadas têm uma distribuição próxima da normal
\-er a discussão de testes paramétricos e não paramétricos no capítulo
7).
A distribuição normal resulta de todos os casos que abarca debaixo da
5ua curva. Cinquenta por cento dos casos ficarão de um lado da média
=.ritmética; os outros cinquenta por cento ficarão do outro lado (ver figura
~ 9 Amediana será igual à média: é por isso que a curva tem o seu pico no va
.::lI
da média. Esta distribuição implica que a maior parte dos valores se situ
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 125/128
106
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
5 8 Duas distribuições normais
50
dos
casos
5 9 Média e distribuição normal
ode ilustrar perfeitamente este tipo de curva. A altura média de uma mulher
dulta no Reino Unido é 160.9 em. Se a altura das mulheres seguir uma distri
uição normal a maior parte delas terá uma altura próxima da média. Muitc
oucas serão muito altas ou muito baixas. Sabemos que a altura das mulheres
m estas propriedades; agora se essa variável tem uma distribuição norma:
erfeita é já um assunto diferente.
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 126/128
RESUMIR OS DADOS
107
~:~g~:
~:8~oSOS
~~:~~:
~~7~oSOS
-~.~~~l-~~
~~S-
4.13 34.13
·3
dp
·2
dp
.
dp
dp
+2
dp
3
dp
Número de desvios padrão a partir da média
-igura 5.10 Propriedades da distribuição normal
Estas propriedades da distribuição normal são extremamente importantes
quando o investigador pretende fazer inferências sobre a população a partir
de uma amostra. Esta questão é o ponto central em análise no capítulo 6.
É importante ter em conta que há variáveis que não seguem o formato
da curva da distribuição normal. Por vezes, podem até afastar-se bastante
dessa disposição. Essa tendência é muito clara quando os valores de uma dis
rribuição são assimétricos ou enviesados isto é, quando tendem a concentrar-se
num extremo. Quando isso acontece, a média e a mediana deixam de coinci
dir. Estas ideias são ilustradas pela figura 5.11.O diagrama da esquerda mos
tra uma curva que épositivamente assimétrica na medida em que os valores ten
dem a concentrar-se à esquerda e existe uma cauda longa no lado direito. A
variável necess ilustra uma distribuição positivamente as simétrica, tal como
o diagrama extremos-e-quartis da figura 5.7 sugere a média é 24,75 e a me
diana é 20,00). No diagrama da direita, a curva é negativamente enviesada ou
negativamente assimétrica Outro tipo de disposição é a de uma distribuição
com mais do que um pico.
Apesar de se reconhecer que algumas variáveis, em ciências sociais, não
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 127/128
8
ANÁLISE DE DADOS EM CIÊNCIAS SOCIAIS
y
Mediana Média
x
y
Média Mediana
x
Distribuição positivamente
assimétrica
Distribuição negativamente
assimétrica
Figura 5.11 Distribuições positiva e negativamente enviesada
argumentariam que não seria correcto aplicar testes estatísticos que pressu
põem que os dados seguem uma distribuição normal quando as variáveis
se:
distribuem de forma pronunciadamente
enviesada.
Muito frequentemente
pode examinar-se se as curvas se afastam da curva característica da distribui
ção normal através da análise de uma distribuição de frequências ou de urr
histograma.
O SPSSpermite-nos avaliar o enviesamento Skewness , através do proce
dimento seguinte avariável rendim vai ser utilizada a título de ilustração :
~ Analyze ~ Descriptive Statistics ~ Frequencies ... [abre a caixa de
diálogo Fequences apresentada na caixa 5.3]
Frequencies: Slalislics I J
Continue
ntral TeriOencl
_.•VaJues are group roidpoínts
Percentae Values
t1 Quartiles
01Cyt points forllQJl equal groups
8/11/2019 Analise de dados em ciencias sociais.pdf
http://slidepdf.com/reader/full/analise-de-dados-em-ciencias-sociaispdf 128/128
RESUMIR OS DADOS
9
~ rendim ~ ~ [botão] ~ Statistics [abre a subcaixa de diálogo Fre
quences: Statistics apresentada na caixa 5.9]
~ Skewness na caixa Distribution ~ Continue [fecha a subcaixa de
diálogo Statistics]
~OK
e não houver ssimetri ou seja, se a variável for normalmente distribuída,
-€ráregistado um valor de zero ou próximo de zero. Se o valor for negativo os
.ados são negativamente assimétricos; se for positivo são positivamente assi
étricos. Por outro lado, este teste não é fácil de interpretar e é importante
onfrontar a possibilidade de uma assimetria excessiva a partir da observa
o directa dos dados. Isto pode ser feito através de uma distribuição de fre
uências ou através de uma representação diagramática, como um histogra
a ou um diagrama troncos-e-folhas.
Exercícios
Qual o procedimento do SPSSnecessário para criar uma distribuição de
frequências para os dados do Questionário do Trabalho referentes a
produtiv, acompanhada dos valores percentuais e da mediana?
Faça correr, novamente, o procedimento que utilizou na pergunta 1.