View
22
Download
0
Category
Preview:
DESCRIPTION
Como se familiarizar com seu banco de dados usando o SPSS. Profa. Suzi Camey Depto de Estatística - UFRGS. Construção de BD. O banco de dados (BD) pode ser construído diretamente no SPSS ou em qualquer tipo de planilha eletrônica (como por exemplo Excel) - PowerPoint PPT Presentation
Citation preview
Como se familiarizar com seu banco de dados
Como se familiarizar com seu banco de dados usando o
SPSSProfa. Suzi Camey
Depto de Estatística - UFRGS
Como se familiarizar com seu banco de dados
Construção de BD
• O banco de dados (BD) pode ser construído
diretamente no SPSS ou em qualquer tipo de
planilha eletrônica (como por exemplo Excel)
– Principal desvantagem: ausência de um sistema
de controle de entrada de dados
– Alternativa: EpiData que pode ser obtido
gratuitamente no endereço
• http://www.epidata.dk/
Como se familiarizar com seu banco de dados
Construção de BD
• Usando o Excel lembrar que:
– Colocar o nome de cada variável na primeira linha
da planilha;
– Cada linha representa um sujeito;
– Cada coluna uma variável;
– Dados perdidos (missing): é mais fácil deixar a
casela vazia;
– Não colocar letras em colunas destinadas à
variáveis numéricas.
Como se familiarizar com seu banco de dados
Construção de BD• Usando o Excel lembrar que:
– Cada variável só pode aparecer uma vez no banco, não
podendo haver 2 colunas com o mesmo nome.
– Não incluir no nome de uma variável acentos, cedilhas,
espaços ou caracteres especiais (%, vírgulas, pontos, *,
& ...), pois dependendo da versão do SPSS, eles serão
lidos de um jeito diferente.
– Mesmo já existindo a numeração padrão do excel, deve
existir uma coluna enumerando os casos no arquivo.
Como se familiarizar com seu banco de dados
Construção de BD• Usando o Excel lembrar que:
– Para facilitar a digitação, algumas linhas e algumas
colunas podem ficar “fixas” na planilha. Por exemplo se
você quer fixar o nome do paciente (coluna b) e o nome
das variáveis (linha 1), então deve colocar o cursor na
célula C2 e clicar em “Janela” no menu superior, e depois
em “congelar painéis”. Neste caso, em qualquer ponto da
planilha que você estiver, sempre aparecerá o nome do
paciente e o nome da variável.
Como se familiarizar com seu banco de dados
Construção de BD
• O ideal é que daqui em diante os próximos
passos sejam executados no arquivo
milsa.xls
Como se familiarizar com seu banco de dados
Iniciando o SPSSQuando abrimos o SPSS ele tem a seguinte aparência:
Clicar aqui
Como se familiarizar com seu banco de dados
Lendo dados do ExcelEscolher tipo de arquivo
Clicar aqui
Como se familiarizar com seu banco de dados
Lendo dados do ExcelEscolher tipo de arquivo
Clicar aqui
Como se familiarizar com seu banco de dados
Lendo dados do ExcelEscolher arquivo: primeiro escolher o subdiretório onde o arquivo se encontra.
Clicar 2x aqui
Como se familiarizar com seu banco de dados
Lendo dados do ExcelEscolher a planilha
Escolher esta opção se houver o nome das variáveis na 1a. linha do arquivo Excel
Aqui pode ser escolhida a planilha do arquivo Excel
Clicar aqui
Como se familiarizar com seu banco de dados
Definições: pelo MenuRótulos das variáveis e categorias, no. de casas decimais e dados perdidos
Clicar aqui
Como se familiarizar com seu banco de dados
Definições: pelo MenuRótulos das variáveis
Nesta coluna podemos colocar os rótulos das variáveis. Basta clicar em uma das caselas e digitar o rótulo.
Como se familiarizar com seu banco de dados
Definições: pelo MenuRótulos das variáveis
Neste exemplo ficaria assim
Como se familiarizar com seu banco de dados
Definições: pelo Menu• Rótulos das categorias
Nesta coluna podemos colocar os rótulos das categorias.Clicando na 2a. casela.
Como se familiarizar com seu banco de dados
Definições: pelo MenuRótulos das categorias
Clique aqui
Como se familiarizar com seu banco de dados
Definições: pelo MenuRótulos das categorias
Aqui digite o rótulo
Aqui digite o valor
Como se familiarizar com seu banco de dados
Definições: pelo MenuRótulos das categorias
Para a variável civil fica assim.
Após adicionar cada “Value” e seu “Label” deve-se clicar aqui.
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Rótulos das categorias: colocar rótulos das variáveis abaixo.
• Instrução: – 1: Ensino Fundamental– 2: Ensino Médio– 3: Superior
• Região:– 1: capital– 2: interior
Como se familiarizar com seu banco de dados
Definições: pelo MenuCasas decimais
Nesta coluna podemos definir o no. de casas decimais. Basta clicar em uma das caselas e digitar o no. de casas decimais ou usar as setas.
Como se familiarizar com seu banco de dados
Definições: pelo MenuDados perdidos
Nesta coluna podemos definir quais são os códigos para valores perdidos.
Como se familiarizar com seu banco de dados
Definições: pelo MenuDados perdidos
Clicar aqui
Como se familiarizar com seu banco de dados
Definições: pelo MenuDados perdidos
Podem ser definidos até 3 valores diferentes.No nosso exemplo o valor perdido é definido pelo número 9.
Como se familiarizar com seu banco de dados
Definições: pela sintaxeAgora vamos definir rótulos das variáveis e
categorias, no. de casas decimais e dados perdidos construindo um arquivo de sintaxe.
Esse método é útil principalmente quando se pretende fazer análises parciais do banco de dados, pois cada vez que lemos um BD do Excel temos que reaplicar as definições.
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Clicar aqui
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Esta é a janela do arquivo de sintaxe.
O arquivo de sintaxe pode ser construído em qualquer editor de texto e é conveniente que seja salvo com a terminação .sps
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Nomes dos comandos
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Nomes das variáveis a serem definidas
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Número da categoria
Código do valor perdido
Nome da categoria
Rótulo da variável
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Os rótulos devem estar entre aspas simples e o código do dado perdido está entre parênteses.
Agora você deve definir os rótulos de variáveis e categorias para todas as variáveis!
Todos os comandos devem terminar com ponto final.
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Clicando aqui após selecionar o comando com o mouse, o comando será executado.
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Lembrar de salvar a sintaxe!
Como se familiarizar com seu banco de dados
Lembrar de salvar o banco de dados!
Como se familiarizar com seu banco de dados
“Limpeza” do BD
• Após colocar todos os rótulos e definir quais são os valores perdidos devemos fazer uma distribuição de freqüências de todas as variáveis para detectar possíveis erros de digitação.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Clicar aqui
Como se familiarizar com seu banco de dados
“Limpeza” do BD
• Clicar aqui depois de selecionar todas as variáveis com o mouse.
• Depois clicar em OK.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
• Quando esse comando é executado, uma nova janela é aberta: a janela de resultados.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
• Aqui temos todas as variáveis analisadas, o número de casos válidos e o número de casos perdidos.
• Por exemplo: temos 13 observações perdidas na variável “Região onde mora” e 23 observações válidas.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
• Agora vamos fazer uma análise de cada uma
das variáveis buscando inconsistências.
Como se familiarizar com seu banco de dados
“Limpeza” do BDVariável Número do sujeito:
• Como esta é a variável de identificação dos casos não podemos ter nenhuma freqüência diferente de 1, pois neste caso teríamos dois sujeitos com a mesma identificação.
Número do Sujeito
1 2,8 2,8 2,8
1 2,8 2,8 5,6
1 2,8 2,8 8,3
1 2,8 2,8 11,1
1 2,8 2,8 13,9
1 2,8 2,8 16,7
1 2,8 2,8 19,4
1 2,8 2,8 22,2
1 2,8 2,8 25,0
1 2,8 2,8 27,8
1 2,8 2,8 30,6
1 2,8 2,8 33,3
1 2,8 2,8 36,1
1 2,8 2,8 38,9
1 2,8 2,8 41,7
1 2,8 2,8 44,4
1 2,8 2,8 47,2
1 2,8 2,8 50,0
1 2,8 2,8 52,8
1 2,8 2,8 55,6
1 2,8 2,8 58,3
1 2,8 2,8 61,1
1 2,8 2,8 63,9
1 2,8 2,8 66,7
1 2,8 2,8 69,4
1 2,8 2,8 72,2
1 2,8 2,8 75,0
1 2,8 2,8 77,8
1 2,8 2,8 80,6
1 2,8 2,8 83,3
1 2,8 2,8 86,1
1 2,8 2,8 88,9
1 2,8 2,8 91,7
1 2,8 2,8 94,4
1 2,8 2,8 97,2
1 2,8 2,8 100,0
36 100,0 100,0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
Total
ValidFrequency Percent Valid Percent
CumulativePercent
Como se familiarizar com seu banco de dados
“Limpeza” do BDVariável Estado civil:
Estado civil
16 44,4 44,4 44,4
19 52,8 52,8 97,2
1 2,8 2,8 100,0
36 100,0 100,0
Solteiro
Casado
4
Total
ValidFrequency Percent Valid Percent
CumulativePercent
Aqui encontramos um problema: na distribuição de freqüência aparece um código 4. Temos que identificar qual o caso corrigí-lo.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Temos várias maneiras de localizar o caso. Uma delas é marcando a coluna da variável onde se encontra o problema e depois clicar em “Find”.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Digitar aqui o valor “estranho” e depois em “Find Next”.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Depois de identificado o sujeito...
Como se familiarizar com seu banco de dados
“Limpeza” do BD
... verificar o erro e corrigí-lo.
Como se familiarizar com seu banco de dados
“Limpeza” do BDVariável Grau de instrução:
• Aqui não nenhuma inconsistência.
• Uma das possíveis observações que podemos fazer é: 33,3% de pessoas que concluíram o Ensino Fundamental.
Grau de instrução
12 33,3 33,3 33,3
18 50,0 50,0 83,3
6 16,7 16,7 100,0
36 100,0 100,0
Ensino Fundamental
Ensino Médio
Supeior
Total
ValidFrequency Percent Valid Percent
CumulativePercent
Como se familiarizar com seu banco de dados
“Limpeza” do BDVariável Número de filhos:
• Nesta variável aparece um sujeito com 55 filhos. Devemos novamente localizar o sujeito e verificar se a informação está correta.
Número de filhos
4 11,1 19,0 19,0
5 13,9 23,8 42,9
7 19,4 33,3 76,2
3 8,3 14,3 90,5
1 2,8 4,8 95,2
1 2,8 4,8 100,0
21 58,3 100,0
15 41,7
36 100,0
0
1
2
3
5
55
Total
Valid
SystemMissing
Total
Frequency Percent Valid PercentCumulative
Percent
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Agora vamos ver outra maneira de localizar o caso. Quando o valor procurado for o maior ou o menor de todos, basta marcar a coluna da variável onde se encontra o problema, clicar com o botão direito do mouse e depois clicar em “Sort Descending” ou “Sort Ascending”, dependendo do caso.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Identificado o sujeito e o erro, devemos corrigir o banco. Neste caso corrija para 5.
Como se familiarizar com seu banco de dados
“Limpeza” do BDVariável Número de salários
mínimos:
• Nesta variável não há inconsistência.
• A partir da tabela podemos ver que 50,0% dos sujeitos ganham no máximo 9,8 salários mínimos.
Número de salários mínimos
1 2,8 2,8 2,8
1 2,8 2,8 5,6
1 2,8 2,8 8,3
1 2,8 2,8 11,1
1 2,8 2,8 13,9
1 2,8 2,8 16,7
1 2,8 2,8 19,4
1 2,8 2,8 22,2
1 2,8 2,8 25,0
1 2,8 2,8 27,8
1 2,8 2,8 30,6
1 2,8 2,8 33,3
1 2,8 2,8 36,1
1 2,8 2,8 38,9
1 2,8 2,8 41,7
1 2,8 2,8 44,4
1 2,8 2,8 47,2
1 2,8 2,8 50,0
1 2,8 2,8 52,8
1 2,8 2,8 55,6
1 2,8 2,8 58,3
1 2,8 2,8 61,1
1 2,8 2,8 63,9
1 2,8 2,8 66,7
1 2,8 2,8 69,4
1 2,8 2,8 72,2
1 2,8 2,8 75,0
1 2,8 2,8 77,8
1 2,8 2,8 80,6
1 2,8 2,8 83,3
1 2,8 2,8 86,1
1 2,8 2,8 88,9
1 2,8 2,8 91,7
1 2,8 2,8 94,4
1 2,8 2,8 97,2
1 2,8 2,8 100,0
36 100,0 100,0
4,00
4,56
5,25
5,73
6,26
6,66
6,86
7,39
7,44
7,59
8,12
8,46
8,74
8,95
9,13
9,35
9,77
9,80
10,53
10,76
11,06
11,59
12,00
12,79
13,23
13,60
13,85
14,69
14,71
15,99
16,22
16,61
17,26
18,75
19,40
23,30
Total
ValidFrequency Percent Valid Percent
CumulativePercent
Como se familiarizar com seu banco de dados
“Limpeza” do BDVariável Idade-anos:
• Há um sujeito com 330. Escolha um dos métodos descritos anteriormente e corrija a idade do sujeito para 33.
Idade - anos
1 2,8 2,8 2,8
1 2,8 2,8 5,6
1 2,8 2,8 8,3
2 5,6 5,6 13,9
1 2,8 2,8 16,7
1 2,8 2,8 19,4
1 2,8 2,8 22,2
2 5,6 5,6 27,8
2 5,6 5,6 33,3
2 5,6 5,6 38,9
1 2,8 2,8 41,7
2 5,6 5,6 47,2
2 5,6 5,6 52,8
2 5,6 5,6 58,3
2 5,6 5,6 63,9
1 2,8 2,8 66,7
1 2,8 2,8 69,4
2 5,6 5,6 75,0
2 5,6 5,6 80,6
1 2,8 2,8 83,3
2 5,6 5,6 88,9
1 2,8 2,8 91,7
1 2,8 2,8 94,4
1 2,8 2,8 97,2
1 2,8 2,8 100,0
36 100,0 100,0
20
23
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
46
48
330
Total
ValidFrequency Percent Valid Percent
CumulativePercent
Como se familiarizar com seu banco de dados
“Limpeza” do BDVariável Idade-meses:
• Não há inconsistência.Idade - meses
4 11,1 11,1 11,1
1 2,8 2,8 13,9
3 8,3 8,3 22,2
1 2,8 2,8 25,0
3 8,3 8,3 33,3
5 13,9 13,9 47,2
3 8,3 8,3 55,6
6 16,7 16,7 72,2
3 8,3 8,3 80,6
1 2,8 2,8 83,3
4 11,1 11,1 94,4
2 5,6 5,6 100,0
36 100,0 100,0
0
1
2
3
4
5
6
7
8
9
10
11
Total
ValidFrequency Percent Valid Percent
CumulativePercent
Como se familiarizar com seu banco de dados
“Limpeza” do BDVariável Região onde mora:
• Há um código 8, identificar o sujeito e corrigir para 9.
Região onde mora
12 33,3 52,2 52,2
10 27,8 43,5 95,7
1 2,8 4,3 100,0
23 63,9 100,0
13 36,1
36 100,0
capital
interior
8
Total
Valid
9Missing
Total
Frequency Percent Valid PercentCumulative
Percent
Como se familiarizar com seu banco de dados
FIM
Agora este banco está pronto para ser analisado!!!
Recommended