Manual Do Spss (v12.0) _completo

Embed Size (px)

Citation preview

SPSS 12Mdulo Base Conceitos e Recursos

Cora Maria Bender de Santana e Maria das Graas Moreira Lisboa

SumrioI Introduo.....................................................................................................................................4 1. Passos de uma anlise estatstica........................................................................................4 2. A famlia SPSS for Windows.............................................................................................5 3. Viso Geral do SPSS for Windows....................................................................................5 II Sobre o Banco de Dados .............................................................................................................12 1. Como criar seu prprio banco de dados .............................................................................13 2. Criando vrias variveis com as mesmas caractersticas ...................................................17 3. Definindo propriedades de variveis categricas...............................................................19 4. Formas de importao e exportao de dados....................................................................22 5. Importao de arquivos tipo Excel ou Ltus......................................................................23 6. Lendo banco de dados usando ODBC................................................................................25 III- Transformao de Dados .............................................................................................................29 1. Compute ...............................................................................................................................29 2. Visual Bander.......................................................................................................................30 4. Recode into different variables .......................................................................................33 5. Recode into same variables.............................................................................................35 6. Automatic Recode..............................................................................................................36 7. Count..................................................................................................................................37 IV- Um pouco de Estatstica Descritiva ............................................................................................37 1. Nvel de medida das variveis............................................................................................37 2. Distribuio de freqncia .................................................................................................38 3. Medidas de posio ............................................................................................................39 4. Medidas de variabilidade ...................................................................................................40 V- Comandos do SPSS para Anlise Estatstica ...............................................................................42 1. Olap Cubes .........................................................................................................................43 2. Frequencies ........................................................................................................................44 3. Descriptives........................................................................................................................47 4. Crosstabs ............................................................................................................................48 VI- Tabelas ........................................................................................................................................51 1. Usando os cones de organizao.......................................................................................53 2. Modificando as clulas.......................................................................................................54 3. Propriedades da tabela........................................................................................................55 4. Tablelooks ..........................................................................................................................58 5. Criando um grfico a partir de uma tabela.........................................................................58 VII Manipulao de Dados .............................................................................................................60 1. Ordenao de casos ..............................................................................................................60 2. Seleo de casos ...................................................................................................................61 3. Split File ...............................................................................................................................64 4. Aggregate .............................................................................................................................65 5. Restructure ...........................................................................................................................66 6. Transpose .............................................................................................................................69 2

VIII- Arquivos e Janelas Produzidas em uma sesso SPSS ..............................................................70 1. Janela de dados.....................................................................................................................70 2. Janela de sadas ....................................................................................................................71 3. Janela de sintaxe...................................................................................................................72 4. Copiando o contedo da janela de sadas.............................................................................76 5. Formas de exportao...........................................................................................................79 IX Utilizando os Scripts do SPSS...................................................................................................80 1. Modificando um script .......................................................................................................81 X Customizao das barras de ferramentas ....................................................................................83 XI Controlando o ambiente ............................................................................................................85 1. Guia General ......................................................................................................................85 2. Guia Viewer .......................................................................................................................86 3. Guia Draft Viewer..............................................................................................................87 4. Guia Output Labels ............................................................................................................87 5. Guia Charts ........................................................................................................................88 6. Guia Interactive ..................................................................................................................89 7. Guia Pivot Tables...............................................................................................................89 8. Guia Data ...........................................................................................................................90 9. Guia Currency ....................................................................................................................91 10. Guia Scripts........................................................................................................................91 XII Unio de dois bancos de dados ................................................................................................92 1. Adicionando casos .............................................................................................................92 2. Adicionando variveis........................................................................................................94 XIII Mltipla Resposta ...................................................................................................................97 XIV Grficos no-interativos.......................................................................................................101 XV - Grficos interativos................................................................................................................107 Alguns tipos de arquivos importantes ...................................................................................122

3

I. Introduo1. Passos de uma anlise estatstica Em nosso dia a dia, vivemos constantemente rodeados por potenciais fontes de dados, que podem ser funcionrios de uma empresa (se estivermos interessados em avaliar seu desempenho antes e aps um treinamento), pacientes de uma clnica (se quisermos estudar tempo de reao a uma determinada droga), objetos em uma linha de produo (se quisermos avaliar quantidades de peas defeituosas produzidas), ou ndices da bolsa de valores (se nosso alvo so as projees econmicas). Por hora, vamos supor que estamos interessados em estimar a altura mdia dos brasileiros do sexo masculino com mais de 25 anos. Em geral no temos recursos financeiros ou mesmo tempo suficiente para entrevistar cada pessoa e, por isso, preciso selecionar um grupo ou uma amostra de pessoas. Esta etapa chamada de coleta de dados que seguida do devido armazenamento dos mesmos. Uma vez reunidas as informaes, frequentemente esses dados precisam passar por algum tipo de transformao. Se a altura das pessoas tivesse sido tomada em ps e polegadas, seria conveniente transform-la para centmetros. Esta a etapa de transformao de dados, que poderia se estender a clculos bem mais complexos. Finalmente os dados esto prontos para a anlise, a qual ser dividida em duas fases. A primeira chamada de descritiva, na qual, como o prprio nome diz, descreveremos os dados. Alguns procedimentos utilizados nessa etapa so: construo de tabelas e grficos, clculo de medidas como mdia, varincia, etc. No estudo sobre a altura dos brasileiros, por exemplo, poderamos ter como primeiros resultados: a altura mdia na amostra entrevistada de 168 cm com um desvio padro de 12 cm. Mas da a dizer que esta a altura mdia do brasileiro do sexo masculino com mais do que 25 anos um grande passo, que deve ser dado com muito cuidado. ento que entra a segunda parte da anlise, a anlise inferencial. Com a ajuda de testes estatsticos, poderemos mais do que simplesmente dizer qual a altura mdia do brasileiro, mas tambm associar uma certa confiabilidade a tal concluso. Depois de tanto trabalho hora de relatar as concluses do estudo. Agora toda informao, seja ela numrica ou grfica, bem-vinda para que algum que no participou do processo de anlise possa compreender as concluses sobre o estudo, atravs do relatrio. Mas afinal, por que devemos realizar uma anlise estatstica? Simplesmente porque precisamos da confiabilidade que esta anlise oferece em um momento de tomada de deciso. A figura I-1 apresenta um esquema com os passos de uma anlise estatstica. O SPSS tem sido considerado um dos melhores softwares estatsticos do mercado, justamente porque participa de grande parte do processo que engloba uma anlise estatstica. Logo na primeira etapa possvel armazenar dados de forma rpida e prtica no prprio SPSS. Durante o processo de transformao e anlise de dados, o SPSS tem recursos considerados dos mais poderosos. At mesmo em um dos momentos mais delicados da anlise, a elaborao de relatrios, o SPSS tem recursos excelentes para ajud-lo. Mas, e na hora de tomar decises? Mesmo nesse momento crtico da sua anlise, voc pode contar com os recursos do SPSS, como por exemplo, um tcnico de resultados que lhe ensina como analisar os resultados apresentados em alguma tabela.

4

Figura I-1: Passos de uma anlise estatstica de dados

Coleta e Armazenagem de Dados Transformao Anlise Descritiva Anlise Inferencial Apresentao dos Resultados Confiabilidade na Tomada de Deciso

2. A Famlia SPSS for Windows A famlia SPSS for Windows formada por onze mdulos: Base, Regression, Models, Tables, Advanced Models, Trends, Exact Tests, Categories, Conjoint, Missing Values, Maps e Complex Samples. O mdulo Base o mdulo central, com o qual todos os demais interagem. Ele o responsvel pela importao e exportao de arquivos, toda etapa de manipulao e transformao de dados, anlise descritiva, anlise no paramtrica, anlise inferencial bsica, e toda a produo grfica. Ao adicionar outros mdulos ao mdulo Base, estaremos apenas acrescentando novos procedimentos estatsticos, ganhando em termos de opes e complexidade; porm o acrscimo de outros mdulos no altera o aspecto geral do SPSS. Dessa forma, os mdulos podem ser adquiridos levando em conta a rea de atuao e o trabalho a ser desenvolvido.

3. Viso geral do SPSS for Windows A janela Untitled SPSS Data Editor (ver figura I-2) carregada automaticamente quando se inicia o SPSS. Esta janela aberta para que comecemos a trabalhar com os nossos dados. Ela permite a digitao, edio, transformao e anlise de dados. O formato de uma planilha, onde cada linha corresponde a um caso e cada coluna a uma varivel. Figura I-2: Aspecto inicial do SPSS

5

O menu File (ver figura I-2) permite que voc tenha controle sobre tudo que se refere ao gerenciamento de arquivos, como importao, exportao, impresso e salvamento. O primeiro bloco desse menu destina-se abertura de arquivos, seja ele um banco de dados, uma janela de sada produzida anteriormente ou uma janela de sintaxe. Os tipos de bancos de dados que podem ser lidos pelo SPSS so os mais diversos, desde do formato ASCII (texto) at bancos em formato Lotus 123, Excel, Dbase, entre outros e, claro, arquivos produzidos pelo prprio SPSS nas suas diferentes verses. A opo New inicializa um novo banco de dados ou outro tipo de janela, a opo Open abre um arquivo diretamente, a opo Open Database... serve para voc ler arquivos de vrios bancos de dados diferentes atravs de ODBC, e a opo Read Text Data abre um assistente para auxili-lo na leitura de arquivo em formato texto. O segundo bloco do menu File tem por funo salvar qualquer janela do SPSS. Assim se estivermos na janela Sadas, podemos salvar os resultados obtidos em uma anlise estatstica atravs da opo Save, etc. Permite ainda salvar um banco de dados criado no SPSS em outro formato, assim como no prprio SPSS. A opo Mark File Read Only serve para evitar que um arquivo original seja modificado ou apagado acidentalmente, com essa opo selecionada o seu arquivo fica marcado como somente leitura. Caso essa opo esteja selecionada, para salvar o arquivo ser necessrio escolher outro nome ou entrar novamente no menu File e escolher a opo Mark File Read Write. No terceiro bloco do menu File, voc pode obter informaes sobre o contedo do seu banco de dados usando a opo Display Data File Information, forar a criao de um arquivo de dados temporrio atravs de Cache Date, parar o processador do SPSS atravas de Stop Processor ou conectar-se a um servidor para executar anlises em bancos de dados maiores (desde que voc tenha um mdulo servidor do SPSS) atravs de Switch Server. No quarto bloco do menu File esta localizada a opo Print para impresso de qualquer janela que esteja ativa e no quinto bloco do menu File temos a lista dos arquivos recentemente utilizados e a opo Exit para voc fechar/sair do SPSS. Figura I-3: O menu File

O menu Edit (ver figura I-4) traz comandos relacionados edio, que podem ser diferentes de acordo com a janela que estiver ativa. Se estivermos na janela de dados, podemos utilizar os recursos Cut, Copy e Paste para copiar, recortar e colar, respectivamente, um conjunto de dados de um lugar para outro. No ltimo bloco do menu Edit, temos o comando Options..., onde podemos definir os principais parmetros do SPSS, como o padro para o tipo da varivel (o padro do SPSS Numeric 8.2, i.e., varivel numrica com 8 dgitos, sendo que os dois ltimos so casas decimais), 6

ou ainda o tamanho e fonte dos ttulos na janela de sadas, entre muitas outras. Todas as opes do comando Options... sero estudas detalhadamente mais adiante. Figura I-4: O menu Edit

Pelo menu View (ver figura I-5) voc escolhe como sero mostrados os dados na janela Data Editor (usando as opes Fonts..., Grid Lines e Value Labels). Por esse menu tambm possvel disponibilizar ou no atravs da opo Status Bar, a barra inferior, chamada de barra de status, que contm algumas mensagens importantes sobre o SPSS. E finalmente, atravs da opo Toolbars... voc pode customizar a(s) barra(s) de ferramentas, podendo inclusive, criar uma barra totalmente nova. Figura I-5: O menu View

O menu Data (ver figura I-6) traz funes relacionadas manipulao dos dados. Comandos como definio de datas, ordenao do banco de dados, juno de arquivos em formato SPSS, 7

seleo de casos do arquivo de dados para trabalho, ponderao de valores, etc, fazem parte das opes desse menu. Figura I-6: O menu Data

A etapa de transformao dos dados concentra-se basicamente no menu Transform. Recursos como criao de novas variveis a partir das j existentes, recodificao de valores do banco de dados e at mesmo interpolao de valores ausentes em uma srie temporal so algumas das opes desse menu (ver figura I-7). Figura I-7: O menu Transform

8

O menu Analyze (ver figura I-8) rene todos os procedimentos estatsticos disponveis no SPSS. Este o principal menu que sofre alteraes com a incluso de outros mdulos. medida que so includos mdulos opcionais, o nmero de opes (linhas) existentes nesse menu vai aumentando, ou seja, a quantidade de recursos estatsticos vai se tornando cada vez maior e o seu SPSS cada vez mais poderoso. Figura I-8: O menu Analyze

O menu Graphs (ver figura I-9) contm todos os tipos de grficos que o SPSS oferece. Grficos de sequncia, barras, pizza, boxplot, pareto e cartas de controle so apenas alguns deles. Nesse menu temos a opo de construir grficos interativos e caso voc tenha o mdulo Maps, possvel a construo de mapas no SPSS. Figura I-9: O menu Graphs

9

O menu Utilities (ver figura I-10) oferece recursos que no so imprescindveis, mas certamente quebram alguns galhos. O comando Variables abre uma janela com informaes sobre as variveis do seu arquivo. Clicando no comando Menu Editor... voc pode customizar os menus do SPSS, criando at mesmo um menu totalmente novo. O principal comando nesse menu o Run Script..., onde podemos escolher algum script do SPSS para ser executado (scripts so programas em Visual Basic que veremos adiante). Figura I-10: O menu Utilities

Atravs do menu Window (ver figura I-11) voc pode navegar pelas janelas criadas pelo SPSS, bastando escolher a janela desejada e clicar em seu nome. Voc tambm pode minimizar o SPSS com todas as suas janelas atravs do comando Minimize All Windows. Figura I-11: O menu Window

O ltimo menu que aparece o Help (ver figura I-12). A ajuda no SPSS um dos pontos fortes desse programa, j que ela muito mais do que uma cpia do manual. Quando clicamos em Help, o comando Topics lhe d a chance de escolher entre esclarecimentos do significado de algum termo tcnico ou de algum comando e um ndice remissivo. 10

Um tutorial do SPSS est disponvel atravs do comando Tutorial. Com ele voc pode obter detalhadamente informaes bsicas do uso do SPSS. O comando SPSS Home Page abre automaticamente a pgina da SPSS norte-americana na Internet. O comando Statistics Coach funciona como um tcnico estatstico. Ele ir fazer a voc algumas perguntas sobre seus dados e o tipo de anlise que voc gostaria de obter, e ento, baseado nas suas respostas, ele indicar o procedimento do SPSS mais apropriado para o seu caso. Figura I-12: O menu Help

Exemplo de Questionrio de Entrada de DadosEste um exemplo de um questionrio que facilita a entrada de dados pelo digitador, pois, nos campos ao lado, ele possui todas as informaes necessrias a serem digitadas. Depois do questionrio preenchido por todos os entrevistados, inicia-se a entrada dos dados.

11

II. Sobre o Banco de Dados1. Como criar seu prprio banco de dados O SPSS tem por regra geral trabalhar com as variveis (campos) definidas em colunas e casos (registros) em linhas. O SPSS identifica/representa as variveis de trs formas diferentes: Numricas: so variveis cujos dados utilizam nmeros. As variveis com formato data e hora so tambm consideradas numricas, por serem armazenadas internamente em nmero de segundos. As variveis so identificadas pelo smbolo . Ex: Varivel string curta: uma varivel com dados alfanumricos com at 8 caracteres. As variveis so identificadas pelo smbolo . Ex: Varivel string longa: seus dados contm mais de 8 caracteres. Nem todos os procedimentos se aplicam a este tipo de varivel. As variveis so identificadas pelo smbolo . Ex: Para definir uma varivel, clique duas vezes no nome da varivel no topo da coluna ou na parte inferior da janela de dados clique em Variable View. Dessa maneira o modo de definio de variveis ser exibido na janela de dados. Nesse modo temos a opo de definir todas as caractersticas que fazem parte de uma varivel: nome, tipo, rtulos, valores ausentes, formato da coluna e o nvel de medida (ver figura II-1). Figura II-1: Modo de definio de variveis

Para dar nome varivel, basta digit-lo no espao designado por Name. O nome da varivel pode ter no mximo 64 caracteres e deve ser iniciado com uma letra. No pode ter espao em branco e nem caracteres especiais, como!, ? , *, &, \, etc. Porm podemos acentuar. O nome da varivel no pode ser repetido dentro do mesmo banco de dados.

12

Tomemos como exemplo o questionrio mostrado como Exemplo de Questionrio de Entrada de Dados. Neste questionrio temos uma pergunta sobre a cidade em que mora o entrevistado. No nosso caso daremos o nome Cidade para esta varivel (ver figura II-2). Figura II-2: Definio de variveis: Nome

Para alterarmos o tipo de uma varivel, basta clicar em Type, onde podemos definir a varivel como numrica (numeric), moeda (dollar), data (date), alfanumrica (string), entre outros tipos. No questionrio exemplo, a varivel cidade assume os seguintes valores: 1 que corresponde cidade do Rio de Janeiro, 2 a So Paulo e 3 a Bahia. Portanto a varivel Cidade ser definida como numrica. Nessa janela ainda podemos especificar quantos caracteres a varivel ocupa (em Width) e o nmero de casas decimais (em Decimals Places). Para a varivel Cidade, vamos deixar 8 em Width e 0 em Decimals Places (dado que s usamos os nmeros 1, 2 e 3 e no precisamos usar casas decimais) e clicar em OK (ver figura II-3). Figura II-3: Definio de variveis: Tipo, Tamanho e Casas Decimais

Voc pode estar se perguntando: por que no definir a varivel cidade como alfanumrica (string) e digitar Rio de Janeiro, So Paulo e Bahia, ao invs dos nmeros 1, 2 e 3? A resposta simples, muitos dos procedimentos estatsticos no conseguem trabalhar com variveis do tipo string, diminui-se o tempo e a ocorrncia de erros durante a digitao e tambm economizamos espao e conseqentemente o tempo no processamento dos dados. Um recurso muito til no SPSS a possibilidade de relacionarmos um texto (rtulo) ao nome das variveis. Basta selecionar a coluna Label e digitar o texto desejado. Vamos colocar Cidade em que mora o entrevistado como rtulo da varivel cidade. 13

Podemos tambm definir rtulos para os valores que uma determinada varivel pode assumir. A coluna Values reservada para esse tipo de definio. Clique no boto que aparece ao selecionarmos essa coluna e no espao Value digitamos o valor que a varivel assume e em Value Label o rtulo (texto) para aquele valor. Feito isso basta clicar Add para armazenar o rtulo do primeiro valor e passar para a segunda definio. No caso da varivel cidade definimos Rio de Janeiro como rtulo para o valor 1, So Paulo para o valor 2 e Bahia para o valor 3 (ver figura II-4). Figura II-4: Definio de variveis: Rtulos para os valores

A vantagem de definirmos rtulos para variveis ou para os valores que uma varivel pode assumir que toda vez, que pedimos qualquer estatstica envolvendo essas variveis, eles aparecero junto com os resultados na janela de sadas (ver figura II-5). Dessa maneira poderemos identificar qual a cidade referente a cada nmero (cdigo). Figura II-5: Frequncia para a varivel cidade

Quando no h resposta para uma determinada questo, considera-se este dado um valor missing. Geralmente no temos condies de obter um banco de dados totalmente completo. Vamos supor que uma das perguntas da pesquisa a idade do respondente e algumas pessoas no gostam de mencionar a idade. Se nada for informado ao SPSS, como padro, a opo No missing values usada. Nesse caso basta deixar em branco o espao reservado informao que falta e o SPSS coloca o separador decimal (. ou ,) no local e interpreta todos os pontos (ou vrgulas) como valores ausentes (missing). Podemos, porm, querer definir valores especficos como valores ausentes. Nesse caso basta selecionar a coluna Missing, clicar no boto que aparecer e escolher a opo mais conveniente (ver figura II-6). Por exemplo, se escolhermos a opo Discrete missing values podemos definir o nmero 9 como valor missing e cada vez que o SPSS encontrar o nmero 9 no meio de uma anlise estatstica que envolve essa varivel ele saber que aquele valor se refere a um valor ausente.

14

Figura II-6: Definio de variveis: Missing Values

Em resumo, para o SPSS existem dois tipos de valores missing: missing do sistema: so as clulas no preenchidas no arquivo de dados, representadas por um ponto ou uma vrgula. missing definidas pelo usurio: pode-se definir qualquer tipo de valor como missing em uma determinada varivel. Na varivel do nosso exemplo, o valor 9.

Na questo Qual a marca de cigarro de sua preferncia?, do nosso questionrio exemplo, aparece dois tipos diferentes de valores que sero considerados missing: No Respondeu (NR) e o No se Aplica (NA), pois o entrevistado poderia ser no fumante e, portanto no necessitava responder a questo (NA) ou ter deixado a questo sem resposta (NR). Para os procedimentos estatsticos do SPSS, os missing so tratados de forma diferenciada, como no exemplo da tabela de freqncia abaixo:Marca de cigarro de sua preferncia Valid Percent 25,0 25,0 12,5 18,8 18,8 100,0 Cumulativ e Percent 25,0 50,0 62,5 81,3 100,0

Valid

Missing

Marca A Marca B Marca C Outras marcas Nenhuma marca Total NA NR Total

Total

Frequency 4 4 2 3 3 16 7 2 9 25

Percent 16,0 16,0 8,0 12,0 12,0 64,0 28,0 8,0 36,0 100,0

A definio do formato da coluna um aspecto meramente esttico. Atravs da coluna Columns voc poder determinar a largura da coluna e na coluna Align o alinhamento do texto que pode ser: esquerda (Left), direita (Right) ou centralizado (Center). No caso da varivel cidade definiremos a largura da coluna como 12 e o alinhamento direita (ver figura II-7).

15

Figura II-7: Definio de variveis: Formato da Coluna

E finalmente na coluna Measure, devemos escolher o nvel de medida da varivel. As possveis escolhas so: Escalar (Scale): usa essa opo quando os dados so valores numricos numa escala intervalar ou de razo (ex: idade, renda, peso, altura). Devem ser numricos. Ordinal: quando os dados representam categorias com uma ordem intrnseca (ex: concordo totalmente, concordo, discordo, discordo totalmente). Podem ser variveis alfanumricas (string) ou numricas com valores representando as categorias distintas (ex: 1=pequeno, 2=mdio, 3=grande). Nominal: quando os dados representam categorias sem ordem intrnseca (ex: as categorias de estado civil, ocupao, nacionalidade). Podem ser variveis alfanumricas (string) ou numricas com valores representando as categorias distintas (ex: 1=masculino, 2=feminino). No nosso caso escolhemos a opo Nominal, pois no existe ordem nas categorias de cidade. Pronto! Agora s voltar para o modo de exibio dos dados (selecionar Data View na parte inferior da janela de dados) e digitar os valores coletados, lembrando que cada caso (registro) deve ser digitado em uma linha (ver figura II-8). Desse modo o primeiro respondente de So Paulo, o segundo do Rio de Janeiro, o terceiro de So Paulo, o quarto da Bahia e assim por diante. Figura II-8: Janela de dados aps definio de uma varivel

16

Observe que no banco de dados aparecem apenas os nmeros 1, 2, 3 e 9 e no os rtulos . A Figura II-9 mostra a janela de dados (nome das cidades). Para ativ-los basta clicar no cone agora com os rtulos ativos. Para desativ-los basta clicar novamente no mesmo cone. Figura II-9: Janela de dados aps a ativao dos rtulos

2. Criando vrias variveis com as mesmas caractersticas Suponha que agora voc tenha que definir as perguntas abaixo, que esto no questionrio exemplo, no SPSS. Note que elas tm as mesmas opes de resposta: 1) Qual a marca de cigarro de sua preferncia? 2) Qual a marca de cigarro que mais chama sua ateno? 3) Que marca de cigarro produz o comercial que mais lhe atrai? Respostas possveis: 1 - Marca A 2 - Marca B 3 - Marca C 4 - Outras Marcas 5 - Nenhuma 8 - NA 9 - NR Usando os conhecimentos adquiridos at agora definiremos trs variveis, uma para cada pergunta. Para cada uma delas ser definido tipo, rtulos, valores ausentes, formato da coluna e nvel de medida. Todas as definies sero exatamente iguais nas trs variveis. Portanto seria desejvel definir apenas uma vez as caractersticas das variveis e atravs de algum mecanismo poder relacion-las a todas as variveis de uma s vez. Podemos fazer isso no modo de definio de variveis usando os comandos Copy e Paste Variables. Para comear vamos definir uma das variveis. Para a primeira pergunta daremos varivel o nome Cigarro1. Vamos defini-la como: numrica de tamanho 8 e sem nenhuma casa decimal; rtulos dos valores sendo 1 - Marca A, 2 - Marca B, 3 - Marca C, 4 - Outras Marcas, 5 Nenhuma, 8 - NA, 9 - NR; dados ausentes 9; largura da coluna 10 e o nvel de medida nominal (ver figura II-10).

17

Figura II-10: Definio da varivel cigarro1

O prximo passo simples: selecione a varivel Cigarro1 na janela de dados (modo de definio de variveis) clicando no nmero da varivel (2 no nosso caso), selecione o comando Copy no menu Edit, depois selecione uma linha vazia (3 no nosso caso) e selecione o comando Paste Variables do menu Edit. Na janela aberta (ver figura II-11) voc escolhe quantas variveis sero criadas a partir da varivel copiada e nome delas. No nosso caso escolha 2 para a opo Number of new variables, pois queremos criar as variveis Cigarro2 e Cigarro3. Na opo New variables names digite cigarro e escolha 2 (lembre-se que j existe uma varivel chamada cigarro1) e clique em OK. Figura II-11: Criando novas variveis a partir de uma j existente

A figura II-12 mostra a janela de definio de variveis (Variable View) com as variveis criadas. Figura II-12: Criando novas variveis a partir de uma j existente

18

Para colocar ttulos nas variveis criadas basta clicar no campo da coluna Label onde est a varivel e digitar o ttulo que desejar. No nosso caso os ttulos seriam: cigarro1 - Qual a marca de cigarro da sua preferncia?, cigarro2 - Qual a marca de cigarro que mais chama a sua ateno? e cigarro3 Que marca de cigarro produz o comercial que mais lhe atrai? Os dados podem ser armazenados sob diversos formatos, tenha sido gerado atravs do SPSS ou de qualquer outro aplicativo. Para isso basta abrir o menu File e escolher o comando Save ou Save As.... Aparece ento uma tela (ver figura II-13) onde no quadro Salvar em especificamos o disco e o subdiretrio, no quadro Nome do arquivo especificamos o nome do arquivo e no quadro Salvar como tipo especificamos a forma sob a qual o arquivo deve ser salvo. O padro o formato SPSS (extenso .sav). Figura II-13: Janela para salvar arquivos de dados

3. Definindo propriedades de variveis categricas No menu Data temos a opo Define Variables Properties que facilitar a definio dos rtulos dos valores e outras propriedades das variveis categricas (nominais e ordinais). Esse comando faz a leitura dos valores atuais dos dados e lista todos os nicos valores para cada varivel selecionada; identifica valores que esto sem rtulo e promove uma rotulao automtica e ainda pode copiar os rtulos dos valores de uma varivel para uma ou mais variveis selecionadas. Abra o menu Data e selecione o comando Define Variable Properties, ser aberta uma janela (ver figura II-14) onde no quadro Variables so mostradas as variveis do banco de dados. Selecione as variveis que queremos definir algum rtulo e/ou outras propriedades e clique na seta ao lado para coloc-las no quadro Variables to Scan. Em banco de dados com uma grande quantidade de casos podemos selecionar a opo Limit number of cases scanned to para limitar em n casos o nmero de casos que sero lidos em cada varivel, reduzindo assim o tempo de processamento. A opo Limit number of values displayed to ser usada para limitar em n respostas o nmero de valores que sero mostrados para cada varivel evitando a presena de muitos valores principalmente no caso de variveis escalares. Clique em Continue. 19

Figura II-14: Janela para a escolha das variveis que sero lidas

Na nova janela aberta (ver figura II-15) teremos todas as variveis que foram escolhidas e suas respectivas propriedades. Figura II-15: Janela para definir as propriedades das variveis

Na lista de variveis mostradas no quadro Scanned Variables List selecione a varivel trabalha. O nvel de medida para essa varivel escalar, ns podemos mudar esse nvel de medida selecionando uma das opes (nominal, ordinal, escalar) presentes no quadro Measurement Level ou clicando na opo Suggest (ver figura II-16), onde podemos alterar o nvel de medida da varivel selecionada segunda a sugesto apresentada pelo SPSS de acordo com os valores encontrados na varivel. Clique em Suggest, escolha a opo Ordinal e em seguida clique em Continue. O nvel de medida agora para a varivel ordinal. 20

Figura II-16: Janela para sugerir o nvel de medida

No quadro Value Label Grid da janela Define Variable Properties (ver figura II-17) podemos adicionar novos valores e rtulos ou alterar os j existentes, visualizar a frequncia de cada valor e definir qual valor ser missing. Qualquer valor que sofra alguma alterao nessa janela ficar marcado como Changed. Ainda com a varivel trabalha selecionada vamos fazer algumas alteraes para o valor 9. No item Label (rtulo) escreveremos NR e no item Missing clicaremos no quadrado referente ao valor 9. Dessa maneira estamos definindo que sempre que o SPSS encontrar o valor 9 na varivel trabalha ele ser tratado como um valor ausente ou valor missing. Figura II-17: Janela para definir as propriedades das variveis

Podemos aplicar as mesmas definies da varivel trabalha para as outras variveis listadas. Para isso basta clicar na opo To Other Variables do quadro Copy Properties que a janela Apply Labels and Level to ser aberta (ver II-18). No quadro Variables selecione as variveis que desejar e clique na opo Copy.

21

Figura II-18: Janela Apply Labels and Level to

Uma outra opo muito til para ajud-lo na definio das caractersticas de suas variveis o comando Copy Data Properties do menu Data. Ao escolher esse comando ser aberta uma janela para voc escolher um arquivo no formato SPSS (.sav), chamado de arquivo modelo. Aps a escolha, o SPSS compara os nomes das variveis do arquivo ativo com as do arquivo modelo e para aquelas variveis que tiverem o mesmo nome, ele copia todas as definies dessas variveis (como tipo, rtulo, valores ausentes, etc) do arquivo modelo para o arquivo ativo. Esse comando substitui o antigo comando Apply Data Dictionary. 4. Formas de importao e exportao de dados O SPSS tem capacidade para importar bancos de dados gerados nos mais diversos formatos, entre eles Lotus 123, Excel, Dbase e ASCII. Para ter acesso aos diferentes formatos de banco de dados basta abrir o menu File, clicar no comando Open... e escolher a opo Data. Aparece ento uma tela (ver figura II-19) onde no quadro Examinar especificamos o disco e o subdiretrio, no quadro Nome do arquivo especificamos o nome do arquivo e no quadro Arquivos do tipo especificamos a forma sob a qual o arquivo foi gerado. O padro o formato SPSS (extenso .sav). Figura II-19: Janela para abertura de banco de dados

22

5. Importao de arquivos de dados do tipo Excel ou Lotus Antes de iniciar a importao de um arquivo precisamos observar como os dados se encontram no original do Excel (ver figura II-20). Figura II-20: Arquivo cigarros.xls no Excel

Notamos que o banco de dados contm no apenas nmeros, mas tambm ttulo, linhas em branco e o nome das variveis. Precisamos ento ter um certo cuidado na importao, pois, o SPSS s consegue ler o nome das variveis e os valores das mesmas. Ttulos, comentrios, grficos ou frmulas presentes no arquivo no podem ser importados. Uma possvel soluo anotarmos as coordenadas dos cantos superior esquerdo e inferior direito da matriz onde o nome das variveis e os dados esto efetivamente situados. No exemplo da figura II-15, teramos como coordenadas A4 e L16. Para importar esse arquivo de dados no SPSS, basta abrir o menu File, clicar no comando Open... e escolher a opo Data. Aparece ento uma tela (ver figura II-21) onde no quadro Examinar especificamos o disco e o subdiretrio onde est o arquivo excel. No quadro Arquivos do tipo especificamos o tipo do arquivo, que no nosso caso Excel (*.xls). E no quadro Nome do arquivo digitamos o nome do arquivo a ser importado, que no nosso caso Cigarros.xls. Nota: o arquivo excel, a ser importado, tem que estar fechado. Figura II-21: Janela para importao do arquivo excel Cigarros.xls

23

Ao clicar em Abrir, ser aberta uma janela de nome Open Excel Data Source (ver figura II - 22). No quadro Worksheet devemos especificar a planilha (arquivo excel) a ser lida. Alm disso, como o nosso arquivo excel contm o nome das variveis, devemos selecionar a opo Read variable names from the first row of data e no quadro Range devemos especificar a faixa de valores que deve ser lida, no nosso caso A4:L16. Agora s clicar OK e pronto! Figura II-22: Opes para abertura de arquivos em formato Excel

Observaes: 1 Caso o arquivo Excel estivesse limpo, isto , com os dados comeando na clula A1, no seria necessrio entrar com as coordenadas em Range e precisaramos apenas especificar se a primeira linha contm ou no o nome das variveis (em Read variable names from the first row of data). 2 Para leitura no formato Lotus o procedimento exatamente o mesmo com duas excees: no quadro Arquivos do tipo escolhemos a opo Lotus (*.w*) e no quadro Range ao invs da especificao A4:L16, usaramos A4..L16. Quando o arquivo importado do Excel ou Lotus aparece na tela de dados do SPSS, observe que o seu ttulo continua sendo Untitled (ver figura II-23). Somente a partir do momento em que salvamos no formato SPSS que o ttulo da janela de dados passa a ser o nome escolhido para o arquivo. Figura II-23: Janela de dados do SPSS aps importao do arquivo Excel

24

6. Lendo Bancos de Dados Usando ODBC J vimos anteriormente como ler arquivos de dados do Excel e usamos vrios arquivos no formato do SPSS (*.sav). Porm, muitas vezes nossos dados esto localizados em bases com as quais o SPSS no consegue se comunicar diretamente. Assim, para que possamos trabalhar com esses dados, o SPSS usa ODBC. Vamos capturar os dados de um banco do Access para exemplificar o uso de ODBC no SPSS. Para iniciar, voc deve escolher, no menu File, o comando Open Database e a opo New Query, uma janela ser aberta (ver figura II-24). Figura II-24: Janela para escolher o tipo de banco de dados a ser aberto

Nessa janela sero mostrados todos os bancos de dados configurados no seu computador (dica: voc pode configurar um novo banco de dados clicando na opo Add Data Source). Escolha a opo e clique em Avanar ou Next. O passo seguinte localizar o arquivo, para isso clique na opo Browse. Aps localizar o arquivo clique em OK.

No nosso exemplo, vamos escolher um banco de dados do Ms Access. Na janela aberta (ver figura II-25), selecionar a(s) tabela(s) a ser(em) lida(s) e arrast-la(s) para o quadro Retrieve Fields in This Order. Se voc clicar no + do lado do nome da a tabela, voc poder selecionar apenas um conjunto de variveis (campos) originais da(s) sua(s) tabela(s).

25

Figura II-25: Selecionando as tabelas a serem lidas

Caso voc escolha mais de uma tabela, o prximo passo selecionar a relao entre essas tabelas. A figura II - 26 mostra nosso exemplo onde a varivel nquest especificada como varivel chave (ou seja, aquela que identificar os casos para que eles possam ser corretamente unidos). Para especificar uma relao entre as tabelas, basta arrastar com o mouse uma varivel de uma tabela at a varivel correspondente (que no precisa, necessariamente ter o mesmo nome) na outra tabela. Voc pode ter mais de uma relao entre as tabelas. Figura II-26: Especificando relaes entre as tabelas

Clicando em Avanar, chega-se no quadro onde podemos limitar os casos a serem lidos. A limitao geralmente consiste em preencher o quadro Criteria com dois ou mais critrios. Um critrio consiste de duas expresses e uma relao entre elas. As limitaes podem retornar um dos valores: verdadeiro, falso ou ausente para cada caso. Se o resultado verdadeiro, o caso selecionado. Se for falso ou ausente, o caso no selecionado. 26

A maioria dos critrios usa um ou mais dos seis operadores relacionados (,=,= e ). As expresses podem incluir nomes de campos, constantes, operadores aritmticos, funes e variveis lgicas. Nessas expresses, voc pode usar campos que no pretende importar como varivel. A figura II-27 mostra um exemplo para o nosso arquivo onde importaramos apenas os casos do sexo masculino e que estudassem. Figura II-27: Selecionando casos a serem importados

Pode-se utilizar a opo Prompt For Value para criar uma caixa de dilogo que solicite informaes ao usurio cada vez que voc rodar a consulta. Ele til quando quiser usar a mesma fonte de dados usando diferentes critrios. A figura II-28 mostra um exemplo onde a cada vez que a consulta fosse rodada, o SPSS perguntaria qual o estado civil que voc quer utilizar. Vamos preencher o quadro Promp For Value para que aparea a pergunta Qual estado civil voc quer analisar? e para limitar as possveis respostas a 1, 2, 3, 4, 5 e 6 (que so os cdigos vlidos das categorias de estado civil no banco de dados). Na opo Use random sampling podemos selecionar uma amostra baseada no percentual aproximado ou no nmero exato de casos. Figura II-28: Usando a opo Prompt For Value

27

Aps clicar em Avanar, entraremos na janela de definies de nomes (ver figura II-29). O nome completo do campo ser usado como rtulo da varivel e na coluna Result Variable Name pode-se especificar o nome da varivel no SPSS. Na coluna Value Labels, pode-se optar por transformar automaticamente uma varivel string em varivel numrica. Figura II-29: Definindo os nomes das variveis

O ltimo passo aps clicar em Avanar escolher se o SPSS deve ler os dados selecionados (Retrieve the data I have selected) ou copiar a sintaxe criada em uma janela de programao (Paste it into the syntax editor for further modification). Note que nessa janela (ver figura II-30) voc pode escolher salvar essa consulta para uso futuro, preenchendo o quadro Save query to file (use a opo Browse para escolher um diretrio). Vamos escolher a opo de ler os dados selecionados e escolher um arquivo para salvar a consulta e clicar em Concluir. Figura II-30: Gravando a consulta para uso futuro

28

Ao clicarmos em Concluir, o resultado da leitura dos dados colocado em uma janela de dados nova do SPSS DATA EDITOR e dever ser salvo (ver figura II-31). Note que poderamos ter clicado em Concluir na janela da figura II-26, caso no houvesse a necessidade de modificar nenhuma das janelas seguintes. Figura II-31: Resultado da leitura de um banco de dados via ODBC

No comando Open Data Base temos mais duas opes: Edit Query permite que voc edite uma consulta j salva anteriormente e execute-a ou salve-a com as modificaes. Run Query permite que voc execute uma consulta j salva (muito til em conjunto com a opo de solicitar um valor para o usurio preencher). Experimente executar novamente nossa consulta criada acima, escolhendo um novo estado civil a ser analisado.

III.

Transformao de Dados

1. Clculo de novas variveis usando o procedimento Compute Vamos agora estudar um recurso de transformao de dados: a criao de uma nova varivel como funo de variveis j existentes. Para isso basta entrar no menu Transform e escolher o comando Compute. A janela Compute Variable aberta (ver figura III-1). No canto esquerdo, dessa janela, temos uma lista com todas as variveis existentes no banco de dados que podem ser usadas para o clculo da nova varivel. No quadro Target Variable, digitamos o nome da varivel a ser criada. No quadro Numeric Expression devemos escrever a funo (envolvendo as variveis j existentes no arquivo) que permitir o clculo da nova varivel. Para enviar uma varivel existente na lista para o quadro Numeric Expression, basta selecion-la e clicar na seta ao lado. Na rea central existe uma srie de botes que contm desde funes matemticas (+, -, *, /, etc) at funes lgicas (&, ~, etc). No quadro Functions, existe um vasto conjunto de funes, desde soma, multiplicao, arco-tangente, logaritmo neperiano, entre outras, que tambm podem ser usadas na construo da expresso numrica. 29

No nosso caso temos a varivel Anonasc e o nosso interesse investigar qual a idade dos entrevistados. Atravs da expresso: 2005 Anonasc, criaremos a varivel Idade, a qual conter a informao desejada. possvel, ainda, aplicar esta transformao somente a um subconjunto de dados especificados atravs da expresso condicional criada com a opo IF. Depois de tudo pronto, clicamos em OK e a nova varivel ser adicionada janela de dados do SPSS. Figura III-1: Criao da varivel Idade atravs do Comando Compute

2. Recodificao usando o procedimento Visual Bander Nem sempre os dados da forma como foram digitados, atendem s nossas necessidades. s vezes necessrio transformar esses dados, criando novas variveis a partir de variveis antigas, alterando os rtulos de seus itens, etc. Para estas transformaes, diversos procedimentos esto disponveis no SPSS. Utilizaremos aqui um recurso muitas vezes necessrio que antecede a anlise estatstica propriamente dita. A recodificao de variveis pode ser usada, entre outras coisas, para criar faixas de valores baseados em variveis j existentes. Um exemplo tpico ter interesse em estudar a faixa etria das pessoas em um estudo onde a informao disponvel originalmente a idade. No nosso exemplo criaremos uma varivel representando a faixa etria a partir da varivel idade. Nossa idia construir tal varivel de acordo com a seguinte diviso de faixas: Valores atuais (Idade) Valores Futuros (Faixa Etria)