Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

Embed Size (px)

Citation preview

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    1/281

    Universidade de Sao Paulo

    Instituto de Matem atica e Estatstica

    Elementos de Amostragem

    Heleno Bolfarine e Wilton O. Bussab

    Maio, 2004

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    2/281

    ii

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    3/281

    Conte udo

    1 No coes basicas 1

    1.1 Palavras-chave . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Guia para um levantamento amostral . . . . . . . . . . . . . . . . . . 21.3 O que se pretende conhecer? . . . . . . . . . . . . . . . . . . . . . . . 3

    1.3.1 Qual a quest ao a ser respondida? . . . . . . . . . . . . . . . . 31.3.2 A operacionaliza cao dos conceitos . . . . . . . . . . . . . . . 41.3.3 Vari aveis e atributos . . . . . . . . . . . . . . . . . . . . . . . 51.3.4 Especica cao dos par ametros . . . . . . . . . . . . . . . . . . 5

    1.4 De quem se est a falando . . . . . . . . . . . . . . . . . . . . . . . . . 61.4.1 Unidade elementar, amostral e resposta . . . . . . . . . . . . 6

    1.4.2 As diversas popula coes possveis . . . . . . . . . . . . . . . . 71.5 Como obter os dados? . . . . . . . . . . . . . . . . . . . . . . . . . . 11

    1.5.1 Tipos de investigacao . . . . . . . . . . . . . . . . . . . . . . 111.5.2 Metodos de coleta de dados . . . . . . . . . . . . . . . . . . . 121.5.3 Planejamento e selecao da amostra . . . . . . . . . . . . . . . 141.5.4 Tipos b asicos de amostras . . . . . . . . . . . . . . . . . . . . 151.5.5 Classica cao de amostras probabilsticas . . . . . . . . . . . . 161.5.6 Estimadores e erros amostrais . . . . . . . . . . . . . . . . . . 191.5.7 Tamanho da amostra . . . . . . . . . . . . . . . . . . . . . . . 21

    1.5.8 Censo ou amostragem . . . . . . . . . . . . . . . . . . . . . . 221.6 Coleta dos dados (trabalho de campo) . . . . . . . . . . . . . . . . . 221.7 Preparacao dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . 251.8 Analises estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.9 Erros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    1.9.1 Erros amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . 291.9.2 Erros n ao amostrais . . . . . . . . . . . . . . . . . . . . . . . 29

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    4/281

    iv CONTE UDO

    1.10 Apresentacao dos resultados . . . . . . . . . . . . . . . . . . . . . . . 31

    1.11 Divulga cao do banco de dados (disponibilidade) . . . . . . . . . . . . 32Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

    2 Denicoes e nota coes basicas 372.1 Popula cao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.2 Amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.3 Planejamento amostral . . . . . . . . . . . . . . . . . . . . . . . . . . 422.4 Estatsticas e distribui coes amostrais . . . . . . . . . . . . . . . . . . 472.5 Estimadores e suas propriedades . . . . . . . . . . . . . . . . . . . . 52

    2.6 Express oes uteis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    Teoricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    3 Amostragem aleat oria simples 613.1 Denicoes e nota coes . . . . . . . . . . . . . . . . . . . . . . . . . . . 613.2 Amostragem aleatoria simples com reposi cao . . . . . . . . . . . . . 62

    3.2.1 Propriedades da estatstica t(s) . . . . . . . . . . . . . . . . . 653.2.2 Estima cao do total e da media populacional . . . . . . . . . . 653.2.3 Estima cao da vari ancia populacional . . . . . . . . . . . . . . 663.2.4 Normalidade assint otica e intervalos de conan ca . . . . . . . 683.2.5 Determinacao do tamanho da amostra . . . . . . . . . . . . . 693.2.6 Estima cao de propor coes . . . . . . . . . . . . . . . . . . . . 713.2.7 Otimalidade de y na AASc . . . . . . . . . . . . . . . . . . . 73

    3.3 Amostragem aleatoria simples sem reposi cao . . . . . . . . . . . . . 743.3.1 Propriedades da estatstica t(s) . . . . . . . . . . . . . . . . . 753.3.2 Estima cao do total e da media populacional . . . . . . . . . . 763.3.3 Estima cao da vari ancia populacional . . . . . . . . . . . . . . 763.3.4 Normalidade assint otica e intervalos de conan ca . . . . . . . 783.3.5 Determinacao do tamanho da amostra . . . . . . . . . . . . . 793.3.6 Estima cao de propor coes . . . . . . . . . . . . . . . . . . . . 803.3.7 Otimalidade de y na AASs . . . . . . . . . . . . . . . . . . . 82

    3.4 Compara cao entre AASc e AASs . . . . . . . . . . . . . . . . . . . . 82Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

    Teoricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    5/281

    CONTE UDO v

    4 Amostragem estraticada 93

    4.1 Notacao e relacoes uteis . . . . . . . . . . . . . . . . . . . . . . . . . 964.2 Estima cao do total e da media populacional . . . . . . . . . . . . . . 1004.3 Alocacao da amostra pelos estratos . . . . . . . . . . . . . . . . . . . 101

    4.3.1 Alocacao proporcional . . . . . . . . . . . . . . . . . . . . . . 1024.3.2 Alocacao uniforme . . . . . . . . . . . . . . . . . . . . . . . . 1034.3.3 Alocacao otima de Neyman . . . . . . . . . . . . . . . . . . . 1044.3.4 Efeito do planejamento . . . . . . . . . . . . . . . . . . . . . 106

    4.4 Normalidade assintotica e intervalos de conan ca . . . . . . . . . . . 1094.5 Determinacao do tamanho da amostra . . . . . . . . . . . . . . . . . 109

    4.6 Estima cao de propor coes . . . . . . . . . . . . . . . . . . . . . . . . . 110Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112Teoricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

    5 Estimadores do tipo razao 1275.1 Estima cao da raz ao, do total e da media populacional com AAS . . 1285.2 Estima cao da vari ancia populacional . . . . . . . . . . . . . . . . . . 1335.3 Comparacao entre os estimadores raz ao e expans ao . . . . . . . . . . 1335.4 Normalidade assintotica e intervalos de conan ca . . . . . . . . . . . 1355.5 Determinacao do tamanho da amostra . . . . . . . . . . . . . . . . . 135

    5.6 Estima cao do total e da media populacional com AE . . . . . . . . . 136Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

    Teoricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

    6 Estimadores do tipo regressao 1456.1 Estima cao do total e da media populacional com AAS . . . . . . . . 1466.2 Comparacao entre os estimadores regress ao e razao . . . . . . . . . . 1496.3 Normalidade assintotica e intervalos de conan ca . . . . . . . . . . . 1506.4 Determinacao do tamanho da amostra . . . . . . . . . . . . . . . . . 1516.5 Estima cao da media populacional com AE . . . . . . . . . . . . . . . 151Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

    Teoricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

    7 Amostragem por conglomerados em um estagio 1597.1 Notacao e relacoes uteis . . . . . . . . . . . . . . . . . . . . . . . . . 1627.2 Plano amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1667.3 Estimadores da media por elemento . . . . . . . . . . . . . . . . . . 167

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    6/281

    vi CONTE UDO

    7.4 Coecientes de correla cao intraclasse . . . . . . . . . . . . . . . . . . 172

    7.4.1 Conglomerados de igual tamanho . . . . . . . . . . . . . . . . 1747.4.2 Conglomerados de tamanhos desiguais . . . . . . . . . . . . . 177

    7.5 Estima cao de propor coes . . . . . . . . . . . . . . . . . . . . . . . . . 1797.6 Normalidade assintotica e intervalos de conan ca . . . . . . . . . . . 1807.7 Determinacao do tamanho da amostra . . . . . . . . . . . . . . . . . 1807.8 Amostragem sistematica . . . . . . . . . . . . . . . . . . . . . . . . . 181

    7.8.1 Relacoes com a AC . . . . . . . . . . . . . . . . . . . . . . . . 182Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

    Teoricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

    8 Amostragem em dois estagios 1978.1 Nota cao e plano amostral . . . . . . . . . . . . . . . . . . . . . . . . 2018.2 Estimadores da media por elemento . . . . . . . . . . . . . . . . . . 201

    8.2.1 N conhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . 2018.2.2 Estimador razao . . . . . . . . . . . . . . . . . . . . . . . . . 2078.2.3 Media simples . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

    8.3 Conglomerados de igual tamanho . . . . . . . . . . . . . . . . . . . . 2108.3.1 Estimador para a media por elemento . . . . . . . . . . . . . 2108.3.2 Uso da correla cao intraclasse . . . . . . . . . . . . . . . . . . 2118.3.3 Eciencia do plano amostral em dois est agios . . . . . . . . . 2128.3.4 Tamanho otimo de b . . . . . . . . . . . . . . . . . . . . . . . 213

    Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214Teoricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

    9 Estima cao com probabilidades desiguais 2259.1 Caso geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2269.2 Amostragem por conglomerados . . . . . . . . . . . . . . . . . . . . . 2309.3 Estimador razao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2319.4 Amostragem em dois est agios . . . . . . . . . . . . . . . . . . . . . . 2319.5 O estimador de HorwitzThompson . . . . . . . . . . . . . . . . . . 2329.6 Amostragem de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . 235Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

    Teoricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    7/281

    CONTE UDO vii

    10 Resultados assint oticos 239

    10.1 Estimador media amostral . . . . . . . . . . . . . . . . . . . . . . . . 23910.2 Estimador razao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24110.3 Estimador regressao . . . . . . . . . . . . . . . . . . . . . . . . . . . 24310.4 Amostragem por conglomerados . . . . . . . . . . . . . . . . . . . . . 24410.5 Ilustra cao numerica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245Exerccios teoricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

    11 Exerccios complementares 249

    A Rela cao de palavras-chave 261

    B Topicos para um levantamento amostral 265

    Referencias bibliogr acas 269

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    8/281

    viii CONTE UDO

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    9/281

    Lista de Figuras

    1.1 Comparacoes das popula coes alvo, referida e amostrada . . . . . . . 10

    1.2 Criterios para classicar pesquisas . . . . . . . . . . . . . . . . . . . 121.3 Criterios para classicar amostras probabilsticas . . . . . . . . . . . 17

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    10/281

    x LISTA DE FIGURAS

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    11/281

    Lista de Tabelas

    1.1 Tipos de amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    2.1 Popula cao de tres domiclios . . . . . . . . . . . . . . . . . . . . . . . 392.2 Distribui cao amostral de r na AASc . . . . . . . . . . . . . . . . . . 492.3 Distribui cao amostral de r na AASs . . . . . . . . . . . . . . . . . . 492.4 Distribui cao amostral de f na AASc . . . . . . . . . . . . . . . . . . 512.5 Distribui coes amostrais de f 1, f 2, f 3, 1, 2, 3 na AASc . . . . . . . 512.6 Distribui cao de f 1 na AASc . . . . . . . . . . . . . . . . . . . . . . . 522.7 Distribui cao de 1 na AASc . . . . . . . . . . . . . . . . . . . . . . . 522.8 Popula cao de 180 domiclios . . . . . . . . . . . . . . . . . . . . . . . 60

    3.1 Valores de y, s2

    e P (s) para as amostras s em S AASc . . . . . . . . . 673.2 Distribui cao amostral de y na AASc . . . . . . . . . . . . . . . . . . 683.3 Distribui cao amostral de s2 na AASc . . . . . . . . . . . . . . . . . . 683.4 Valores de y, s2 e P (s) para as amostras s em S AASs . . . . . . . . . 773.5 Distribui cao amostral de y na AASs . . . . . . . . . . . . . . . . . . 773.6 Distribui cao amostral de s2 na AASs . . . . . . . . . . . . . . . . . . 78

    4.1 Uma popula cao estraticada . . . . . . . . . . . . . . . . . . . . . . . 97

    5.1 Distribui coes amostrais de f , t e f R na AASc . . . . . . . . . . . . . 129

    6.1 Distribui cao amostral de f Reg na AASc . . . . . . . . . . . . . . . . 149

    7.1 Distribui cao amostral de y na AC . . . . . . . . . . . . . . . . . . . . 1617.2 Popula cao disposta em conglomerados . . . . . . . . . . . . . . . . . 1627.3 Pares possveis dentro do conglomerado . . . . . . . . . . . . . . . 1737.4 Amostras sistematicas . . . . . . . . . . . . . . . . . . . . . . . . . . 1827.5 Distribui cao de ysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    12/281

    xii LISTA DE TABELAS

    8.1 Espaco amostral e probabilidades na A2E . . . . . . . . . . . . . . . 199

    8.2 Valores de y e y2c1 na A2E . . . . . . . . . . . . . . . . . . . . . . . 200

    9.1 Tamanhos dos grupos . . . . . . . . . . . . . . . . . . . . . . . . . . 2269.2 Distribui cao de yc . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2269.3 Distribui cao amostral de ppz . . . . . . . . . . . . . . . . . . . . . . 2299.4 Distribui cao amostral de HT . . . . . . . . . . . . . . . . . . . . . . 235

    10.1 Probabilidades de coberturas estimadas (em porcentagem) . . . . . . 246

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    13/281

    Captulo 1

    No coes basicas

    A experiencia com amostragem e fato corrente no cotidiano. Basta lembrar como umcozinheiro verica o tempero de um prato que est a preparando, como alguem testaa temperatura de um prato fumegante de sopa, ou ainda como um medico detectaas condi coes de um paciente atraves de exames de sangue. Poderiam ser listadosoutros exemplos que usam procedimentos amostrais mais complicados, mas todoscom o mesmo objetivo: obter informa coes sobre o todo baseando-se no resultado deuma amostra.

    Porem, o uso inadequado de um procedimento amostral pode levar a um viesde interpreta cao do resultado. Por exemplo, n ao mexer bem a sopa antes de retiraruma colher para experimentar pode levar a subavalia cao da temperatura do pratotodo com consequencias deagrad aveis para o usu ario.

    Em estudos mais sosticados, onde as informa coes sao obtidas atraves de le-vantamentos amostrais, e comum o usu ario car t ao envolvido na apuracao e inter-preta cao dos dados que esquece de vericar possveis vieses origin arios do protocolode escolha da amostra.

    O uso de amostras que produzam resultados con aveis e livres de vieses e odesejo de todos. Entretanto, estes conceitos n ao sao triviais e precisam ser estabe-

    lecidos para o uso cientco dos processos amostrais. Desse modo, necessita-se deteoria que descreva as propriedades e impropriedades de alguns protocolos de obteramostras. Esse e o objetivo do livro: apresentar os princpios b asicos de uma Teo-ria de Amostragem. Cursos introdut orios de inferencia estatstica tambem ensinama fornecer resultados para o todo baseando-se em resultados da amostra, porem aenfase e dada para popula coes innitas, ou o que e muito mais comum, a amostra eretirada de uma distribui cao de probabilidade. Nao se discute muito como a amostra

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    14/281

    2 No coes basicas

    e obtida, garante-se apenas que as observa coes foram obtidas independentemente,

    com igual probabilidade, e retiradas de uma mesma popula cao teoricamente innita.Aqui a popula cao sera nita, e possivelmente enumer avel ou passvel de descricao.

    Neste captulo pretende-se dar uma vis ao geral das questoes envolvidas em umplano amostral e que servir a para um primeiro contato com aspectos metodol ogicosemergentes de uma pesquisa de tal natureza.

    1.1 Palavras-chave

    Toda teoria, e amostragem n ao foge a regra, necessita de um conjunto de conceitose termos tecnicos sobre a qual ela se fundamenta. Estes conceitos ir ao aparecendopelos diversos captulos conforme se tornarem necess arios. Porem, e conveniente paraunicar a linguagem e tornar mais clara a explica cao, denir alguns desses conceitos,mesmo que de forma abreviada. No Apendice A est ao listadas e descritas algumaspalavras-chave que atendem a esse objetivo. Recomendamos ao leitor consult a-losempre que tiver duvidas em rela cao a algum dos conceitos mencionados.

    1.2 Guia para um levantamento amostral

    Ao optar por uma pesquisa quantitativa, levantamento ou experimenta cao, enecessario que o pesquisador planeje, execute, corrija e analise adequadamente oprocedimento proposto e usado. Isto signica tomar uma serie de medidas e cui-dados antes da realiza cao, durante a aplica cao e depois da pesquisa efetuada. Semesses passos dicilmente pode-se garantir resultados convincentes e con aveis. Umestatstico experiente desenvolve os seus pr oprios procedimentos, escritos ou n ao,para conduzir ou orientar uma pesquisa quantitativa, mas ter a muita diculdade emtransmitir esses conhecimentos sem a pr atica e o convvio cotidiano com o aprendiz.Um dos metodos para transferir conhecimento e agilizar o treinamento nesta ativi-

    dade e atraves da apresenta cao de uma lista de topicos que devam ser abordados emuma pesquisa quantitativa, ou melhor, apresentando o chamado checklist. Estaslistas nunca sao denitivas ou completas. Em primeiro lugar elas traduzem as idios-sincrasias de seus formuladores, e em segundo, dicilmente conseguem prever todasas possveis situacoes de um mundo tao rico e complexo como as pesquisas quanti-tativas. Portanto, devem ser usadas como um guia aproximado para planejamentoe execucao de um plano amostral.

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    15/281

    1.3 O que se pretende conhecer? 3

    Apresentamos no Apendice B a nossa lista de pontos. Ela e resultante de

    nossas discuss oes, conhecimento, aprendizado, experiencia e pr atica. Alem de servircomo referencia, aproveitaremos a rela cao para abordar alguns t opicos que raramenteaparecem em livros de tecnicas de amostragem. Tais assuntos s ao fundamentaispara aqueles que tenham que conduzir ou assessorar um levantamento amostral, eousamos armar que se estes procedimentos metodol ogicos nao forem adequados,nao existe tecnica estatstica, por melhor ou mais sosticada que seja, que possaproduzir resultados id oneos.

    Embora exista alguma aparente ordem na sequencia das atividades, a pr aticanem sempre age deste modo. Salta-se de um ponto para outro de acordo com as

    necessidades, lembran cas e informa coes que vao aparecendo. Entretanto, seguiros pontos mencionados ter a a vantagem de uma apresenta cao aparentemente maisracional, servindo tambem como roteiro para apresenta cao do relat orio.

    As secoes seguintes abordarao alguns dos item mencionados, procurando ex-plicar um pouco mais sobre o seu signicado. Os assuntos n ao serao obrigatoria-mente tratados nem na ordem nem no grupo onde apareceu mencionado. Os demaiscaptulos deste livro, relacionados com as tecnicas de amostragem, abordam commaior profundidade os itens contidos no grupo intitulado Planejamento e Sele caode Amostra .

    1.3 O que se pretende conhecer?

    1.3.1 Qual a questao a ser respondida?

    Usualmente o objetivo geral de uma pesquisa e obvio. Na maioria das vezes pode serresumida em uma pergunta. As diculdades come cam ao se procurar em respostasa esta pergunta. Qual o potencial do mercado no municpio X para consumir umnovo produto cultural? Deve-se investigar as pessoas mais ricas ou as de maiornvel educacional? O conhecimento substantivo do assunto abordado ajuda muito a

    estabelecer os melhores caminhos em busca de uma resposta? Estudar levantamentossemelhantes realizados no passado, ou em outras regi oes, e uma das melhores fontespara identicar e operacionalizar objetivos, bem como obter sugest oes de como oproblema pode ser resolvido. Pode-se aprender muito com erros cometidos poroutros pesquisadores.

    Portanto, uma das maiores diculdades de qualquer pesquisa e a formula caocorreta dos seus objetivos gerais e operacionais. Exige muito conhecimento especco

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    16/281

    4 No coes basicas

    da area de interesse, muito trabalho de pesquisa bibliogr aca e grande habilidade

    criativa por parte dos pesquisadores envolvidos. Em pesquisas quantitativas, a si-tua cao agrava-se pela necessidade de transformar estes objetivos em quest oes opera-cionais quanticaveis. A literatura, e a experiencia mais ainda, e rica em exemplose situa coes onde a dist ancia entre o objetivo generico e a resposta quantitativa ope-racional e muito grande. Pense, por exemplo, na quest ao: renda e uma boa maneirade operacionalizar o conceito de classe social para uma famlia? Caso a resposta sejaarmativa, o que e melhor: renda familiar total ou renda familiar per capita?

    Pode-se ate postular que um problema corretamente denido j a est a resol-vido, pois em sua formulacao vem embutida a solucao.

    Quase sempre um levantamento amostral tem m ultiplos objetivos, mas paraefeitos pr aticos e conveniente prender-se a um conjunto pequeno de quest oes-chave eque precisam ser respondidas. Isto facilitar a o trabalho de planejamento. As demaisquest oes farao parte de um conjunto de objetivos secund arios, que poderao ou naoser adequadamente respondidos pela pesquisa. Deve-se evitar fortemente a tenta caode acrescentar quest oes so para aproveitar o levantamento.

    1.3.2 A operacionaliza cao dos conceitos

    Um dos maiores desaos das pesquisas quantitativas e a cria cao de bons indicadores(vari aveis, escalas) que representem adequadamente os conceitos (constructos) deinteresse. S ao exemplos de constructos: inteligencia, nvel s ocio-economico, desem-penho escolar, potencial de mercado, ansiedade, satisfa cao, etc. Para inteligenciae bem conhecido o quociente de inteligencia (QI) como um indicador. O criterioBrasil, antigo ABA/ABIPEME, aquele que combina grau educacional, condi coes damoradia e bens possudos e muito usado para expressar o nvel s ocio-economico. OMinisterio da Educa cao aplica uma serie de provas para avaliar desempenho escolar(SAEB, ENEM, Prov ao, Pisa, etc.). Ja para o potencial de mercado, procura-secriar uma escala medindo as componentes do conceito operacional: pessoas, com

    dinheiro e disponibilidade para gastar. Estas escalas, muitas vezes mal entendidase erroneamente empregadas, s ao aceitas e largamente usadas por terem sido vali-dadas, isto e, foram criadas, analisadas contextualmente, comparadas e vericadaa pertinencia entre os valores na escala e o signicado dentro do conceito. Algunsindicadores s ao medidos por meio de uma unica vari avel mensur avel, outras, que eo mais comum, s ao combina coes de resultados de varias perguntas quantic aveis.Boa parte dos conteudos dos livros de metodologia de pesquisa dedica-se a prescre-

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    17/281

    1.3 O que se pretende conhecer? 5

    ver metodos e processos para transformar conceitos te oricos em escalas con aveis e

    validadas. Dentro da vasta literatura disponvel, recomenda-se o livro de Pedhazure Schmelkin (1991), pela sua abordagem mais quantitativa.

    1.3.3 Variaveis e atributos

    Associada a cada unidade elementar (UE - veja a deni cao na Secao 1.4.1) existir auma ou mais caractersticas de interesse a pesquisa. S ao as chamadas variaveisou atributos. Por exemplo, em um estudo onde a UE e a famlia pode-se estarinteressado na renda familiar total, no n umero de membros, no sexo ou educacaodo chefe, etc. J a para a UE empresa, o interesse pode ser no faturamento total,

    lucratividade, ramo de atividade econ omica, consumo de energia eletrica, etc.O objetivo especco da pesquisa e que orienta a escolha e deni cao da UE e

    das vari aveis a serem coletadas. Em pesquisa de Marketing, sobre o poder de compra,uma das variaveis mais usadas e a renda familiar total. J a para um estudo sobrepoltica de emprego e mais indicado analisar a renda individual do trabalhador.Em algumas situacoes a escolha da UE e muito mais complexa. Por exemplo, em umestudo sobre o comportamento de setores ligados ` a industria de alimenta cao, comotratar o restaurante dentro de uma grande montadora de autom oveis? Observe quedependendo da denicao, o mesmo estabelecimento poderia ser tratado de modo

    diferente caso a exploracao fosse propria ou terceirizada.

    1.3.4 Especica cao dos par ametros

    Com os conceitos de interesse da pesquisa traduzidos em vari aveis mensur aveis,necessita-se tornar bem claro quais as caractersticas populacionais ( parametros )que dever ao ser estimados pela amostra. A falta de uma inequvoca deni cao inicialtem sido fatal para muitas pesquisas.

    Suponha que o objetivo de um levantamento seja medir o crescimento dasvendas das empresas do setor de vestu ario em um determinado ano. Isso pode

    ser medido, pelo menos, de duas maneiras: (i) como a media do crescimento decada empresa (vendas deste ano/vendas do ano anterior, para cada empresa) ou,(ii) raz ao entre o total de vendas de todas as empresas neste ano dividido pelototal de vendas das empresas no ano passado. Estes resultados podem ser bemdiferentes, principalmente se as grandes empresas tiverem comportamento distintodas pequenas. A escolha de um outro par ametro e fundamental na orienta cao dodesenho amostral.

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    18/281

    6 No coes basicas

    Quando o levantamento exige, alem de estimativas para a popula cao toda,

    tambem para estratos e/ou subpopula coes, deve-se redobrar o cuidado no planeja-mento para garantir estimadores adequados para o todo e as partes. E bom lembrarque podem ser usadas diferentes formas de par ametros para vari aveis em estratosdistintos.

    1.4 De quem se esta falando

    1.4.1 Unidade elementar, amostral e resposta

    A unidade elementar , ou simplesmente elemento de uma popula cao e o objeto ouentidade portadora das informa coes que pretende-se coletar. Pode ser uma pessoa,famlia, domiclio, loja, empresa, estabelecimento, classe de alunos, escola, etc. Emuito importante que a unidade elementar seja claramente denida para que oprocesso de coleta e an alise tenha sempre um signicado preciso e uniforme. Porexemplo, o conceito de famlia parece ser natural, mas sem uma deni cao adequadapessoas distintas teriam a mesma diculdade de dar uma mesma classica cao parasitua coes especiais. Veja um destes casos: suponha que em um domiclio vive umcasal com lhos adultos, inclusive uma de suas lhas casada, com o genro e um neto.Deve-se considerar uma ou duas famlias? Suponha agora que a lha e divorciada,e claro o genro nao vive com eles, mudaria alguma coisa na sua deni cao? Nestassitua coes em vez de tentar criar deni coes proprias, recomenda-se fortemente buscarestudos j a realizados onde esses problemas j a foram estudados e as denicoes seraomais amplas e permitir ao compara coes entre diferentes pesquisas. Para o exemplocitado acima sugere-se consultar os manuais de metodologia de pesquisa editadospelo IBGE.

    Qualquer plano amostral far a recomenda coes para selecionar elementos dapopula cao por meio das unidades amostrais. Pode ser formada por uma unicaunidade elementar ou por v arias. Uma pesquisa eleitoral usa eleitores como sendo a

    unidade elementar. Um levantamento pode escolher um ponto da cidade e entrevis-tar os cem primeiros eleitores que passam por l a. Usou-se a unidade elementar comounidade amostral. Um plano alternativo decidiu selecionar domiclios e entrevistartodos os eleitores residentes nos domiclios escolhidos. A unidade elementar conti-nua sendo eleitor mas agora a unidae amostral passou a ser domiclio, um conjuntode unidades elementares. Como ser a visto mais a frente, os planos amostrais emmultiplos est agios empregam diferentes unidades amostrais em um mesmo planeja-

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    19/281

    1.4 De quem se esta falando 7

    mento. Por exemplo, uma amostra de eleitores pode ser obtida selecionando primeiro

    algumas cidades, quateir oes dentro das cidades, domiclios dentro dos quateir oes enalmente eleitores dentro dos domiclios.

    As vezes e conveniente ressaltar quem e a unidade respondente ou a unidadede resposta . Um exemplo pode ajudar a entender o conceito. O censo demogr acotem uma primeira parte com quest oes simples sobre cada morador do domiclio, taiscomo sexo, idade, grau de instru cao, etc. Um unico morador pode responder portodos os outros; usualmente elege-se o chefe, ou c onjuge como unidade de resposta.

    1.4.2 As diversas popula coes possveis

    Como ja foi dito, o objetivo da amostragem e fazer arma coes sobre uma popula caobaseando-se no resultado (informa cao) de uma amostra. Assim, n ao sabendo exa-tamente de onde foi retirada a amostra, n ao se sabe para quem pode-se estender asconclusoes, ou seja, para que populacao pode ser feita a inferencia.

    Inicialmente convem lembrar que entende-se por popula cao a reuniao detodas as unidades elementares denidas no item anterior.

    Como no caso dos objetivos, comeca-se falando de uma popula cao generica efrequentemente obvia. Por exemplo, na pesquisa de potencial de mercado menci-onada acima, decide-se investigar a renda individual dos moradores do municpio.Portanto, a popula cao e formada por todos os moradores do municpio. Ser a que os jovens irao consumir o produto? E os moradores da regi ao rural? Assim, em umasegunda aproximacao operacional, a populacao passa a ser os adultos (maiores de 18anos), moradores da regi ao urbana de X . Restam ainda outras d uvidas: como trataros inativos e aqueles que nao tem renda? Conforme a resposta, pode ser necess arioa redenir a popula cao ob jetivo (ou popula cao alvo).

    A obten cao de uma amostra, qualquer que seja o plano amostral adotado,necessita de uma relacao das unidades elementares. O ideal seria dispor de um rolsequencial dessas unidades para que se pudesse fazer uma escolha conveniente das

    unidades que comporiam a amostra. Entretanto, raramente disp oe-se de tais listas.No exemplo acima, dever-se-a dispor da rela cao dos moradores de X , o que pareceser bem pouco prov avel que exista. Felizmente, existem informa coes, mais ou menosatualizadas, que podem ser usadas como alternativas para (descrever) a rela caodas unidades. Podem ser mapas, v arias listas que reunidas descrevem boa partedo universo, censos, etc. Essas fontes que descrevem o universo a ser investigadoformam o chamado sistema de referencias . As unidades que aparecem nessas

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    20/281

    8 No coes basicas

    listas muitas vezes sao chamadas de unidades de listagem .

    Para o exemplo de potencial mencionado acima, pode-se usar como sistema dereferencia a relacao dos Setores Censitarios (SC) empregada pelo IBGE nos CensosDemogr acos. O municpio e dividido em pequenas areas que reunidas recobremtoda a area do municpio. Durante a realiza cao do censo, cada SC e designado a umentrevistador que se encarrega de aplicar o question ario em todos os moradores decada domiclio. Aos interessados, o IBGE fornece o mapa do SC, o n umero e tipo dedomiclios existentes, o total de moradores e uma serie de outras informa coes agrega-das. Na regi ao urbana, cada SC engloba cerca de 300 domiclios. Essas informa coessao atualizadas de 10 em 10 anos, e algumas vezes em prazos menores. Analisando a

    rela cao de SC do municpio X , observa-se que em alguns deles existem quarteis, inter-natos, alojamentos, etc., os chamados domiclios coletivos . Tambem constata-seque alguns SC s ao formados especicamente por favelas, e neste momento n ao inte-ressaria ao levantamento. Decide-se assim, n ao entrevistar os domiclios coletivos enem as favelas. Informacoes recentes sobre o crescimento da cidade, desde a ultimaatualizacao dos SC, informa que a cidade ja est a invadindo SC que sao classicadoscomo rurais, mas nao se sabe quais. Assim, devido `a particularidade do sistemade referencia, a popula cao que servir a de base para a escolha da amostra pode serdenida como: todos os moradores adultos, com residencia em domiclios parti-culares classicados no ultimo censo como moradores de regi ao urbana, excluindomoradores de favelas. Repare que a deni cao operacional baseada no sistema dereferencia nao e obrigatoriamente a mesma que a popula cao alvo. Chamaremos estade popula cao referenciada ou popula cao referida.

    Selecionada a amostra, passa-se ao trabalho de campo, onde os dados ser aocoletados. Por diversas raz oes nao se conseguem informa coes sobre algumas uni-dades selecionadas, e em compensa cao aparecem dados para outras unidades quenao estavam previstas inicialmente. Unidades inexistentes, recusas, domiclios va-gos, ou fechados, impossibilidade de acessar a unidade (condomnios fechados) s aoalguns dos motivos para se perder unidades. Cria cao de novos conjuntos habitacio-

    nais, transforma cao de casas em corti cos, etc. podem ser motivos de aparecimentode unidades nao selecionadas a priori. Em todo caso, tem-se uma amostra que foiretirada de uma popula cao que n ao e exatamente a referida. Se a cidade tiver mui-tos condomnios fechados aos quais n ao foram permitido o acesso, e sabendo quenestes locais moram pessoas de alta renda, a estimativa do potencial de mercadosera subestimada. Assim, a inferencia referir-se- a apenas a uma nova popula cao: apopula cao amostrada . Ela so pode ser descrita apos a realiza cao do levantamento

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    21/281

    1.4 De quem se esta falando 9

    de campo, e procura-se ressaltar quais as possveis diferen cas que ela possa ter com

    a popula cao referida.A Figura 1.1 procura ilustrar as rela coes existentes entre as diferentes po-

    pula coes. Como a amostra foi retirada da popula cao amostrada e apenas sobre elaque valem as inferencias estatsticas. A an alise qualitativa, e algumas vezes ate aquantitativa, das caractersticas das unidades perdidas e das agregadas, permite ava-liar quais as consequencias em estender estas conclus oes para a populacao referida.O conhecimento substantivo do assunto de pesquisa e das caractersticas das unida-des distintas nas duas popula coes, permite ao pesquisador avaliar as consequenciasde usar as conclus oes da popula cao referida para a popula cao alvo.

    No exemplo em quest ao, estima-se estatisticamente qual o potencial relativode pessoas na populacao amostrada. Para a popula cao referida, pode-se apenasdizer que essa porcentagem deve ser maior que a da popula cao amostrada, naose saberia precisar o quanto, pois deixaram-se de lado informa coes desconhecidassobre moradores mais ricos da cidade. Ao eliminar do sistema de referencia asfavelas e os domiclios coletivos, elimina-se tambem uma parte dos mais pobres. Seeste contingente for maior que o dos moradores dos condomnios fechados ent ao opotencial relativo da popula cao alvo e menor do que o da populacao amostrada.Novamente, nao se sabe precisar os valores sem outros estudos ou informa coes.

    Em sua opini ao, e ainda usando o exemplo acima, a inclus ao dos moradoresrurais na populacao alvo, de que modo afetaria o potencial de compra da cidade?

    Caso a pesquisa deva produzir respostas para partes preestabelecidas da po-pula cao, isto deve ser conhecido antes da deni cao do plano amostral. Suponhaque no exemplo anterior pretendia-se conhecer o mercado potencial separado dosmoradores da regiao sul e norte. Assim, antes de denir a amostra, devia-se separaro sistema de referencias nos SC do sul e do norte, ou seja, e como se estivesse tra-balhando com duas popula coes. Cada uma dessas subpopula coes e chamada de umestrato . Estraticacao e uma das estrategias mais usadas em desenhos amostrais.E utilizado tanto para dar respostas a partes da popula cao como para melhorar os

    processos de estimacao. Sera visto em outros captulos como a estratica cao e umrecurso poderosssimo dentro da Amostragem.

    Existe uma forte tenta cao em usar a pesquisa amostral para conhecer detalhesde todas as partes da popula cao, e para tanto, exageram ao estabelecer o n umerode estratos. Esta op cao frequentemente implica em tamanhos de amostras econo-micamente inviaveis. Uma solu cao de compromisso e considerar os fatores b asicoscomo estratos e os secundarios como subclasses. Estas sao partes da subpopula cao

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    22/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    23/281

    1.5 Como obter os dados? 11

    ter um n umero insignicante de representantes de uma das categorias de genero,

    invalidando qualquer conclus ao.Solicita-se a atencao para a diferenca entre estrato e subclasse. Ambas repre-

    sentam partes da popula cao, porem a primeira e contemplada no desenho amostralgarantindo-se `a priori, estimativas con aveis. J a a segunda, a qualidade das esti-mativas depender a da presen ca ou nao de unidades sucientes em cada subclasse.Maiores esclarecimentos sobre estas diferen cas aparecerao nos captulos tecnicos.

    Uma ultima palavra de advertencia sobre os cuidados em denir as popula coes.Nao se duvida em armar, que o sucesso de um levantamento amostral baseia-sefortemente no conhecimento que se tem sobre a popula cao. Deve-se gastar boa parte

    do tempo (mais de 50%) estudando e denindo a popula cao. Dever-se-ia conhecertanto sobre ela que talvez fosse ate dispens avel a realizac ao da pesquisa.

    1.5 Como obter os dados?

    1.5.1 Tipos de investiga cao

    Uma das etapas importantes de uma pesquisa quantitativa e muitas vezes relegadaa um segundo plano, e o levantamento dos dados da(s) caracterstica(s) de interesse.Um exemplo bem conhecido de coleta de dados s ao os chamados censos populacio-nais, realizados no Brasil pelo IBGE, que procuram determinar o n umero de pessoasexistentes no pas, segundo algumas caractersticas importantes como sexo, idade,nvel educacional, etc. Porem, mesmo no censo, nem todas as vari aveis sao obtidasentrevistando todas as pessoas. Devido aos altos custos envolvidos, e o uso dasinforma coes de forma mais agregada, outras caractersticas como renda, ocupa cao,etc., s ao obtidas atraves de amostras, entrevistando apenas os moradores de partedos domiclios, algo em torno de um em cada dez domiclios. Outro exemplo de le-vantamento amostral bastante divulgado ultimamente s ao as pesquisas de intencaode votos.

    Tipos de levantamento como os divulgados acima s ao mais passivos poisprocuram identicar caractersticas da popula cao sem interferir nos resultados, s aoas chamadas pesquisas de levantamento de dados ( survey , em ingles). Outras vezesdeseja-se saber o que acontece com determinada vari avel quando as unidades saosubmetidas a tratamentos especiais controlados. Por exemplo, o uso de determinadavacina diminui a incidencia de certa doen ca? A altura com que um produto e expostona gondola aumenta a oportunidade de venda? Nesses casos e necess ario trabalhar

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    24/281

    12 Nocoes basicas

    com grupos que recebam o tratamento e outros que sirvam como controle. S ao os

    conhecidos planejamentos de experimentos, ou simplesmente experimenta cao.Outros criterios poderiam ser utilizados para identicar tipos de pesquisa. Na

    Figura 1.2 apresentam-se quatro possveis criterios dicot omicos para classicar umapesquisa. S o a combina cao de suas alternativas j a produziria 16 possveis tipos depesquisas quantitativas.

    a. participacao do pesquisadornos resultados

    experimentacao levantamento

    b. objetivo da analise

    descritivo analtico

    c. complexidade dos dados

    simples multivariado

    d. amplitude da coleta

    censo amostra

    Figura 1.2: Criterios para classicar pesquisas

    Neste livro a preocupacao maior ser a em apresentar pesquisas do tipo levan-tamento, com objetivos descritivos de dados simples obtidos de amostras. Eventu-

    almente serao tratados dados multivariados.

    1.5.2 Metodos de coleta de dados

    Escolhido o tipo de investigacao e necess ario decidir que metodo ser a usado paraobter os dados. Os coment arios feitos a seguir ser ao muito mais adequados parapesquisas amostrais, embora se apliquem tambem para outras situa coes.

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    25/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    26/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    27/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    28/281

    16 Nocoes basicas

    Tabela 1.1: Tipos de amostrasCriterio do Procedimento de sele cao

    amostrista probabilstico n ao probabilsticoobjetivo amostras probabilsticas amostras criteriosassubjetivo amostras quase-aleat orias amostras intencionais

    aleat orio simples como amostras aleat orias simples para descrever um determinadoprocedimento de selecao. Entende-se por amostras aleat orias simples as amostrasobtidas atraves de um protocolo de sele cao chamado plano aleat orio simples.

    Alguns exemplos de planos amostrais:

    probabilstica: amostragem aleat oria estraticada proporcional; quase-aleatoria: amostragem por quotas; criteriosas: uso do conceito de cidade tpica; intencional: j uri de especialistas, volunt arios.

    1.5.5 Classica cao de amostras probabilsticas

    A qualidade do sistema de referencias e outras informa coes disponveis orientam odesenho do plano amostral mais adequado para atingir os objetivos da pesquisa. Asmultiplas possibilidades dessas caractersticas podem gerar uma grande variedadede planos amostrais. Como sempre, a apresenta cao sistem atica destas possibilidadesca mais facil quando agrupadas por alguns criterios, gerando tipologias de planosamostrais. Usar-se-a aqui os criterios propostos por Kish (1965) e resumidos naFigura 1.3.

    A combina cao dos resultados de cada um desses criterios apontados gera 32possveis planos amostrais. Por exemplo, usando as primeiras op coes de cada criteriotem-se o conhecido plano de Amostragem Aleat oria Simples . Ou seja, cadaunidade elementar e sorteada com igual probabilidade, individualmente, sem estra-

    tica cao, e um unico est agio e selecao aleat oria. Neste livro ser ao abordados algunsdestes planos e fornecidos instrumentos para que sejam exploradas as principaispropriedades dos demais.

    Quando o sistema de referencias (SR) e perfeito , isto e, quando ele lista umaa uma todas as unidades de an alise, e possvel ent ao usar um processo onde cadaunidade e sorteada diretamente com igual probabilidade de pertencer ` a amostra.A melhor maneira para denir este plano e descrevendo o processo de sorteio que

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    29/281

    1.5 Como obter os dados? 17

    a. Probabilidade de sele cao

    da unidade amostral

    igual distinta

    b. Unidade amostral

    uma unidade deresposta (elementar)

    elementos(conglomerado)

    c. Divisao em estratos

    nao estraticada estraticada

    d. Numero de est agios

    um unico mais de um

    e. Selecao das unidades

    aleat oria sistem atica

    Figura 1.3: Criterios para classicar amostras probabilsticas

    seria o seguinte: da relacao de unidades do SR sorteie, com igual probabilidadede pertencer `a amostra, o primeiro elemento da amostra, repita o processo para osegundo e assim sucessivamente ate sortear o ultimo elemento programado para a

    amostra. As amostras assim obtidas denem o plano de Amostragem Aleat oriaSimples (AAS). Introduzindo o criterio da reposi cao ou nao da unidade sorteada an-tes do sorteio seguinte, obtem-se uma primeira dicotomia deste plano: AmostragemAleat oria Simples com e sem reposi cao (AASc e AASs). Do ponto de vista praticodever-se-ia usar sempre amostras sem reposi cao, pois nao estaria sendo incorporadanova informa cao se uma mesma unidade fosse sorteada novamente. Entretanto, doponto de vista estatstico a reposi cao recomp oe o universo tornando mais facil de-

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    30/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    31/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    32/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    33/281

    1.5 Como obter os dados? 21

    1.5.7 Tamanho da amostra

    O erro padrao do estimador, como ser a visto em captulos posteriores, decrescea medida que aumenta o tamanho da amostra. Assim, um ponto chave de umlevantamento amostral e a xa cao do tamanho da amostra.

    Uma amostra muito grande pode implicar em custos desnecess arios, enquantoque uma amostra pequena pode tornar a pesquisa inconclusiva. Suponha um levan-tamento amostral cujo ob jetivo e prever qual dentre os dois unicos possveis partidoster a maior porcentagem de votos v alidos - excludos nulos e brancos. Aceite tambemque foi utilizado um plano amostral aleat orio simples (AAS) e um dos partidos ob-teve 56% dos votos. Caso tivesse sido usada uma amostra de 100 eleitores, o intervalode 95% de conan ca indicaria um numero entre 46% e 66%, portanto inconclusivopara armar se partido ganharia ou n ao a eleicao. J a uma amostra de 400 eleitoresindicaria o intervalo entre 51% e 61%, sugerindo a vit oria do partido. Por outrolado, uma amostra de 1600 eleitores deniria o intervalo entre 53,5% e 59,5 im-plicando no uso desnecessario de 1200 unidades a mais. O problema real e muitomais complexo que o apresentado aqui, mas o exemplo d a uma boa ilustracao dosproblemas estatsticos envolvidos na determina cao do tamanho da amostra.

    Um dos aspectos pouco discutidos em cursos de amostragem e aquele associadoaos custos de um levantamento. Este t opico e fundamental para o delineamento de

    toda a pesquisa, desde a deni cao dos objetivos possveis de serem respondidos,passando pelo tamanho da amostra economicamente vi avel e chegando ate a escolhada sostica cao do modelo de an alise a ser adotado. Recomenda-se ` aqueles quevenham a se dedicar a pratica de amostragem que estudem mais profundamenteeste aspecto, podendo consultar principalmente o livro de Kish (1965) e Lansing eMorgan (1971).

    Como ja foi mencionado, muitas vezes a precisao estatstica desejada para apesquisa esbarra nas limita coes impostas pelo or camento, obrigando a decidir entrerealizar a pesquisa baixando a precis ao desejada ou n ao realizar o levantamento.

    Isto nos remete ao compromisso para xar o tamanho da amostra, ou mesmo para apesquisa como um todo, em procurar dentro das restri c oes impostas pelo or camento,desenhar uma amostra que atinja os objetivo, produzindo estimativas com a menor imprecis ao possvel .

    Embora neste livro a determina cao do tamanho da amostra ser a sempre feitalevando em conta os aspectos da precis ao estatstica, acredita-se que na maioria doscasos a decisao segue a proposi cao acima, isto e, as limita coes orcament arias denem

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    34/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    35/281

    1.6 Coleta dos dados (trabalho de campo) 23

    tado, deixar esta escolha para o entrevistador. Sem d uvida ele escolher a um membro

    presente na casa na hora da entrevista, introduzindo um vies na pesquisa. Provavel-mente este levantamento ter a uma proporcao bem maior de mulheres. Se nao foremtomados cuidados, o trabalho de campo pode arruinar totalmente uma pesquisa.Assim, deve-se planejar e usar procedimentos que minimizem os erros, ou viesesintroduzidos na coleta de dados.

    Jessen (1978) resume estes cuidados na seguinte frase: as medidas s ao aque-las obvias; selecionar boas pessoas, trein a-las bem e vericar se fazem o trabalhocorretamente .

    O volume de trabalho para operacionalizar essas medidas ir a depender prin-

    cipalmente do tamanho da pesquisa e do fato da pesquisa ser pontual (ad-hoc) ouperi odica. Para pesquisas pequenas, o treinamento de pessoal envolvido e bem re-duzido, podendo chegar ao caso de ser apenas o pr oprio pesquisador. Em pesquisasperi odicas o esforco deve ser maior para elaborar manuais e material de consulta queserao usados freq uentemente. Entretanto, pode-se apresentar sucintamente algunscoment arios em como evitar vieses nos cuidados mencionados por Jessen.

    Recrutamento. Para pesquisas grandes, realizadas uma unica vez, recomenda-sea contratacao de empresas especializadas que possuam pesquisadores prossi-onais e que estejam acostumadas com a aplica cao e administracao deste tipo

    de trabalho. A alternativa, freq uentemente mais barata, ser a a de executaro trabalho todo de contratar entrevistadores, listadores, supervisores, checa-dores, etc., cada um deles com um perl pr oprio, desenvolver programas dequalidade da coleta, etc. Com uma sele cao impr opria ou caseira, corre-seo risco de pagar caro pelo noviciado. Para pesquisas peri odicas, e com a ne-cessidade constante de renova cao e substituicao de pessoas envolvidas pode-secriar um n ucleo permanente de selecao de pessoal, com a vantagem adicionalda escolha ser dirigida para os objetivos especcos do trabalho.

    Treinamento. O pessoal de pesquisa deve ser bem treinado n ao apenas com os

    conceitos, deni coes, uso do instrumento de mensura cao, etc., mas tambemcom os melhores procedimentos para extrair as informa coes desejadas. Existemtecnicas bem desenvolvidas acerca de como abordar as pessoas, de postura, deentona cao de voz e outras. Ou ainda, o treinamento para uma pesquisa frentea frente e bem diferente de uma por telefone. Em pesquisas muito grandesos problemas envolvidos com o treinamento s ao enormes e requerem muitasvezes o uso de mecanismos bastante especiais. Apenas imagine os cuidados

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    36/281

    24 Nocoes basicas

    que devem ser tomados para o treinamento de mais de 150 mil entrevistadores

    para a realizacao do censo populacional brasileiro. Nestes casos, e na maioriadeles, recomenda-se a adocao de manuais escritos para cada uma das tarefas:listagem, entrevistas, checagem, codica coes, etc.

    Embora o treinamento procure prever todas as situa coes que serao encontradas,e preciso dar instru coes sobre situa coes imprevistas. Por exemplo, na casasorteada, tem mais de um domiclio e v arias famlias, ou ainda, n ao se consegueencaixar a prossao do chefe em nenhum dos casos listados. O entrevistadordeveria entrar em contato com a supervis ao, ou ent ao anotar o maior numeropossvel de informacao para possvel corre cao no escrit orio.

    Verica cao. E importante que se tenha um processo de controle contnuo da qua-lidade do trabalho de campo. A verica cao deve ser realizada em v ariasetapas do trabalho do pesquisador. No incio da pesquisa deve-se fazer umacompanhamento mais meticuloso para verica cao do entendimento corretodos conceitos, da identicacao exata das unidades selecionadas e de resposta,aprimorando e corrigindo-as imediatamente. Alem de verica coes rotineirasdeve-se ter um plano de verica cao aleat oria, onde uma subamostra e reen-trevistada para apurar desde fraude ate a qualidade das informa coes obtidas.Este procedimento permite avaliar a magnitude de alguns vieses introduzidospelo trabalho de coleta de dados.

    A supervis ao de campo deve estar em permanente contato com os respons aveisdo planejamento para obter os esclarecimentos sobre quest oes ambguas e de-cisoes a serem tomadas para casos imprevistos. Tambem, o contato com osrespons aveis com o processamento dos dados ajuda a esclarecer e remover in-forma coes desencontradas e os erros mais comuns cometidos pelo pessoal decampo.

    Registro. Muitas ocorrencias e decis oes imprevistas acontecem nesta fase e e muito

    importante que se mantenha um registro atualizado das mesmas para futurasavalia coes do desempenho do levantamento. As estatsticas e qualica coessobre as unidades perdidas e as includas indevidamente e que permitir ao adescri cao pormenorizada da populac ao amostrada . As duvidas e inadequacoesapresentadas pelos entrevistadores, bem como os esclarecimentos prestadosajudarao a entender a qualidade, signicado e dedignidade das respostas ob-tidas.

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    37/281

    1.7 Prepara cao dos dados 25

    1.7 Prepara cao dos dados

    Se nao for devidamente avaliada, planejada e executada a constru cao inicial do bancode dados pode-se tornar a etapa mais demorada de um processo de levantamento deinforma coes.

    Usando uma imagem bastante simplicada, pode-se descrever o banco de da-dos como sendo uma matriz de n+1 linhas por p+1 colunas. As linhas correspondemas n unidades respondentes e as colunas ` as p variaveis de interesse. A primeira co-luna descreve a identica cao da unidade respondente, enquanto que a primeira linhadenomina as variaveis. A celula (i,j) contem os dados codicados da j-esima vari avelpara a i-esima unidade respondente. Estes dados devem estar disponveis em ummeio que permita o f acil acesso e manipula cao, imagina-se um meio eletronico con-veniente.

    A constru cao desta tabela exige: (i) transcri cao; (ii) minucioso escrutnio daqualidade e (iii) disponibiliza cao das informa coes.

    Transcri cao. Esta tem sido a fase mais demorada do processo, porem tem sidoaquele segmento onde a tecnologia vem apresentando solu coes bem competen-tes. Quanto menos haja interven cao na transcricao de um meio para outro,menor a possibilidade de introdu cao de erros na pesquisa. Deve-se procu-

    rar balancear o custo de uso de recursos mais sosticados com a qualidade erapidez para a execucao desta tarefa.

    Qualidade dos dados. Antes de liberar os dados para a an alise deve-se ter cer-teza da boa qualidade dos mesmos. O escrutnio crtico dos dados passa pelaidentica cao de erros de transcricao, de inconsistencias e outros tipos de enga-nos. A corre cao pode ser feita com a ajuda da lembran ca e interpretacao dospesquisadores, com o apoio de processos autom aticos e, quando for necessario,revisitar a unidade sorteada.

    A utiliza cao de programas autom aticos de an alise da consistencia logica dasrespostas e uma das ferramentas mais poderosas na detec cao de varios tiposde erros. O conhecimento substantivo do instrumento de pesquisa associado ` ahabilidade do pesquisador possibilita a constru cao de bons mecanismos de de-tec cao autom atica de erros. Hoje em dia, com o uso de instrumentos eletr onicosde entrada de dados, este tipo de controle vem sendo feito no ato de coleta,nao aceitando a entrada de dados inconsistentes.

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    38/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    39/281

    1.8 Analises estatsticas 27

    vari avel nos estudos. O emprego de tabelas cruzadas para algumas carac-

    tersticas decompostas pelos estratos, ou por fatores geogr acos, economicos,demogr acos, etc., permite adquirir maior conhecimento de seus signicados.A compara cao com resultados de outras pesquisas con aveis, tais como oscensos, permite avaliar a qualidade do levantamento.

    Plano tabular. Com esse ttulo entende-se ` aquele conjunto mnimo de tabelas emodelos estatsticos que foram denidos a priori para responder aos objetivosiniciais da pesquisa.

    O exerccio, realizado antes da obten cao dos dados, de imaginar operacional-mente como os recolhidos na pesquisa responderiam aos objetivos da pesquisa,alem de ajudar, e muito, o planejamento amostral evita divulgar os resulta-dos em prazos distantes do trabalho de campo tornando-os desinteressantes.Serve tambem para que sejam previamente preparados, escolhidos e testadosos programas computacionais necess arios para sua execucao. Usualmente, es-tas primeiras respostas s ao fornecidas por tabelas de duplas entradas, da onome de plano tabular.

    Junto com a divulgacao da aplica cao do plano tabular, recomenda-se quetambem sejam apresentados os erros amostrais, permitindo avaliar qual a con-abilidade apresentada pela pesquisa. Para pesquisas com um n umero muitogrande de variaveis deve-se procurar modos adequados e resumidos para di-vulga cao dos erros. Pode-se encontrar exemplos de como divulgar os errosamostrais consultando os compendios de metodologia publicados pelo IBGE.

    Analises adicionais. Os levantamentos estatsticos de um modo geral possuemmuito mais informacoes do que aquelas usadas para responder aos objetivosiniciais. Pode-se, em uma segunda etapa, voltar a explorar os dados paratestar novas hioteses ou mesmo para especular sobre rela coes inesperadas. Umunico levantamento amostral sobre condi coes de vida realizado pela Funda cao

    SEADE, produziu mais de 10 trabalhos em um perodo de 3 anos. Durantepelo menos 10 anos, ate que um novo seja realizado, os censos demogr acos saoinvestigados, em varias dimensoes e por pesquisadores de diversas institui coes.

    Tambem os modelos de an alise podem ser bem mais sosticados do que sim-ples tabelas descritivas, desde que haja tempo para investigar a adequa cao epertinencia dos mesmos. Na mencionada pesquisa da Funda cao SEADE, al-guns estudos foram novamente analisados empregando-se modelos para dados

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    40/281

    28 Nocoes basicas

    categ oricos e outros modelos multivariados.

    Uma das consequencias mais importantes da an alise dos dados e a possibilidadede cria cao de novas vari aveis (ndices) resultante da combina cao de outras, eque descrevam de maneira mais adequada os conceitos pretendidos. Voltandoa pesquisa do SEADE, usaram-se combina coes do grau de educa cao do chefe ede um segundo membro da famlia para criar um grau de educa cao da famlia.De modo mais sosticado, e com tecnicas estatsticas criou-se uma condi caode qualidade de emprego da famlia.

    1.9 ErrosTodo levantamento amostral ou n ao, est a sujeito a produzir diferen cas entre opar ametro populacional , de interesse, e o valor t empregado para estim a-lo. Adiferen ca t e considerada como o erro da pesquisa . Varios fatores podem agirsobre esta diferenca e faz parte da avaliacao detect a-las, tentar med-las e avaliarsuas conseq uencias. Para facilitar a exposi cao, dividir-se- ao os fatores que afetamesta diferen ca em dois grandes grupos:

    erros devido ao plano amostral;

    erros devidos a outros fatores.O primeiro deles, j a mencionado na Se cao 1.5.6, talvez seja equivocadamente

    chamado de erro. Melhor seria cham a-lo de desvio, objeto controlado pelos processosestatsticos que ser ao devidamente tratados nos demais captulos deste livro. Estesdesvios tendem a desaparecer com o crescimento do tamanho da amostra.

    Os erros do segundo grupo sao resultantes de inadequa coes dos processos demensuracao, entrevistas, codicacoes, etc. Eles permanecem mesmo em censos po-pulacionais. Eles serao analisados nas se coes abaixo.

    A qualidade do levantamento est a associada a capacidade do pesquisador emevitar, ou se nao for possvel, procurar manter esta diferen ca em nveis aceitaveis.O conceito mais amplo da qualidade do levantamento deveria ser expresso em umamedida do erro total, contendo a mensura cao dos erros amostrais e avalia coes, qua-litativas ou quantitativas, dos possveis efeitos dos demais erros. Para estes ultimose extremamente desej avel que seja feita uma interpreta cao substantiva das possveisconsequencias das direcoes e magnitudes dos seus vieses.

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    41/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    42/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    43/281

    1.10 Apresenta cao dos resultados 31

    1.10 Apresenta cao dos resultados

    O relat orio do plano amostral presta contas para uma determinada audiencia sobre osprocedimentos adotados para escolha e coleta das unidades elementares portadorasdos dados de interesse do levantamento.

    Um plano amostral tecnicamente perfeito e corretamente aplicado pode n ao tersua qualidade reconhecida devido a um relat orio mal escrito e/ou mal organizado. Aspropostas para desenvolver competencias em se comunicar s ao bem conhecidas e n aoserao abordadas aqui. Apenas insiste-se que consultem as bibliotecas especializadase pratiquem as recomenda coes sugeridas. H a muita similaridade entre relat oriosdescrevendo planos amostrais e outros tipos de relat orios cientcos, desse modo,sugerimos consultar tambem livros que tratam deste assunto, tais como Eco (1977)ou Babbie (1999). Ressaltam-se a seguir na elabora cao do relat orio alguns pontosespeccos que devem ser considerados.

    Como os relat orios podem ter diferentes formatos e tamanhos, deve-se emprimeiro lugar decidir para qual audiencia ele est a sendo escrito. Caso seja dirigidoa um p ublico afeito a linguagem de amostragem ser a possvel usar um vocabul ariomais tecnico do que aquele destinado ao p ublico leigo.

    Algumas vezes o relatorio do plano amostral e apenas uma pequena partedentro da secao de metodologia, devendo ent ao ser bastante conciso e direto. Outras

    vezes ele e o produto nal de seu trabalho, devendo incluir a descri cao de todas asetapas bem como a descricao, construcao e analise do banco de dados, e, neste casoo relat orio sera muito mais amplo e detalhado.

    Sugere-se como pr atica de trabalho, escrever sempre um relat orio completo,elaborado conforme o desenrolar do levantamento. Ele servir a como uma especie dediario e mem oria. A partir dele voce poder a extrair outros produtos que sejam deinteresse. Voce poder a usar os itens mencionados no Apendice B como guia, sem anecessidade de respeitar a ordem apresentada.

    Resumindo, qualquer que seja o tipo de relat orio usado, ele deve mencionar

    pelo menos os seguintes itens: propositos, as diversas populacoes, sistema de re-ferencia, unidades amostrais, plano de sele cao, procedimento de coleta, desempenhoda amostra, tamanho, sistema de pondera cao, formulas para os erros amostrais eavalia coes dos possveis efeitos dos erros nao amostrais.

    Quando o relatorio tambem inclui a an alise, distinga bem os resultados des-critivos da amostra dos que fazem inferencias populacionais. Para grandes volumesde dados, onde a apresenta cao dos erros amostrais pode poluir e dicultar a lei-

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    44/281

    32 Nocoes basicas

    tura de cada tabela, sugere-se a ado cao de procedimentos agregados que avaliem

    erros aproximados globais. Grandes institutos de pesquisa costumam usar este tipode apresentacao para os erros amostrais (consulte, por exemplo, as publica coes doIBGE).

    1.11 Divulga cao do banco de dados (disponibilidade)

    Falta a maioria dos bancos de dados obtidos por levantamentos amostrais, uma do-cumentacao bem elaborada que descreva a utilidade das vari aveis e liste os vnculosentre os c odigos e os atributos que compoem as vari aveis (Babie, 1999), conforme

    mencionado na Se cao 1.7. Essa ausencia deve-se ao fato de que na maioria das vezes,os dados ser ao produzidos e analisados por uma unica pessoa ou grupo, tornandoaparentemente dispens avel esse trabalho. Entretanto, esse descuido j a causou mui-tos prejuzos, tempo perdido e duplica cao de trabalho ao se analisar o mesmo bancode dados em ocasi oes distintas.

    Manter um banco de dados organizado e documentado deve ser uma preo-cupa cao priorit aria dos amostristas e dos analistas de dados. Os primeiros usam-no para bem caracterizar os sistemas de pondera cao e recodiccoes, e os segundospara descrever as recodica coes, novas vari aveis e indicadores criados.

    O Banco de Dados junto com esse dicionario descritivo permite oferecer maisum servi co: disponibilizar a pesquisa para um p ublico maior, gracas as facilidadesoferecidas hoje pela comunicacao eletr onica. Como orientacao para organizar esseservico, sugere-se consultar os bancos de dados disponveis no IBGE e SEADE.

    Exerccios

    1.1 Apresente uma questao ligada a sua area de interesse e que poderia ser res-pondida por um levantamento amostral. Aproveite para denir claramentequais seriam os seguintes conceitos na sua pesquisa:

    a. unidade de pesquisa;

    b. popula cao;

    c. instrumento de coleta de dados;

    d. unidade respondente;

    e. possvel sistema de referencia;

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    45/281

    1.11 Divulga cao do banco de dados (disponibilidade) 33

    f. unidade amostral mais prov avel;

    g. unidades amostrais alternativas.

    Discuta tambem como voce xaria o tamanho da amostra a outros t opicos queachar relevantes.

    1.2 Desenhe um plano amostral, ressaltando os pontos discutidos neste captulopara responder ao seguinte problema: Deseja-se conhecer o n umero total de palavras existente no livro texto Bolfarine e Bussab .

    1.3 Planeja-se uma pesquisa para determinar a propor cao de crian cas do sexo

    masculino com idade inferior a 15 anos, moradoras de uma cidade. Sugerem-se tres procedimentos:

    a. Para cada menino de uma amostra de n meninos (retirada da popula caode meninos menores de 15 anos) pede-se que informe quantos irm aos eirmas ele tem;

    b. Toma-se uma amostra de n famlias e pergunta-se o n umero de meninose meninas menores de 15 anos existentes;

    c. Procura-se casualmente n crian cas de 15 anos e alem de anotar o sexo do

    entrevistado pergunta-se o n umero de irm aos e irmas que eles possuemna faixa et aria de interesse.

    Analise os planos amostrais acima e justique suas arma ces. Diga e justiquequal deles voce usaria, ou ent ao proponha um outro.

    1.4 A comissao de pos-gradua cao de sua universidade pretende fazer uma pes-quisa cuja populacao alvo e formada por todos os alunos de p os-gradua cao.Um dos principais ob jetivos e estimar a propor cao dos favor aveis a uma de-terminada mudan ca nas exigencias do exame de qualica cao, e espera-se queessa propor cao seja da ordem de 5%. Imagine a situa cao na sua universidadee proponha um plano amostral, destacando: sistema de referencia, tamanhoda amostra, UPA, USA, f ormulas de estimadores e vari ancias.

    1.5 Sugira um esquema amostral aproximado para escolher amostras aleat oriasnos seguintes casos:

    a. Arvores em uma oresta;

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    46/281

    34 Nocoes basicas

    b. Crian cas abaixo de 5 anos e que tiveram sarampo;

    c. Oper arios em ind ustrias texteis.

    Em cada caso, sugira uma vari avel que poderia ser estudada, qual a lista deelementos a que voce teria acesso e faca as suposi coes (razo aveis) necess ariaspara resolver o problema.

    1.6 Uma rede banc aria tem liais espalhadas por todo o pas e seu pessoal es-pecializado (cerca de 20 mil) e removido frequentemente de um ponto paraoutro. Deseja-se selecionar uma amostra de 10% do atual pessoal especiali-zado, para uma pesquisa contnua durante os pr oximos anos. Pretende-se obterinforma coes sobre o progresso da rma, mudan ca de emprego, etc. A sele caode uma amostra aleat oria de 2 mil indivduos seria muito cara, por quest oesde identica cao. Foi proposto entao que se sorteasse uma letra (digamos S) etodos os funcion arios com sobrenomes come cando com essa letra fariam parteda amostra. A inicial do sobrenome tem a vantagem de ser facilmente identi-cavel, porque as chas dos funcionarios sao arquivadas em ordem alfabetica.Quais as crticas que voce faria a este plano? Sugira um plano melhor, masainda baseado nas vantagens da ordem alfabetica. Descreva sucintamente oseu novo plano.

    1.7 Descreva sucintamente como pode ser incorporado num plano amostral o co-nhecimento de variaveis auxiliares da popula cao.

    1.8 O IME-USP formou no ano passado a sua setima turma de bachareis em Es-tatstica e deseja fazer um levantamento atraves de amostra, com m ultiplosprop ositos. Os principais objetivos s ao: estimar a proporcao de formandosque realmente exercem a pross ao e estimar o sal ario medio. Proponha umesquema amostral e aponte as diculdades que provavelmente ser ao encontra-das.

    1.9 Faca uma lista de pontos essenciais para propor, executar e analisar um le-vantamento amostral.

    1.10 Um pesquisador pretende estimar o consumo medio de agua por domiclioem uma cidade. Discuta as vantagens e desvantagens em usar as seguintesUPAs:

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    47/281

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    48/281

    36 Nocoes basicas

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    49/281

    Captulo 2

    Denicoes e nota coes basicas

    Neste captulo considera-se formalmente os conceitos introduzidos no captulo ante-rior. Estas denicoes serao usadas com bastante freq uencia nos captulos seguintes.A primeira se cao dene os par ametros (funcoes parametricas) populacionais de inte-resse, quantidades estas que s ao funcoes das caractersticas populacionais associadasa cada unidade. Nas secoes seguintes tratam-se das quantidades relacionadas comamostras que sao os estimadores e estimativas dos par ametros populacionais.

    Ressalta-se que estas apresenta coes estar ao restritas primordialmente ` as po-pula coes nitas, embora sejam facilmente export aveis para as populacoes inni-

    tas (modelos teoricos, distribuicoes de probabilidade). A teoria e abordagem, nes-tas ultimas populacoes, sao bastante exploradas em livros de inferencia estatstica,basicos ou avan cados, veja, por exemplo, Bussab e Morettin (2004). Para estudosmais aprofundados, distin coes e integra cao dos dois conceitos sugere-se o livro deCassel et al (1977).

    2.1 Popula cao

    Popula cao ou Universo e o conjunto U de todas as unidades elementares deinteresse. E indicado por

    U = {1, 2, . . . , N },onde N e o tamanho xo e algumas vezes desconhecido da popula cao.

    Elemento Populacional e a nomenclatura usada para denotar qualquer ele-mento i U . E tambem conhecido por unidade elementar.

    Caracterstica(s) de Interesse sera usado para denotar a vari avel ou ovetor de informacoes associado a cada elemento da popula cao. Sera representado

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    50/281

    38 Deni coes e nota coes basicas

    por

    Y i , i U ,ou, no caso multivariado,

    Y i = ( Y i1, . . . , Y ip ), i U .A unidade elementar pode ser, por exemplo, estabelecimento agrcola e a carac-terstica de interesse a vari avel produ cao (em dinheiro) agrcola ou o n umero detratores, ou ainda a vari avel qualitativa tipo de apropria cao da terra (dono, me-eiro, alugado, etc.).

    Parametro Populacional e a nomenclatura utilizada para denotar o vetor

    correspondente a todos os valores de uma vari avel de interesse que denota-se por

    D = ( Y 1, . . . , Y N ),

    no caso de uma unica caracterstica de interesse, e pela matriz

    D = ( Y 1, . . . , Y N ),

    no caso em que para cada unidade da popula cao tem-se associado um vetor Y i decaractersticas de interesse.

    Funcao Parametrica Populacional e uma caracterstica numerica qualquer

    da popula cao, ou seja, uma expressao numerica que condensa funcionalmente os Y i s(ou Y i s), i U . Tal fun cao numerica ser a denotada por

    (D ).

    Esta fun cao pode ser, por exemplo, o total, as medias, ou ainda o quociente de doistotais. E comum utilizar-se a express ao par ametro populacional de interesse, ousimplesmente parametro populacional.

    Exemplo 2.1 Considere a populacao formada por tres domiclios U = {1, 2, 3} eque est ao sendo observadas as seguintes vari aveis: nome (do chefe), sexo, idade,fumante ou nao, renda bruta familiar e n umero de trabalhadores. A popula cao est adescrita na Tabela 2.1.Portanto, para os dados descritos na Tabela 2.1, os seguintes par ametros populaci-onais podem ser denidos:

    i. para a variavel idade,D = (20 , 30, 40) = Y ;

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    51/281

    2.1 Popula cao 39

    Tabela 2.1: Popula cao de tres domicliosVari avel Valores Notacaounidade 1 2 3 inome do chefe Ada Beto Ema Aisexo1 0 1 0 X iidade 20 30 40 Y ifumante 2 0 1 1 Girenda bruta familiar 12 30 18 F ino de trabalhadores 1 3 2 T i1 0: feminino; 1: masculino.

    2 0: nao fumante; 1: fumante.

    ii. para o vetor ( F i , T i) ,

    D =12 30 181 3 2

    .

    Com rela cao a funcoes parametricas populacionais, tem-se:

    i. idade media,(Y ) = (D ) =

    20 + 30 + 403

    = 30;

    ii. media das variaveis renda e n umero de trabalhadores,

    (D ) =12+30+18

    31+3+2

    3=

    202

    ;

    iii. renda media por trabalhador,

    (D ) = 12 + 30 + 18

    1 + 3 + 2 = 10.

    Para uma vari avel de interesse, os parametros populacionais mais usados s ao:

    a. total populacional,(D ) = (Y ) = =

    N

    i=1Y i ;

    b. media populacional,

    (D ) = (Y ) = = Y = 1N

    N

    i=1Y i ;

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    52/281

    40 Deni coes e nota coes basicas

    c. variancia populacional, representada por

    (D ) = (Y ) = 2 = 1N

    N

    i=1(Y i )2 ,

    ou, as vezes,

    (D ) = (Y ) = S 2 = 1N 1

    N

    i=1(Y i )2 .

    Conforme ser a visto nos captulos seguintes, a vari ancia populacional aparecediretamente na express ao das vari ancias dos estimadores considerados.

    Para vetores bidimensionais, isto e, duas vari aveis de interesse, representadas

    por (X, Y ), sao bastante usuais os seguintes par ametros:

    d. covari ancia populacional,

    (D ) = XY = Cov[X, Y ]

    = 1N

    N

    i=1(X i X ) (Y i Y ) ,

    ou, as vezes,

    (D ) = S XY = 1N

    1

    N

    i=1

    (X i X ) (Y i Y ) ,

    onde X = N i=1 X i /N e Y = N i=1 Y i /N denotam as medias populacionaiscorrespondentes `as vari aveis X e Y , respectivamente.Pode-se tambem ter interesse pela:

    e. correla cao populacional,

    (D ) = XY = XY X Y

    ;

    f. razao populacional,

    (D ) = Y X = Y X = R,

    onde X = N i=1 X i e Y =N i=1 Y i ;

    g. raz ao media populacional,

    (D ) = R = 1N

    N

    i=1

    Y iX i

    .

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    53/281

    2.2 Amostras 41

    2.2 Amostras

    Considere uma popula cao xa

    U = {1, 2, . . . , N }.Deni cao 2.1 Uma seq uencia qualquer de n unidades de U , e denominada uma amostra ordenada de U , isto e,

    s = ( k1, . . . , k n )

    tal que

    ki U .O r otulo ki e chamado de i-esimo componente de s.Exemplo 2.2 Seja U = {1, 2, 3}. Os vetores s1 = (1 , 2), s2 = (2 , 1), s3 = (1 , 1, 3),s4 = (3) e s5 = (2 , 2, 1, 3, 2) sao exemplos de amostras ordenadas de U .Deni cao 2.2 Seja f i (s) a vari avel que indica o n umero de vezes (freq uencia) que a i-esima unidade populacional aparece na amostra s. Seja i (s) a vari avel bin aria que indica a presenca ou n ao da i-esima unidade na amostra s, isto e,

    i(s) = 1, se i

    s

    0, se i / s.

    Exemplo 2.3 Usando as amostras do Exemplo 2.2, tem-se para a vari avel frequenciaf que f 1(s1) = 1, f 2(s1) = 1, f 3(s1) = 0, f 1(s5) = 1, f 2(s5) = 3 e f 3(s5) = 1. Comrela cao a vari avel presen ca , temos, por exemplo, que 1(s1) = 1 , 2(s1) = 1 , 3(s1) = 0 , e 1(s5) = 1, 2(s5) = 1, 3(s5) = 1.

    Deni cao 2.3 Chama-se de tamanho n(s) da amostra s, a soma das freq uencias das unidades populacionais na amostra, isto e,

    n(s) =N

    i=1f i (s).

    Chama-se de tamanho efetivo (s) da amostra s ao n umero de unidades populacio-nais distintas presentes na amostra s, isto e,

    (s) =N

    i=1 i (s).

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    54/281

    42 Deni coes e nota coes basicas

    Exemplo 2.4 Usando os dados do Exemplo 2.3, observa-se que:

    n(s1) = 1 + 1 + 0 = 2 , enquanto que (s1) = 1 + 1 + 0 = 2 .

    Tambem,

    n(s5) = 1 + 3 + 1 = 5 enquanto que (s5) = 1 + 1 + 1 = 3 .

    Verique que: n(s2) = 2 e (s2) = 2, enquanto que n(s4) = 1 e (s4) = 1.

    Deni cao 2.4 Seja S ( U ), ou simplesmente S o conjunto de todas as amostras (seq uencias ordenadas) de U , de qualquer tamanho. E S n ( U ), a subclasse de to-das as amostras de tamanho n.

    Exemplo 2.5 (Continuacao do Exemplo 2.4) Como U = {1, 2, 3}, ent ao:

    S ( U ) = {(1) , (2), (3) , (1, 1), (1, 2), (1, 3), (2, 1), . . . , (2, 2, 1, 3, 2), . . .}e

    S 2( U ) = {(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)}.Quando nao houver d uvidas em rela cao ao universo, usa-se a notacao simpli-

    cada:

    S = {1, 2, 3, 11, 12, 13, 21, . . . , 22132, . . .}e

    S 2 = {11, 12, 13, 21, 22, 23, 31, 32, 33}.Algumas vezes, como ser a visto adiante, e interessante trabalhar com amostras

    nao ordenadas. Por exemplo, as amostras (1,2) e (2,1) s ao consideradas a mesma.No caso de amostras nao ordenadas sem reposicao, uma amostra e um subconjuntode elementos de U . O numero de amostras ordenadas de tamanho n, com reposi cao,e N n , enquanto que, sem reposi cao, e dado pelo coeciente binomial N n .

    2.3 Planejamento amostral

    Conforme mencionado anteriormente, o objetivo e apresentar procedimentos amos-trais probabilsticos, ou seja, aqueles que permitem associar a cada amostra umaprobabilidade conhecida de ser sorteada. O modo como essas probabilidades s ao as-sociadas e que ira denir um planejamento amostral. Isto leva ` a seguinte denicao:

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    55/281

    2.3 Planejamento amostral 43

    Deni cao 2.5 Uma func ao P (s) denida em S ( U ), satisfazendoP (s) 0, para qualquer s S ( U )

    e tal que

    {s ;sS}P (s) = 1 ,

    e chamado um planejamento amostral ordenado.

    Exemplo 2.6 Considere U = {1, 2, 3} e o respectivo S ( U ) construdo no Exemplo2.5. Considere os seguintes exemplos de planejamentos amostrais:

    Plano A , P (11) = P (12) = P (13) = 1 / 9P (21) = P (22) = P (23) = 1 / 9P (31) = P (32) = P (33) = 1 / 9P (s) = 0 , para as demais s S ;

    Plano B ,P (12) = P (13) = P (21) = P (23) = P (31) = P (32) = 1 / 6P (s) = 0 , para as demais s S ;

    Plano C ,P (2) = 1 / 3P (12) = P (32) = 1 / 9P (112) = P (132) = P (332) = P (312) = 1 / 27P (111) = P (113) = P (131) = P (311) = 1 / 27P (133) = P (313) = P (331) = P (333) = 1 / 27P (s) = 0 , para as demais s S ;

    Plano D ,P (12) = 1 / 10 P (21) = 1 / 6P (13) = 1 / 15 P (31) = 1 / 12P (23) = 1 / 3 P (32) = 1 / 4P (s) = 0 , para as demais s S ;

    Plano E ,P (12) = P (32) = 1 / 2P (s) = 0 , para as demais s S .

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    56/281

    44 Deni coes e nota coes basicas

    Do exposto acima constata-se que e possvel criar innitos planejamentos

    amostrais. Entretanto, descrever probabilidades associadas a cada amostra passaa ser uma tarefa bastante ardua, principalmente para popula coes grandes. Seriamuito mais f acil se existissem descri coes que permitissem associar, ou calcular, asprobabilidades correspondentes a cada amostra de S . No Exemplo 2.6, plano C,o planejamento amostral poderia ser descrito mais facilmente da seguinte maneira:sorteie uma unidade ap os a outra, repondo a unidade sorteada antes de sortear a seguinte, ate o surgimento da unidade 2 ( i = 2) ou ate que 3 unidades tenham sidosorteadas . E facil vericar que com esta descricao reproduz-se as probabilidadesconsideradas naquele exemplo.

    Podem ser usados varios tipos de descritores para representar as probabili-dades associadas a cada amostra. Um deles muito utilizado na abordagem cl assicada amostragem e a descri cao do planejamento atraves das regras para o sorteio daamostra.

    Exemplo 2.7 Seja U = {1, 2, 3}, como no Exemplo 2.6, e a seguinte regra de sorteio:i. Sorteia-se com igual probabilidade um elemento de U , e anota-se a unidade

    sorteada;

    ii. Este elemento e devolvido ` a popula cao e sorteia-se um segundo elemento do

    mesmo modo.Com estas regras, a probabilidade de ocorrer a amostra 11, ser a

    P (11) = P (1 no 1o sorteio) P (1 no 2o sorteio |1 no 1o sorteio)=

    13

    13

    = 19

    .

    De modo an alogo, conclui-se que s o ter ao probabilidades nao nulas, as amostras de

    S 2, isto e,S 2 = {11, 12, 13, 21, 22, 23, 31, 32, 33}.

    Quanto ao planejamento amostral, este ser a dado por

    P (s) = 1/ 9, se i s

    0, se i / s.

    Observe que este e o mesmo plano amostral descrito no Exemplo 2.6, plano A. Inci-dentalmente, este plano amostral, um dos mais simples, e conhecido como Amostra-gem Aleat oria Simples, com reposi cao, e sera estudado detalhadamente no pr oximocaptulo.

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    57/281

    2.3 Planejamento amostral 45

    Observa-se que para a maioria dos planejamentos, atribui-se probabilidade

    nula para muitas amostras de S . Por isso e comum, ao apresentar um plano amostralA, restringir S a alguma subclasse S A , contendo apenas as amostras s, tais queP (s) > 0. Isto facilita bastante a apresenta cao dos resultados. E evidente quequanto mais complexas as regras que descrevem os planos amostrais, mais difceisserao os procedimentos para a determina cao das probabilidades associadas ao espa coamostral S . Neste livro serao abordados os planos amostrais mais simples e maisusados, e que servem de base para planos amostrais mais complexos.

    Outro conjunto de planos muito uteis e simples, s ao aqueles de tamanho xo,ou seja, possuem probabilidades diferentes de zero apenas para a subclasse S n (vejao Exemplo 2.7). Sera visto que as suas probabilidades s ao mais simples de seremdeterminadas.

    Exemplo 2.8 Retorne aos dados do Exemplo 2.1, lembrando que U = {1, 2, 3}e queo domiclio 1 tem um trabalhador, o 2 tem tres enquanto que o 3 tem dois. Considereo seguinte plano amostral A, que ser a mais tarde chamado de PPT (ProbabilidadeProporcional ao Tamanho).

    i. Sorteia-se um elemento de U com probabilidade proporcional ao n umero detrabalhadores;

    ii. Sem repor o domiclio selecionado, sorteia-se um segundo tambem com proba-bilidade proporcional ao numero de trabalhadores.

    Ent ao

    S A = {12, 13, 21, 23, 31, 32},de modo que

    P (12) = P (1 no 1o sorteio) P (1 no 2o sorteio |1 no 1o sorteio)=

    16

    35

    = 110

    .

    De modo similar,P (21) = 36 13 = 16 ,P (13) = 16 25 = 115 ,P (31) = 26 14 = 112 ,P (23) = 36 23 = 13 eP (32) = 26 34 = 14 .

    Observe que este plano e o mesmo apresentado no Exemplo 2.6, plano D.

  • 7/24/2019 Elementos de Amostragem - Heleno Bolfarine, Wilton Oliveira Bussab

    58/281

    46 Deni coes e nota coes basicas

    Deste ultimo exemplo, observa-se claramente a facilidade em calcular as pro-

    babilidades associadas com os planos amostrais equiprobabilisticos, e aqueles emque reposi cao est a presente nas regras de sele cao. Considera-se equiprobabilsticosaqueles planos A, onde cada s S A tem a mesma probabilid