23
stragem em Pesquisas Sócio-Econômi • Introdução •Termos e Definições de Amostragem • Métodos de Seleção de Amostras •Amostragem aleatória ou probabilística •Amostragem por quotas •Amostragem Sistemática Henrique Dantas Neder Prof. Universidade Federal de Uberlândia

Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

Embed Size (px)

Citation preview

Page 1: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

Amostragem em Pesquisas Sócio-Econômicas

• Introdução•Termos e Definições de Amostragem• Métodos de Seleção de Amostras•Amostragem aleatória ou probabilística•Amostragem por quotas •Amostragem Sistemática

Henrique Dantas NederProf. Universidade Federal de Uberlândia

Page 2: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

AMOSTRAGEM SISTEMÁTICA

1a. Calcula-se o tamanho do intervalo sistemático. Este é igual a: onde Int uma função que aplicada ao argumento produz o maior inteiro menor do que este argumento. Por exemplo, se N = 1000 e n = 90.2a. Escolhe-se um número aleatório entre 1 e I, no caso do exemplo entre 1 e 11. Digamos que seja escolhido o número 9.3a. Os elementos escolhidos na população para entrar na amostra são:primeiro número aleatório = A; A + I; A +2I; A + 3I; ....No caso do exemplo:O que dá a seguinte seqüência: 9o.; 20o. ; 31o. ;42o.;..... 

Page 3: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

A escolha do número aleatório pode ser feita empregando-se uma tabela de números aleatórios. Mas um procedimento mais fácil é utilizar no Excel a função ALEATORIOENTRE (escreva em qualquer célula da planilha a fórmula =ALEATORIOENTRE(1,11). Quando apertar a tecla entre o programa retorna um número aleatório dentro do intervalo fechado [1,11]

Page 4: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

Desenhos de Amostras

1. Amostragem Aleatória Simples

Se tivermos, por exemplo, uma população de tamanho N = 100 e selecionarmos n = 10, teremos 17310309456440 amostras distintas de 10 elementos em uma população de tamanho 100

Utilizar a função ALEATORIOENTRE do Excel para selecionar a amostra, desde que todos os elementos da população estejam rotulados com números na seqüência 1 a N. Se tivermos n = 10 e N = 100 devemos ativar 10 vezes a função =ALEATORIOENTRE(1,100).

Page 5: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

2. Amostragem com probabilidade desigual

1000 70 130750 130681-130750

Empresa Número de empregados

Número de empregados acumulado

Intervalo

1 100 100 1-100

2 200 300 101-300

3 50 350 301-350

4 500 850 351-850

... ... ... ...

999 100 130680 ...

Page 6: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

3. Amostra Aleatória Estratificada

Subdivide-se a população em K estratos e seleciona-se aleatoriamente alguns elementos amostrais de cada estrato populacional

4. Amostragem por Conglomerados

Subdivide-se a população em conglomerados e seleciona-se aleatoriamente um conjunto de conglomerados. O conglomerado é chamado de unidade de amostragem primária (UPA). Dentro de cada UPA (conglomerado) selecionada todos os indivíduos são incluídos na amostra.

Exemplo: as escolas da rede municipal de ensino são os

conglomerados e os alunos são as unidades de amostragem secundária (USA).

Page 7: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

5. Amostragem por Conglomerados em Múltiplos Estágios

Seleciona-se aleatoriamente os conglomerados (UPAs) e dentro de cada UPA selecionado seleciona-se aleatoriamente as USAs.Os UPAs podem ser selecionados com probabilidade proporcional ao tamanho (PPT)

Exemplo: Na PNAD (Pesquisa Nacional por Amostra Domiciliar) são selecionados primeiramente os municípios (UPAs) com Probabilidade proporcional ao tamanho (número de domicílios). Posteriormente, em cada município selecionado, seleciona-se os Setores censitários (USAs) e finalmente, dentro de cada USA selecionada, são escolhidos aleatoriamete os domicílios.

Page 8: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

Figura 1 – Ilustração Do Teorema Do Limite Central Para Uma

Distribuição log-normal 

                 

 

Page 9: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

(400;400)

40011 X

(400;600)

50012 X

(400;800)

60013X

(400;1000)

70014 X

(400;1200)

80015 X

(600;400)

50021 X

(600;600)

60022 X

(600;800)

70023 X

(600;1000)

80024 X

(600;1200)

90025 X

(800;400)

60031 X

(800;600)

70032 X

(800;800)

80033 X

(800;1000)

90034 X

(800;1200)

100035 X

(1000;400)

70041 X

(1000;600)

80042 X

(1000;800)

90043 X

(1000;1000)

100044 X

(1000;1200)

110045 X

(1200;400)

80051 X

(1200;600)

90052 X

(1200;800)

100053 X

(1200;1000)

110054 X

(1200;1200)

120055 X

Quadro 1 – Simulação de uma amostragem com reposição de uma população hipotética de 5 elementos

Page 10: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

Parâmetro Representação do parâmetro

Estimador Representação do estimador

Variância do estimador

Média populacional

Média amostral

Total populacional

Total amostral expandido

Proporção populacional

Proporção amostral

Total de indivíduos na população com determinada característica

Total amostral expandido

N

XN

ii

1

N

iiXT

1

1,0X i

1

onde

XpN

ii

1,0X onde i

1

N

iiX

n

XX

N

ii

1

n

Xp

n

ii

n

N XT

222ˆ

n

ppp

)1(2ˆ

nX

X

22

n

iiXn

NT

1

ˆ

n

iiXn

N

1̂ )1(

22ˆ pp

n

N

Quadro 4 – Principais Estimadores utilizados em amostragem

Page 11: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

erro (d) n erro (d) n0,99 2,576 1 5971 1 165870,95 1,96 1 3457 1 96040,8 1,282 1 1478 1 4106

0,99 2,576 5 239 5 6630,95 1,96 5 138 5 3840,8 1,282 5 59 5 164

0,99 2,576 10 60 10 1660,95 1,96 10 35 10 960,8 1,282 10 15 10 41

0,99 2,576 30 7 30 180,95 1,96 30 4 30 110,8 1,282 30 2 30 5

30X 50X z

Tabela 4 – Tamanho amostral para uma Amostra Aleatória Simples (AAS) com objetivo de estimar para um dado desvio-padrão da população e (população infinita)

Page 12: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

Erro (%) p n p n p n0,99 1 2,5758 0,1 5971 0,3 13933 0,5 165870,95 1 1,96 0,1 3457 0,3 8067 0,5 96030,8 1 1,2815 0,1 1478 0,3 3448 0,5 4105

0,99 5 2,5758 0,1 238 0,3 557 0,5 6630,95 5 1,96 0,1 138 0,3 322 0,5 3840,8 5 1,2815 0,1 59 0,3 137 0,5 164

0,99 10 2,5758 0,1 59 0,3 139 0,5 1650,95 10 1,96 0,1 34 0,3 80 0,5 960,8 10 1,2815 0,1 14 0,3 34 0,5 41

z

Tabela 5 – Tamanho amostral para uma Amostra Aleatória Simples com objetivo de estimar uma proporção populacional p para diversos valores de , p e erro (população infinita)

Page 13: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística
Page 14: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística
Page 15: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística
Page 16: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

BOOTSTRAPPING

Em muitas situações de análise de dados de amostras, não é possível fazer estimativas porque as fórmulas das variâncias dos estimadores simplesmente não existem ou porque analiticamente podem ser obtidas através de métodos muito exaustivos. Nestes casos uma solução prática para obtermos intervalos de confiança é o uso da técnica estatística conhecida na literatura como bootstrapping. Nesta técnica obtém-se a partir de uma única amostra um número grande de replicações que são amostras de mesmo tamanho com reposição selecionadas da amostra original.

Page 17: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

A lógica por trás do bootstrapping é a seguinte: “em alguns casos a distribuição amostral pode ser derivada analiticamente. Por exemplo, se a população é distribuída normalmente e desejamos estimar médias, a distribuição amostral para a média é uma “t” de Student com n-1 graus de liberdade. Em outros casos, derivar a distribuição amostral é muito difícil, como no caso de médias estimadas de populações não normais (e com tamanhos de amostras pequenos, sem possibilidade de aplicação do Teorema do Limite Central)” (Stata Reference Manual, 2001).

Page 18: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

Se conhecermos a distribuição da população, podemos obter a distribuição amostral por simulação: podemos selecionar aleatoriamente amostras de tamanho n, de cada uma calcular o valor da estatística e desta forma construir uma distribuição para esta estatística. A técnica do bootstrapping faz precisamente isto, mas ela usa a distribuição observada na amostra no lugar da distribuição verdadeira da população. Portanto, esta técnica se baseia na hipótese de que a distribuição observada é uma boa estimativa da distribuição da população subjacente.

Para exemplificar suponhamos que desejamos estimar um intervalo de confiança para a mediana da variável mpg através de uma amostra de 74 observações. No Stata podemos utilizar o seguinte comando:

bs "summarize mpg,detail" "r(p50)", reps(100)

Page 19: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística
Page 20: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

bs "reg mpg weight foreign" "_b[weight] _b[foreign]", reps(100)

Page 21: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

ALGUNS EXEMPLOS DE APLICAÇÕES DE AMOSTRAGEM

Nesta parte da apresentação serão mostrados alguns estudos decasos correspondendo a algumas experiências relacionadas a amostragem em pesquisas sócio-econômicas.

Um primeiro estudo de caso refere-se a uma pesquisa dascondições sociais das famílias de baixa renda de Uberlândia

Page 22: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

COD BAIRRO

No. de famílias na

amostraNo. Pessoas na amostra

No. de domicílios

na população

No. de pessoas na população

Peso do domicílio

Peso da pessoa

1 SANTA MONICA 567 2092 9237 31323 21,647 19,728

5SEGISMUNDO PEREIRA 51 204 4725 16024 21,647 19,728

….………………………………………. … … … … … …

208 MORUMBI 155 599 4030 13664 25,997 22,812

216 SHOPPING PARK I 16 73 615 2013 38,449 27,581

217 SHOPPING PARK II 0 0 38,449 27,581

222

PARQUE RESIDENC. DO CAMARU 3 13 0 0

225PRIMAVERA PARQUE 1 8 0 0

236 FUNDINHO 1 2 1172 3973 1171,631 1986,435

174 ESPERANÇA 5 28 394 1336 78,839 47,724

TOTAL 5458 20267 148617 503903

Tabela A. 10 – distribuição da amostra por bairros e pesos (fatores) de expansão da amostra

Page 23: Amostragem em Pesquisas Sócio-Econômicas Introdução Termos e Definições de Amostragem Métodos de Seleção de Amostras Amostragem aleatória ou probabilística

2

1 1

2 2 2

1 1

ˆvar( ) var( ) var( )

(1 ) ( )

L Li

i i ii i i

L Li i i i i

i ii ii i i i i

Nw y y

n

N y y N yn y

n n n n n