44
Intervalo de Confiança e cálculo de tamanho de amostra Henrique Dantas Neder

IntervalodeConfiançaecálculodetamanhode · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Embed Size (px)

Citation preview

Page 1: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de Confiança e cálculo de tamanho deamostra

Henrique Dantas Neder

Page 2: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µX

I Até o momento discutimos as propriedades da distrbuiçãonormal e vimos que dentro de certa condição (amostrasgrandes) podemos generalizar o seu uso para calcularprobabilidades referentes a valores da média da amostra X e asoma da dos valores amostrais S =

∑ni=1 Xi . Verificamos que

para qualquer tamanho de amostra (mesmo para amostraspequenas) a distribuição amostral das médias amostrais terámédia igual a média da população (E (X ) = E (X ) ou dito deoutra forma µX = µX ) e que a variância das médias amostraisserá igual a variância de X dividido por n (σ2X =

σ2Xn ).

I Verificamos também que a média de S será igual a média dapopulação multiplicada pelo tamanho da população(µS = µ× N) e a variância de S = n × σ2X . Estaspropriedades são válidas para qualquer tamanho da amostra.Somente é necessário ter tamanho grande de amostra para adistribuição de X e de S serem normais.

Page 3: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µXI Quando selecionamos aleatoriamente (amostra aleatoria

simples) uma amostra de tamanho n > 30 de uma populaçãoqualquer a probabilidade do valor da média da amostra X sermenor do que um determinado valor X̄k :

P(X < X̄k) = P(z < X̄k − µXσX

)

I Por exemplo, se n = 40, µX = 50 e σX = 20, a probabilidadede X̄ ser menor do que X k = 55 é:

P(X < 55) = P(z < 55− 5020/√40

) = .31622768

I Podemos também afirmar que:P(−1.96 < z < 1.96) = 0.95

Esta expressão é equivalente a:

P(−1.96 < X − µσX

< 1.96) = 0.95

Page 4: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µX

I Manimulando algebricamente a desigualdade temos:

P(−1.96× σX < X − µ < 1.96× σX ) = 0.95

P(−X − 1.96× σX < −µ < −X + 1.96× σX ) = 0.95

P(X + 1.96× σX > µ > X − 1.96× σX ) = 0.95

I Reordenando os termos da desigualdade temos:

P(X − 1.96× σX < µ < X + 1.96× σX ) = 0.95

Page 5: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µXI Esta última expressão indica que podemos construir um

intervalo de confiança de 95% de probabilidade para o valordo parâmetro µX conhecendo-se o valor de X . Por exemplo,de acordo com o exemplo anterior, suponhamos que nãoconhecemos µX e que X = 40 ,σX = 20 e n = 40:

P(40− 1.96× σX < µ < 40− 1.96× σX ) = 0.95

P(40− 1.96× 20√40

< µ < 40− 1.96× 20√40

) = 0.95

P(33.801936 < µ < 46.198064) = 0.95

I Então podemos afirmar que existe uma probabilidade de 95%de que o valor do parâmetro µX esteja contido no intervaloindicado nesta última expressão. Observe que não termoscerteza absoluta (probabilidade de 100%) de que este valoresteja contido nos limites do intervalo.

Page 6: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µXI Mas é um grande avanço a uma simples estimativa de ponto

(simplesmnete afirmarmos que a média amostral X = 40).Com isto podemos determinar uma região na qual existe umadeterminada probabilidade de conter o verdadeiro valor doparâmetro desconhecido. É importante observar que jamaisconheceremos o verdadeiro valor do parâmetro µX .

I Isto aconteceria apenas se conhecessessemos toda apopulação. Mas já é uma grande vantagem podermosconstruir este intervalo. Neste caso estamos realizando umaoperação de inferência.

I Inferência significa desenvolver qualquer afirmativa a respeitodo valor de um parâmetro a partir de resultados amostrais.Não conhecemos a população completa, conhecemos apenasos valores de uma única amostra selecionada desta população,mas a partir desta informação podemos estabelecer algumasafirmativas a respeito de um determinado parâmetro (no casodeste exemplo de intervalo estamos tratando do parâmetro µXque é a média desconhecida da população.

I Podemos generalizar este resultado como:P(X − z1−α/2 × σX < µ < X + z1−α/2 × σX ) = 1− α (1)

Page 7: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µX

I Chamamos 1− α de nível de confiança do intervalo. Se1− α = 0.95, então α = 0.05. No caso do exemplo anterior(X = 40 ,σX = 20 e n = 40), podemos calcular um intervalode confiança de 80% de probabilidade (1− α = 0.80) para oparâmetro µX como:

I Se 1− α = 0.80 então α = 0.20 e 1− α/2 = 1− 0.2/2 = 0.9.Portanto: z1−α/2 = z0.9 = φ−1(0.9) = 1.2815516

I Desta forma, um intervalo de confiança de 80% para a médiapopulacional será:

P(40− 1.2815516× σ2X < µ < 40− 1.2815516× σ2X ) = 0.80P(40− 1.2815516× 20√

40 < µ < 40− 1.2815516× 20√40) = 0.80

P(35.947378 < µ < 44.052622) = 0.80

Page 8: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µX

I Observe que, em relação ao intervalo de 95% de probabilidade,este intervalo ficou com uma amplitude menor. A amplitudedo intervalo de confiança dependerá do valor da expressão:

z1−α/2 ×σXn (2)

I Desta forma a amplitude aumenta quando σX aumenta. Istoocorre quando temos uma população com maiorvariância.Então, para populações de maiores variânciasteremos (mantido o mesmo tamanho n de amostra e o mesmonível de confiança 1− α) maiores amplitudes de intervalos deconfiança.

I A amplitude do intervalo de confiança também podeaumentar (de acordo com a expressão anterior) com a reduçãodo tamanho da amostra n.

Page 9: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µX

I Uma terceira forma de aumentar a amplitude do intervalo deconfiança (para mesmo tamanho de amostra e mesmavariância da população) é aumentar z1−α/2. Para fazermosisto temos que aumentar o nível de confiança 1− α dointervalo.

I Aumentar o tamanho (amplitude) do intervalo de confiançasignifica reduzir a precisão da estimativa por intervalo. Paraaumentar a precisão da estimativa temos que reduzir otamanho (amplitude) do intervalo.

I Só podemos fazer isto através de três maneiras: 1) reduzir ograu de confiança 1− α do intervalo; 2) aumentar o tamanhon da amostra e 3) reduzir a variância σ2

X da população. Comoa variância da população geralmente é um dado do problema,temos apenas as duas primeiras opções.

Page 10: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µX

I A esta altura já deu para perceber que existe uma espécie de“trade-off” entre precisão do intervalo e nível de confiança dointervalo. Se não podemos auterar o tamanho n da amostra,quando aumentamos a precisão do intervalo somos obrigadosa reduzir o seu grau de confiança e quando diminuimos aprecisão automaticamente aumentamos o seu grau deconfiança.

Page 11: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µX

I Na verdade só existe uma maneira de aumentarmossimultaneamente a precisão e confiança do intervalo:aumentarmos o tamanho da amostra. Todo este raciocíniopode ser obtido da análise da expressão (2) anterior.

I O intervalo de confiança pode ser interpretado de duas formas:

1) Um intervalo de confiança de 1− α de probabilidade significaque existe esta probabilidade de que o verdadeiro valordesconhecido do parâmetro µ esteja contido entre os limitesinferior e superior do intervalo.2) Se selecionassemos 100 amostras de mesmo tamanho n a partirde uma população com parâmetro (média populacional) µ efossem construidos 100 intervalos de confiança a partir de cada Xusando a expressão (1) anterior, 100× (1− α) destes intervaloconteriam o valor de µ desconhecido.

Page 12: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µX

I Vamos verificar esta última interpretação fazendo a simulaçãono computador de 100 intervalos de 95% de confiançaconstruidos a partir de 100 amostras de tamanho n = 50 eselecionadas a partir de uma população com média µ = 40. Apartir da construção destes 100 intervalos de confiança iremoscontar quantos contem µ.

Page 13: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

* ROTINA PARA CONSTRUÇÃO DE 100 INTERVALOS DE CONFIANÇAclearset seed 9999* GERA 10 MIL OBSERVAÇÕES VAZIASset obs 10000* GERA VALORES ALEATORIOS DE UMA POPULAÇÃO NORMAL* COM MÉDIA MU = 40 E DESVIO PADRÃO SIGMA = 20gen x = rnormal(40, 20)* SALVA ESTES DADOS COMO UMA POPULAÇAO DE DADOSsave "D:\ECN26\pop.dta", replace* CRIA UMA VARIAVEL ESCALAR COM O VALOR DA MÉDIA DA POPULAÇÃOscalar mu = 40* CRIA UMA MACRO LOCAL PARA CONTAR (INICIALIZA COM ZERO)local contador = 0* INICIA “LOOP” COM 1000 LAÇOS PARA SELECIONAR 1000* AMOSTRAS DA MESMA POPULAÇÃO E CALCULAR A MÉDIA* AMOSTRAL E OS LIMITES DOS INTERVALOSforvalues i=1(1)1000 {* ABRE A POPULAÇÃO CRIADA ANTERIORMENTEuse "D:\ECN26\pop.dta", clear* SELECIONA UMA AMOSTRA ALEATORIA DE TAMANHO n = 50sample 50, count* CALCULA A MÉDIA DA AMOSTRA (VALOR ARMAZENADO EM r(mean)summa x* CALCULA LIMITES DO INTERVALO DE CONFIANÇAscalar li = r(mean) - invnormal(.975)*20/sqrt(50)scalar ls = r(mean) + invnormal(.975)*20/sqrt(50)* TESTA SE MU CAI DENTRO DOS LIMITES

Page 14: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

if mu > li & mu < ls {local contador = ‘contador’ + 1 }}* APRESENTA O VALOR DO CONTADOR APÓS AS 1000 REALIZAÇÕESdisp "contador = ", ‘contador’* APAGA O ARQUIVO DE DADOS DA POPULAÇÃOerase "D:\ECN26\pop.dta"

Page 15: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a média da população µX

I O resultado apresentado a partir da execução desta rotina éque sendo selecionadas 1000 amostras da mesma população,construindo-se 1000 intervalos de confiança, 950 destesintervalos contem o valor do parâmetro µ = 40.

I Neste caso conhecemos o valor de µ para podermos realizar asimulação. Na prática não conhecemos µmas podemosconstruir um intervalo em torno de X e fazermos umaafirmação (com base neste intervalo) a respeito daprobabilidade de µ estar contido neste único intervalo.

Page 16: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para amostras pequenas

Quando temos uma amostra pequena (n < 30) e desconhecemos ovalor de σ não podemos usar o valor do desvio padrão amostral

(s =

√∑ni=1(Xi−X)2

n−1 ) no lugar de σ e não podemos usar adistribuiçao normal padrão. Se a distribuição de X for normaltemos que usar a distribuição t de Student de acordo com aseguinte expressão:

P(X − t1−α/2 × sX < µ < X + t1−α/2 × sX ) = 1− α (3)

O valor da variável aleatória t de Student irá depender do númerode graus de liberdade e do nível de confiança 1− α. O número degraus de liberdade é igual a n − 1, porque perdemos um grau deliberdade ao estimarmos a média amostral X .Vamos desenvolver uma pequena rotina do Stata para calcularalguns valores de t para algusn pares de valores de 1− α e donúmero de graus de liberdade df :

Page 17: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Distribuição t de Student* ROTINA STATA PARA CONSTRUIR PEQUENA TABELA PARA ADISTRIBUIÇÃO t de STUDENT *clearmatrix C = J(27,7,0)forvalues i=2(1)27 {matrix C[‘i’,1] = ‘i’ + 3}local j = 1foreach k in .10 .05 .025 .01 .005 .001 {local j = ‘j’ + 1matrix C[1,‘j’] = ‘k’}forvalues i = 2(1)27 {local j = 1foreach k in .10 .05 .025 .01 .005 .001 {local j = ‘j’ + 1matrix C[‘i’,‘j’] = invttail(‘i’ + 3,‘k’)}}matrix list Csvmat C, names(C)format C2-C5 %5.4fxmlsave "D:\ECN26\APOSTILA DE ESTATISTICA\TABELA DISTRIBUIÇÃO t deSTUDENT.xml", doctype(excel) replace

Page 18: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Distribuição t de Student

Esta rotina gera a seguinte tabela:1 − α/2 0.1 0.05 0.025 0.01 0.005 0.001

graus de liberdade

5 1.4759 2.0150 2.5706 3.3649 4.0321 5.8934

6 1.4398 1.9432 2.4469 3.1427 3.7074 5.2076

7 1.4149 1.8946 2.3646 2.9980 3.4995 4.7853

8 1.3968 1.8595 2.3060 2.8965 3.3554 4.5008

9 1.3830 1.8331 2.2622 2.8214 3.2498 4.2968

10 1.3722 1.8125 2.2281 2.7638 3.1693 4.1437

11 1.3634 1.7959 2.2010 2.7181 3.1058 4.0247

12 1.3562 1.7823 2.1788 2.6810 3.0545 3.9296

13 1.3502 1.7709 2.1604 2.6503 3.0123 3.8520

14 1.3450 1.7613 2.1448 2.6245 2.9768 3.7874

15 1.3406 1.7531 2.1314 2.6025 2.9467 3.7328

16 1.3368 1.7459 2.1199 2.5835 2.9208 3.6862

Page 19: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Distribuição t de Student1 − α/2 0.1 0.05 0.025 0.01 0.005 0.001

graus de liberdade

17 1.3334 1.7396 2.1098 2.5669 2.8982 3.6458

18 1.3304 1.7341 2.1009 2.5524 2.8784 3.6105

19 1.3277 1.7291 2.0930 2.5395 2.8609 3.5794

20 1.3253 1.7247 2.0860 2.5280 2.8453 3.5518

21 1.3232 1.7207 2.0796 2.5176 2.8314 3.5272

22 1.3212 1.7171 2.0739 2.5083 2.8188 3.5050

23 1.3195 1.7139 2.0687 2.4999 2.8073 3.4850

24 1.3178 1.7109 2.0639 2.4922 2.7969 3.4668

25 1.3163 1.7081 2.0595 2.4851 2.7874 3.4502

26 1.3150 1.7056 2.0555 2.4786 2.7787 3.4350

27 1.3137 1.7033 2.0518 2.4727 2.7707 3.4210

28 1.3125 1.7011 2.0484 2.4671 2.7633 3.4082

29 1.3114 1.6991 2.0452 2.4620 2.7564 3.3962

30 1.3104 1.6973 2.0423 2.4573 2.7500 3.3852

Page 20: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a proporção populacional

I Da mesma forma que construimos um intervalo de confiançapara a média µX da população, também podemos construirum intervalo de confiança para a proporção populacional p

I Suponhamos que em uma população eleitores, uma proporçãop de eleitores tenha intenção de votar em determinadocandidato.

I Iremos definir uma variável aleatória de Bernoulli X de formaque:

Xi = 1 se a i-ésima pessoa tenha a intenção de votar no candidatoXi = 0 se a i-ésima pessoa não tenha a intenção de votar nocandidato

Page 21: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a proporção populacional

I Se selecionarmos aleatoriamente (amostra aleatória simplescom reposição) uma amostra de tamanho n de eleitores, onúmero total de eleitores dentro da amostra que tem aintenção de votar no candidato (

∑ni=1 Xi) segue uma

distribuição binomial com parâmetros n e p.I A proporção amostral de eleitores p̂ =

∑ni=1 Xi/n que pode

ser interpretada como sendo uma média amostral de umavariável aleatória Bernoulli.

I Pelo Teorema do Limite Central p̂ terá distribuição normalquando n→∞.

Page 22: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a proporção populacional

I A questão é saber qual é a média (esperança matemática) dep̂, ou seja, E (p̂) e qual é a variãncia de p̂, ou seja,var(p̂) = σ2p̂.

I Podemos demonstrar que E (p̂) é p, ou seja, p̂ é um estimadornão viesado para p.

I Isto significa que se slecionarmos todas as amostras de mesmotamanho n e calcularmos para cada uma delas uma proporçãoamostral p̂, a média de todas estas proporções amostrais seráigual ao valor do parâmetro p.

Page 23: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a proporção populacional

I Para demonstrar isto basta pensar p̂ como sendo uma médiade uma variável aleatória Bernoulli calculada para os nelementos de uma amostra. Como a média amostral é umestimador não viesado para a média populacional mostramosque E (p̂) = p.

I A variância de p̂ é dada porvar(p̂) = var( 1n

∑ni=1 Xi ) = 1

n2 × np(1− p) = p(1−p)n já que o

somatório é uma variável aleatória binomial.I Podemos então dizer que para n→∞, p̂ segue

aproximadamente uma distribuição normal com médiaE (p̂) = p e variância var(p̂) = p(1−p)

n

Page 24: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a proporção populacional

I Para construirmos um intervalo de confiança para a proporçãopopulacional (e seguindo as mesmas operações que usamos nocaso da média da população µX podemos utilizar a expressão:

P(p̂−z1−α/2×

√p(1− p)

n < p < p̂+z1−α/2×

√p(1− p)

n ) = 1−α

(4)I Observe que na expressão (3) caimos em um círculo vicioso;

para construirmos um intervalo de confiança para pprecisamos do valor de p.

I Na prática, temos apenas o valor de p̂ e substituimos estevalor na expressão (3) conduzindo a:

P(p̂−z1−α/2×

√p̂(1− p̂)

n < p < p̂+z1−α/2×

√p̂(1− p̂)

n ) = 1−α

(5)

Page 25: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a proporção populacional

Um exemplo: suponhamos que uma amostra de tamanho n = 50de eleitores tenha 30 eleitores a favor de um determinadocandidato. O intervalo de confiança de 95 % de probabilidade paraa proporção populacional p será:

P(3050 − 1, 96×√

3050 (1−

3050 )

50 < p < 3050 + 1, 96×

√3050 (1−

3050 )

50 ) = 0, 95P(0, 4642 < p < 0, 7358) = 0, 95Se quisermos calcular um intervalo de confiança de 80 % deprobabilidade:P( 3050 − φ

−1(.90)×√

3050 (1− 30

50 )

50 < p < 3050 + φ−1(.90)×

√3050 (1− 30

50 )

50 ) = 0, 80P(0, 51121 < p < .68878) = 0, 80

Page 26: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de confiança para a proporção populacional

I Duas questões sobre este último intervalo:

1) Porque usamos φ−1(.90)? Como o intervalo é de 80% deverádeixar 10% em cada cauda. Então o limite superior terá que deixaruma área a esquerda de 90% e o limite inferior deixará uma área aesquerda de 10%.2) Repare que o intervalo (quando passamos de 90% para 80%)contrai-se. O que já havíamos dito: mantido o mesmo tamanho daamostra, quando diminuimos o nível de confiança a precisão dointervalo aumenta (porque a amplitude do intervalo reduz).

Page 27: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Determinação do tamanho da amostra

I Até o momento mostramos como calcular os limites de umintervalo quando conhecemos X ou p̂ e o tamanho da amostran.

I Mas se quisermos resolver o problema inverso: temos otamanho do intervalo e desejamos conhecer o tamanho daamostra n. Este deve ser o tamanho da amostra necessáriopara construir um intervalo de confiança com determinadonível de confiança e determinado erro de amostragem.

I Para o caso da estimação do parâmetro µ, a metade dotamanho do intervalo, que chamamos erro de amostragem, éigual a:

e = z1−α/2 × σX = z1−α/2 × σX/√

n (6)

Page 28: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Determinação do tamanho da amostra

I Fazendo uma manipulação algébrica da expressão (5) temos:

n =

(z1−α/2 × σX

e

)2

(7)

I Por exemplo, desejamos estimarmos µX , com um erro deamostragem e = 10, com σX = 20 e nível de confiança1− α = 0, 95.

I Para 1− α = 0, 95 então, 1− α/2 = 0, 975 eφ−1(0, 975) = 1.959964

I n =( z1−α/2×σX

e

)2

=(1.959964×20

10

)2= 15.36

Page 29: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Determinação do tamanho da amostra

I Então concluimos que para estimar a média populacional µX ecom um erro de amostragem e = 10 , com σX = 20 e nível deconfiança 1− α = 0, 95, precisamos de uma amostra detamanho n = 16.

I Para uma amostra com as mesmas características e nível deconfiança 1− α = 0, 99, precisamos de n = 27 (faça ascontas).

I Podemos observar que para determinar o tamanho da amostrapara estimar µX sempre precisamos do valor de σX . Naprática, este valor é desconhecido.

I Precisamos primeiro realizar uma amostra piloto para estimar

σX através de sX =

√∑ni=1(Xi−X)2

n−1 (que é um estimador nãoviesado para σX , ou seja E (sX ) = σX .

Page 30: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Determinação do tamanho da amostra (amostragem pelasproporções)

I Para o caso da determinação do tamanho da amostra quandoo objetivo é estimar p, o erro de amostragem é dado por:

e = z1−α/2 × σp̂ = z1−α/2 ×

√p(1− p)

n (8)

I Manipulando os termos da expressão (7), temos:

n =z21−α/2 × p(1− p)

e2 (9)

I Se o objetivo da amostragem é o de justamente estimar p,substituimos na expressão (8), o valor de p que torna máximoo valor de n (ou seja, trabalhamos a favor da segurança).Neste caso p = 0, 5.

Page 31: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Determinação do tamanho da amostra (amostragem pelasproporções)

I Até o momento estamos considerando que a nossa amostra érealizada com reposição e neste caso não precisamos fazercorreção de população finita no caso em que n

N > 0, 05.I Quando a amostragem é feita com reposição, uma expressão

mais exata para o erro de amostragem é:

e = z1−α/2 × σp̂ = z1−α/2 ×

√p(1− p)

n × N − nN − 1 (10)

I Exercício: determinar uam expressão para n a partir daexpressão (9).

Page 32: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Intervalo de Confiança - exercícios

1) Numa fábrica de computadores a administração pretende-seuma estimativa para o tempo médio de vida de um determinadotipo de disco rígido. Para tal, foi seleccionada uma amostraconstituída por 15 computadores. Com base nesta amostraobteve-se um tempo médio de vida igual a 27 350 horas. Supondoque o tempo de vida segue uma distribuição normal com σv igual a3000 horas, construa um intervalo de confiança a 99% para otempo médio de vida dos discos rígidos.Solução:P(27350− z1−.99/2× 3000√

15 < µX < 27350+ z1−.99/2× 3000√15 ) = 0.99

P(27340.292 < µX < 27359.708) = 0.99

Page 33: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Exercícios

2) Com o objectivo de prever a produção de trigo duma certaregião dividiu-se a mesma em pequenos talhões, procedendo-se emseguida ao registo, ao acaso, da produção de alguns desses talhões.Admita que a quantidade de trigo produzida por talhão temdistribuição normal com desvio padrão igual a 60 Kg. a) Determineo número mínimo de talhões que o experimentador deverá analisarse desejar garantir, com uma confiança de pelo menos 95%, que amédia da amostra difira no máximo 30 Kg do verdadeiro valor daprodução média por talhão. b) Qual o número mínimo de talhõesque será necessário analisar se o nível de confiança exigido for de99%? c) Acha que a hipótese de normalidade é essencial naresolução das alíneas a) e b)? Justifique a resposta.

Page 34: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Exercícios

Solução:a)

n =( z1−α/2×σX

e

)2

=(φ−1(1−.05/2)×60

30

)2=(1.959964×60

30

)2= 15, 36

b) n =( z1−α/2×σX

e

)2

=(φ−1(1−.01/2)×60

30

)2=(2.5758293×60

30

)2=

26, 53c) A hipótese de normalidade é essencial pois do contrário X nãoteria distribuição normal para os tamanhos de amostra.

Page 35: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Exercícios

3) Um fabricante produz peças que obedecem a uma norma queespecifica que o seu diâmetro deve ser igual a 100 mm. Admitaque os diâmetros das peças produzidas são N(μ, σv) e que umaamostra aleatória de 20 peças conduziu aos resultados seguintes:∑20

i=1 xi = 1999, 60 e∑n

i=1(xi − x)2 = 111, 91a) Construa um I. C. a 95% para o diâmetro médio das peças. b)Construa um I. C. a 95% para a variância do diâmetro das peças.

Page 36: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

ExercíciosSolução: Quando o tamanho da amostra é pequeno e não seconhece o valor de σ não é apropriado usar no lugar de σ o valor

do desvio-padrão da amostra (s =

√∑ni=1(Xi−X)2

n−1 ) pois isto produzresultados incorretos. Ao invés disso, utiliza-se a distribuição t deStudent. Para isto é necessário que a distribuição de X sejanormal. A regra geral é que quando temos uma amostra grande(n ≥ 30) utiliza-se a distribuição normal padrão e quando temosuma amostra pequena (n < 30), utiliza-se a distribuição t deStudent, desde que a distribuição de X seja normal. Utilizaremos aexpressão:P(X − t1−α/2 × sX < µ < X + t1−α/2 × sX ) = 1− αP(1999.620 −t1−α/2×

√111.9120−1 < µ < 1999.6

20 +t1−α/2×√

111.9120−1 ) = 0.95

O valor de t1−α/2 para um intervalo de 95% de probabilidade é ovalor que deixa uma cauda a direita de 0.025 e com 19 graus deliberdade este valor é t = 2.0930. Portanto:P(1999.620 −2.0930×

√111.9120−1 < µ < 1999.6

20 +2.0930×√

111.9120−1 ) = 0.95

P(94.900431 < µ < 105.05957) = 0.95

Page 37: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Exercícios4) Num determinado período pré eleitoral foi realizada umasondagem com o objectivo de analisar a popularidade de doiscandidatos A e B num determinado distrito. Para tal, foraminquiridas 780 pessoas residentes nesse distrito manifestando-se55% dos inquiridos a favor do candidato A.a) Construa um intervalo de confiança a 90%, 95% e 99% para apercentagem de pessoas do distrito que são a favor do candidatoA. Comente as diferenças obtidas para os três intervalos. b)Suponha que a percentagem obtida resultou de uma amostra de1020 pessoas. Determine um intervalo de confiança a 95% para apercentagem de pessoas a favor do candidato A. Comente oresultado obtido.Solução:a)P(p̂ − z1−α/2 ×

√p̂×(1−p̂)

n < p < p̂ + z1−α/2 ×√

p̂×(1−p̂)n ) = 1− α

P(0.55− z1−0.10/2 ×√

0.55×(1−0.55)780 < p <

0.55 + z1−0.10/2 ×√

0.55×(1−0.55)780 ) = 0.90

P(0.55− z1−0.10/2 ×√

0.55×(1−0.55)780 < p <

0.55 + z1−0.10/2 ×√

0.55×(1−0.55)780 ) = 0.90

z1−0.10/2 = z0.95 = φ−1(0.95) = 1.6448P(0.55− 1.6448×

√0.55×(1−0.55)

780 < p <

0.55 + 1.6448×√

0.55×(1−0.55)780 ) = 0.90

Page 38: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

ExercíciosP(0.5207 < p < .5793) = 0.90Da mesma forma:P(0.55− z1−0.05/2 ×

√0.55×(1−0.55)

780 < p <

0.55 + z1−0.05/2 ×√

0.55×(1−0.55)780 ) = 0.95

z1−0.05/2 = z0.975 = φ−1(0.975) = 1.9599P(0.55− 1.9599×

√0.55×(1−0.55)

780 < p <

0.55 + 1.9599×√

0.55×(1−0.55)780 ) = 0.95

P(0.5151 < p < 0.5849) = 0.95Da mesma forma:P(0.55− z1−0.01/2 ×

√0.55×(1−0.55)

780 < p <

0.55 + z1−0.01/2 ×√

0.55×(1−0.55)780 ) = 0.99

z1−0.01/2 = z0.995 = φ−1(0.995) = 2.5758P(0.55− 2.5758×

√0.55×(1−0.55)

780 < p <

0.55 + 2.5758×√

0.55×(1−0.55)780 ) = 0.99

P(0.5041 < p < .5959) = 0.99

Page 39: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Exercícios

b) P(0.55− z1−0.05/2 ×√

0.55×(1−0.55)1020 < p <

0.55 + z1−0.05/2 ×√

0.55×(1−0.55)1020 ) = 0.95

z1−0.05/2 = z0.975 = φ−1(0.975) = 1.9599P(0.55− 1.9599×

√0.55×(1−0.55)

1020 < p <

0.55 + 1.9599×√

0.55×(1−0.55)1020 ) = 0.95

P(0.5195 < p < .5805) = 0.95O resultado mostra que quando aumentamos o tamanho daamostra, mantendo o mesmo nível de confiança (95%), o tamanho(amplitude) do intervalo diminui (aumenta a precisão daestimativa).

Page 40: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Exercícios

5) Admita que a direcção de determinada Universidade se dispõe aoferecer aos seus 3800 alunos a possibilidade de estes frequentaremaulas ao Sábado de manhã se a procura para este horário forsuficientemente alta. a) Determine a dimensão apropriada daamostra de alunos a inquirir para que a amplitude do intervalo deconfiança a 95% para a proporção de alunos com interesse poraquele horário não exceda 0.1? b) Suponha que após realizada aamostragem com o tamanho indicado pelo dimensionamento, ovalor da proporção amostral é de 50%. Determine um intervalo deconfiança para a proporção populacional de 95% de probabilidade.Solução:O erro de amostragem paar uma estimativa de proporçãopopulacional p (quando consideramos que a amostragem érealizada sem reposição) é dado pela seguinte expressão:e = z1−α/2 × σp̂ ×

√N−nN−1 = z1−α/2 ×

√p×(1−p)

n ×√

N−nN−1

Page 41: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Exercícios

Elevando ambos os termos desta expressão, temos:e2 = z21−α/2 ×

p×(1−p)n × N−n

N−1e2 × n × (N − 1) = z21−α/2 × p × (1− p)× (N − n)

e2×n×(N−1)+z21−α/2×p×(1−p)×n = z21−α/2×p×(1−p)×Nn(e2× (N − 1) + z21−α/2× p× (1− p)) = z21−α/2× p× (1− p)×N

n =z21−α/2×p×(1−p)×N

e2×(N−1)+z21−α/2×p×(1−p)Esta é a expressão para determinar o tamanho de uma amostrapara estimarmos a proporção populacional e quando a amostragemé sem reposição. Neste caso temos que considerar o fator decorreção da população finita nos cálculos.

Page 42: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Exercícios

Substituindo os valores do enunciado na expressão anterior:n = 1.95992×0.5×(1−0.5)×3800

0.12×(3800−1)+1.95992×0.5×(1−0.5) = 93.68 ' 94b)P(0.50− 1.9599×

√0.50×(1−0.50)

94 ×√

3800−943800−1 < p<

0.50 + 1.9599×√

0.50×(1−0.50)94 ×

√3800−943800−1 ) = 0.95

P(0.4001 < p < 0.5998) = 0.95Reparem que o erro de amostragem do intervalo é praticamenteigual a 0.10. Seria isto uma coincidência?

Page 43: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Exercícios

6) Num estudo de mercado quantas pessoas devem ser inquiridaspara, com 95% de confiança, se cometer um erro de estimativa daverdadeira proporção de potenciais clientes de um novo produtoinferior a 3%? E para se cometer um erro de estimativa inferior a1%?

Page 44: IntervalodeConfiançaecálculodetamanhode  · PDF fileforvaluesi=1(1)1000{*ABREAPOPULAÇÃOCRIADAANTERIORMENTE use"D:\ECN26\pop.dta",clear

Exercícios

7) Considere uma amostra aleatória obtida no mercado de trabalhode uma grande cidade, constituída por 2000 indivíduos. Dasentrevistas efectuadas constatou-se que 165 pessoas responderamnão ter emprego. a) Construa um intervalo de confiança a 95%para a proporção média de indivíduos desempregados na referidacidade. b) Caso pretenda reduzir para metade a amplitude dointervalo relativo à alínea anterior, mantendo o mesmo grau deconfiança, qual a dimensão da amostra adequada? Justifique aresposta.