21
Probabilidade e Estatística Básica: Um curso para inocentes com o companheiro R Ministrado por um bobo. Teoria da Estimação Sérgio Mário Lins Galdino

Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Embed Size (px)

Citation preview

Page 1: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Probabilidade e Estatística Básica:Um curso para inocentes com o

companheiro R Ministrado por um bobo.

Teoria da Estimação

Sérgio Mário Lins Galdino

Page 2: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Estimativas não-tendenciosos e Estimativas Eficientes

Estimativas pontuais e Estimativas Intervalares

Estimativas do Intervalo de Confiança dos Parâmetros da População

Intervalos de Confiança para Médias Intervalos de Confiança para Proporções Intervalos de Confiança para Diferenças e

Somas

Agenda

Page 3: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Uma estimativa é não tendenciosa quando a média ou esperança da estatística é igual ao parâmetro da população.

Quando duas estatísticas da distribuição amostral tem mesma média, a estatística coma menor variância é a mais eficiente.

Estatística eficiente e não tendenciosa nem sempre é possível

Estimativas não-tendenciosos e Estimativas Eficientes

Page 4: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Um estimador pontual de um parâmetro populacional é dado por um único valor.

Um estimador intervalar de um parâmetro populacional é dado por dois números (limites inferior e superior) no qual o parâmetro é considerado pertencer.

Exemplo: Temperatura: 28ºC (pontual) Temperatura: 28±2 (intervalar)

Estimativas pontuais e Estimativas Intervalares

Page 5: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Estimativas do Intervalo de Confiança dos Parâmetros da População

Sejam s e s a média e o desvio padrão (erro padrão) da distribuição amostral de uma estatística amostral S. Assumindo S normalmente distribuída ( n ≥ 30, lei dos grandes números). Espera-se encontrar S nos intervalos

s ± s , s ±2 s e s ± 3s em cerca de 68,27%, 98,45% e 99,83% das vezes.

Page 6: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Estimativas do Intervalo de Confiança dos Parâmetros da População

Os números extremos dos intervalosS1.96s e S2.58s, são chamados limites de confiança 1- 95% e 99% (ou 0.95 e 0.99). Os números 1.96, 2.98, etc. são os valores críticos (zc).

Exemplo: > LC= 0.95> ZC = qnorm(1 - (1-LC)/2)> ZC[1] 1.959964

Limite de confiança

99 98 96 95 90 80 50

zc 2.58 2.33 2.05 1.96 1.645 1.28 0.6745

Page 7: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Estimativas do Intervalo de Confiança dos Parâmetros da População

O limite de confiança (1-)100% onde [0, 1] (LC = 1- ) pode-se determinar um z com∗

P (−z∗ < z < z∗) = 1 − α

z∗ é chamado de z1−α/2 . Em R ele é calculado pela função qnorm

> alpha = c(0.01,0.02,0.04,0.05,0.10,0.20,0.5)> zasterisco = qnorm(1 - alpha/2)> zasterisco[1] 2.5758293 2.3263479 2.0537489 1.9599640 1.6448536 1.2815516 0.6744898>

Page 8: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Amostras grandes ( n ≥ 30). Os limites de confiança para a média da população

são

no caso de uma população infinita, ou por

no caso de amostragem com reposição de uma população finita,

Intervalos de Confiança para Médias

nZX C

1

N

nN

nZX C

Page 9: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Exemplo: Encontre os limites de confiança de 95% e 99% de uma amostra de tamanho 30 com média 1.82 e desvio padrão amostral 0.17.

Resposta: Os limites de confiança de 95% são

> qnorm(1-(1-0.95)/2)*0.17/sqrt(30)[1] 0.0608326>

no caso de amostragem com reposição de uma população finita,

Intervalos de Confiança para Médias

06.082.130

17.096.182.1

Page 10: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Os limites de confiança de 99% são

> qnorm(1-(1-0.99)/2)*0.17/sqrt(30)[1] 0.07994759>

Intervalos de Confiança para Médias

08.082.130

17.058.282.1

Page 11: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Amostras pequenas (n < 30) e População Normal.

Usa-se a distribuição T (t de Student) para obtenção dos limites de confiança.

Por exemplo -t0.95 e t0.95 são os valores de T para os quais 5% da área pertence a cada lado da distribuição T

Intervalos de Confiança para Médias

95.095.0 ˆtn

S

Xt

Page 12: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Amostras pequenas (n < 30) e População Normal. pode ser estimado pertencer ao intervalo

com 95% de confiança. Os limites de confiança são

com tc obtido por tabela ou calculado

Intervalos de Confiança para Médias

n

StX

n

StX

ˆˆ975.0975.0

n

StX c

ˆ

Page 13: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Amostras pequenas (n < 30) e População Normal.

Exemplo: Os valores de tc em R são calculado pela função qt.

> qt(.975, df = c(1:10,20,50,100,1000)) [1] 12.706205 4.302653 3.182446 2.776445 2.570582

2.446912 2.364624 2.306004 2.262157 2.228139 2.085963

[12] 2.008559 1.983972 1.962339>

Intervalos de Confiança para Médias

Page 14: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Amostras pequenas (n < 30) e População Normal.

Exemplo:x=c(175, 176, 173, 175, 174, 173, 173, 176, 173,

179)n=length(x)xm=mean(x)df=n-1tc=qt(0.975,df)delta.x=tc*sd(x)/sqrt(n)x.inf=xm-delta.xx.sup=xm+delta.x

Intervalos de Confiança para Médias

Page 15: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Amostras pequenas (n < 30) e População Normal.

Exemplo(continuação)># Intervalo de confiança de 95%> x.inf[1] 173.3076> x.sup[1] 176.0924> # Média de x> xm[1] 174.7> xm/sd(x)*sqrt(10)[1] 283.8161>

Intervalos de Confiança para Médias

Page 16: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Amostras pequenas (n < 30) e População Normal.

Exemplo(continuação)> t.test(x)

One Sample t-test

data: x

t = 283.8161, df = 9, p-value < 2.2e-16

alternative hypothesis: true mean is not equal to 0

95 percent confidence interval:

173.3076 176.0924

sample estimates:

mean of x

174.7

>

Intervalos de Confiança para Médias

Page 17: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Suponha que a estatística S é a proporção de “sucesso” em uma amostra de tamanho n≥30 extraída de uma população binomial em que p é a proporção de sucessos (i. é., probabilidade de sucesso).

Os limites de confiança para a proporção da população são dadas por

para uma amostra de população infinita, ou uma amostra com reposição de uma população finita.

Intervalos de Confiança para Proporções

n

ppzP

n

pqzP cc

)1(

Page 18: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

(continuação)

Os limites de confiança para a proporção da população são dadas por

se a amostragem é sem reposição , de uma população finita de tamanho N.

Intervalos de Confiança para Proporções

1

N

nNzP

n

pqzP cc

Page 19: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

(continuação) Exemplo: Uma amostra aleatória de 600 eleitores de certo

distrito eleitoral dá 55% como favoráveis a determinado candidato A. Determine limites de confiança para a proporção global de eleitores favoráveis ao candidato na base de 99%.

Os limites de confiança de 99% para população são

Conclusão: O candidato A está com 99% de chance para vencer as eleições

Intervalos de Confiança para Proporções

04.055.01000

45.055.058.255.0

)1(58.2

n

ppPP PP

Page 20: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

Intervalos de Confiança para Diferenças e Somas

222121 2121 SScSSc zSSzSS

222121 2121 SScSSc zSSzSS

Se S1 e S2 são duas estatísticas amostrais com distribuições amostrais aproximadamente normais, a expressão

dá limites de confiança para as diferenças dos parâmetros populacionais, e

dá os limites de confiança para a soma dos parâmetros populacionais, desde que as amostras sejam independentes.

Page 21: Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo

No caso de populações infinitas

dá limites de confiança para as diferenças dos parâmetros

populacionais onde são as respectivas médias, desvios padrões e tamanhos das duas amostras populacionais.

Analogamente,

dá os limites de confiança para a soma dos parâmetros populacionais, desde que as amostras sejam independentes.

Intervalos de Confiança para Diferenças e Somas

222121

2121 XXcXXc zXXzXX

2

22

1

112121

)1()1(21 n

pp

n

ppzPPzPP cPPc

22111 ,,,, 2 nXenX