Upload
vankhanh
View
224
Download
0
Embed Size (px)
Citation preview
NOTAS DE AULA: DISTRIBUIÇÃO AMOSTRAL E INTERVALOS DE CONFIANÇA
Objetivos da aula:
• Compreender que um estimador é uma variável aleatória e,portanto, pode-se estabelecer sua distribuição probabilística;
• Estabelecer a distribuição amostral das principaisestatísticas: média, variância e proporção.estatísticas: média, variância e proporção.
• Aplicar os resultados: construção de intervalos de confiança,
dimensionamentos amostral, etc.
Prof. Idemauro Antonio Rodrigues de Lara
1. INFERÊNCIA OU INDUÇÃO ESTATÍSTICA
POPULAÇÃO:
Seja θ : característica de uma variável X quese quer conhecer (PARÂMETRO)
AMOSTRA:
Seja T um estimador de θ, construído combase em valores amostrais
),...,,(ˆ21 nXXXT
Função da amostra aleatória
2. Métodos para realizar inferências a respeito dos parâmetros
1. Estimação:Determinar estimativas para os parâmetrospopulacionais: por ponto e por intervalo.
2. Testes de hipóteses:2. Testes de hipóteses:Processo de indução estatística: decisãorelativa ao valor de um parâmetro populacional(ou conjunto de parâmetros).
IC e testes de hipóteses necessitam do conhecimento da distribuição amostral do estimador.
3. Distribuição amostral
Amostras de n elementos → estimador → estimativas
Distribuição amostral do estimador: distribuição de probabilidade
de um estimador pontual.
Parâmetros da distribuição amostral do estimador:
Importante: conhecendo-se a distribuição amostral de
determinado estimador pode-se fazer inferências.
4. Distribuição amostral da média1º caso – Variável X tem distribuição normal com
variância conhecida.
Distribuição de probabilidade
),(~2
nNX
0.4
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Figura: Distribuição amostral da média
de
nsi
dad
e
Teorema Central do Limite
X 1, X 2, ...X n → v. a. independentes, com média µ e variância σ²
A distribuição de → Normal a medida que n cresce, ou seja:
Xou seja:
Ou, ainda:
),(~2
nNX
)1,0(N
n
XZ
Teorema Central do Limite
Normal
Density
-2 -1 0 1
0.0
0.2
0.4
0.6
0.8
Gamma
Density
0 2 4 6 8 10
0.0
00.1
00.2
00.3
0
sample size = 5
x
-2 -1 0 1
x
0 2 4 6 8 10
Uniform
x
Density
0.2 0.4 0.6 0.8
0.0
1.0
2.0
3.0
Beta
x
Density
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.5
1.0
1.5
2.0
Teorema Central do Limite
Normal
Density
-1.0 -0.5 0.0 0.5 1.0
0.0
0.5
1.0
1.5
Gamma
Density
1 2 3 4 5 6 7
0.0
0.2
0.4
sample size = 15
x
-1.0 -0.5 0.0 0.5 1.0
x
1 2 3 4 5 6 7
Uniform
x
Density
0.2 0.3 0.4 0.5 0.6 0.7 0.8
01
23
45
Beta
x
Density
0.2 0.4 0.6 0.8
01
23
4
Teorema Central do Limite
Normal
De
nsity
0.0
0.5
1.0
1.5
2.0
Gamma
De
nsity
0.0
0.2
0.4
0.6
sample size = 30
x
-0.5 0.0 0.5
x
2 3 4 5
Uniform
x
De
nsity
0.3 0.4 0.5 0.6 0.7
02
46
8
Beta
x
De
nsity
0.3 0.4 0.5 0.6 0.7 0.8
01
23
45
Teorema Central do Limite
Normal
De
nsity
0.0
1.0
2.0
3.0
Gamma
De
nsity
0.0
0.2
0.4
0.6
0.8
1.0
sample size = 50
x
-0.4 -0.2 0.0 0.2 0.4
x
1.5 2.0 2.5 3.0 3.5 4.0 4.5
Uniform
x
De
nsity
0.35 0.40 0.45 0.50 0.55 0.60 0.65
02
46
81
0
Beta
x
De
nsity
0.4 0.5 0.6 0.7
01
23
45
67
Resultado: IC para a média pressupondo normalidade (ou amostras grandes) e variância
conhecida
);(),( )2/()2/(n
zXn
zXIC
Exemplo1- Por analogia a produtos similares, o tempo de reação
de um novo medicamento pode ser considerado normalcom desvio padrão igual a 2 minutos. Vinte pacientesforam sorteados, receberam o medicamento e tiveramseu tempo de reação anotado. Os dados foram:
2,9 3,4 3,5 4,1 4,6 4,7 4,5 3,8 5,3 4,92,9 3,4 3,5 4,1 4,6 4,7 4,5 3,8 5,3 4,94,8 5,7 5,8 5,0 3,4 5,9 6,3 4,6 5,5 6,2
média 4,745
Obtenha um intervalo de confiança para o tempo de reação.
Interpretação do IC
30
40
50
Confidence intervals based on z distribution
| | || |
|| || |
| ||| ||| |
|| || |
3 4 5 6
01
02
03
0
Confidence Interval
Ind
ex
| || ||
| | || || |
|| | ||| | || ||| |
| || | |
2 º caso: Distribuição amostral da média, pressupondodistribuição normal e variância desconhecida.
)1(~
nt
n
s
X 30nSe :
n
Se n > 30 :
)1,0(N
n
s
X
A distribuição t de Student0.1
0.2
0.3
graus de liberdade=5
de
nsid
ade
0.0
0.1
0.2
0.3
0.4
graus de liberdade=15
de
nsid
ade
-3 -2 -1 0 1 2 3
t
-3 -2 -1 0 1 2 3
t
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
graus de liberdade=25
t
de
nsid
ad
e
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
graus de liberdade=45
t
de
nsid
ad
e
Resultado: IC para a média pressupondo normalidade e variância desconhecida
);(),( )2/()2/(n
stX
n
stXIC
Exemplo
2- Admita que o índice de poluiçãoambiental em uma região e horário siga omodelo normal. Oito índices forammedidos às 13 horas: 34, 45, 77, 52, 48,medidos às 13 horas: 34, 45, 77, 52, 48,54, 79, 66. Construa um intervalo de 99%de confiança para a média.
5.Distribuição amostral da proporção
Realizada uma amostragem, tal que:
Temos o seguinte resultado:
})1,0{(;...,,11 inn xxXxX
Temos o seguinte resultado:
)1,0()ˆ1(ˆ
ˆN
n
pp
pp
Aplicação: construção de um IC para a proporção
n
ppzp
n
ppzppIC
)ˆ1(ˆˆ;
)ˆ1(ˆˆ),( )2/()2/(
Exemplo
3. Pretende-se estimar a proporção de locais deuma macro região, que tem condiçõessatisfatórias de saneamento básico. Para tantoforam escolhidos aleatoriamente 200 locais eobservou-se que 115 deles não havia condiçõesobservou-se que 115 deles não havia condiçõesmínimas de saneamento. Estimar por intervalo averdadeira proporção de locais sem saneamentobásico. Use nível de confiança igual a 95%.
6- Distribuição amostral de S²
Considere uma amostra aleatória extraída depopulação normal com média e variânciadesconhecidas. Temos o seguinte resultado:
22
)1(~
2)1(
2
2
nS
n
A menos de uma constante a distribuição amostral da variância aproxima-se da distribuição qui-
quadrado com (n-1) graus de liberdade
A distribuição qui-quadrado0
.40
.50
.6
0 1 2 3 4 5
0.0
0.1
0.2
0.3
x
f(x)
Assimétrica à direita, parâmetro graus de liberdade
Intervalo de confiança para a variância
2
2
2
22 )1(
;)1(
),(ab
SnSnIC
ab
EXEMPLO: IC para a variância do exemplo 2
ERRO MÁXIMO DA ESTIMATIVA / DETERMINAÇÃO DO TAMANHO
DA AMOSTRA
2 conhecida (ou n > 30) I.C. x z
n
x
2
2
2
n zx
erro = e
0
22n z
e
x
para pop. “infinitas”
0
2 2
2 2 21n
N z
e N z
x
x
( ) para pop. finitas
Determinação do tamanho da amostra necessário para com desvio máximo pré-determinado, a um certo nível de
confiança:
0
2
2nz p q
e
para populações “infinitas”
2
0
2
2 21n
z p q N
e N z p q
( ) para populações finitas
obs.: Quando não houver condições de prever o valor de p ,
admitir ,p 0 50. Dessa forma, obter-se-á o maior tamanho da
amostra, admitindo-se constantes os demais elementos.
ERRO MÁXIMO DA ESTIMATIVA / DETERMINAÇÃO DO
TAMANHO DA AMOSTRA
2 desconhecida IC. x t
s
n
x
2
erro = e
02
2
2n ts
e
x
para populações “infinitas”
ou
0
2 2
2 2 21n
N t s
N e t s
x
x
( ) para populações finitas
Referências
1. ANDRADE, D. F.; OGLIARI, P. J. Estatística para as ciências agrárias e biológicas com noções de experimentação. Editora da UFSC, Florianópolis, 2007.
2. BUSSAB, W. O. ; P. A. MORETIN. Estatística Básica, 5ª edição. Editora Saraiva, 2002.
3. MAGALHÃES, M. N.; LIMA, A.C. P de. Noções de Probabilidade e Estatística. 6ª ed. São Paulo: EDUSP, 2007.e Estatística. 6ª ed. São Paulo: EDUSP, 2007.