Upload
nathalia-mendonca
View
2.922
Download
10
Embed Size (px)
DESCRIPTION
Intervalo de confiança de metodos estatisticos
Citation preview
Intervalo de Confiança
Estatística Inferencial
Duas Fases da Estatística
• Estatística Descritiva: descrever e estudar uma amostra.
• Estatística Indutiva (inferencial): a partir de uma amostra inferir sobre as características de uma população.
População vs. Amostra
População: colecção de unidades individuais (pessoas ou resultados experimentais) com uma ou mais
características comuns, que se pretendem estudar.
Amostra: Conjunto de dados ou observações, recolhidos a partir de um subconjunto da população, que se estuda com o objectivo de tirar conclusões para a população de onde foi recolhida
Podemos inferir (deduzir) determinadas características de uma
população se extraímos uma amostra representativa desta
amostragem
Amostragem
• Amostragem Aleatória Simples: cada elemento da amostra é retirado
aleatoriamente de toda a população (com ou sem reposição)
cada possível amostra tem a mesma probabilidade de ser recolhida
• Amostragem Estratificada: subdividir a população em, pelo menos, dois
subgrupos distintos que partilham alguma característica e, em seguida,
recolher uma amostra de cada um dos subgrupos (estratos)
• Amostragem por clusters: dividir a população em secções (clusters);
seleccionar aleatoriamente alguns desses clusters; escolher todos os
membros dos clusters seleccionados.
Processo pelo qual se extraem dados de uma população
Existem vários tipos de amostragem:
Inferência Estatística
amostra
inferir certas características da população
distribuição conhecida/desconhecidae/ou parâmetros desconhecidos
n indivíduos (ou objetos) da populaçãoex: sortear n pixels de uma imagem
(com ou sem reposição)
n realizações de uma v.a. Xex: medir a reflectância de um objeto
n vezes
a amostra constitui um conjunto de n v.a.X1, X2, ..., Xn independentes e identicamente distribuídas com distribuição FX
Amostra Aleatória
• Parâmetro – Medida usada para descrever a distribuição da população.– a média μ e o desvio padrão σ são parâmetros de uma distribuição
Normal.
– a probabilidade de sucesso p é um parâmetro da distribuição Binomial.
• Estatística – Função de uma amostra aleatória que não depende de parâmetros desconhecidos – Média amostral
– Variância amostral
– Amplitude da amostra
Parâmetro vs. Estatística
Estimação de ParâmetrosPopulação Amostra
Distribuição da População
Parâmetros
Distribuição Amostral
Estatísticas(valor fixo)
estimar
(função da amostra)
pontual (estatísticas)
por intervalo (intervalos de confiança)Estimação
OBS: estatística: é a v.a. que estima (pontualmente) um parâmetro (populacional)as vezes é chamada simplesmente de estimador
estimativa: é o valor do estimador obtido para uma amostra específica
Intervalo de Confiança
É uma faixa de possíveis valores em torno da média amostral, e a
probabilidade de que esta faixa realmente contenha o valor real da média
da população
O Intervalo de confiança terá uma certa probabilidade chamada de nível
de confiança (simbolizada por 1 – ) de conter a média da população.
x
1 – α/2 /2
Intervalo de confiança
1 – α = nível de confiança
α = nível de significância (probabilidade de erro)
Há uma probabilidade de 1 – da
média estar contida no intervalo
definido
Há uma probabilidade de a média
amostral estar fora do intervalo definido
(área hachurada)
Intervalo de Confiança
z2z1
Erro = z . Desvio padrão amostral
nz.e s
=intervalo
errox errox
(μ)
= 1)( exexP
α /2 α /2
s = desvio padrão da população
1 - α = grau de confiança
Distribuição das médias amostrais
x
1 – α
Intervalo de Confiança
exouexex =
Quando tem n > 30 e
s é conhecido
Quando tem n > 30 e
σ é desconhecido
Substitui o desvio padrão da
população s pelo desvio
padrão da amostra s
Região
CríticaRegião
Crítica
Z/2Z/2
ZcríticoZcrítico
1 - α
xn
X
ss =
XzX s .:
nzes
.=n
Sze X.=
n
SzX X.=
Intervalo de Confiança
X50403020 807060Amostra
1
2
3
...
45
46
47
...
98
99
100=50
Se em um estudo, forem
retiradas várias amostras
aleatórias de tamanho n da
população e que, para cada
amostra, seja construído
um intervalo de (1-) de
confiança para a variável
desejada.
Os intervalos obtidos
serão diferentes, mas
(1-)% destes intervalos
conterão entre os seus
intervalos o valor real do
parâmetro.
Ao nível de 95% de confiança espera-se que em 100 intervalos para as amostras, 95 deles contenham a média μ
Interpretação:
Exercícios
1) Determine o valor crítico que corresponde ao grau de
confiança indicado:
2/Z
a) 99%
b) 94%
c) 92%
d) 90%
Exercícios
1) Um dos principais produtos de uma indústria siderúrgica é a
folha de flandres. Havia uma preocupação com a possibilidade de
haver um número de folhas fora da faixa de especificação de
dureza (LIE = 58,0 HR e LSE = 64,0 HR). A partir desta
informação a empresa decidiu estimar a dureza média das folhas
de flandres () coletando uma amostra aleatória de 49 folhas.
61,0 60,2 60,3 60,3 60,0 61,0 60,3
60,0 60,0 60,9 61,0 61,2 59,2 60,9
60,0 60,5 59,8 59,3 61,0 59,6 59,8
59,6 60,1 58,0 59,8 58,9 57,6 58,0
60,5 60,1 61,6 61,1 59,7 58,3 61,6
59,5 59,0 60,3 58,7 59,6 54,2 60,3
61,0 59,7 59,9 59,9 60,0 58,6 59,9
Medidas de dureza (HR) das folhas-de-flandres fabricadas pela
siderúrgica
Para um grau de confiança de 95%, determine a margem de erro (E) e o
intervalo de confiança para média populacional ().
3) Uma máquina automática de suco industrial é regulada de modo
que a quantidade suprida de cada vez, tenha distribuição
aproximadamente normal com desvio-padrão de 35ml. Determine
um intervalo de 96% de confiança para a quantidade média de toda
produção, sabendo que uma amostra de 30 embalagens teve um
conteúdo médio de 290 ml.
Exercícios:
4) A Polícia Rodoviária faz mensalmente uma pesquisa para avaliar a
velocidade desenvolvida nas rodovias durante o período de 2 às 4
horas da madrugada. Num período de observação e em um trecho
específico, 100 carros passaram por um aparelho de radar a uma
velocidade média de 115 Km/h, com desvio padrão de 10 Km/h.
a) Construa um intervalo de 98% de confiança para a média da
população;
5) Uma amostra aleatória de 40 contas não-comerciais na filial de um
banco acusou saldo médio de R$140,00 com desvio-padrão de
R$30,00.
a) Construa um intervalo de 95% confiança para a verdadeira média.
b) Construa um intervalo de 99% confiança para a verdadeira média.
c) A que conclusão podemos chegar com os resultados das opções
anteriores?
Exercícios: