Upload
david-marques
View
10
Download
0
Embed Size (px)
DESCRIPTION
estimação ao processo de atribuição de um valor a um parâmetro, para o qual não se conhece o valor absoluto.
Citation preview
INFERNCIA ESTATSTICA
ISEL ADM
1
2. ESTIMAO
Suponhamos que X, representa uma certa populao ou universo. O
comportamento de X conhecido quando se conhece a sua distribuio e o
valor dos parmetros caracterizadores dessa distribuio. Se ( ; )f x for a funo
de probabilidade ou de densidade da varivel X, neste caso o parmetro
desconhecido. Os mtodos de estimao so utilizados precisamente para
estimar um valor para um certo parmetro desconhecido.
Existem trs grandes reas dentro da estimao paramtrica:
Estimao pontual: produo de um valor, que se pretende que seja o melhor
para um determinado parmetro da populao, com base na informao
amostral.
Estimao intervalar: construo de um intervalo que, com certo grau de
certeza previamente definido, contenha o verdadeiro valor do parmetro da
populao.
Estimao por testes de Hipteses: trata-se de uma metodologia que permite
validar ou no determinadas hipteses sobre os parmetros de uma ou mais
populaes.
2.1 Estimao pontual
O objectivo da estimao pontual produzir um valor para , que pertena ao
conjunto de valores admissveis que o parmetro pode assumir, de acordo com
a distribuio de X. Por exemplo, se X segue uma Binomial, ( , )X B n p , os
parmetros da populao desconhecidos so o n e o p, sendo 0 1e 0p n .
Definio de Estimador: Designa-se genericamente por: 1 2 , ,..., nX X X ,
sendo uma estatstica (portanto, uma varivel aleatria funo da amostra)
INFERNCIA ESTATSTICA
ISEL ADM
2
cujas realizaes fornecem aproximaes (estimativas) para o parmetro
desconhecido.
(obs: Qualquer estimador uma estatstica, mas nem todas as estatsticas so estimadores.)
Um estimador no mais do que uma frmula, funo de variveis que
assumem determinados valores para uma dada amostra concreta, no
envolvendo nenhum valor desconhecido. Ou seja, com as observaes de uma
amostra concreta a referida frmula produz um valor determinado a que
chamamos estimativa para o parmetro desconhecido.
Definio de Estimativa: valor especifico assumido por um estimador, obtido
quando se concretiza uma amostra concreta na frmula matemtica do
estimador. Representa-se por .
Exemplo: A estatstica X um estimador do valor mdio , isto , para uma
amostra concreta, obtemos uma estimativa x para .
Propriedades desejveis nos estimadores Para estimar um certo parmetro da populao, podem-se utilizar estimadores
alternativos. A escolha do melhor estimador deve ser feita tendo em conta
algumas propriedades desejveis num bom estimador. Essas propriedades
dependem da dimenso da amostra considerada.
Propriedades desejveis num bom estimador obtido a partir de amostras
pequenas:
No Enviesamento: Um estimador diz-se no enviesado ou centrado
para , se E .
Exemplos: o A mdia amostral um estimador centrado do valor mdio da populao,
pois j vimos anteriormente que: E X .
INFERNCIA ESTATSTICA
ISEL ADM
3
o A varincia amostral
2
2
1 1
ni
i
X XS
n
um estimador centrado de 2 , pois
demonstra-se que 2 2E S .
Esta propriedade s por si no suficiente para optar por, um entre dois
estimadores, no caso por exemplo dos mesmos terem varincias muito
diferentes.
Eficincia: Um estimador diz-se eficiente se dentro da classe dos
estimadores no enviesados ou centrados, tiver varincia mnima (o que
significa que a magnitude dos erros de estimao mnima).
Exemplo: Demonstra-se que, de entre os estimadores para o valor mdio de uma
populao normal, a mdia amostral um estimador eficiente.
Suficincia: Um estimador diz-se suficiente, quando obtido utilizando
toda a informao disponvel na amostra, relevante para a estimao do
parmetro.
Nota: Estas propriedades tambm so vlidas para amostras grandes
Propriedades desejveis num bom estimador obtido a partir de amostras
grandes (propriedades assintticas):
No enviesamento assinttico: Um estimador diz-se no enviesado
assintoticamente quando a mdia da distribuio do estimador converge
para o parmetro medida que a dimenso da amostra aumenta, ou seja,
quando n tende para infinito tem-se: lim ( )nE .
Por exemplo, o estimador 2S (varincia da amostra), um estimador no
enviesado assintoticamente para a varincia da populao 2 .
INFERNCIA ESTATSTICA
ISEL ADM
4
Consistncia: Um estimador diz-se consistente simples ou em
probabilidade se medida que a dimenso da amostra aumenta se tem,
1, 0nP .
Eficincia assinttica: Um estimador diz-se assintoticamente mais
eficiente se, de entre os estimadores consistentes em mdia quadrtica, for o que
apresenta distribuio assinttica com varincia mnima.
Nota: um estimador consistente em mdia quadrtica se, medida que
aumenta a dimenso da amostra, se verifica 2lim ( ) 0nE .
Definidas as propriedades desejveis dos estimadores, a questo que se coloca
seguidamente a de saber como os definir. Existem diversos mtodos
alternativos de estimao pontual, nomeadamente o mtodo dos momentos e o
mtodo da mxima verosimilhana, os quais no sero estudados nesta unidade
curricular.
2.2 Estimao por Intervalos
A grande limitao dos mtodos de estimao pontual a de no fornecerem
qualquer informao relativa ao rigor das estimativas efectuadas, ou seja, a
grandeza do erro de amostragem. Esta dificuldade ultrapassada recorrendo
aos intervalos de confiana. Na estimao por intervalos, vamos construir um
intervalo, que com certo grau de certeza, previamente fixado, contenha o
verdadeiro valor do parmetro.
INFERNCIA ESTATSTICA
ISEL ADM
5
Definio de Estimador Intervalar
Um estimador intervalar para o parmetro um intervalo de limites
aleatrios 1 2 , , que tem uma certa probabilidade de conter o verdadeiro
valor do parmetro ( desejvel que essa probabilidade seja elevada). Os limites
do intervalo so aleatrios porque 1 2 e so estatsticas amostrais, so
portanto variveis aleatrias, j que dependem da amostra aleatria
1 2, ,..., nX X X . Amostras diferentes produzem estimativas de intervalo
diferentes.
S possvel construir um intervalo de confiana para um parmetro,
associando-lhe um determinado coeficiente de confiana se for conhecida a
distribuio do estimador intervalar utilizado.
Definio de Intervalo de confiana de nvel (1 ) 100%
Um intervalo de confiana a (1 ) 100% para o parmetro , representa-se
por (1 ) 100% 1 2 ] [ ,I , em que os limites de confiana so aleatrios tais que:
1 2 1P , sendo (1 ) 100% o nvel ou coeficiente de confiana e
o nvel de significncia.
2.2.1 Metodologia utilizada na construo de intervalos de confiana
A metodologia para a construo de um intervalo de confiana para um dado
parmetro segue os seguintes passos:
1. definio da populao, da sua distribuio e do parmetro a estimar;
2. escolha da varivel fulcral, ou seja, da estatstica que vamos utilizar para
obter a estimativa intervalar para o parmetro;
INFERNCIA ESTATSTICA
ISEL ADM
6
A varivel fulcral um estimador pontual para o parmetro que contm o
parmetro na sua expresso e cuja distribuio no depende dele, nem de
quaisquer outros valores que se desconheam.
3. Determinao da distribuio da varivel fulcral;
4. Escolha do nvel de significncia , ou do nvel de confiana
100(1 )% , os valores mais usuais so 90%, 95% e 99%;
5. Construo do intervalo aleatrio;
6. Determinao dos limites do intervalo aleatrio;
7. Determinao dos limites do intervalo de confiana concretos, a partir
dos valores de uma amostra concreta 1 2( , ,..., )nx x x .
Exemplo
A varivel aleatria X representa o tempo de processamento em milsimas de
segundo, de um novo processador desenvolvido por uma empresa de
hardware. Considere que o tempo segue uma distribuio normal com desvio
padro 3.0 . Com base numa amostra aleatria de dimenso 25 a qual
forneceu uma mdia amostral 48x milsimas de segundo, construa um
intervalo de confiana ao nvel de 95% para o verdadeiro valor mdio do tempo
de processamento.
1) , 0.3X N ; Parmetro a estimar: .
2) Para estimar , vamos utilizar o estimador pontual X , a mdia amostral.
Dado que a caracterstica em estudo tem distribuio normal com desvio
padro conhecido, sabemos por aplicao do teorema do limite central que
,X Nn
e portanto
(0,1)
XN
n
. Assim a varivel fulcral a escolher
neste caso
X
Z
n
.
3) A distribuio da varivel fulcral
0,1
XN
n
.
INFERNCIA ESTATSTICA
ISEL ADM
7
4) Nvel de confiana 100(1 )% = 95%.
5)
1 12 2
0.95X
P z z
n
6) 1.96 1.96 0.95P X Xn n
7) Considerando agora as observaes da amostra, obtm-se a estimativa
48x , que aps ser substituda nos limites aleatrios do intervalo, produz a
estimativa intervalar ao nvel de confiana de 95% para , dada por
47.882 , 48.118 .
No exemplo dado foi relativamente fcil de determinar a varivel fulcral a
utilizar, bem como a sua distribuio terica, que com se viu essencial para a
construo do intervalo. Na construo de um intervalo de confiana para um
certo parmetro a varivel fulcral a utilizar depende do parmetro
desconhecido, da distribuio da caracterstica em estudo na populao ser ou
no conhecida e da dimenso da amostra. Assim, o quadro resumo que se segue
apresenta a varivel fulcral e a sua distribuio, em funo do parmetro
desconhecido, de existirem ou no outros parmetros desconhecidos
intervenientes, para alm do que estamos a estimar, da distribuio da
populao e da dimenso da amostra.
O processo de construo de uma estimativa intervalar para qualquer um dos
parmetros que esto na 1 coluna do quadro resumo segue as mesmas etapas
que descrevemos ao obter o intervalo de confiana para a mdia populacional
.
INFERNCIA ESTATSTICA
ISEL ADM
8
Quadro resumo das distribuies das estatsticas mais importantes
Parmetro 2
conhecido?
Tipo de populao
Dimenso da amostra
Distribuio amostral da Varivel fulcral
Sim
Normal Qualquer 0,1X
N
n
Qualquer 30n 0,1X
N
n
No
Normal 30n 1nX
tS
n
Normal ou outra
30n 0,1X
NS
n
2
Normal Qualquer 2
2
121
n
Sn
p
Bernoulli 30n
0,1
1
p pN
p p
n
1 2
2 21 2
e
conhecidas
Normais Quaisquer
1 2 1 2
2 2
1 2
1 2
( ) ( )(0,1)
X XN
n n
1 2
2 21 2
e
desconhecidas
Normais ou outras 1 2
30 e 30 n n
1 2 1 2
2 2
1 2
1 2
( ) ( )(0,1)
X XN
S S
n n
1 2
2 21 2
e
desconhecidas
(2 2
1 2 )
Normais 1
30n e
230n
1 2
1 2 1 22
2 2
1 1 2 2
1 2 1 2
( ) ( )
( 1). ( 1) 1 1.
2
n n
X Xt
n S n S
n n n n
1 2p p
Bernoulli 1 230 e 30 n n
1 2 1 2
1 1 2 2
1 2
( ) ( )(0,1)
(1 ) (1 )
p p p pN
p p p p
n n
2
1
2
2
Normais Quaisquer
2 2
1 21 22 2
2 1
. F( -1, 1)S
n nS
INFERNCIA ESTATSTICA
ISEL ADM
9
2.2.2 Interpretao de um intervalo de confiana
A probabilidade do intervalo aleatrio
0,95] [ 1.96 1.96I X Xn n
conter o verdadeiro valor de de 0.95. Trata-se de um intervalo aleatrio
pois os seus limites dependem de X que uma varivel aleatria, dependente
da amostra seleccionada.
O que varia de amostra para amostra o valor concreto, x que a varivel
aleatria X vai assumir, variando com ele a localizao do intervalo de
confiana (e no a sua amplitude), como se pode ver na figura seguinte.
Fazendo uma interpretao frequencista do intervalo de confiana, podemos
dizer que se recolhssemos 100 amostras aleatrias da mesma dimenso e se
para cada uma delas fosse calculado o intervalo acima referido,
aproximadamente 95 destes intervalos conteriam o parmetro , enquanto que
os outros 5 no o conteriam.
No exemplo anterior, ao calcularmos o intervalo de confiana para uma
amostra concreta obtivemos o intervalo 47.882 , 48.118 . J no se pode
afirmar que a probabilidade deste intervalo conter parmetro de 0.95, pois
INFERNCIA ESTATSTICA
ISEL ADM
10
este intervalo tem dois limites determinados (no aleatrios), e portanto ele
contm ou no contm o parmetro .
2.2.3 Planeamento da dimenso da amostra a recolher em funo da preciso da estimativa
A preciso do intervalo de confiana ao nvel (1 )100% para a mdia metade
da sua amplitude, portanto 2
1/z n ,
21
/z s n , ou 2
/t s n . Antes de recolher a
amostra possvel determinar a dimenso da amostra, que permite obter um
intervalo com um dado nvel de confiana (1 )100% , garantindo que o erro
mximo cometido preciso inferior a um valor E previamente fixado.
O menor inteiro n que verifique a desigualdade 2
1/z n E ou
21
/z s n E , ou
2
/t s n E , ser obtido resolvendo as respectivas inequaes, o que nos conduz
aos seguintes resultados, respectivamente:
2
2
1z
nE
, 22
1z s
nE
, e 22
t sn
E
.
Podemos verificar que a dimenso amostral inversamente proporcional ao
quadrado da preciso fixada. Frequentemente a varincia populacional
desconhecida. Nesse caso antes de determinar n temos de utilizar uma amostra
preliminar 30n para obter a varincia amostral 2s .
Exemplo: Para os dados do exemplo anterior, qual dever ser a dimenso da
amostra a recolher se pretendermos estimar o tempo mdio de processamento
com um erro inferior a 0,09 milsimas de segundo, ao nvel de confiana de
95%?
Substituindo 2
11,960z , 0,3 e E=0,09, em
2
2
1z
nE
, obtm-se:
21,96 0,3
430,09
n n
.