Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem para a estimacaode medidas de precisao em sondagens
Conceicao Amado
Instituto Superior TecnicoUniversidade Tecnica de Lisboa
Seminarios CEMAT 2007
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Outline
1 Estimacao da precisaoIntroducaoLinearizacaoSerie de Taylor
2 Metodos de ReamostragemJackknifeBootstrap
3 Comentarios e conclusoes finais
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Introducao
Estimacao da precisao
A questao
Uma parte crucial da teoria da amostragem em populacoes finitase a determinacao de um estimador adequado da variancia de umdado estimador.
Um estimador da variancia pode ser usado para:
medir a incerteza da estimacao;
comparar a eficiencia dos varios esquemas de amostragem;
encontrar afectacoes para um determinado esquema deamostragem;
determinar coeficientes de variacao;
a construcao de intervalos de confianca e de testes para osparametros de interesse da populacao finita.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Introducao
Estimacao da precisao
A questao
Uma parte crucial da teoria da amostragem em populacoes finitase a determinacao de um estimador adequado da variancia de umdado estimador.
Um estimador da variancia pode ser usado para:
medir a incerteza da estimacao;
comparar a eficiencia dos varios esquemas de amostragem;
encontrar afectacoes para um determinado esquema deamostragem;
determinar coeficientes de variacao;
a construcao de intervalos de confianca e de testes para osparametros de interesse da populacao finita.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Introducao
Estimacao da precisao
Mas...
...a estimacao da variancia, do enviesamento e de erros quadraticosmedios pode ser uma tarefa bastante complicada, devido:
a complexidade dos esquemas de amostragem;
ao uso de estimadores nao lineares;
ao impacto do processo de recolha dos dados (dados omissos,nao respostas);
mesmo em esquemas de amostragem simples, como e o casoda amostragem aleatoria simples, a estimacao da variancia dealgumas estatısticas requer tecnicas mais elaboradas deestimacao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Introducao
Estimacao da precisao
Mas...
...a estimacao da variancia, do enviesamento e de erros quadraticosmedios pode ser uma tarefa bastante complicada, devido:
a complexidade dos esquemas de amostragem;
ao uso de estimadores nao lineares;
ao impacto do processo de recolha dos dados (dados omissos,nao respostas);
mesmo em esquemas de amostragem simples, como e o casoda amostragem aleatoria simples, a estimacao da variancia dealgumas estatısticas requer tecnicas mais elaboradas deestimacao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Introducao
Estimacao da precisao
Mas...
...a estimacao da variancia, do enviesamento e de erros quadraticosmedios pode ser uma tarefa bastante complicada, devido:
a complexidade dos esquemas de amostragem;
ao uso de estimadores nao lineares;
ao impacto do processo de recolha dos dados (dados omissos,nao respostas);
mesmo em esquemas de amostragem simples, como e o casoda amostragem aleatoria simples, a estimacao da variancia dealgumas estatısticas requer tecnicas mais elaboradas deestimacao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Introducao
Estimacao da precisao
Mas...
...a estimacao da variancia, do enviesamento e de erros quadraticosmedios pode ser uma tarefa bastante complicada, devido:
a complexidade dos esquemas de amostragem;
ao uso de estimadores nao lineares;
ao impacto do processo de recolha dos dados (dados omissos,nao respostas);
mesmo em esquemas de amostragem simples, como e o casoda amostragem aleatoria simples, a estimacao da variancia dealgumas estatısticas requer tecnicas mais elaboradas deestimacao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Introducao
Estimacao da precisao
Mas...
...a estimacao da variancia, do enviesamento e de erros quadraticosmedios pode ser uma tarefa bastante complicada, devido:
a complexidade dos esquemas de amostragem;
ao uso de estimadores nao lineares;
ao impacto do processo de recolha dos dados (dados omissos,nao respostas);
mesmo em esquemas de amostragem simples, como e o casoda amostragem aleatoria simples, a estimacao da variancia dealgumas estatısticas requer tecnicas mais elaboradas deestimacao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Introducao
Estimacao da Variancia
Basicamente existem duas abordagens:
analıtica usando o metodo da linearizacao;
metodos de reamostragem ou replicacao (jackknife, replicacaoequilibrada repetida, bootstrap).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Introducao
Estimacao da Variancia
Basicamente existem duas abordagens:
analıtica usando o metodo da linearizacao;
metodos de reamostragem ou replicacao (jackknife, replicacaoequilibrada repetida, bootstrap).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Introducao
Estimacao da Variancia
Basicamente existem duas abordagens:
analıtica usando o metodo da linearizacao;
metodos de reamostragem ou replicacao (jackknife, replicacaoequilibrada repetida, bootstrap).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Linearizacao
A linearizacao como metodo para a obtencaode uma aproximacao da variancia de um estimador.
Como?
Baseia-se na aproximacao linear do estimador atraves dacorrespondente expansao em serie de Taylor (em geral, ate aprimeira ordem) em torno de um ponto central,determinando-se em seguida uma expressao aproximada paraa variancia da estatıstica linearizada.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Linearizacao
A linearizacao como metodo para a obtencaode uma aproximacao da variancia de um estimador.
Frequentemente, a forma analıtica de determinacao da variancia deestimadores a partir de esquemas amostrais probabilısticos pode serefectuada, atraves da relacao:
V (∑k
i=1ai YTi
) =∑k
i=1a2i V (YTi
) + 2∑k
i=1
∑k
j=i+1aiajCov(YTi
, YTj),
(1)onde YTi
corresponde ao estimador do total num grupo (ou num estrato)i e k indica o numero de grupos (ou estratos). Para o caso deamostragem aleatoria simples de dimensao n tem-se:
Cov(YTi, YTj
) = N2(1 − f )Sij/n,
ondeSij =
∑N
k=1(Yik − Y i )(Yjk − Y j)/(N − 1).
Uma relacao similar tambem e valida para estimadores de medias.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Linearizacao
A relacao (1) e util em dois tipos de situacao
quando o parametro de interesse e uma combinacao linear detotais ou de medias;
quando o parametro de interesse nao e uma combinacao linearde totais ou de medias mas pode ser aproximado por umadessas combinacoes lineares. Esta e a abordagem delinearizacao por serie de Taylor.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Linearizacao
A relacao (1) e util em dois tipos de situacao
quando o parametro de interesse e uma combinacao linear detotais ou de medias;
quando o parametro de interesse nao e uma combinacao linearde totais ou de medias mas pode ser aproximado por umadessas combinacoes lineares. Esta e a abordagem delinearizacao por serie de Taylor.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Linearizacao
A relacao (1) e util em dois tipos de situacao
quando o parametro de interesse e uma combinacao linear detotais ou de medias;
quando o parametro de interesse nao e uma combinacao linearde totais ou de medias mas pode ser aproximado por umadessas combinacoes lineares. Esta e a abordagem delinearizacao por serie de Taylor.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Linearizacao
A aplicacao da serie de Taylor (na estatıstica)
Usa-se para obter uma aproximacao de uma funcao nao linear,sendo a variancia dessa funcao determinada com base nessaaproximacao.
Frequentemente a aproximacao origina uma estimativarazoavel da funcao sendo que, em alguns casos, essaaproximacao e uma funcao linear.
Este metodo tem varias denominacoes na literatura, tais como“metodo da linearizacao”,“metodo delta”ou“metodo dapropagacao da variancia”.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Linearizacao
A aplicacao da serie de Taylor (na estatıstica)
Usa-se para obter uma aproximacao de uma funcao nao linear,sendo a variancia dessa funcao determinada com base nessaaproximacao.
Frequentemente a aproximacao origina uma estimativarazoavel da funcao sendo que, em alguns casos, essaaproximacao e uma funcao linear.
Este metodo tem varias denominacoes na literatura, tais como“metodo da linearizacao”,“metodo delta”ou“metodo dapropagacao da variancia”.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Linearizacao
A aplicacao da serie de Taylor (na estatıstica)
Usa-se para obter uma aproximacao de uma funcao nao linear,sendo a variancia dessa funcao determinada com base nessaaproximacao.
Frequentemente a aproximacao origina uma estimativarazoavel da funcao sendo que, em alguns casos, essaaproximacao e uma funcao linear.
Este metodo tem varias denominacoes na literatura, tais como“metodo da linearizacao”,“metodo delta”ou“metodo dapropagacao da variancia”.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Linearizacao
A aplicacao da serie de Taylor (na estatıstica)
Usa-se para obter uma aproximacao de uma funcao nao linear,sendo a variancia dessa funcao determinada com base nessaaproximacao.
Frequentemente a aproximacao origina uma estimativarazoavel da funcao sendo que, em alguns casos, essaaproximacao e uma funcao linear.
Este metodo tem varias denominacoes na literatura, tais como“metodo da linearizacao”,“metodo delta”ou“metodo dapropagacao da variancia”.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Como se aplica?
Nas aplicacoes em Estatıstica, a expansao e avaliada no valormedio, E (X ), obtendo-se para a variavel aleatoria f (X ), funcao davariavel aleatoria X ,
f (X ) = f [E (X )]+f ′[E (X )][X−E (X )]+f ′′[E (X )][X−E (X )]2/2!+. . . ,
onde f e uma funcao infinitamente diferenciavel. Considerandoapenas os termos ate a primeira ordem tem-se,
f (X ) ≃ f [E (X )] + f ′[E (X )][X − E (X )].
Entao, aplicando o operador variancia a ambos os membros daexpressao anterior, obtem-se a seguinte aproximacao para avariancia de X
V [f (X )] ≃ f ′[E (X )]2V (X ).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Duas e mais variaveis...
Duas variaveis...
No caso de funcoes de duas variaveis, X1 e X2 com valores esperados µ1
e µ2 respectivamente, a expansao em serie de Taylor com os termos deprimeira ordem origina:
V [f (X1, X2)] ≃
[
∂f
∂X1(µ1, µ2)
]2
V (X1) +
[
∂f
∂X2(µ1, µ2)
]2
V (X2)+
+ 2
[
∂f
∂X1(µ1, µ2)
] [
∂f
∂X2(µ1, µ2)
]
Cov (X1, X2) .
Caso geral...
V (h(X)) ≃ H′(µ)V (X)H′(µ)T ,
onde h e uma funcao diferenciavel de IRm para IRp, X e um vectoraleatorio de ordem m, V (X) e a sua matriz de covariancias e a matriz H′
de ordem p ×m corresponde a matriz de primeiras derivadas da funcao h.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Duas e mais variaveis...
Duas variaveis...
No caso de funcoes de duas variaveis, X1 e X2 com valores esperados µ1
e µ2 respectivamente, a expansao em serie de Taylor com os termos deprimeira ordem origina:
V [f (X1, X2)] ≃
[
∂f
∂X1(µ1, µ2)
]2
V (X1) +
[
∂f
∂X2(µ1, µ2)
]2
V (X2)+
+ 2
[
∂f
∂X1(µ1, µ2)
] [
∂f
∂X2(µ1, µ2)
]
Cov (X1, X2) .
Caso geral...
V (h(X)) ≃ H′(µ)V (X)H′(µ)T ,
onde h e uma funcao diferenciavel de IRm para IRp, X e um vectoraleatorio de ordem m, V (X) e a sua matriz de covariancias e a matriz H′
de ordem p ×m corresponde a matriz de primeiras derivadas da funcao h.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Exemplo
Variancia do quociente entre duas v.a., R = Y /X
V (R) ≃ [V (Y ) + r2V (X ) − 2rCov(X ,Y )]/µ2X =
≃ r2[V (Y )/µ2Y + V (X )/µ2
X − 2Cov(X ,Y )/µX µY ],
onde µX = E (X ), µY = E (Y ) e r = µY /µX .
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Questao...
E muitas vezes complicado aplicar metodos analıticosquando...
...e necessario utilizar estimadores nao lineares;
...os esquemas amostrais sao complexos;
...as derivadas nao tem uma expressao explıcita.
Quando a abordagem de linearizacao por serie de Taylor eusada:
e necessario encontrar uma expressao que e unica...
...nao so para cada estimador nao linear,mas tambem para cada esquema de amostragem onde esseestimador possa ser usado!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Questao...
E muitas vezes complicado aplicar metodos analıticosquando...
...e necessario utilizar estimadores nao lineares;
...os esquemas amostrais sao complexos;
...as derivadas nao tem uma expressao explıcita.
Quando a abordagem de linearizacao por serie de Taylor eusada:
e necessario encontrar uma expressao que e unica...
...nao so para cada estimador nao linear,mas tambem para cada esquema de amostragem onde esseestimador possa ser usado!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Questao...
E muitas vezes complicado aplicar metodos analıticosquando...
...e necessario utilizar estimadores nao lineares;
...os esquemas amostrais sao complexos;
...as derivadas nao tem uma expressao explıcita.
Quando a abordagem de linearizacao por serie de Taylor eusada:
e necessario encontrar uma expressao que e unica...
...nao so para cada estimador nao linear,mas tambem para cada esquema de amostragem onde esseestimador possa ser usado!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Questao...
E muitas vezes complicado aplicar metodos analıticosquando...
...e necessario utilizar estimadores nao lineares;
...os esquemas amostrais sao complexos;
...as derivadas nao tem uma expressao explıcita.
Quando a abordagem de linearizacao por serie de Taylor eusada:
e necessario encontrar uma expressao que e unica...
...nao so para cada estimador nao linear,mas tambem para cada esquema de amostragem onde esseestimador possa ser usado!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Questao...
E muitas vezes complicado aplicar metodos analıticosquando...
...e necessario utilizar estimadores nao lineares;
...os esquemas amostrais sao complexos;
...as derivadas nao tem uma expressao explıcita.
Quando a abordagem de linearizacao por serie de Taylor eusada:
e necessario encontrar uma expressao que e unica...
...nao so para cada estimador nao linear,mas tambem para cada esquema de amostragem onde esseestimador possa ser usado!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Questao...
E muitas vezes complicado aplicar metodos analıticosquando...
...e necessario utilizar estimadores nao lineares;
...os esquemas amostrais sao complexos;
...as derivadas nao tem uma expressao explıcita.
Quando a abordagem de linearizacao por serie de Taylor eusada:
e necessario encontrar uma expressao que e unica...
...nao so para cada estimador nao linear,mas tambem para cada esquema de amostragem onde esseestimador possa ser usado!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Questao...
E muitas vezes complicado aplicar metodos analıticosquando...
...e necessario utilizar estimadores nao lineares;
...os esquemas amostrais sao complexos;
...as derivadas nao tem uma expressao explıcita.
Quando a abordagem de linearizacao por serie de Taylor eusada:
e necessario encontrar uma expressao que e unica...
...nao so para cada estimador nao linear,mas tambem para cada esquema de amostragem onde esseestimador possa ser usado!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Como ultrapassar os problemas anteriores?
Em esquemas de amostragem complexos...
...poder-se-ia pensar em ignorar o esquema de amostragem eutilizar as expressoes da amostragem aleatoria simples, porem ...
...quando se ignora (mesmo que por ingenuidade) o esquemade amostragem ou a estrutura dos dados, poder-se-asubestimar substancialmente o erro padrao;
varios estudos mostraram que ignorar o esquema deamostragem e usar as expressoes para a amostragem aleatoriasimples conduz a estimadores enviesados (ver por exemplo,Korn e Graubard, 1995 e Kish, 1992).
Ou usar...
...metodos de reamostragem!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Como ultrapassar os problemas anteriores?
Em esquemas de amostragem complexos...
...poder-se-ia pensar em ignorar o esquema de amostragem eutilizar as expressoes da amostragem aleatoria simples, porem ...
...quando se ignora (mesmo que por ingenuidade) o esquemade amostragem ou a estrutura dos dados, poder-se-asubestimar substancialmente o erro padrao;
varios estudos mostraram que ignorar o esquema deamostragem e usar as expressoes para a amostragem aleatoriasimples conduz a estimadores enviesados (ver por exemplo,Korn e Graubard, 1995 e Kish, 1992).
Ou usar...
...metodos de reamostragem!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Como ultrapassar os problemas anteriores?
Em esquemas de amostragem complexos...
...poder-se-ia pensar em ignorar o esquema de amostragem eutilizar as expressoes da amostragem aleatoria simples, porem ...
...quando se ignora (mesmo que por ingenuidade) o esquemade amostragem ou a estrutura dos dados, poder-se-asubestimar substancialmente o erro padrao;
varios estudos mostraram que ignorar o esquema deamostragem e usar as expressoes para a amostragem aleatoriasimples conduz a estimadores enviesados (ver por exemplo,Korn e Graubard, 1995 e Kish, 1992).
Ou usar...
...metodos de reamostragem!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Serie de Taylor
Como ultrapassar os problemas anteriores?
Em esquemas de amostragem complexos...
...poder-se-ia pensar em ignorar o esquema de amostragem eutilizar as expressoes da amostragem aleatoria simples, porem ...
...quando se ignora (mesmo que por ingenuidade) o esquemade amostragem ou a estrutura dos dados, poder-se-asubestimar substancialmente o erro padrao;
varios estudos mostraram que ignorar o esquema deamostragem e usar as expressoes para a amostragem aleatoriasimples conduz a estimadores enviesados (ver por exemplo,Korn e Graubard, 1995 e Kish, 1992).
Ou usar...
...metodos de reamostragem!
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem
Grande parte dos metodos estatısticos baseiam-se nasuposicao de que a amostra aleatoria tem uma determinadaforma distribucional.
No entanto, em varias situacoes, a amostra pode nao seajustar a essa suposicao.
O que fazer nestes casos?
A resposta podera ser dada aplicando os denominadosmetodos de reamostragem: estes sao procedimentos, em geralnao parametricos, de estimacao da distribuicao amostral doestimador correspondente ou de algumas das suascaracterısticas.
Mais concretamente, a inferencia e baseada em amostragemrepetida de uma mesma amostra, daı o uso da palavra“reamostragem”.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem
Grande parte dos metodos estatısticos baseiam-se nasuposicao de que a amostra aleatoria tem uma determinadaforma distribucional.
No entanto, em varias situacoes, a amostra pode nao seajustar a essa suposicao.
O que fazer nestes casos?
A resposta podera ser dada aplicando os denominadosmetodos de reamostragem: estes sao procedimentos, em geralnao parametricos, de estimacao da distribuicao amostral doestimador correspondente ou de algumas das suascaracterısticas.
Mais concretamente, a inferencia e baseada em amostragemrepetida de uma mesma amostra, daı o uso da palavra“reamostragem”.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem
Grande parte dos metodos estatısticos baseiam-se nasuposicao de que a amostra aleatoria tem uma determinadaforma distribucional.
No entanto, em varias situacoes, a amostra pode nao seajustar a essa suposicao.
O que fazer nestes casos?
A resposta podera ser dada aplicando os denominadosmetodos de reamostragem: estes sao procedimentos, em geralnao parametricos, de estimacao da distribuicao amostral doestimador correspondente ou de algumas das suascaracterısticas.
Mais concretamente, a inferencia e baseada em amostragemrepetida de uma mesma amostra, daı o uso da palavra“reamostragem”.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem
Grande parte dos metodos estatısticos baseiam-se nasuposicao de que a amostra aleatoria tem uma determinadaforma distribucional.
No entanto, em varias situacoes, a amostra pode nao seajustar a essa suposicao.
O que fazer nestes casos?
A resposta podera ser dada aplicando os denominadosmetodos de reamostragem: estes sao procedimentos, em geralnao parametricos, de estimacao da distribuicao amostral doestimador correspondente ou de algumas das suascaracterısticas.
Mais concretamente, a inferencia e baseada em amostragemrepetida de uma mesma amostra, daı o uso da palavra“reamostragem”.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem
Porque?
Um dos aspectos que impulsionou, nas ultimas decadas, o uso dosmetodos de reamostragem em estatıstica foi, sem duvida, odesenvolvimento tecnologico dos computadores.
A reamostragem esta bastante ligada ao metodo de simulacao deMonte Carlo, ja que e necessario recorrer a este metodo quando naoe possıvel calcular o valor do estimador para todas as reamostraspossıveis.
Os metodos de reamostragem jackknife e bootstrap e replicacaoequilibrada repetida (traducao de Balanced Repeated Replication,BRR) poderao ser usados para determinar a precisao de estimadoresem populacoes finitas.
Devido a particularidade da amostragem ser em populacoes finitas enecessario efectuar alguns ajustamentos a estes metodos.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem
Porque?
Um dos aspectos que impulsionou, nas ultimas decadas, o uso dosmetodos de reamostragem em estatıstica foi, sem duvida, odesenvolvimento tecnologico dos computadores.
A reamostragem esta bastante ligada ao metodo de simulacao deMonte Carlo, ja que e necessario recorrer a este metodo quando naoe possıvel calcular o valor do estimador para todas as reamostraspossıveis.
Os metodos de reamostragem jackknife e bootstrap e replicacaoequilibrada repetida (traducao de Balanced Repeated Replication,BRR) poderao ser usados para determinar a precisao de estimadoresem populacoes finitas.
Devido a particularidade da amostragem ser em populacoes finitas enecessario efectuar alguns ajustamentos a estes metodos.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem
Porque?
Um dos aspectos que impulsionou, nas ultimas decadas, o uso dosmetodos de reamostragem em estatıstica foi, sem duvida, odesenvolvimento tecnologico dos computadores.
A reamostragem esta bastante ligada ao metodo de simulacao deMonte Carlo, ja que e necessario recorrer a este metodo quando naoe possıvel calcular o valor do estimador para todas as reamostraspossıveis.
Os metodos de reamostragem jackknife e bootstrap e replicacaoequilibrada repetida (traducao de Balanced Repeated Replication,BRR) poderao ser usados para determinar a precisao de estimadoresem populacoes finitas.
Devido a particularidade da amostragem ser em populacoes finitas enecessario efectuar alguns ajustamentos a estes metodos.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem
Porque?
Um dos aspectos que impulsionou, nas ultimas decadas, o uso dosmetodos de reamostragem em estatıstica foi, sem duvida, odesenvolvimento tecnologico dos computadores.
A reamostragem esta bastante ligada ao metodo de simulacao deMonte Carlo, ja que e necessario recorrer a este metodo quando naoe possıvel calcular o valor do estimador para todas as reamostraspossıveis.
Os metodos de reamostragem jackknife e bootstrap e replicacaoequilibrada repetida (traducao de Balanced Repeated Replication,BRR) poderao ser usados para determinar a precisao de estimadoresem populacoes finitas.
Devido a particularidade da amostragem ser em populacoes finitas enecessario efectuar alguns ajustamentos a estes metodos.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem
Porque?
Um dos aspectos que impulsionou, nas ultimas decadas, o uso dosmetodos de reamostragem em estatıstica foi, sem duvida, odesenvolvimento tecnologico dos computadores.
A reamostragem esta bastante ligada ao metodo de simulacao deMonte Carlo, ja que e necessario recorrer a este metodo quando naoe possıvel calcular o valor do estimador para todas as reamostraspossıveis.
Os metodos de reamostragem jackknife e bootstrap e replicacaoequilibrada repetida (traducao de Balanced Repeated Replication,BRR) poderao ser usados para determinar a precisao de estimadoresem populacoes finitas.
Devido a particularidade da amostragem ser em populacoes finitas enecessario efectuar alguns ajustamentos a estes metodos.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Observacao
Em seguida, e antes de se expor a aplicacao dos metodos dereamostragem na estimacao da variancia em populacoes finitas,descreve-se um esquema de amostragem estratificado multi-etapicoque unifica muitos dos esquemas de amostragem usados na pratica.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Considere que:
a populacao esta dividida em k estratos, e cada estrato temNe grupos (clusters)
Em cada estrato e, para e = 1, 2, · · · , k, sao seleccionados ne
grupos (ne ≥ 2), de forma independente ao longo dos estratos.
Esta primeira etapa de seleccao dos grupos e efectuada ou poramostragem aleatoria simples sem reposicao ou poramostragem com diferentes probabilidades mas com reposicao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Considere que:
a populacao esta dividida em k estratos, e cada estrato temNe grupos (clusters)
Em cada estrato e, para e = 1, 2, · · · , k, sao seleccionados ne
grupos (ne ≥ 2), de forma independente ao longo dos estratos.
Esta primeira etapa de seleccao dos grupos e efectuada ou poramostragem aleatoria simples sem reposicao ou poramostragem com diferentes probabilidades mas com reposicao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Considere que:
a populacao esta dividida em k estratos, e cada estrato temNe grupos (clusters)
Em cada estrato e, para e = 1, 2, · · · , k, sao seleccionados ne
grupos (ne ≥ 2), de forma independente ao longo dos estratos.
Esta primeira etapa de seleccao dos grupos e efectuada ou poramostragem aleatoria simples sem reposicao ou poramostragem com diferentes probabilidades mas com reposicao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Considere que:
a populacao esta dividida em k estratos, e cada estrato temNe grupos (clusters)
Em cada estrato e, para e = 1, 2, · · · , k, sao seleccionados ne
grupos (ne ≥ 2), de forma independente ao longo dos estratos.
Esta primeira etapa de seleccao dos grupos e efectuada ou poramostragem aleatoria simples sem reposicao ou poramostragem com diferentes probabilidades mas com reposicao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Por simplicidade considere-se:
que a primeira etapa de amostragem e efectuada segundo umesquema de amostragem aleatoria simples sem reposicao.
seleccionado o (e, i)-esimo grupo (em primeira fase) obtem-se nei
unidades, i = 1, 2, · · · , ne , e = 1, 2, · · · , k , o numero total de
unidades finais na amostra e dado por n =k∑
e=1
ne∑
i=1
nei.
Yeij , j = 1, 2, · · · , Nei; i = 1, 2, · · · , Ne ; e = 1, 2, · · · , k , e o vector de
caracterısticas associado a j-esima unidade final no i-esimo grupodo estrato e, onde Nei
denota o numero de unidades do i-esimogrupo do estrato e.
e os valores observados das unidades seleccionadas saoyeij , j = 1, 2, · · · , nei
; i = 1, 2, · · · , ne ; e = 1, 2, · · · , k .
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Por simplicidade considere-se:
que a primeira etapa de amostragem e efectuada segundo umesquema de amostragem aleatoria simples sem reposicao.
seleccionado o (e, i)-esimo grupo (em primeira fase) obtem-se nei
unidades, i = 1, 2, · · · , ne , e = 1, 2, · · · , k , o numero total de
unidades finais na amostra e dado por n =k∑
e=1
ne∑
i=1
nei.
Yeij , j = 1, 2, · · · , Nei; i = 1, 2, · · · , Ne ; e = 1, 2, · · · , k , e o vector de
caracterısticas associado a j-esima unidade final no i-esimo grupodo estrato e, onde Nei
denota o numero de unidades do i-esimogrupo do estrato e.
e os valores observados das unidades seleccionadas saoyeij , j = 1, 2, · · · , nei
; i = 1, 2, · · · , ne ; e = 1, 2, · · · , k .
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Por simplicidade considere-se:
que a primeira etapa de amostragem e efectuada segundo umesquema de amostragem aleatoria simples sem reposicao.
seleccionado o (e, i)-esimo grupo (em primeira fase) obtem-se nei
unidades, i = 1, 2, · · · , ne , e = 1, 2, · · · , k , o numero total de
unidades finais na amostra e dado por n =k∑
e=1
ne∑
i=1
nei.
Yeij , j = 1, 2, · · · , Nei; i = 1, 2, · · · , Ne ; e = 1, 2, · · · , k , e o vector de
caracterısticas associado a j-esima unidade final no i-esimo grupodo estrato e, onde Nei
denota o numero de unidades do i-esimogrupo do estrato e.
e os valores observados das unidades seleccionadas saoyeij , j = 1, 2, · · · , nei
; i = 1, 2, · · · , ne ; e = 1, 2, · · · , k .
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Por simplicidade considere-se:
que a primeira etapa de amostragem e efectuada segundo umesquema de amostragem aleatoria simples sem reposicao.
seleccionado o (e, i)-esimo grupo (em primeira fase) obtem-se nei
unidades, i = 1, 2, · · · , ne , e = 1, 2, · · · , k , o numero total de
unidades finais na amostra e dado por n =k∑
e=1
ne∑
i=1
nei.
Yeij , j = 1, 2, · · · , Nei; i = 1, 2, · · · , Ne ; e = 1, 2, · · · , k , e o vector de
caracterısticas associado a j-esima unidade final no i-esimo grupodo estrato e, onde Nei
denota o numero de unidades do i-esimogrupo do estrato e.
e os valores observados das unidades seleccionadas saoyeij , j = 1, 2, · · · , nei
; i = 1, 2, · · · , ne ; e = 1, 2, · · · , k .
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Por simplicidade considere-se:
que a primeira etapa de amostragem e efectuada segundo umesquema de amostragem aleatoria simples sem reposicao.
seleccionado o (e, i)-esimo grupo (em primeira fase) obtem-se nei
unidades, i = 1, 2, · · · , ne , e = 1, 2, · · · , k , o numero total de
unidades finais na amostra e dado por n =k∑
e=1
ne∑
i=1
nei.
Yeij , j = 1, 2, · · · , Nei; i = 1, 2, · · · , Ne ; e = 1, 2, · · · , k , e o vector de
caracterısticas associado a j-esima unidade final no i-esimo grupodo estrato e, onde Nei
denota o numero de unidades do i-esimogrupo do estrato e.
e os valores observados das unidades seleccionadas saoyeij , j = 1, 2, · · · , nei
; i = 1, 2, · · · , ne ; e = 1, 2, · · · , k .
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Metodos de reamostragem em populacoes finitas
Em muitos estudos de sondagens, o interesse reside...
na estimacao de um parametro populacional que pode ser descritocomo sendo uma funcao
θ ≡ θ (N , YT ) .
Um estimador de θ pode ser escrito como θ = Tn = T(
Z)
, com T
um funcional conhecido e
Z =
k∑
e=1
ne∑
i=1
nei∑
j=1
weijzeij ,
onde zeij e um vector definido apropriadamente a partir dos dadosda ultima unidade amostral (e, i , j).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Metodos de reamostragem
Jackknife
Este metodo de reamostragem foi proposto por Quenouille(1949), com o objectivo de estimar o enviesamento de umestimador da correlacao em series temporais.
O jackknife, para alem de permitir estimar de forma naoparametrica o enviesamento de um estimador, possui outrautilidade muito importante, a de permitir obter estimativas davariancia de uma dada estatıstica. Esta proposta foiapresentada por Tukey (1958).
Este procedimento tem como versao mais frequente a divisaoda amostra em n grupos de dimensao unitaria, avaliando emcada um deles a estatıstica de interesse.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Metodos de reamostragem
Jackknife
Este metodo de reamostragem foi proposto por Quenouille(1949), com o objectivo de estimar o enviesamento de umestimador da correlacao em series temporais.
O jackknife, para alem de permitir estimar de forma naoparametrica o enviesamento de um estimador, possui outrautilidade muito importante, a de permitir obter estimativas davariancia de uma dada estatıstica. Esta proposta foiapresentada por Tukey (1958).
Este procedimento tem como versao mais frequente a divisaoda amostra em n grupos de dimensao unitaria, avaliando emcada um deles a estatıstica de interesse.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Metodos de reamostragem
Jackknife
Este metodo de reamostragem foi proposto por Quenouille(1949), com o objectivo de estimar o enviesamento de umestimador da correlacao em series temporais.
O jackknife, para alem de permitir estimar de forma naoparametrica o enviesamento de um estimador, possui outrautilidade muito importante, a de permitir obter estimativas davariancia de uma dada estatıstica. Esta proposta foiapresentada por Tukey (1958).
Este procedimento tem como versao mais frequente a divisaoda amostra em n grupos de dimensao unitaria, avaliando emcada um deles a estatıstica de interesse.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Metodos de reamostragem
Jackknife
Este metodo de reamostragem foi proposto por Quenouille(1949), com o objectivo de estimar o enviesamento de umestimador da correlacao em series temporais.
O jackknife, para alem de permitir estimar de forma naoparametrica o enviesamento de um estimador, possui outrautilidade muito importante, a de permitir obter estimativas davariancia de uma dada estatıstica. Esta proposta foiapresentada por Tukey (1958).
Este procedimento tem como versao mais frequente a divisaoda amostra em n grupos de dimensao unitaria, avaliando emcada um deles a estatıstica de interesse.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Metodos de reamostragem
Jackknife
A aplicacao do metodo jackknife a problemas de sondagens,quando o esquema nao e amostragem aleatoria simples, nao e umprocesso simples.
Basta pensar, por exemplo, na situacao de amostragemaleatoria simples estratificada, e nas seguintes questoes: quala unidade a ser removida?
Uma unidade da amostra global apos a estratificacao ou umaunidade de um estrato? E, neste ultimo caso, de que estrato?
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Metodos de reamostragem
Jackknife
A aplicacao do metodo jackknife a problemas de sondagens,quando o esquema nao e amostragem aleatoria simples, nao e umprocesso simples.
Basta pensar, por exemplo, na situacao de amostragemaleatoria simples estratificada, e nas seguintes questoes: quala unidade a ser removida?
Uma unidade da amostra global apos a estratificacao ou umaunidade de um estrato? E, neste ultimo caso, de que estrato?
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Metodos de reamostragem
Jackknife
A aplicacao do metodo jackknife a problemas de sondagens,quando o esquema nao e amostragem aleatoria simples, nao e umprocesso simples.
Basta pensar, por exemplo, na situacao de amostragemaleatoria simples estratificada, e nas seguintes questoes: quala unidade a ser removida?
Uma unidade da amostra global apos a estratificacao ou umaunidade de um estrato? E, neste ultimo caso, de que estrato?
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Jackknife
Naturalmente, num esquema multi-etatipo, a aplicacao dojackknife torna a tarefa ainda mais complicada
Assim sendo, a primeira decisao a tomar e determinar qual aunidade primaria a remover.
Em geral, nao e boa ideia remover uma unidade de cada vezda amostra final, pois yeij pode ser dependente para valoresfixos de e e i e a estrutura de dependencia pode nao serfacilmente modelada.
A ideia e entao a remocao da unidade (grupo) da primeiraetapa de amostragem, uma de cada vez. O numero total de
grupos da amostra na primeira etapa e ng =k∑
e=1ne .
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Jackknife
Naturalmente, num esquema multi-etatipo, a aplicacao dojackknife torna a tarefa ainda mais complicada
Assim sendo, a primeira decisao a tomar e determinar qual aunidade primaria a remover.
Em geral, nao e boa ideia remover uma unidade de cada vezda amostra final, pois yeij pode ser dependente para valoresfixos de e e i e a estrutura de dependencia pode nao serfacilmente modelada.
A ideia e entao a remocao da unidade (grupo) da primeiraetapa de amostragem, uma de cada vez. O numero total de
grupos da amostra na primeira etapa e ng =k∑
e=1ne .
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Jackknife
Seja
Seja Ze′−i ′ =∑
e 6=e′
ne∑
i=1
nei∑
j=1
weijzeij + ne′
ne′−1
∑
i 6=i ′
ne′i∑
j=1
we′ijze′ ij , a expressao
analoga de Z apos a remocao do i ′ - esimo grupo do estrato e ′ e
θe′−i ′ = T(
Ze′−i ′
)
e θe′ = n−1e′
ne′∑
i ′=1
θe′−i ′ .
Um estimador jackknife da variancia para θ e dado por
[
V (θ)]I
jack=
k∑
e=1
(1 − λe fe) (ne − 1)
ne
ne∑
i=1
(
θe−i − θe
)2
, (2)
onde
λe =
{
1 se a primeira etapa de amostragem e feita sem reposicao0 se a primeira etapa de amostragem e feita com reposicao
.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Jackknife
Seja
Seja Ze′−i ′ =∑
e 6=e′
ne∑
i=1
nei∑
j=1
weijzeij + ne′
ne′−1
∑
i 6=i ′
ne′i∑
j=1
we′ijze′ ij , a expressao
analoga de Z apos a remocao do i ′ - esimo grupo do estrato e ′ e
θe′−i ′ = T(
Ze′−i ′
)
e θe′ = n−1e′
ne′∑
i ′=1
θe′−i ′ .
Um estimador jackknife da variancia para θ e dado por
[
V (θ)]I
jack=
k∑
e=1
(1 − λe fe) (ne − 1)
ne
ne∑
i=1
(
θe−i − θe
)2
, (2)
onde
λe =
{
1 se a primeira etapa de amostragem e feita sem reposicao0 se a primeira etapa de amostragem e feita com reposicao
.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Jacknife
Existem, pelo menos, mais duas versoes do estimadorapresentado na equacao (2)
Assim, quando se substitui θe em (2) por 1ng
k∑
e=1
ne∑
i=1
θei
obtem-se o estimador que sera denotado por[
V (θ)]II
jack;
e quando se substitui θe por 1k
k∑
e=1θe obtem-se uma terceira
versao do estimador jackknife para a variancia de θ a qual
sera denotada por[
V (θ)]III
jack.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Jacknife
Para alem dos tres estimadores, podem ainda ser definidosmais dois estimadores jackknife para a variancia de θ
os quais sao baseados no calculo dos pseudo-valoresθ−ei = ne θ − (ne − 1)θ−ei ;
Considerando agora θIVjack = n−1
g
k∑
e=1
ne∑
i=1θ−ei ,
θVjack = k−1
k∑
e=1
1ne
ne∑
i=1θ−ei obtem-se as seguintes expressoes
para as duas variancias jackknife de um estimador θ:
[
V (θ)]j
jack=
k∑
e=1
(1 − λe fe)
ne (ne − 1)
ne∑
i=1
(
θ−ei − θjjack
)2, j = IV ,V .
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Jacknife: exemplo
Variancia jackknife para estimador do quociente, R = yx, em
amostragem aleatoria simples estratificada
Suponha-se que no estrato e ′ se omite a unidade i ′. Para cada replicajackknife, determina-sey e′−i ′ =
∑
e 6=e′Wey e + We′ (ne′y e′ − ye′−i ′)/(ne′ − 1)
xe′−i ′ =∑
e 6=e′Wexe + W ′
e (ne′xe′ − xe′−i ′)/(ne′ − 1).
Calcula-se entao
Re′−i ′ =y e′−i ′
xe′−i ′e Re′ = n−1
e′
ne′∑
i=1
Re′−i ′ .
E a variancia jackknife do tipo I e dada pela seguinte expressao
[
V (R)]I
jack=
k∑
e=1
(1 − fe) (ne − 1)
ne
ne∑
i=1
(
Re′−i ′ − Re′
)2
. (3)
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Jackknife
Jacknife
Leitura aconselhada:
Em Miller (1974) apresenta-se uma revisao bastante completada aplicacao do metodo de reamostragem jackknife no casode amostragem aleatoria simples.
Ver, sobre a extensao para a amostragem estratificada, ostrabalhos pioneiros de Mccarthy (1966), Jones (1974) e Kish eFrankel (1974).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
O bootstrap
Um dos grandes atractivos do metodo de reamostragembootstrap deve-se a sua simplicidade e versatilidade,principalmente em problemas complexos de estimacao.
Desde o trabalho de Efron (1979) que numerosa literaturatem sido dedicada a este metodo de reamostragem.
Em situacoes onde nao estejam claras as hipotesesdistribucionais, onde a informacao seja escassa, a recolha dedados seja muito dispendiosa ou difıcil de obter, o bootstrap
torna-se um metodo muito util.
O metodo de reamostragem bootstrap permite obter variosvalores de Tn pela avaliacao desta estatıstica em cada umadas amostras, seleccionadas com reposicao a partir daamostra original e com a mesma dimensao n.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
O bootstrap
Um dos grandes atractivos do metodo de reamostragembootstrap deve-se a sua simplicidade e versatilidade,principalmente em problemas complexos de estimacao.
Desde o trabalho de Efron (1979) que numerosa literaturatem sido dedicada a este metodo de reamostragem.
Em situacoes onde nao estejam claras as hipotesesdistribucionais, onde a informacao seja escassa, a recolha dedados seja muito dispendiosa ou difıcil de obter, o bootstrap
torna-se um metodo muito util.
O metodo de reamostragem bootstrap permite obter variosvalores de Tn pela avaliacao desta estatıstica em cada umadas amostras, seleccionadas com reposicao a partir daamostra original e com a mesma dimensao n.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
O bootstrap
Um dos grandes atractivos do metodo de reamostragembootstrap deve-se a sua simplicidade e versatilidade,principalmente em problemas complexos de estimacao.
Desde o trabalho de Efron (1979) que numerosa literaturatem sido dedicada a este metodo de reamostragem.
Em situacoes onde nao estejam claras as hipotesesdistribucionais, onde a informacao seja escassa, a recolha dedados seja muito dispendiosa ou difıcil de obter, o bootstrap
torna-se um metodo muito util.
O metodo de reamostragem bootstrap permite obter variosvalores de Tn pela avaliacao desta estatıstica em cada umadas amostras, seleccionadas com reposicao a partir daamostra original e com a mesma dimensao n.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
O bootstrap
Um dos grandes atractivos do metodo de reamostragembootstrap deve-se a sua simplicidade e versatilidade,principalmente em problemas complexos de estimacao.
Desde o trabalho de Efron (1979) que numerosa literaturatem sido dedicada a este metodo de reamostragem.
Em situacoes onde nao estejam claras as hipotesesdistribucionais, onde a informacao seja escassa, a recolha dedados seja muito dispendiosa ou difıcil de obter, o bootstrap
torna-se um metodo muito util.
O metodo de reamostragem bootstrap permite obter variosvalores de Tn pela avaliacao desta estatıstica em cada umadas amostras, seleccionadas com reposicao a partir daamostra original e com a mesma dimensao n.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
O bootstrap
Um dos grandes atractivos do metodo de reamostragembootstrap deve-se a sua simplicidade e versatilidade,principalmente em problemas complexos de estimacao.
Desde o trabalho de Efron (1979) que numerosa literaturatem sido dedicada a este metodo de reamostragem.
Em situacoes onde nao estejam claras as hipotesesdistribucionais, onde a informacao seja escassa, a recolha dedados seja muito dispendiosa ou difıcil de obter, o bootstrap
torna-se um metodo muito util.
O metodo de reamostragem bootstrap permite obter variosvalores de Tn pela avaliacao desta estatıstica em cada umadas amostras, seleccionadas com reposicao a partir daamostra original e com a mesma dimensao n.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
Os conceitos basicos do bootstrap sao simples:
Seja F o modelo (em geral desconhecido) gerador da amostraaleatoria Xn e Tn(Xn) e a estatıstica de interesse.
Para uma concretizacao, (x1, x2, · · · , xn), da amostraaleatoria, seja Fn a sua funcao de distribuicao empırica.
A amostra aleatoria de dimensao n com distribuicao Fn
denomina-se amostra bootstrap e denota-se por X∗
n. Istosignifica que numa amostra aleatoria bootstrap aprobabilidade da variavel X ∗
j poder assumir o valor xi e de1/n, i = 1, 2, · · · , n.
A estatıstica de interesse, Tn, avaliada na amostra bootstrap
X∗
n e uma replica bootstrap de Tn, e denota-se porT ∗
n = Tn(X∗
n).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
Os conceitos basicos do bootstrap sao simples:
Seja F o modelo (em geral desconhecido) gerador da amostraaleatoria Xn e Tn(Xn) e a estatıstica de interesse.
Para uma concretizacao, (x1, x2, · · · , xn), da amostraaleatoria, seja Fn a sua funcao de distribuicao empırica.
A amostra aleatoria de dimensao n com distribuicao Fn
denomina-se amostra bootstrap e denota-se por X∗
n. Istosignifica que numa amostra aleatoria bootstrap aprobabilidade da variavel X ∗
j poder assumir o valor xi e de1/n, i = 1, 2, · · · , n.
A estatıstica de interesse, Tn, avaliada na amostra bootstrap
X∗
n e uma replica bootstrap de Tn, e denota-se porT ∗
n = Tn(X∗
n).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
Os conceitos basicos do bootstrap sao simples:
Seja F o modelo (em geral desconhecido) gerador da amostraaleatoria Xn e Tn(Xn) e a estatıstica de interesse.
Para uma concretizacao, (x1, x2, · · · , xn), da amostraaleatoria, seja Fn a sua funcao de distribuicao empırica.
A amostra aleatoria de dimensao n com distribuicao Fn
denomina-se amostra bootstrap e denota-se por X∗
n. Istosignifica que numa amostra aleatoria bootstrap aprobabilidade da variavel X ∗
j poder assumir o valor xi e de1/n, i = 1, 2, · · · , n.
A estatıstica de interesse, Tn, avaliada na amostra bootstrap
X∗
n e uma replica bootstrap de Tn, e denota-se porT ∗
n = Tn(X∗
n).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
Os conceitos basicos do bootstrap sao simples:
Seja F o modelo (em geral desconhecido) gerador da amostraaleatoria Xn e Tn(Xn) e a estatıstica de interesse.
Para uma concretizacao, (x1, x2, · · · , xn), da amostraaleatoria, seja Fn a sua funcao de distribuicao empırica.
A amostra aleatoria de dimensao n com distribuicao Fn
denomina-se amostra bootstrap e denota-se por X∗
n. Istosignifica que numa amostra aleatoria bootstrap aprobabilidade da variavel X ∗
j poder assumir o valor xi e de1/n, i = 1, 2, · · · , n.
A estatıstica de interesse, Tn, avaliada na amostra bootstrap
X∗
n e uma replica bootstrap de Tn, e denota-se porT ∗
n = Tn(X∗
n).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
O estimador bootstrap da variancia de Tn e
[V (Tn)]boot = E∗ [T ∗
n − E∗ [T ∗
n ]]2
= V∗ (T ∗
n ) ,(4)
onde E ∗(.) e V∗(.) representam o valor esperado e a variancia,respectivamente, com respeito a amostragem bootstrap.
A expressao (4) corresponde a definicao formal do estimadorbootstrap da variancia de Tn e na pratica so e usadadirectamente quando se obtem uma funcao explıcita de(X1,X2, · · · ,Xn).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap
O estimador do estimador bootstrap da variancia de Tn
Quando isso nao acontece e necessario utilizar metodos desimulacao de Monte Carlo para obter uma sua aproximacao.Obtem-se essa aproximacao pela seguinte expressao
[V (Tn)]Bboot =
1
B − 1
B∑
b=1
(
T ∗
n,b − B−1∑B
j=1T ∗
n,b
)2
, (5)
onde T ∗
n,b = Tn(X∗
1,b,X∗
2,b, · · · ,X ∗
n,b) e a avaliacao daestatıstica Tn na b-esima replica Monte Carlo,b = 1, 2, · · · ,B.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Metodo de reamostragem bootstrap em sondagens
O bootstrap
Uma extensao directa do metodo bootstrap em sondagens,por exemplo, quando o esquema e estratificado, consiste emaplicar o bootstrap independentemente em cada estrato. Cadaamostra de cada estrato, {yei , i = 1, 2, · · · , ne},e = 1, 2, · · · , k, e seleccionada com reposicao, obtendo-se aamostra bootstrap {y∗ei , i = 1, 2, · · · , ne}.
Porem, quando se aplica o metodo bootstrap na amostragemem populacoes finitas verifica-se um problema de escala, queesta relacionado com a forma de como imitar o efeito deamostrar sem reposicao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap usual: exemplo
Variancia bootstrap usual para o estimador do quociente,
R = h(y , x) =y
x, em amostragem estratificada
Para cada amostra bootstrap, {y∗ei}
ne
i=1, retirada com reposicao daamostra {yei}
ne
i=1 no estrato e, independentemente para cada estrato,
determina-se y∗e = n−1
e
ne∑
i=1
y∗ei , y∗ =
k∑
e=1Wey
∗e ,
x∗e = n−1
e
ne∑
i=1
x∗ei , x∗ =
k∑
e=1
Wex∗e e R∗ =
y∗
x∗ . Repete-se o procedimento
anterior, de modo independente, um grande numero de vezes, B, ecalculam-se as respectivas estimativas bootstrap R∗
1 , R∗2 , · · · , R∗
B . A
expressao da variancia bootstrap de R e dada por[
V (R)]B
boot=
1
B − 1
B∑
b=1
(
R∗b − B−1
∑B
j=1R∗
b
)2
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap usual: exemplo 2Considere-se que no exemplo anterior h e uma funcao linear de apenasuma variavel, y
Neste caso θ∗ = h(y∗) =k∑
e=1
Wey∗
e e a variancia,[
V (θ)]
boot, reduz-se a
[V (y)]boot =
k∑
e=1
We
ne
(
ne − 1
ne
)
s2e .
Comparando esta expressao com a variancia do estimador centrado de Y , y es ,
V (y es) =
k∑
e=1
W 2e (1 − λe fe)
ne
s2e′ ,
verifica-se que [V (y)]boot
possui dois defeitos potenciais:
a falta do factor de escala 1 − λe fe , a qual pode causar problemas quandoa amostragem em cada estrato e realizada sem reposicao;
a existencia de um factor de escala superfluo, ne−1ne
, fazendo com que oestimador (7) nao seja centrado nem consistente para a variancia de y e
quando ne e limitado.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap usual: exemplo 2Considere-se que no exemplo anterior h e uma funcao linear de apenasuma variavel, y
Neste caso θ∗ = h(y∗) =k∑
e=1
Wey∗
e e a variancia,[
V (θ)]
boot, reduz-se a
[V (y)]boot =
k∑
e=1
We
ne
(
ne − 1
ne
)
s2e .
Comparando esta expressao com a variancia do estimador centrado de Y , y es ,
V (y es) =
k∑
e=1
W 2e (1 − λe fe)
ne
s2e′ ,
verifica-se que [V (y)]boot
possui dois defeitos potenciais:
a falta do factor de escala 1 − λe fe , a qual pode causar problemas quandoa amostragem em cada estrato e realizada sem reposicao;
a existencia de um factor de escala superfluo, ne−1ne
, fazendo com que oestimador (7) nao seja centrado nem consistente para a variancia de y e
quando ne e limitado.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap usual: exemplo 2Considere-se que no exemplo anterior h e uma funcao linear de apenasuma variavel, y
Neste caso θ∗ = h(y∗) =k∑
e=1
Wey∗
e e a variancia,[
V (θ)]
boot, reduz-se a
[V (y)]boot =
k∑
e=1
We
ne
(
ne − 1
ne
)
s2e .
Comparando esta expressao com a variancia do estimador centrado de Y , y es ,
V (y es) =
k∑
e=1
W 2e (1 − λe fe)
ne
s2e′ ,
verifica-se que [V (y)]boot
possui dois defeitos potenciais:
a falta do factor de escala 1 − λe fe , a qual pode causar problemas quandoa amostragem em cada estrato e realizada sem reposicao;
a existencia de um factor de escala superfluo, ne−1ne
, fazendo com que oestimador (7) nao seja centrado nem consistente para a variancia de y e
quando ne e limitado.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap usual: exemplo 2Considere-se que no exemplo anterior h e uma funcao linear de apenasuma variavel, y
Neste caso θ∗ = h(y∗) =k∑
e=1
Wey∗
e e a variancia,[
V (θ)]
boot, reduz-se a
[V (y)]boot =
k∑
e=1
We
ne
(
ne − 1
ne
)
s2e .
Comparando esta expressao com a variancia do estimador centrado de Y , y es ,
V (y es) =
k∑
e=1
W 2e (1 − λe fe)
ne
s2e′ ,
verifica-se que [V (y)]boot
possui dois defeitos potenciais:
a falta do factor de escala 1 − λe fe , a qual pode causar problemas quandoa amostragem em cada estrato e realizada sem reposicao;
a existencia de um factor de escala superfluo, ne−1ne
, fazendo com que oestimador (7) nao seja centrado nem consistente para a variancia de y e
quando ne e limitado.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
O problema...
Nao parece existir uma forma obvia de transpor a falta deconsistencia devido ao efeito de escala, excepto quando areamostragem e realizada com reposicao e ne = c , ∀e , poisneste caso c (c − 1)−1 [V (·)]boot sera um estimadorconsistente.
Observe-se que quando se tem amostragem aleatoria simplessem reposicao (correspondendo ao caso de k = 1) o factor deescala ne−1
ne= n−1
nnao tem um efeito apreciavel quando a
dimensao da amostra e grande. No entanto, na amostragemaleatoria estratificada, isso ja e mais difıcil de acontecer.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
O problema...
Nao parece existir uma forma obvia de transpor a falta deconsistencia devido ao efeito de escala, excepto quando areamostragem e realizada com reposicao e ne = c , ∀e , poisneste caso c (c − 1)−1 [V (·)]boot sera um estimadorconsistente.
Observe-se que quando se tem amostragem aleatoria simplessem reposicao (correspondendo ao caso de k = 1) o factor deescala ne−1
ne= n−1
nnao tem um efeito apreciavel quando a
dimensao da amostra e grande. No entanto, na amostragemaleatoria estratificada, isso ja e mais difıcil de acontecer.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
O problema...
Nao parece existir uma forma obvia de transpor a falta deconsistencia devido ao efeito de escala, excepto quando areamostragem e realizada com reposicao e ne = c , ∀e , poisneste caso c (c − 1)−1 [V (·)]boot sera um estimadorconsistente.
Observe-se que quando se tem amostragem aleatoria simplessem reposicao (correspondendo ao caso de k = 1) o factor deescala ne−1
ne= n−1
nnao tem um efeito apreciavel quando a
dimensao da amostra e grande. No entanto, na amostragemaleatoria estratificada, isso ja e mais difıcil de acontecer.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
As propostas...
Tem sido propostas modificacoes ao bootstrap usual, numesforco de o adaptar a amostragem em populacoes finitas e aesquemas de amostragem complexos.
Entre outros salientam-se os trabalhos de McCarthy eSnowden (1985), Rao e Wu (1988), Sitter (1992a), Boothet al. (1994) e Canty e Davison (1999).
A maior parte dos procedimentos propostos fundamentam-sena procura de estimadores consistentes de erros padroes, combase na estimacao de V (y)
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
As propostas...
Tem sido propostas modificacoes ao bootstrap usual, numesforco de o adaptar a amostragem em populacoes finitas e aesquemas de amostragem complexos.
Entre outros salientam-se os trabalhos de McCarthy eSnowden (1985), Rao e Wu (1988), Sitter (1992a), Boothet al. (1994) e Canty e Davison (1999).
A maior parte dos procedimentos propostos fundamentam-sena procura de estimadores consistentes de erros padroes, combase na estimacao de V (y)
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
As propostas...
Tem sido propostas modificacoes ao bootstrap usual, numesforco de o adaptar a amostragem em populacoes finitas e aesquemas de amostragem complexos.
Entre outros salientam-se os trabalhos de McCarthy eSnowden (1985), Rao e Wu (1988), Sitter (1992a), Boothet al. (1994) e Canty e Davison (1999).
A maior parte dos procedimentos propostos fundamentam-sena procura de estimadores consistentes de erros padroes, combase na estimacao de V (y)
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
As propostas...
Tem sido propostas modificacoes ao bootstrap usual, numesforco de o adaptar a amostragem em populacoes finitas e aesquemas de amostragem complexos.
Entre outros salientam-se os trabalhos de McCarthy eSnowden (1985), Rao e Wu (1988), Sitter (1992a), Boothet al. (1994) e Canty e Davison (1999).
A maior parte dos procedimentos propostos fundamentam-sena procura de estimadores consistentes de erros padroes, combase na estimacao de V (y)
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
Podem distinguir-se basicamente duas famılias deprocedimentos:
os que tentam reconstituir as condicoes de tiragem inicial,criando pseudo-populacoes baseadas no esquema deamostragem;
os que efectuam a reamostragem directamente a partir daamostra original.
Em seguida apresentam-se alguns metodos pertencentes a cadauma dessas famılias.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
Podem distinguir-se basicamente duas famılias deprocedimentos:
os que tentam reconstituir as condicoes de tiragem inicial,criando pseudo-populacoes baseadas no esquema deamostragem;
os que efectuam a reamostragem directamente a partir daamostra original.
Em seguida apresentam-se alguns metodos pertencentes a cadauma dessas famılias.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
Podem distinguir-se basicamente duas famılias deprocedimentos:
os que tentam reconstituir as condicoes de tiragem inicial,criando pseudo-populacoes baseadas no esquema deamostragem;
os que efectuam a reamostragem directamente a partir daamostra original.
Em seguida apresentam-se alguns metodos pertencentes a cadauma dessas famılias.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap em sondagens
Podem distinguir-se basicamente duas famılias deprocedimentos:
os que tentam reconstituir as condicoes de tiragem inicial,criando pseudo-populacoes baseadas no esquema deamostragem;
os que efectuam a reamostragem directamente a partir daamostra original.
Em seguida apresentam-se alguns metodos pertencentes a cadauma dessas famılias.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
BSR - Bootstrap Sem Reposicao
BSR
Foi proposto por Gross (1980) no caso da amostragemaleatoria simples.
Este metodo cria uma populacao bootstrap (oupseudo-populacao), P, combinando l copias da amostraoriginal.
As reamostras bootstrap, (y∗
1 , y∗
2 , · · · , y∗
n ), sao seleccionadaspor amostragem sem reposicao da populacao P .
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap Sem Reposicao
BSR(S): Sitter (1992a)
E uma modificacao ao BSR que tenta resolver o problema deescala, na qual a dimensao da populacao empırica(pseudo-populacao) e da reamostra sao diferentes de N e de n.
Assim, em cada estrato e cria-se uma pseudo-populacaoreplicando a amostra {yei , i = 1, 2, · · · , ne} le vezes, emseguida selecciona-se dessa populacao uma amostra aleatoriasem reposicao de dimensao me , onde
me = ne − (1 − fe) e le = Ne
ne
(
1 − 1−fene
)
.
O procedimento anterior e repetido independentemente paracada estrato.
A escolha de me e le e feita de modo a que o metodo BSR origineestimadores bootstrap consistentes.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap Sem Reposicao
BSR(S): Sitter (1992a)
E uma modificacao ao BSR que tenta resolver o problema deescala, na qual a dimensao da populacao empırica(pseudo-populacao) e da reamostra sao diferentes de N e de n.
Assim, em cada estrato e cria-se uma pseudo-populacaoreplicando a amostra {yei , i = 1, 2, · · · , ne} le vezes, emseguida selecciona-se dessa populacao uma amostra aleatoriasem reposicao de dimensao me , onde
me = ne − (1 − fe) e le = Ne
ne
(
1 − 1−fene
)
.
O procedimento anterior e repetido independentemente paracada estrato.
A escolha de me e le e feita de modo a que o metodo BSR origineestimadores bootstrap consistentes.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap Sem Reposicao
BSR(S): Sitter (1992a)
E uma modificacao ao BSR que tenta resolver o problema deescala, na qual a dimensao da populacao empırica(pseudo-populacao) e da reamostra sao diferentes de N e de n.
Assim, em cada estrato e cria-se uma pseudo-populacaoreplicando a amostra {yei , i = 1, 2, · · · , ne} le vezes, emseguida selecciona-se dessa populacao uma amostra aleatoriasem reposicao de dimensao me , onde
me = ne − (1 − fe) e le = Ne
ne
(
1 − 1−fene
)
.
O procedimento anterior e repetido independentemente paracada estrato.
A escolha de me e le e feita de modo a que o metodo BSR origineestimadores bootstrap consistentes.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap Com Reposicao: BCR(MS)
BCR(MS): McCarthy e Snowden (1985)
A proposta e usar reamostras bootstrap com reposicao (como ousual bootstrap) porem com dimensao distinta da amostra original.
Segundo estes autores deve ser retirada uma amostra aleatoriasimples com reposicao de dimensao me , em vez de ne , a partir de{yei , i = 1, 2, · · · , ne}, e = 1, 2, . . . , k , de forma independente aolongo dos estratos, com me = ne−1
1−λe fe.
Os estimadores bootstrap sao obtidos da forma usual.
Quando θ = h(Z ) = cT Z , o seu estimador bootstrap da varianciaobtido a partir de BCR(MS) e
k∑
e=1
1
me
(
ne − 1
ne
)
cT s2e c =
k∑
e=1
1 − λe fe
ne
cT s2e c ,
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
Bootstrap Com Reposicao: BCR(MS)
BCR(MS): McCarthy e Snowden (1985)
A proposta e usar reamostras bootstrap com reposicao (como ousual bootstrap) porem com dimensao distinta da amostra original.
Segundo estes autores deve ser retirada uma amostra aleatoriasimples com reposicao de dimensao me , em vez de ne , a partir de{yei , i = 1, 2, · · · , ne}, e = 1, 2, . . . , k , de forma independente aolongo dos estratos, com me = ne−1
1−λe fe.
Os estimadores bootstrap sao obtidos da forma usual.
Quando θ = h(Z ) = cT Z , o seu estimador bootstrap da varianciaobtido a partir de BCR(MS) e
k∑
e=1
1
me
(
ne − 1
ne
)
cT s2e c =
k∑
e=1
1 − λe fe
ne
cT s2e c ,
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
O Rescaled Bootstrap: BR
BR: Rao e Wu (1988)
O metodo proposto por estes autores efectua uma mudanca deescala aos valores do bootstrap original. Em termos de seleccao dasreamostras e similar ao BCR(MS) porem o valor de me ≥ 1 nao enecessariamente dado pela mesma expressao.
Apos ter sido feita a seleccao da reamostra bootstrap calcula-se
θ∗ = T(
Z ∗)
, com
Z ∗ =k∑
e=1
{
(
(1−λe fe )me
ne−1
)12
z∗e +
(
1 −(
(1−λe fe)me
ne−1
)12
)
ze
}
, onde
z∗e = 1me
me∑
i=1
z∗ei .
Os estimadores bootstrap sao obtidos da forma usual, substituindonas expressoes θ∗ por θ∗.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
O Rescaled Bootstrap: BR (cont.)
Quando θ = h(Z ) = cT Z , o seu estimador bootstrap da varianciaobtido a partir de BR e
k∑
e=1
1
me
(
ne − 1
ne
)
cT s2e c =
k∑
e=1
1 − λe fe
ne
cT s2e c ,
para qualquer inteiro me ≥ 1. V∗(·) representa a variancia com respeito aamostragem bootstrap.A escolha, para o valor me , recomendada por Rao e Wu (1988) e aseguinte:
me ≈(1 − λe fe) (ne − 2)
2
(1 − 2λefe) (ne − 1).
Como o valor anterior e raras vezes um inteiro devera ser realizada umaapropriada aleatorizacao entre os inteiros mais proximos.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
O Mirror-Match Bootstrap: BMM
BMM: (Sitter, 1992b)
Este metodo e adequado para situacoes onde o esquema de amostragemoriginal (na primeira etapa) tenha sido efectuado sem reposicao. Oprocedimento proposto e o seguinte:
1 as reamostras bootstrap, de dimensao n∗e < ne , sao obtidas por
amostragem aleatoria simples sem reposicao a partir da amostra{yei , i = 1, 2, · · · , ne};
2 repete-se o passo (1) le vezes, de forma independente, obtendo-se areamostra bootstrap {y∗ei , i = 1, 2, · · · , me}, onde
le =ne (1 − f ∗
e )
n∗e (1 − λe fe)
, f ∗e =n∗
e
ne
e me = len∗e ;
3 repete-se o passo (2) para cada estrato, independentemente.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
O Mirror-Match Bootstrap: BMM
BMM: (Sitter, 1992b)
Este metodo e adequado para situacoes onde o esquema de amostragemoriginal (na primeira etapa) tenha sido efectuado sem reposicao. Oprocedimento proposto e o seguinte:
1 as reamostras bootstrap, de dimensao n∗e < ne , sao obtidas por
amostragem aleatoria simples sem reposicao a partir da amostra{yei , i = 1, 2, · · · , ne};
2 repete-se o passo (1) le vezes, de forma independente, obtendo-se areamostra bootstrap {y∗ei , i = 1, 2, · · · , me}, onde
le =ne (1 − f ∗
e )
n∗e (1 − λe fe)
, f ∗e =n∗
e
ne
e me = len∗e ;
3 repete-se o passo (2) para cada estrato, independentemente.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
O Mirror-Match Bootstrap: BMM
BMM: (Sitter, 1992b)
Este metodo e adequado para situacoes onde o esquema de amostragemoriginal (na primeira etapa) tenha sido efectuado sem reposicao. Oprocedimento proposto e o seguinte:
1 as reamostras bootstrap, de dimensao n∗e < ne , sao obtidas por
amostragem aleatoria simples sem reposicao a partir da amostra{yei , i = 1, 2, · · · , ne};
2 repete-se o passo (1) le vezes, de forma independente, obtendo-se areamostra bootstrap {y∗ei , i = 1, 2, · · · , me}, onde
le =ne (1 − f ∗
e )
n∗e (1 − λe fe)
, f ∗e =n∗
e
ne
e me = len∗e ;
3 repete-se o passo (2) para cada estrato, independentemente.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
O Mirror-Match Bootstrap: BMM
BMM: (Sitter, 1992b)
Este metodo e adequado para situacoes onde o esquema de amostragemoriginal (na primeira etapa) tenha sido efectuado sem reposicao. Oprocedimento proposto e o seguinte:
1 as reamostras bootstrap, de dimensao n∗e < ne , sao obtidas por
amostragem aleatoria simples sem reposicao a partir da amostra{yei , i = 1, 2, · · · , ne};
2 repete-se o passo (1) le vezes, de forma independente, obtendo-se areamostra bootstrap {y∗ei , i = 1, 2, · · · , me}, onde
le =ne (1 − f ∗
e )
n∗e (1 − λe fe)
, f ∗e =n∗
e
ne
e me = len∗e ;
3 repete-se o passo (2) para cada estrato, independentemente.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
O Mirror-Match Bootstrap: BMM (cont.)
No caso especial de θ = cT Z o estimador da variancia a partir de BMM e
V∗
(
k∑
e=1
m−1e
me∑
i=1
cTz∗
ei
)
=k∑
e=1
l−1e V∗
1
n∗
e
n∗e∑
i=1
cTz∗
ei
=k∑
e=1
1 − f ∗
e
len∗
e
cTs2e c.
Observacoes
Sitter (1992b) tambem recomenda o uso de n∗
e = fene . Esta igualdadetem uma motivacao intuitiva ja que iguala a fraccao de reamostragem afraccao de amostragem, isto e, f ∗
e = fe .
Mais uma vez o valor le pode nao ser inteiro e e necessario ter de serecorrer a uma aleatorizacao entre os inteiros mais proximos.
Observe-se que o BCR(MS) e um caso especial deste metodo, quandon∗
e = 1, para todo o e.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Bootstrap
O Mirror-Match Bootstrap: BMM (cont.)
No caso especial de θ = cT Z o estimador da variancia a partir de BMM e
V∗
(
k∑
e=1
m−1e
me∑
i=1
cTz∗
ei
)
=k∑
e=1
l−1e V∗
1
n∗
e
n∗e∑
i=1
cTz∗
ei
=k∑
e=1
1 − f ∗
e
len∗
e
cTs2e c.
Observacoes
Sitter (1992b) tambem recomenda o uso de n∗
e = fene . Esta igualdadetem uma motivacao intuitiva ja que iguala a fraccao de reamostragem afraccao de amostragem, isto e, f ∗
e = fe .
Mais uma vez o valor le pode nao ser inteiro e e necessario ter de serecorrer a uma aleatorizacao entre os inteiros mais proximos.
Observe-se que o BCR(MS) e um caso especial deste metodo, quandon∗
e = 1, para todo o e.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais
Linearizacao
Quando a abordagem de linearizacao por serie de Taylor e usada enecessario usar estimadores encontrar uma expressao que e unica, paraalem de ser aplicavel apenas em funcoes diferenciaveis (o que nao e ocaso dos quantis).
E dificil incluir alguns efeitos: imputacao; amostragem por fases...
Jackknife
Originalmente o metodo de reamostragem jackknife foi proposto paraamostras independentes e identicamente distribuıdas. Por esta razao aaplicacao deste procedimento tem de ser adaptada para as situacoes ondeo esquema de amostragem e realizado sem reposicao (de forma aincorporar o factor de correccao para populacoes finitas).
Nao pode ser aplicado a estimacao da variancia de quantis.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais
Linearizacao
Quando a abordagem de linearizacao por serie de Taylor e usada enecessario usar estimadores encontrar uma expressao que e unica, paraalem de ser aplicavel apenas em funcoes diferenciaveis (o que nao e ocaso dos quantis).
E dificil incluir alguns efeitos: imputacao; amostragem por fases...
Jackknife
Originalmente o metodo de reamostragem jackknife foi proposto paraamostras independentes e identicamente distribuıdas. Por esta razao aaplicacao deste procedimento tem de ser adaptada para as situacoes ondeo esquema de amostragem e realizado sem reposicao (de forma aincorporar o factor de correccao para populacoes finitas).
Nao pode ser aplicado a estimacao da variancia de quantis.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais
Linearizacao
Quando a abordagem de linearizacao por serie de Taylor e usada enecessario usar estimadores encontrar uma expressao que e unica, paraalem de ser aplicavel apenas em funcoes diferenciaveis (o que nao e ocaso dos quantis).
E dificil incluir alguns efeitos: imputacao; amostragem por fases...
Jackknife
Originalmente o metodo de reamostragem jackknife foi proposto paraamostras independentes e identicamente distribuıdas. Por esta razao aaplicacao deste procedimento tem de ser adaptada para as situacoes ondeo esquema de amostragem e realizado sem reposicao (de forma aincorporar o factor de correccao para populacoes finitas).
Nao pode ser aplicado a estimacao da variancia de quantis.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais
Linearizacao
Quando a abordagem de linearizacao por serie de Taylor e usada enecessario usar estimadores encontrar uma expressao que e unica, paraalem de ser aplicavel apenas em funcoes diferenciaveis (o que nao e ocaso dos quantis).
E dificil incluir alguns efeitos: imputacao; amostragem por fases...
Jackknife
Originalmente o metodo de reamostragem jackknife foi proposto paraamostras independentes e identicamente distribuıdas. Por esta razao aaplicacao deste procedimento tem de ser adaptada para as situacoes ondeo esquema de amostragem e realizado sem reposicao (de forma aincorporar o factor de correccao para populacoes finitas).
Nao pode ser aplicado a estimacao da variancia de quantis.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais
Linearizacao
Quando a abordagem de linearizacao por serie de Taylor e usada enecessario usar estimadores encontrar uma expressao que e unica, paraalem de ser aplicavel apenas em funcoes diferenciaveis (o que nao e ocaso dos quantis).
E dificil incluir alguns efeitos: imputacao; amostragem por fases...
Jackknife
Originalmente o metodo de reamostragem jackknife foi proposto paraamostras independentes e identicamente distribuıdas. Por esta razao aaplicacao deste procedimento tem de ser adaptada para as situacoes ondeo esquema de amostragem e realizado sem reposicao (de forma aincorporar o factor de correccao para populacoes finitas).
Nao pode ser aplicado a estimacao da variancia de quantis.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais
Linearizacao
Quando a abordagem de linearizacao por serie de Taylor e usada enecessario usar estimadores encontrar uma expressao que e unica, paraalem de ser aplicavel apenas em funcoes diferenciaveis (o que nao e ocaso dos quantis).
E dificil incluir alguns efeitos: imputacao; amostragem por fases...
Jackknife
Originalmente o metodo de reamostragem jackknife foi proposto paraamostras independentes e identicamente distribuıdas. Por esta razao aaplicacao deste procedimento tem de ser adaptada para as situacoes ondeo esquema de amostragem e realizado sem reposicao (de forma aincorporar o factor de correccao para populacoes finitas).
Nao pode ser aplicado a estimacao da variancia de quantis.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais
Bootstrap
No que diz respeito ao bootstrap, este necessita de modificacoesmesmo nos casos de amostragem com reposicao.
Para alem dos cinco metodos bootstrap descritos ainda existemoutras propostas na literatura, ver, por exemplo, os trabalhos deKuk (1989) no caso de amostragem sistematica, de Booth et al.
(1994) numa abordagem do bootstrap usando o conceito desuper-populacoes.
Pode ser aplicado na estimacao de quantis.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais
Bootstrap
No que diz respeito ao bootstrap, este necessita de modificacoesmesmo nos casos de amostragem com reposicao.
Para alem dos cinco metodos bootstrap descritos ainda existemoutras propostas na literatura, ver, por exemplo, os trabalhos deKuk (1989) no caso de amostragem sistematica, de Booth et al.
(1994) numa abordagem do bootstrap usando o conceito desuper-populacoes.
Pode ser aplicado na estimacao de quantis.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais
Bootstrap
No que diz respeito ao bootstrap, este necessita de modificacoesmesmo nos casos de amostragem com reposicao.
Para alem dos cinco metodos bootstrap descritos ainda existemoutras propostas na literatura, ver, por exemplo, os trabalhos deKuk (1989) no caso de amostragem sistematica, de Booth et al.
(1994) numa abordagem do bootstrap usando o conceito desuper-populacoes.
Pode ser aplicado na estimacao de quantis.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais
Bootstrap
No que diz respeito ao bootstrap, este necessita de modificacoesmesmo nos casos de amostragem com reposicao.
Para alem dos cinco metodos bootstrap descritos ainda existemoutras propostas na literatura, ver, por exemplo, os trabalhos deKuk (1989) no caso de amostragem sistematica, de Booth et al.
(1994) numa abordagem do bootstrap usando o conceito desuper-populacoes.
Pode ser aplicado na estimacao de quantis.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais (cont.)
Linearizacao, jackknife e bootstrap
Os estudos realizados revelam alguma superioridade dojackknife e da linearizacao face ao bootstrap na estimacao davariancia de estimadores que sao funcoes suaves de medias.
A desvantagem do jackknife e da linearizacao em relacao aobootstrap e porque nao origina estimadores consistentes davariancia para funcoes que nao sao suaves, nomeadamente amediana ou, de um modo geral, quantis.
Em muitos estudos de sondagens aparecem valores omissosdevido a variadas razoes, e os metodos de reamostragem saotambem importantes nestas situacoes. Sobre este assuntoconsultar, por exemplo, os trabalhos de Rubin (1987), Rao eShao (1992) e Shao e Sitter (1996).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais (cont.)
Linearizacao, jackknife e bootstrap
Os estudos realizados revelam alguma superioridade dojackknife e da linearizacao face ao bootstrap na estimacao davariancia de estimadores que sao funcoes suaves de medias.
A desvantagem do jackknife e da linearizacao em relacao aobootstrap e porque nao origina estimadores consistentes davariancia para funcoes que nao sao suaves, nomeadamente amediana ou, de um modo geral, quantis.
Em muitos estudos de sondagens aparecem valores omissosdevido a variadas razoes, e os metodos de reamostragem saotambem importantes nestas situacoes. Sobre este assuntoconsultar, por exemplo, os trabalhos de Rubin (1987), Rao eShao (1992) e Shao e Sitter (1996).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais (cont.)
Linearizacao, jackknife e bootstrap
Os estudos realizados revelam alguma superioridade dojackknife e da linearizacao face ao bootstrap na estimacao davariancia de estimadores que sao funcoes suaves de medias.
A desvantagem do jackknife e da linearizacao em relacao aobootstrap e porque nao origina estimadores consistentes davariancia para funcoes que nao sao suaves, nomeadamente amediana ou, de um modo geral, quantis.
Em muitos estudos de sondagens aparecem valores omissosdevido a variadas razoes, e os metodos de reamostragem saotambem importantes nestas situacoes. Sobre este assuntoconsultar, por exemplo, os trabalhos de Rubin (1987), Rao eShao (1992) e Shao e Sitter (1996).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Comentarios e conclusoes finais (cont.)
Linearizacao, jackknife e bootstrap
Os estudos realizados revelam alguma superioridade dojackknife e da linearizacao face ao bootstrap na estimacao davariancia de estimadores que sao funcoes suaves de medias.
A desvantagem do jackknife e da linearizacao em relacao aobootstrap e porque nao origina estimadores consistentes davariancia para funcoes que nao sao suaves, nomeadamente amediana ou, de um modo geral, quantis.
Em muitos estudos de sondagens aparecem valores omissosdevido a variadas razoes, e os metodos de reamostragem saotambem importantes nestas situacoes. Sobre este assuntoconsultar, por exemplo, os trabalhos de Rubin (1987), Rao eShao (1992) e Shao e Sitter (1996).
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Conclusao
Para finalizar refira-se que...
...caso se pretenda construir intervalos de confianca e/outestes de hipoteses com base em estimadores que sao funcoessuaves de medias, pode usar-se conjuntamente o metodobootstrap com o metodo jackknife ou com o de linearizacao.
E desta forma estimar-se, por exemplo, os quantis de umavariavel padronizada usando o bootstrap e a variancia porjackknife ou linearizacao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Conclusao
Para finalizar refira-se que...
...caso se pretenda construir intervalos de confianca e/outestes de hipoteses com base em estimadores que sao funcoessuaves de medias, pode usar-se conjuntamente o metodobootstrap com o metodo jackknife ou com o de linearizacao.
E desta forma estimar-se, por exemplo, os quantis de umavariavel padronizada usando o bootstrap e a variancia porjackknife ou linearizacao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Conclusao
Para finalizar refira-se que...
...caso se pretenda construir intervalos de confianca e/outestes de hipoteses com base em estimadores que sao funcoessuaves de medias, pode usar-se conjuntamente o metodobootstrap com o metodo jackknife ou com o de linearizacao.
E desta forma estimar-se, por exemplo, os quantis de umavariavel padronizada usando o bootstrap e a variancia porjackknife ou linearizacao.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Agora sim, e que e o final!
Muito obrigada pelo vosso tempo e atencao!
Conceicao Amado
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Referencias I
Booth, J., Butler, R. e Hall, P. (1994). Bootstrap methods forfinite populations. Journal of the American Statistical
Association 89, 1282–1289.
Canty, A. J. e Davison, A. C. (1999). Resampling-based varianceestimation for labour force surveys. The Statistician 48,379–391.
Efron, B. (1979). Bootstrap methods: another look at thejackknife. The Annals of Statistics 7, 1–26.
Gross, S. (1980). Median estimation in sample surveys.Proceedings of the Section on Survey Research Methods,181–184.
Jones, H. (1974). Jackknife estimation of functions of stratummeans. Biometrika 61, 343–348.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Referencias II
Kish, L. (1992). Weighting for unequal pi. Journal of Official
Statistics 8, 183–200.
Kish, L. e Frankel, M. R. (1974). Inference from complex samples(with discussion). Journal of the Royal Statistical Society B 36,1–37.
Korn, E. e Graubard, B. (1995). Examples of differing weightedand unweighted estimates from a sample survey. The American
Statistician 49, 291–295.
Kuk, A. Y. C. (1989). Double bootstrap estimation of varianceunder systematic sampling with probability proportional to size.Journal of Statistical Computation and Simulation 31, 73–82.
Mccarthy, P. (1966). Replication: an approach to the analysis ofdata from complex surveys. U.S. Government Printing Office,Washington, D.C.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Referencias III
McCarthy, P. J. e Snowden, C. B. (1985). The bootstrap and finitepopulation sampling. Public Health Service Publication 85-1369,U.S. Government Printing Office, Washington, D.C.
Miller, R. (1974). The jackknife - a review. Biometrika 61, 1–15.
Quenouille, M. (1949). Approximate tests of correlation in timeseries. Journal of the Royal Statistical Society B 11, 18–84.
Rao, J. e Shao, J. (1992). Jackknife variance estimation withsurvey data under hot deck imputation. Biometrika 79, 811–822.
Rao, J. N. K. e Wu, C. F. J. (1988). Resampling inference withcomplex survey data. Journal of the American Statistical
Association 83, 231–241.
Rubin, D. (1987). Multiple imputation for Nonresponse in Surveys.
New York: Wiley.
Estimacao da precisao Metodos de Reamostragem Comentarios Referencias
Referencias IV
Shao, J. e Sitter, R. R. (1996). Bootstrap for imputed survey data.Journal of the American Statistical Association 91, 1278–1288.
Sitter, R. R. (1992a). Comparing three bootstrap methods forsurvey data. The Canadian Journal of Statistics 20, 135–154.
Sitter, R. R. (1992b). A resampling procedure for complex surveysdata. Journal of the American Statistical Association 87,755–65.
Tukey, J. W. (1958). Bias and confidence in not quite largesamples. Annals of Mathematics and Statistics 29, 614.