23
Distribuic ¸˜ oes amostrais Tatiene Correia de Souza / UFPB [email protected] October 14, 2014 Souza () Distribuic ¸˜ oes amostrais October 14, 2014 1 / 23

Tatiene Correia de Souza / UFPB [email protected]/Disciplinas/2014.2/Slides/... · A probabilidade estimada de um divorcio´ e´ ^p = 3 10 = 0;3: Note que para a distribuic¸ao

  • Upload
    hathien

  • View
    212

  • Download
    0

Embed Size (px)

Citation preview

Distribuicoes amostrais

Tatiene Correia de Souza / [email protected]

October 14, 2014

Souza () Distribuicoes amostrais October 14, 2014 1 / 23

Distribuicao Amostral

ObjetivoEstender a nocao de uma distribuicao amostral a situacoes em queamostramos de uma distribuicao normal. Considere X1, · · · ,Xn umaamostra aleatoria de uma distribuicao normal com media µ e desviopadrao σ.

Souza () Distribuicoes amostrais October 14, 2014 2 / 23

ExemploSuponha que estamos interessados em estimar quantas horasadicionais de sono sao garantidas a um indivıduo apos ingerir umadeterminada droga. Alem disso, suponha que a droga e testada em 20indivıduos de modo que a media amostral X = 0,8 horas. Porem, se oestudo for repetido com outros 20 participantes podemos ter outrosresultados para a media amostral. Por exemplo, podemos ter X = 1,3.E, repetindo o estudo novamente, poderıamos ter X = −0,2. Emtermos estatısticos, havera variacao entre as medias amostrais.Este problema poderia ser resolvido se repetıssemos o estudo muitasvezes, porem isto e inviavel.

Souza () Distribuicoes amostrais October 14, 2014 3 / 23

Resultado importanteQuando as observacoes sao amostradas aleatoriamente de umadistribuicao normal, a media amostral tambem tem uma distribuicaonormal. Isto e, quando n observacoes sao amostradas aleatoriamentede uma distribuicao normal com media µ e variancia σ2, a mediaamostral tem distribuicao normal com media µ e variancia σ2/n.

Souza () Distribuicoes amostrais October 14, 2014 4 / 23

Para amostras casuais simples X1, . . . ,Xn retiradas de uma populacaocom media µ e variancia σ2, a distribuicao amostral da media X seaproxima de uma distribuicao normal com media µ e variancia σ2/n,quando n tende a infinito. Desta forma:E(X ) = µ e Var(X ) = σ2/n.

Se X ∼ N(µ, σ2)⇒ X ∼ N(µ, σ2/n) .

Souza () Distribuicoes amostrais October 14, 2014 5 / 23

Exemplo 1

Seja X ∼ N (100,100). Seja X a media de uma amostra de 16elementos retirados desta populacao, calcule:a) P(90 < X < 110).b) Qual deveria ser o tamanho da amostra de modo a garantir queP(90 < X < 110) = 0.95?

Souza () Distribuicoes amostrais October 14, 2014 6 / 23

Amostra aleatoria simplesTodos os elementos da populacao tem igual probabilidade depertencer a amostra, e todas as possıveis amostras de mesmotamanho tem igual probabilidade de serem sorteadas.

Souza () Distribuicoes amostrais October 14, 2014 7 / 23

Teorema Central do LimiteE um resultado estatıstico fundamental em aplicacoes praticas, poiseste teorema garante que mesmo que os dados nao sejamdistribuıdos conforme uma distribuicao normal, a media dos dadosconverge para a distribuicao normal conforme o numero de dadosaumenta.Para amostras grandes, a distribuicao amostral da media pode seraproximada pela distribuicao normal. Ou seja, considere uma amostraaleatoria simples de tamanho n retirada de uma populacao com mediaµ e variancia σ2 (note que o modelo da variavel aleatoria nao eapresentado). Representando tal amostra por n variaveis aleatoriasindependentes X1, · · · ,Xn, e denotando sua media por X , temos peloteorema central do limite, que quando n for grande, a variavel Z dadapor

X − µσ/√

n

tem distribuicao aproximadamente normal com media 0 e variancia 1(N(0,1)).Souza () Distribuicoes amostrais October 14, 2014 8 / 23

Distribuicao binomialPara construir o modelo binomial vamos introduzir uma sequencia deensaios de Bernoulli. Tal sequencia e definida por meio das seguintescondicoes:Em cada ensaio considera-se somente a ocorrencia ounao-ocorrencia de um certo evento que sera denominado sucesso (S)e cuja nao-ocorrencia sera denominada falha (F). Os ensaios saoindependentes. A probabilidade de sucesso, que denotaremos por p ea mesma para cada ensaio. A probabilidade de falha sera denotadapor 1− p.Para um experimento que consiste na realizacao de n ensaiosindependentes de Bernoulli, o espaco amostral e dados por sucessos(S) ou fracassos (F).

Souza () Distribuicoes amostrais October 14, 2014 9 / 23

A probabilidade de um ponto amostral com sucessos nos k primeirosensaios e falhas nos n − k ensaios seguintes e pk (1− p)n−k .Seja X o numero de sucessos obtidos na realizacao de n ensaios deBernoulli independentes. Diremos que X tem distribuicao binomialcom parametros n e p, em que p e a probabilidade de sucesso emcada ensaio, se sua funcao de probabilidade for dada por

P[X = k ] =(

nk

)pk (1− p)n−k .

Usaremos a notacao X ∼ B(n,p).

Souza () Distribuicoes amostrais October 14, 2014 10 / 23

Exemplo 2Se a probabilidade de um estabelecimento possuir trator e 0,4; e sepesquisarmos 5 estabelecimentos, qual a probabilidade de:a) Exatamente dois possuırem trator?b) No maximo dois possuırem trator?c) No mınimo tres possuırem trator?

Souza () Distribuicoes amostrais October 14, 2014 11 / 23

Exemplo 3Os camaroes macho da especie A, para serem considerados adultos,devem apresentar um comprimento total maior ou igual a 22 mm.Suponha que numa populacao de camaroes machos adultos a mediados comprimentos seja igual a µ = 27,3 e desvio padrao σ = 7,8.Pergunta-se:a) Qual a probabilidade de que numa amostra de n = 35 camaroes,obtenhamos uma media de X < 22.b) Qual deve ser o valor para media do comprimento total, µ, a fim deque a P(X ≤ 22) = 0.05?

Souza () Distribuicoes amostrais October 14, 2014 12 / 23

Distribuicao amostral da proporcao

A nocao de uma distribuicao amostral e talvez mais facil de explicar eilustrar quando trabalhamos com a distribuicao binomial.Para exemplificar, suponha que queremos determinar a proporcao deadultos com idade superior aos 40 que sofrem de artrite. Logo,podemos definir uma variavel aleatoria X da seguinte maneira

X = 1, se o indivıduo e portador de artrite

X = 0, se o indivıduo nao e portador de artrite

logo, temos que X e uma variavel discreta, com distribuicao deBernoulli tal que

µ = E(X ) = p, σ2 = Var(X ) = p(1− p).

Souza () Distribuicoes amostrais October 14, 2014 13 / 23

Retirada uma amostra aleatoria X1,X2, ...,Xn sem reposicao detamanho n dessa populacao, e indicando por Yn o total de indivıduosportadores de artrite nessa amostra, sabemos que

Yn ∼ Binomial(n,p)

ou seja,

P(Yn = k) =(

nk

)pk (1− p)n−k .

Souza () Distribuicoes amostrais October 14, 2014 14 / 23

Vamos definir por p a proporcao de indivıduos portadores de artrite,ou seja,

p =Yn

n.

A distribuicao amostral de p e obtida da distribuicao de Yn.Observamos que

Yn = X1 + X2 + . . .+ Xn,

em que cada Xi tem distribuicao de Bernoulli com media µ = p evariancia σ2 = p(1− p) com p desconhecido. Desta forma, podemosescrever que

Yn =n∑

i=1

Xi = nn∑

i=1

Xi

n= nX

Souza () Distribuicoes amostrais October 14, 2014 15 / 23

Pelo Teorema Central do Limite, X tera distribuicao aproximadamentenormal, com media p e variancia p(1− p)/n, ou seja

X ∼ N(

p,p(1− p)

n

).

Logo, a transformacao Yn = nX tera a distribuicao

Yn ∼ N(np,np(1− p)).

Podemos observar que X , na expressao acima, e a propria variavel pe, desse modo, para n grande podemos considerar a distribuicaoamostral de p como aproximadamente normal

p ∼ N(

p,p(1− p)

n

)

Souza () Distribuicoes amostrais October 14, 2014 16 / 23

ExemploSuponha que queremos saber a porcentagem de casamentos queterminam em divorcio entre casais que vivem em Joao Pessoa. Comonao temos recursos suficientes para checar todos os arquivos, vamosestimar esta porcentagem baseados em alguns dados disponıveis.Suponha que temos dados sobre 10 casais:

X1 = 1,X2 = 0,X3 = 0,X4 = 0,X5 = 1,X6 = 0,X7 = 0,X8 = 0,X9 = 0,X10 = 1.

Isto e, o primeiro casal se divorciou, os proximos tres nao sedivorciaram, o quinto casal se divorciou e assim por diante. O numerode divorcios entre estes casais e

10∑i=1

Xi = 1 + 0 + 0 + 0 + 1 + 0 + 0 + 0 + 0 + 1 = 3,

Souza () Distribuicoes amostrais October 14, 2014 17 / 23

A probabilidade estimada de um divorcio e

p =310

= 0,3.

Note que para a distribuicao binomial, se sabemos a realprobabilidade de divorcio, p, poderıamos calcular a probabilidade determos p = 0,3 baseados em uma amostra de tamanho 10. Quandon = 10, esta e justamente a probabilidade de observamos 3 divorcios,ou seja,

P(X = 3) =(

103

)p3(1− p)7.

Se, por exemplo, p = 0,4, entao P(X = 3) = 0,215. Isto e, aprobabilidade de tomarmos p = 0,3 e 0,215.

Souza () Distribuicoes amostrais October 14, 2014 18 / 23

Suponha que a taxa de divorcio de uma populacao e p = 0,3. Imagineagora 1000 equipes de pesquisadores e suponha que cada equipeestima a taxa de divorcio baseada em dados de 10 casais. Nestecaso, diferentes equipes de pesquisadores conseguirao resultadosdiferentes. Por exemplo, a primeira equipe consegue p = 0,5, asegunda equipe consegue p = 0,1, e assim por diante. A distribuicaoamostral de p se refere a distribuicao dos valores de p que as equipesde pesquisadores conseguiriam ao conduzir o mesmo estudo.

Souza () Distribuicoes amostrais October 14, 2014 19 / 23

Exemplo 4Sabe-se que 20% das pecas de um lote sao defeituosas. Sorteiam-se8 pecas, com reposicao, e calcula-se a proporcao de pecasdefeituosas na amostra. Qual sera a distribuicao de p?

Souza () Distribuicoes amostrais October 14, 2014 20 / 23

Exemplo 5Suponha que a proporcao de pecas fora de especificacao em um lotee 40%. Considere que foi retirada uma amostra de tamanho 30, qual aprobabilidade desta amostra fornecer uma proporcao de pecasdefeituosas menor que 0.50?

Souza () Distribuicoes amostrais October 14, 2014 21 / 23

Exemplo 6Um fabricante afirma que sua vacina contra gripe imuniza em 80% doscasos. Uma amostra de 25 indivıduos que tomaram a vacina foisorteada e testes foram feitos para verificar a imunizacao ou naodesses indivıduos. Se o fabricante estiver correto, qual e aprobabilidade da proporcao de imunizados na amostra ser inferior a0.75? E superior a 0.85?

Souza () Distribuicoes amostrais October 14, 2014 22 / 23

Exemplo 7Sabe-se que nem processo de industrializacao de pessegos em lata,a probabilidade de apresentar peso fora dos padroes e 0,05. Qual aprobabilidade de, em uma amostra de 500 latas, apresentarem-se forados padroes:a) 6% ou mais das latas?b) 4% ou menos das latas?

Souza () Distribuicoes amostrais October 14, 2014 23 / 23