Amostras, Distribuição Amostral da Média e Teorema do ... · Vejamos a nossa simulação...

Preview:

Citation preview

Amostras, Distribuição Amostral da Média e Teorema

do Limite Central

Introdução à Inferência Estatística

Distribuição amostral

• Observe: ► Muitas amostragens são possíveis

► Duas amostragens da mesma população geralmente serão diferentes

► Amostragens são probabilísticas, portanto, estatísticas baseadas nas amostragens também são

► Se as características da amostragem e a composição da população são conhecidas, a probabilidade de cada resultado pode ser determinada

► Diferentes amostragens produzirão amostras com estatísticas diferenciadas

Vejamos a nossa simulação (População = X~N(100:152)

0

5

10

15

20

78

81

84

87

90

93

96

99

10

2

10

5

10

8

11

1

11

4

11

7

12

0

Histograma n =100

0

5

10

15

20

78

80

,5 83

85

,5 88

90

,5 93

95

,5 98

10

0,5

10

3

10

5,5

10

8

11

0,5

11

3

11

5,5

11

8

12

0,5

Histograma n = 60

0

5

10

15

20

78

81

84

87

90

93

96

99

10

2

10

5

10

8

11

1

11

4

11

7

12

0

Histograma n= 5

0

5

10

15

20

78

81

84

87

90

93

96

99

10

2

10

5

10

8

11

1

11

4

11

7

12

0

Histograma n= 10

0

2

4

6

8

10

12

14

16

18

20

78

81

84

87

90

93

96

99

10

2

10

5

10

8

11

1

11

4

11

7

12

0

Histograma n = 30

Tabela comparativa

População = X~N(100:152)

n Das médias

Amplitude das amostras médias desvios-padrão

média dpad mín máx ampl. mín máx ampl. 5 100,66 6,890 82,06 118,20 36,13 3,646 25,699 22,053

10 99,46 4,738 89,92 112,54 22,62 7,808 22,231 14,424 30 99,83 2,697 93,89 106,15 12,25 10,762 18,576 7,814 60 100,06 2,086 95,06 106,31 11,24 11,374 18,813 7,438

100 100,02 1,301 96,95 103,72 6,78 11,613 17,891 6,278

Há alguma relação entre o tamanho da amostra e o desvio-padrão das

médias?

Distribuição amostral da média

• Seja X uma v.a. com média μ e variância σ2, e seja (X1, X2,..., Xn) uma Amostra Aleatória Simples (AAS) de X, de tamanho n, então:

= X)E(

n =

n =

XX

2

2

Erro amostral da média

• A diferença entre a estatística x e o parâmetro μ é chamada de erro amostral da média, definido assim:

• Verifica-se que a distribuição de e aproxima-se de uma normal com média 0 (zero) e variância σ2/n

X = e

Teorema do Limite Central

• Quando o tamanho da amostra aumenta, independente da forma de distribuição da população, a distribuição amostral de X aproxima-se cada vez mais de uma distribuição normal.

Histogramas de distribuição da média para amostras de algumas populações

Distribuição amostral de uma proporção

• Consideramos X uma v.a. onde:

1, se portador da característica

X =

0, se não for portador da característica

► Ex.: 1, se doador de órgãos; 0, se não doador

• Podemos aproximar a distribuição binomial para uma normal, onde:

μ= E(X) = p

σ2 = Var(X) = p(1-p)

n

pppNp

)1(;~ˆ

Exercícios básicos: uso da curva normal

1. Um levantamento realizado pela ANAC* verificou que a altura dos usuários de aviação segue uma distribuição normal com média de 171,3cm e desvio-padrão de 7,3cm. Com base nesses dados determine: a. Probabilidade de um usuário ter mais de 1,90m de

altura = P(X>190)

b. P(165<X<180)

c. P(X<140)

d. Um intervalo simétrico em relação à média que exclua apenas 5% dos indivíduos

Dica: desenhe a curva normal e marque a área

a ser determinada

* SILVA, S. C; MONTEIRO, D.. Levantamento do perfil antropométrico da população brasileira usuária do transporte aéreo nacional: projeto conhecer. Relatório Técnico Final. Agência Nacional de Aviação Civil. 2009. Disponível em http://www2.anac.gov.br/arquivos/pdf/Relatorio_Final_Projeto_Conhecer.pdf

Exercícios básicos: uso da curva normal

2. Uma v.a. X tem distribuição normal, com média 100 e desvio-padrão 10.

a. Qual a P(90<X<110)?

b. Se X for a média de uma amostra de 16 elementos tirados dessa população, calcule P(90<X<110)?

c. Que tamanho deveria ter a amostra para que P(90<X<110) = 0,95?

Exercícios básicos: binomial como normal

3. Um processo produtivo foi planejado para ter 5% de itens defeituosos. A cada 4 horas sorteia-se uma amostra de 25 peças e, havendo-se mais de 8% de defeituosos, interrompe-se a produção para calibragem. Calcule a probabilidade de uma parada desnecessária.

Sugestão de exercícios

• Capítulo 5 (Larson; Farber, 2010)

• 5.4: Exercícios (228-31)

► 25 → 38

• 5.5: Exercícios (238-40)

► 19; 21; 22; 23

Recommended