24
Inferência Estatística – Distribuições Amostrais e TCL Introdução e conceitos fundamentais Distribuição amostral Teorema central do limite 1

Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Inferência Estatística –

Distribuições Amostrais e TCL

� Introdução e conceitos fundamentais

� Distribuição amostral

� Teorema central do limite

1

Page 2: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Divisão da Estatística

�� DescritivaDescritiva

�� InferênciaInferência

2

Page 3: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Idéia fundamentalIdéia fundamental

Inferência Estatística

Dar informação sobre o Dar informação sobre o todotodo com com base no conhecimento da base no conhecimento da parteparte

3

“Não é preciso beber toda a garrafa “Não é preciso beber toda a garrafa para saber se o vinho é bom.” para saber se o vinho é bom.”

Page 4: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

�������� Pesquisas são feitas com amostrasamostras , mas o pesquisador quer estender os resultadosestender os resultados que obteve para toda a populaçãopopulação .

populaçãopopulação

amostraamostra

pesquisaspesquisas

interesseinteresse

Pesquisador Pesquisador quer fazer quer fazer inferênciainferência

4

ConceitoConceito:: É o conjunto de procedimentos estatísticos quetêm por finalidade generalizar conclusões de uma amostrapara uma população.

Inferência estatísticaInferência estatística

Page 5: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

⇒⇒⇒⇒ Erro provávelGeneralização= Inferência

Exemplo: Pesquisas eleitorais no Rio Grande do Sul

Resultados

Amostragem(deve garantir a

Candidato A - 25% Candidato B – 18% Candidato C – 12%

��

��

��

��

��

��

��

��

�� �

���

5

Amostra (de 1000 a 2000 entrevistados)População

(8 milhões de eleitores)

(deve garantir a representatividade)

��

�� �

����� �

��

Page 6: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

N = tamanho N = tamanho da populaçãoda população n = tamanho n = tamanho

da amostrada amostra (1, 1)

(1, 2)14 4 A amostra é A amostra é

Exemplo

com reposiçãocom reposição

[X1, X2]

n=2

(1, 2)16

5 4

32

4 4

3

1 (1, 3)

(6, 6)

. . .

A amostra é A amostra é uma variável uma variável

aleatóriaaleatória

[X1, X2] X S2

N=10

6

[X1, X2]

(1, 1)

(1, 2)

(6, 6). . .

(1, 3)

X S

. . . . . .

1,5x2 =1x1 =

2x3 =

6xk =

0s21 =

0,5s22 =

2s23 =

0s2k =

Page 7: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Amostra: [X1, X2, ..., Xn]

Como a amostra é uma variável aleatória, qualquer função da amostra (soma, média, variância) também será uma variável aleatória.

Variável aleatóriaVariável aleatória

X S2EstatísticasEstatísticas

Variáveis aleatóriasVariáveis aleatóriasX Variáveis aleatóriasVariáveis aleatórias

. . .

1x

2x

kx. . .

21s22s

2ks

Se temos k amostras Se temos k amostras de mesmo tamanho n, de mesmo tamanho n,

temos k médias e temos k médias e variânciasvariâncias

EstatísticaEstatística é qualquer valor obtido em função da amostra .

7

EstatísticaEstatística é qualquer valor obtido em função da amostra .

�������� Como as estatísticas são variáveis aleatórias, também terãoalguma distribuição de probabilidade com média, variância, etc.

DistribuiçãoDistribuição amostralamostral é a distribuição de probabilidade deuma estatística .

Page 8: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Exemplo:

O mecânico de uma oficina de regulagem para carros 1.0, 1.4, 2.0,cobra pelo serviço 40, 45 e 50 reais, respectivamente. Seja a variávelX = valor cobrado pelo mecânico, com a seguinte distribuição deprobabilidade:

a) Determine a média e a variância da população .

X = x 40 45 50 Σ P(X = x) 0,2 0,3 0,5 1

46,50,5500,3450,240p(x)x µE(X) =×+×+×=== ∑

8

46,50,5500,3450,240p(x)x µE(X)XSx

=×+×+×=== ∑∈

15,2546,50,5)500,3450,2(40

µ)E(XσV(X)2222

222

=−×+×+×=−==

Page 9: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Exemplo:

O mecânico de uma oficina de regulagem para carros 1.0, 1.4, 2.0,cobra pelo serviço 40, 45 e 50 reais, respectivamente. Seja a variávelX = valor cobrado pelo mecânico, com a seguinte distribuição deprobabilidade:

X = x 40 45 50 Σ P(X = x) 0,2 0,3 0,5 1

b) Suponha a retirada de uma amostra de tamanho nn == 22 , comreposição.

9

Quantas e quais são as possíveis amostras retiradas da população equal a probabilidade associada a cada uma?

Determine a média e a variância da distribuição amostral da média .

Page 10: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

n = 2 → [X1, X2]onde:→ k = Nn = 32 = 9 quantas

X = x 40 45 50 Σ P(X = x) 0,2 0,3 0,5 1

Amostra [X1, X2] P [X1, X2] X

1 (40, 40) 0,2 . 0,2 = 0,04 40

2 (40, 45) 0,2 . 0,3 = 0,06 42,5

3 (40, 50) 0,2 . 0,5 = 0,10 45

onde:k = número de amostras possíveis N = tamanho da populaçãon = tamanho da amostra

10

3 (40, 50) 0,2 . 0,5 = 0,10 45 4 (45, 40) 0,06 42,5

5 (45, 45) 0,09 45

6 (45, 50) 0,15 47,5 7 (50, 40) 0,10 45

8 (50, 45) 0,15 47,5

9 (50, 50) 0,25 50

quais

Page 11: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Distribuição amostral da média das amostras de tamanho 2

xX = 40 42,5 45 47,5 50 Σ

P( xX = ) 0,04 0,12 0,29 0,3 0,25 1

46,5

0,25500,347,50,29450,1242,50,0440

)xp( xµ)XE(XSx

X

=×+×+×+×+×=

== ∑∈

= µ (média da população)

11

7,625

46,50,25)500,1242,50,04(40

µ)XE(σ)XV(2222

2X

22X

=−×++×+×=

−==

K

= metade de σ2 (variância da população)

Page 12: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Exemplo:

O mecânico de uma oficina de regulagem para carros 1.0, 1.4, 2.0,cobra pelo serviço 40, 45 e 50 reais, respectivamente. Seja a variávelX = valor cobrado pelo mecânico, com a seguinte distribuição deprobabilidade:

X = x 40 45 50 Σ P(X = x) 0,2 0,3 0,5 1

c) Suponha a retirada de uma amostra de tamanho nn == 33 , comreposição.

12

reposição.

Quantas e quais são as possíveis amostras retiradas da população equal a probabilidade associada a cada uma?

Determine a média e a variância da distribuição amostral da média .

Page 13: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

n = 3 → [X1, X2 , X3] → k = Nn = 33 = 27

Quantas?Quantas?

Quais?Quais?

Amostra [X1, X2, X3] P[X1, X2, X3] X Amostra [X1, X2, X3] P[X1, X2, X3] X1 (40, 40, 40) 0,008 40 15 (45, 45, 50) 0,045 46,72 (40, 40, 45) 0,012 41,7 16 (45, 50, 40) 0,030 453 (40, 40, 50) 0,020 43,3 17 (45, 50, 45) 0,045 46,74 (40, 45, 40) 0,012 41,7 18 (45, 50, 50) 0,075 48,35 (40, 45, 45) 0,018 43,3 19 (50, 40, 40) 0,020 43,36 (40, 45, 50) 0,030 45 20 (50, 40, 45) 0,030 457 (40, 50, 40) 0,020 43,3 21 (50, 40, 50) 0,050 46,78 (40, 50, 45) 0,030 45 22 (50, 45, 40) 0,030 45

13

8 (40, 50, 45) 0,030 45 22 (50, 45, 40) 0,030 459 (40, 50, 50) 0,050 46,7 23 (50, 45, 45) 0,045 46,7

10 (45, 40, 40) 0,012 41,7 24 (50, 45, 50) 0,075 48,311 (45, 40, 45) 0,018 43,3 25 (50, 50, 40) 0,050 46,712 (45, 40, 50) 0,030 45 26 (50, 50, 45) 0,075 48,313 (45, 45, 40) 0,018 43,3 27 (50, 50, 50) 0,125 5014 (45, 45, 45) 0,027 45

Page 14: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Distribuição amostral da média das amostras de tamanho 3

xX = 40 41,7 43,3 45 46,7 48,3 50 Σ

P( xX = ) 0,008 0,036 0,114 0,207 0,285 0,225 0,125 1

2 2 2V(X) E(X )= σ = − µ

= µ (média da população)

Xx SXE(X) x p(x)

, , , ,

,

∈= µ =

= × + × + + ×=

40 0 008 41 7 0 036 50 0 125

46 5

K...

14

2 2 2X XV(X) E(X )

( , , , , ) 4 ,

,

= σ = − µ

= × + × + + × −=

2 2 2 240 0 008 41 7 0 036 50 0 125 6 5

5 083

K

= um terço de σ2 (variância da população)

...

Page 15: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Amostras de tamanho n = 2

População

46,5µE(X) ==

15,25σV(X) 2 ==µ=)XE(

7,625σ)XV( 2X == = σ2/2

Amostras de tamanho n = 2

46,5µ)XE( X == = µ

Amostras de tamanho n = 3

)XV(2

=

µ=)XE(

σσ2

===σ

15

5,083σ)XV( 2X == = σ2/3

Amostras de tamanho n = 3

46,5µ)XE( X == = µn

σ

)XV(X ===σ

Erro padrão da média

Page 16: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Distribuição de probabilidade da população

X = x 40 45 50 Σ P(X = x) 0,2 0,3 0,5 1

Distribuição amostral da média das amostras de tamanho 2

xX = 40 42,5 45 47,5 50 Σ

P( xX = ) 0,04 0,12 0,29 0,3 0,25 1

16

Distribuição amostral da média das amostras de tamanho 3

xX = 40 41,7 43,3 45 46,7 48,3 50 Σ

P( xX = ) 0,008 0,036 0,114 0,207 0,285 0,225 0,125 1

Page 17: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Comparando o histograma da população X com os histogramas da

Distribuição da média das amostras de tamanho 2

Distribuição da média das amostras de tamanho 3

Distribuição da população

17

Comparando o histograma da população X com os histogramas da média para as amostras de tamanhos 2 e 3, observamos que,

mesmo a distribuição da população não sendo simétri ca, a distribuição amostral da média tende para a simetria à medida que

o tamanho da amostra aumenta .

Page 18: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

18

Page 19: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Qual é a distribuição da média?Qual é a distribuição da média?

�� Se a população (X) de onde foi extraída a amostra aleatória não tiver distribuição normal, então a distribuição amostral da média se aproximará da normal à medida que o tamanho da amostra (n) cresce (Teorema Central do Limite ).

�� Se a população (X) de onde foi extraída a amostra aleatória tiver distribuição normal, então a distribuição amostral da média será normal.

As médias são iguais, mas a se X ~ N (µ, σ2),

amostra (n) cresce (Teorema Central do Limite ).

19

iguais, mas a variância de é n

vezes menor.Xentão, ~ N (µ, σ2/n)X

Page 20: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

Exercício proposto: Sabe-se a variável X (peso do queijo ralado contido em pacotinhos de 100g vendidos em supermercados) tem distribuição normal de média 100 e desvio padrão 10.

(a) Qual a probabilidade de encontrar um pacote de queijo ralado com peso entre 95g e 105g? com peso entre 95g e 105g?

(b) Se 16 pacotes são escolhidos ao acaso em um supermercado, qual a probabilidade do peso médio estar entre 95g e 105g?

Solução:

(a) Como X é uma N(100, 102) vem:

20

P(95 < X < 105)= P(-0,5 < Z < 0,5) = 2 . 0,1915 = 38,30%

(b) Neste caso é uma N(100; 2,52), então:

P(95 < < 105)= P(-2,0 < Z < 2,0) = 2 . 0,4772 = 95,44%X

Page 21: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

� Como estimar a probabilidade de obter cara ao lançar uma moeda?

Teorema Central do Limite

(exemplo para proporção)

moeda?

� Seja π a probabilidade de sair cara ao lançar a moeda

� Supondo a moeda honesta, uma estimativa adequada seria ½

� Conde de Buffon (1707-1788) em 4.040 lançamentos da � Conde de Buffon (1707-1788) em 4.040 lançamentos da moeda encontrou 2048 caras, logo a estimativa foi 0,5069

� Karl Pearson (1857-1937) em 24.000 lançamentos encontrou 12.012 caras, logo a estimativa foi 0,5005

21

Page 22: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

0,9

1,0

p1 p2 p3 p4 p5

Simulação para estimar a probabilidade de cara com uma amostra de tamanho 30

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

Est

imat

iva

de ππ ππ

p1 p2 p3 p4 p5

0,0

0,1

0,2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

tamanho da amostra (n)

22

Page 23: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

1,0

Simulação para estimar a probabilidade de cara com uma amostra de tamanho 100

0,3

0,4

0,5

0,6

0,7

0,8

0,9

Est

imat

iva

de

ππ ππ

p1 p2 p3 p4 p5

0,0

0,1

0,2

0 10 20 30 40 50 60 70 80 90 100

Tamanho da amostra (n)

23

Page 24: Inferência Estatística – Distribuições Amostrais e TCL › provasimuladaestatistica › img › apostil... · Estatística é qualquer valor obtido em função da amostra

0,9

1,0

p1 p2 p3 p4 p5

Simulação para estimar a probabilidade de cara com uma amostra de tamanho 500

0,2

0,3

0,4

0,5

0,6

0,7

0,8

Est

imat

iva

de

ππ ππ

0,0

0,1

0,2

0 50 100 150 200 250 300 350 400 450 500

Tamanho da amostra (n)

24