NOTAS DE AULA: DISTRIBUIÇÃO AMOSTRAL E INTERVALOS … · Figura: Distribuição amostral da...

Preview:

Citation preview

NOTAS DE AULA: DISTRIBUIÇÃO AMOSTRAL E INTERVALOS DE CONFIANÇA

Objetivos da aula:

• Compreender que um estimador é uma variável aleatória e,portanto, pode-se estabelecer sua distribuição probabilística;

• Estabelecer a distribuição amostral das principaisestatísticas: média, variância e proporção.estatísticas: média, variância e proporção.

• Aplicar os resultados: construção de intervalos de confiança,

dimensionamentos amostral, etc.

Prof. Idemauro Antonio Rodrigues de Lara

1. INFERÊNCIA OU INDUÇÃO ESTATÍSTICA

POPULAÇÃO:

Seja θ : característica de uma variável X quese quer conhecer (PARÂMETRO)

AMOSTRA:

Seja T um estimador de θ, construído combase em valores amostrais

),...,,(ˆ21 nXXXT

Função da amostra aleatória

2. Métodos para realizar inferências a respeito dos parâmetros

1. Estimação:Determinar estimativas para os parâmetrospopulacionais: por ponto e por intervalo.

2. Testes de hipóteses:2. Testes de hipóteses:Processo de indução estatística: decisãorelativa ao valor de um parâmetro populacional(ou conjunto de parâmetros).

IC e testes de hipóteses necessitam do conhecimento da distribuição amostral do estimador.

3. Distribuição amostral

Amostras de n elementos → estimador → estimativas

Distribuição amostral do estimador: distribuição de probabilidade

de um estimador pontual.

Parâmetros da distribuição amostral do estimador:

Importante: conhecendo-se a distribuição amostral de

determinado estimador pode-se fazer inferências.

4. Distribuição amostral da média1º caso – Variável X tem distribuição normal com

variância conhecida.

Distribuição de probabilidade

),(~2

nNX

0.4

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Figura: Distribuição amostral da média

de

nsi

dad

e

Teorema Central do Limite

X 1, X 2, ...X n → v. a. independentes, com média µ e variância σ²

A distribuição de → Normal a medida que n cresce, ou seja:

Xou seja:

Ou, ainda:

),(~2

nNX

)1,0(N

n

XZ

Teorema Central do Limite

Normal

Density

-2 -1 0 1

0.0

0.2

0.4

0.6

0.8

Gamma

Density

0 2 4 6 8 10

0.0

00.1

00.2

00.3

0

sample size = 5

x

-2 -1 0 1

x

0 2 4 6 8 10

Uniform

x

Density

0.2 0.4 0.6 0.8

0.0

1.0

2.0

3.0

Beta

x

Density

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Teorema Central do Limite

Normal

Density

-1.0 -0.5 0.0 0.5 1.0

0.0

0.5

1.0

1.5

Gamma

Density

1 2 3 4 5 6 7

0.0

0.2

0.4

sample size = 15

x

-1.0 -0.5 0.0 0.5 1.0

x

1 2 3 4 5 6 7

Uniform

x

Density

0.2 0.3 0.4 0.5 0.6 0.7 0.8

01

23

45

Beta

x

Density

0.2 0.4 0.6 0.8

01

23

4

Teorema Central do Limite

Normal

De

nsity

0.0

0.5

1.0

1.5

2.0

Gamma

De

nsity

0.0

0.2

0.4

0.6

sample size = 30

x

-0.5 0.0 0.5

x

2 3 4 5

Uniform

x

De

nsity

0.3 0.4 0.5 0.6 0.7

02

46

8

Beta

x

De

nsity

0.3 0.4 0.5 0.6 0.7 0.8

01

23

45

Teorema Central do Limite

Normal

De

nsity

0.0

1.0

2.0

3.0

Gamma

De

nsity

0.0

0.2

0.4

0.6

0.8

1.0

sample size = 50

x

-0.4 -0.2 0.0 0.2 0.4

x

1.5 2.0 2.5 3.0 3.5 4.0 4.5

Uniform

x

De

nsity

0.35 0.40 0.45 0.50 0.55 0.60 0.65

02

46

81

0

Beta

x

De

nsity

0.4 0.5 0.6 0.7

01

23

45

67

Resultado: IC para a média pressupondo normalidade (ou amostras grandes) e variância

conhecida

);(),( )2/()2/(n

zXn

zXIC

Exemplo1- Por analogia a produtos similares, o tempo de reação

de um novo medicamento pode ser considerado normalcom desvio padrão igual a 2 minutos. Vinte pacientesforam sorteados, receberam o medicamento e tiveramseu tempo de reação anotado. Os dados foram:

2,9 3,4 3,5 4,1 4,6 4,7 4,5 3,8 5,3 4,92,9 3,4 3,5 4,1 4,6 4,7 4,5 3,8 5,3 4,94,8 5,7 5,8 5,0 3,4 5,9 6,3 4,6 5,5 6,2

média 4,745

Obtenha um intervalo de confiança para o tempo de reação.

Interpretação do IC

30

40

50

Confidence intervals based on z distribution

| | || |

|| || |

| ||| ||| |

|| || |

3 4 5 6

01

02

03

0

Confidence Interval

Ind

ex

| || ||

| | || || |

|| | ||| | || ||| |

| || | |

2 º caso: Distribuição amostral da média, pressupondodistribuição normal e variância desconhecida.

)1(~

nt

n

s

X 30nSe :

n

Se n > 30 :

)1,0(N

n

s

X

A distribuição t de Student0.1

0.2

0.3

graus de liberdade=5

de

nsid

ade

0.0

0.1

0.2

0.3

0.4

graus de liberdade=15

de

nsid

ade

-3 -2 -1 0 1 2 3

t

-3 -2 -1 0 1 2 3

t

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

graus de liberdade=25

t

de

nsid

ad

e

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

graus de liberdade=45

t

de

nsid

ad

e

Resultado: IC para a média pressupondo normalidade e variância desconhecida

);(),( )2/()2/(n

stX

n

stXIC

Exemplo

2- Admita que o índice de poluiçãoambiental em uma região e horário siga omodelo normal. Oito índices forammedidos às 13 horas: 34, 45, 77, 52, 48,medidos às 13 horas: 34, 45, 77, 52, 48,54, 79, 66. Construa um intervalo de 99%de confiança para a média.

5.Distribuição amostral da proporção

Realizada uma amostragem, tal que:

Temos o seguinte resultado:

})1,0{(;...,,11 inn xxXxX

Temos o seguinte resultado:

)1,0()ˆ1(ˆ

ˆN

n

pp

pp

Aplicação: construção de um IC para a proporção

n

ppzp

n

ppzppIC

)ˆ1(ˆˆ;

)ˆ1(ˆˆ),( )2/()2/(

Exemplo

3. Pretende-se estimar a proporção de locais deuma macro região, que tem condiçõessatisfatórias de saneamento básico. Para tantoforam escolhidos aleatoriamente 200 locais eobservou-se que 115 deles não havia condiçõesobservou-se que 115 deles não havia condiçõesmínimas de saneamento. Estimar por intervalo averdadeira proporção de locais sem saneamentobásico. Use nível de confiança igual a 95%.

6- Distribuição amostral de S²

Considere uma amostra aleatória extraída depopulação normal com média e variânciadesconhecidas. Temos o seguinte resultado:

22

)1(~

2)1(

2

2

nS

n

A menos de uma constante a distribuição amostral da variância aproxima-se da distribuição qui-

quadrado com (n-1) graus de liberdade

A distribuição qui-quadrado0

.40

.50

.6

0 1 2 3 4 5

0.0

0.1

0.2

0.3

x

f(x)

Assimétrica à direita, parâmetro graus de liberdade

Intervalo de confiança para a variância

2

2

2

22 )1(

;)1(

),(ab

SnSnIC

ab

EXEMPLO: IC para a variância do exemplo 2

ERRO MÁXIMO DA ESTIMATIVA / DETERMINAÇÃO DO TAMANHO

DA AMOSTRA

2 conhecida (ou n > 30) I.C. x z

n

x

2

2

2

n zx

erro = e

0

22n z

e

x

para pop. “infinitas”

0

2 2

2 2 21n

N z

e N z

x

x

( ) para pop. finitas

Determinação do tamanho da amostra necessário para com desvio máximo pré-determinado, a um certo nível de

confiança:

0

2

2nz p q

e

para populações “infinitas”

2

0

2

2 21n

z p q N

e N z p q

( ) para populações finitas

obs.: Quando não houver condições de prever o valor de p ,

admitir ,p 0 50. Dessa forma, obter-se-á o maior tamanho da

amostra, admitindo-se constantes os demais elementos.

ERRO MÁXIMO DA ESTIMATIVA / DETERMINAÇÃO DO

TAMANHO DA AMOSTRA

2 desconhecida IC. x t

s

n

x

2

erro = e

02

2

2n ts

e

x

para populações “infinitas”

ou

0

2 2

2 2 21n

N t s

N e t s

x

x

( ) para populações finitas

Referências

1. ANDRADE, D. F.; OGLIARI, P. J. Estatística para as ciências agrárias e biológicas com noções de experimentação. Editora da UFSC, Florianópolis, 2007.

2. BUSSAB, W. O. ; P. A. MORETIN. Estatística Básica, 5ª edição. Editora Saraiva, 2002.

3. MAGALHÃES, M. N.; LIMA, A.C. P de. Noções de Probabilidade e Estatística. 6ª ed. São Paulo: EDUSP, 2007.e Estatística. 6ª ed. São Paulo: EDUSP, 2007.

Recommended