19
Aula 8 : Estimação de parâmetros UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MEAU- MESTRADO EM ENGENHARIA AMBIENTAL URBANA ENG C 18 Métodos de Pesquisa Quantitativos e Qualitativos DOCENTE:CIRA SOUZA PITOMBO

UNIVERSIDADE FEDERAL DA BAHIA ESCOLA ... 8 Estimacao de...ESTIMAÇÃO DE UMA MÉDIA (Amostras grandes) Para estimar o parâmetro µ (média de alguma variável quantitativa), a partir

Embed Size (px)

Citation preview

Aula 8 : Estimação

de parâmetros

UNIVERSIDADE FEDERAL DA BAHIA

ESCOLA POLITÉCNICA

MEAU- MESTRADO EM ENGENHARIA AMBIENTAL URBANA

ENG C 18 Métodos de Pesquisa Quantitativos e Qualitativos

DOCENTE:CIRA SOUZA PITOMBO

INTRODUÇÃO

AMOSTRA (DADOS OBSERVADOS)

Processo de

estimação de

parâmetros

POPULAÇÃO (UNIVERSO DE ESTUDO)

PARÂMETRO: Alguma característica descritiva dos elementos

da população (média de alguma variável, por exemplo)

ESTATÍSTICA: Alguma operação com os dados de uma amostra.

Esta operação pode ser o cálculo de uma média, por exemplo.

Também chamada de estimador

EXEMPLO 1 A prefeitura de uma cidade pretende avaliar a aceitação de um certo projeto

educacional. Depois de apresentá-lo aos moradores do município, os

responsáveis por sua execução desejam avaliar o valor aproximado do

parâmetro ¶= proporção de favoráveis ao projeto, dentre os indivíduos

residentes no município. Para estimar este parâmetro, a prefeitura planeja

observar uma amostra aleatória simples de n=400 moradores e calcular o valor

da estatística P = Proporção de moradores favoráveis ao projeto na amostra

¶=P± erro amostral

P = 240/400 = 0,60 (ou 60%)

EXEMPLO 2 Para estudar o efeito da merenda escolar, introduzida nas escolas de um grande

município, planeja-se acompanhar uma amostra de n = 100 crianças, que estão

entrando na rede municipal de ensino. Dentre diversas características de

interesse, pretende-se avaliar o parâmetro µ = ganho médio de peso, dentre

todas as crianças da rede municipal de ensino, durante o primeiro ano letivo.

Da amostra de crianças em estudo, pode-se calcular a estatística X= ganho

médio de peso, durante o primeiro ano letivo, das 100 crianças em observação.

A estatística X pode ser usada como estimador do parâmetro µ

µ=X± erro amostral

A estimativa é tão mais precisa quanto menor for o

erro amostral

Um dos principais objetivos na teoria da

estimação é estimar um limite superior provável

para o erro amostral

Avaliar precisão: estimativa de parâmetro tipo

proporção de algum atributo e do tipo média de

algum atributo

DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO A prefeitura de uma cidade pretende avaliar a aceitação de um certo projeto

educacional. Depois de apresentá-lo aos moradores do município, os

responsáveis por sua execução desejam avaliar o valor aproximado do

parâmetro ¶= proporção de favoráveis ao projeto, dentre os indivíduos

residentes no município. Para estimar este parâmetro, a prefeitura planeja

observar uma amostra aleatória simples de n=400 moradores e calcular o valor

da estatística P = Proporção de moradores favoráveis ao projeto na amostra

O valor de P (proporção de favoráveis numa amostra de n =

400 moradores) vai ser um valor próximo da verdadeira

proporção ¶, a qual refere a todos os moradores do

município?

DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO

O valor de P (proporção de favoráveis numa amostra de n =

400 moradores) vai ser um valor próximo da verdadeira

proporção ¶, a qual refere a todos os moradores do

município?

POPULAÇÃO

¶=0,70

AMOSTRA1

(400 Moradores)

P1

AMOSTRA2

(400 Moradores) P2

AMOSTRA3

(400 Moradores)

P3

AMOSTRA100

(400 Moradores) P100

DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO VALORES DE P

0,7 0,67 0,69 0,7 0,74 0,71 0,68 0,69

0,69 0,71 0,71 0,68 0,71 0,71 0,7 0,7

0,72 0,71 0,71 0,68 0,7 0,71 0,68 0,67

0,65 0,67 0,69 0,7 0,71 0,72 0,72 0,71

0,65 0,71 0,67 0,7 0,7 0,72 0,7 0,66

0,69 0,70 0,73 0,74 0,71 0,7 0,72 0,72

0,66 0,66 0,67 0,70 0,71 0,71 0,72 0,71

0,69 0,69 0,66 0,7 0,7 0,73 0,75 0,75

0,73 0,7 0,71 0,76 0,73 0,73 0,72 0,71

0,7 0,68 0,71 0,69 0,74 0,72 0,73 0,74

0,68 0,69 0,70 0,71 0,71 0,71 0,72 0,76

0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74

0,75 0,67 0,66 0,68

DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO VALORES DE P

0,7 0,67 0,69 0,7 0,74 0,71 0,68 0,69

0,69 0,71 0,71 0,68 0,71 0,71 0,7 0,7

0,72 0,71 0,71 0,68 0,7 0,71 0,68 0,67

0,65 0,67 0,69 0,7 0,71 0,72 0,72 0,71

0,65 0,71 0,67 0,7 0,7 0,72 0,7 0,66

0,69 0,70 0,73 0,74 0,71 0,7 0,72 0,72

0,66 0,66 0,67 0,70 0,71 0,71 0,72 0,71

0,69 0,69 0,66 0,7 0,7 0,73 0,75 0,75

0,73 0,7 0,71 0,76 0,73 0,73 0,72 0,71

0,7 0,68 0,71 0,69 0,74 0,72 0,73 0,74

0,68 0,69 0,70 0,71 0,71 0,71 0,72 0,76

0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74

0,75 0,67 0,66 0,68

Em nenhuma das amostras o erro amostral teve magnitude superior a

0,06, ou seja 6%

96 valores de P, dentre os 100, acusaram erros amostrais inferiores a 0,05

Erro amostral 0,05 e nível de confiança 96%

DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO

Problemas de estimação de uma proporção – experimento tipicamente

binomial, com parâmetros n (tamanho da amostra) e ¶ (proporção do

atributo em questão)

Se n for grande, a distribuição binomial se aproxima de uma distribuição

normal.

pn

p

)1(

-z

-1,96

z

1,96

0,95

Se exigirmos nível de confiança de 95%

de confiança, podemos explicitar um

limite superior provável para o erro

amostral, considerando a faixa de 1,96

desvios padrão, acima e abaixo do

centro de distribuição

ESTIMAÇÃO DE UMA PROPORÇÃO Tamanho da amostra razoavelmente grande

Válida a aproximação da distribuição binomial para a normal

np

)1(

-z

-1,96

z

1,96

0,95

Fixado um nível de confiança de 95%, o

Limite máximo para o erro amostral fica

em torno de Sp(1,96)

O desvio padrão da distribuição amostral de P, também conhecido como

erro padrão de P, pode ser estimado por:

n

PPS p

)1(

EXERCÍCIO EM SALA Admita que na amostra de n=400 elementos, encontramos 60% de

favoráveis. Temos, então, P=0,60 (ou 60%) e erro padrão de P dado por

Usando nível de confiança de 95%, temos um erro amostral máximo

provável de (1,96) Sp= (1,96)(0,0245)=0,048 ou 4,8%

n

PPS p

)1( 0245,0

400

)6,01(6,0

pS

Podemos dizer que o intervalo 60% ± 4,8% ( 55,2% a 64,8%) contém com

95% de confiança, o parâmetro ¶ (proporção de favoráveis em toda a

população de moradores do município)

P±(1,96) Sp é dito o intervalo de confiança para o parâmetro ¶, com nível

de confiança de 95%.

OUTROS NÍVEIS DE CONFIANÇA Arbitrado um nível de confiança, podemos obter o limite

provável para o erro amostral, multiplicando Sp por um

determinado valor z da curva normal padrão.

Estimativa do erro amostral máximo z Sp

Intervalo de confiança P± zSp

EXERCÍCIO EM SALA 2 Admita que na amostra de n=400 elementos, encontramos 60% de

favoráveis. Temos, então, P=0,60 (ou 60%) e erro padrão de P dado por

Usando nível de confiança de 99%, determine o erro amostral máximo e o

intervalo de confiança

n

PPS p

)1( 0245,0

400

)6,01(6,0

pS

ESTIMAÇÃO DE UMA MÉDIA (Amostras grandes)

Para estimar o parâmetro µ (média de alguma variável quantitativa), a

partir de X (média da variável observada numa amostra aleatória simples),

podemos seguir os mesmos princípios da estimação de uma proporção,

pois, para amostras grandes, a distribuição amostral de X também se

aproxima de uma distribuição normal.

O erro padrão da média amostral pode ser estimado, a partir do desvio

padrão amostral, S, segundo a expressão

n

SS

x

1

22

n

XnXS

Para amostras grandes, podemos avaliar o erro amostral máximo

provável por zSx, onde z pode ser obtido pelos mesmos procedimentos

anteriores, em função do nível de confiança desejado

EXERCÍCIO EM SALA 3 Observando uma amostra aleatória simples de n = 100 crianças no

primeiro ano letivo, nas escolas municipais em que se estava servindo

uma merenda especial, encontram-se as seguintes estatísticas relativas à

variável ganho de peso ao longo do ano

Ganho médio de peso das crianças da amostra KgX 0,6

Desvio padrão dos pesos das crianças da amostra kgS 0,2

Com o objetivo de estimar o parâmetro µ=ganho médio de peso da

população, podemos calcular uma estimativa para o erro padrão da média

amostral

n

SS

x kgS

x2,0

100

0,2

O erro amostral máximo provável (95% de confiança)

Kg392,0)2,0)(96,1( kg392,0000,6

A partir do acompanhamento da amostra das cem crianças, chegamos a

conclusão de que o intervalo de 5,608 a 6,392kg contém, com 95% de

confiança, o ganho médio de peso, µ, de todas as crianças da rede

municipal de ensino

ESTIMAÇÃO DE UMA MÉDIA (Amostras pequenas)

Quando dispomos de uma amostra pequena (n<30), não temos a garantia

de que a distribuição amostral da média se aproxime de uma distribuição

normal.

Porém , se a variável em estudo tiver uma distribuição razoavelmente

simétrica, parecida com uma normal, a teoria estatística mostra que é

possível construir estimativas intervalares para a média populacional µ,

utilizando uma distribuição , denominada de t de Student.

Para obter o valor t da distribuição t de student, basta calcular o grau de

liberdade: gl = n-1, fixar o nível de confiança e usar tabela da distribuição

ESTIMAÇÃO DE UMA MÉDIA (Amostras pequenas)

Para gl = 9 e nível de

confiança 95%

0 t

95%

2.5% 2.5%

O intervalo de confiança

para uma média µ tem a

seguinte expressão

xtSX

EXERCÍCIO EM SALA 4

Para verificar a eficácia de um programa de prevenção de acidentes de

trabalho, fez-se um estudo experimental, implementando este programa

em dez empresas da construção civil, escolhidas ao acaso, numa certa

região. Os dados abaixo referem-se aos percentuais de redução de

acidentes de trabalho nas 10 empresas observadas

n

SS

x

10,210

65,6

xS

Usando nível de 95% de confiança, graus de liberdade gl=9 (n=10 e

gl=n-1)

EXERCÍCIO EM SALA 4 Usando nível de 95% de confiança, graus de liberdade gl=9 (n=10 e gl=n-1)

t=2,262

xtSX

t.Sx = (2,62).(2,10) = 4,75 = 4,8

Então, temos o seguinte

intervalo de 95% de

confiança para o parâmetro µ

18,0 ± 4,8 pontos percentuais