IntervalosdeConfianaeTestedeHipteses_20140427001148

FACULDADE PITÁGORAS DE LINHARES

Prof. Esp. Thiago Magalhães

Estatística e Probabilidade Página 122

Intervalos de Confiança

Estimativa Pontual é a estimativa de um único valor para um parâmetro

populacional. A melhor estimativa pontual da média populacional é a média

amostral.

Exemplo: Pesquisadores de mercado usam o número de frases por

propaganda como maneira de medir a legibilidade dos anúncios em revistas.

Os dados a seguir representam uma amostra aleatória do número de frases

encontradas em 50 anúncios. Obtenha uma estimativa pontual da média

populacional µ.

9 - 20 - 18 - 16 - 9 - 9 - 11 - 13 - 22 - 16 - 5 - 18 - 6 - 6 - 5 - 12 - 25 - 17 - 23 - 7

10 - 9 - 10 - 10 - 5 - 11 - 18 - 18 - 9 - 9 - 17 - 13 - 11 - 7 - 14 - 6 - 11 - 12 - 11 - 6

12 - 14 - 11 - 9 - 18 - 12 - 12 - 17 - 11 - 20

Solução:

4,1250

620

n

xx

A estimativa pontual para o comprimento da média de todos os anúncios da

revista é 12,4 frases.

Estimativa Intervalar é um intervalo (ou amplitude) de valores usados para

estimar um parâmetro populacional.

Nível de Confiança c é a probabilidade de que o intervalo estimado contenha

o parâmetro populacional em questão.

Quando o tamanho da amostra é de pelo menos 30, a distribuição amostral

para é normal. O nível de confiança c é área sob a curva normal padrão entre

os valores críticos, . Como a área remanescente é – concluímos

que, a área em cada cauda é

– .




Exemplo: Se então os 5% da área estão à esquerda de,

e 5% estão à direita de, .

Obs.: Usaremos normalmente níveis de confiança de 80%, 90%, 95% e 99%.

Para tanto, segue uma tabelinha com os correspondentes valores para z.

Dado o nível de confiança c, a margem de erro E, é a maior distância possível

entre a estimativa pontual e o valor do parâmetro que se está estimando, a

dado nível de confiança, c.

nzzE cxc

Para usarmos esta técnica assumimos que o desvio padrão da amostra é

conhecido.

Exemplo: Use os dados do exemplo anterior e o nível de confiança de 95%

para obter o erro máximo da estimativa do número médio de frases em todos

os anúncios de revistas. Assuma que o desvio padrão da amostra seja de

aproximadamente 5.

Solução: A pontuação z que corresponde ao nível de confiança de 95% é de

1,96.




4,150

0,5.96,1

nzzE cxc

Você está 95% confiante de que a margem de erro para a média populacional

é de aproximadamente 1,4 frases.

O intervalo de confiança para a média populacional é o intervalo:

ExEx

A probabilidade de que o intervalo de confiança contenha é .

Intervalo de Confiança para média populacional (Grandes Amostras

).

Exemplo: Construa um intervalo de confiança de 95% para o número médio de

fraes em todos os anúncios de revistas.

Solução: Como o intervalo de confiança é:

ExEx

8,1311 .

Com 95% de confiança, você pode dizer que a média populacional do número

de frases está entre 11 e 13,8.




Tamanho da amostra

Dados um nível de confiança e um erro máximo da estimativa E, o tamanho

mínimo da amostra n necessário para se estimar a média populacional é:

2

E

zn c

Exemplo: Você deseja calcular o número médio de frases em anúncios de

revistas. Quantos anúncios de revista devem ser incluídos na amostra se você

quer ter 95% de confiança de que a média amostral esteja dentro do intervalo

de uma sentença da média populacional.

Solução:

Usando

95c

96,1cz

5,0

04,961

0,5.96,122

E

zn c

A distribuição t de Student

Se a distribuição de uma variável x for aproximadamente normal, então:

Segue uma distribuição t.

Valores críticos de são denotados por .

Algumas propriedades da distribuição t estão apresentadas a seguir:

1. A distribuição t tem forma de sino e é simétrica sobre a média;

2. A distribuição t é uma família de curvas, cada uma determinada por um

parâmetro chamado graus de liberdade. Os graus de liberdades são o

número de escolhas livres deixadas depois que uma amostra estatística tal

como é calculada. Quando usamos a distribuição t para estimar a média




da população, os graus de liberdades são iguais ao tamanho da amostra

menos um: .

3. A área total sob a curva t igual a 1 ou 100%

4. A média, a mediana e a moda da distribuição t são iguais a zero.

5. Conforme os graus de liberdade aumentam, a distribuição t aproxima a

distribuição normal. Depois de de 30 g.l, a distribuição t está muito próxima

à distribuição normal padrão z.




TABELA t – Student.




Intervalo de Confiança para média populacional (Pequenas Amostras

).

Construir um intervalo de confiança usando a distribuição t é similar a construir

um intervalo de confiança usando a distribuição normal, ambos usam uma

estimativa pontual e uma margem de erro E.

Exemplo: Você seleciona aleatoriamente 16 cafeteiras e mede a temperatura

do café vendido em cada uma delas. A média de temperatura da amostra é de

162º F com desvio padrão da amostra de 10º F. Encontre um intervalo de

confiança de 95% para a temperatura média. Assuma que as temperaturas são

aproximadamente normalmente distribuídas.

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________




O fluxograma descreve quando usamos a distribuição normal para construir um

intervalo de confiança para média da população e quando usamos a

distribuição t.




Testes de Hipótese Com Uma Amostra

Processo que usa estatísticas amostrais para testar uma afirmação sobre o

valor de um parâmetro populacional. Hipótese é então uma afirmativa sobre

uma propriedade da população.

No teste de hipótese são utilizadas duas hipóteses:

A hipótese nula H0 é a hipótese sobre a qual devem ser obtidas evidências

para rejeitá-la. Contém uma afirmação de igualdade, tal como ≤, = ou ≥. A

hipótese nula é o valor corretamente aceito até que se tenham evidências de

que esse valor não é mais correto. Ho é o ponto de partida do teste de

hipótese.

A hipótese alternativa Ha é a hipótese sobre a qual devem ser obtidas

evidências para aceitá-la. A hipótese alternativa somente será aceita se

surgirem evidências de que o valor da hipótese nula Ho é falsa e contém uma

afirmação de desigualdade, tal como <, ≠ ou >.

As hipóteses H0 e Ha são complementares, assim temos:

Tipos de Erro

Decisões

possíveis

Estados possíveis

Ho verdadeira Ho falsa

Aceitação de Ho Decisão correta Erro do tipo II

Rejeição de Ho Erro do tipo I Decisão correta

Nível de significância

Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual se

sujeitaria a correr o risco de um erro do tipo I é denominada de Nível de




Significância do Teste. Essa probabilidade, representada frequentemente por

, é geralmente especificada antes da extração de quaisquer amostras, de

modo que os resultados obtidos não influenciem na escolha.

Os três níveis de significância mais comumente usados são

Estatística do Teste Padronizado

Tipos de Testes de Hipótese

Há três tipos de testes de hipótese:

Se Ho: μ ≥ K, o teste é unicaudal a esquerda.

Se Ho: μ ≤ K, o teste é unicaudal a direita.




Se Ho: μ = K, o teste é bicaudal.

Tomando e Interpretando uma decisão

Para concluímos o teste de hipótese, você deve tomar uma decisão e

interpretá-la. Há somente dois resultados possíveis para um teste de hipótese:

1. Rejeitar a hipótese nula;

2. Falhar em rejeitar a hipótese nula.

Regra de decisão baseada em um valor P

1. Se

2. Se

A tabela a seguir ajudará você a interpretar sua decisão.




Teste de Hipótese para Média (Amostras Grandes)

Regiões de Rejeição e Valores Críticos

Uma região de rejeição (ou região crítica) da distribuição amostral é a

amplitude de valores para a qual a hipótese nula não é provável. Se uma

estatística de teste está nessa região, a hipótese nula é rejeitada. Um valor

crítico separa a região de rejeição da região de não rejeição.




Em resumo temos:

Exemplo1: Em um anúncio, uma pizzaria afirma que a média de seu tempo de

entrega é menor que 30 minutos. Uma seleção aleatória de 36 tempos de

entrega tem média amostral de 28,5 minutos e desvio padrão de 3,5 minutos.

Há evidência suficiente para apoiar a decisão em um nível de significância de

1%?

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________




_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

Exemplo2: A Secretaria de Agricultura do Brasil reporta que o custo médio

para se criar um filho até a idade de 2 anos na zona rural é de R$ 10.460,00.

Você acredita que esse valor está incorreto, então você seleciona uma amostra

aleatória de 900 crianças (com idade de 2 anos) e descobre que a média dos

custos é de R$ 10.345,00 com desvio padrão de R$ 1.540,00. Com um nível de

significância de 5%, há evidência suficiente para concluir que a média do custo

é diferente de R$ 10.460,00?

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________




Teste de Hipótese para Média (Amostras Pequenas)

Regiões de Rejeição e Valores Críticos

Uma região de rejeição (ou região crítica) da distribuição amostral é a

amplitude de valores para a qual a hipótese nula não é provável. Se uma

estatística de teste está nessa região, a hipótese nula é rejeitada. Um valor

crítico separa a região de rejeição da região de não rejeição.




Exemplo1: Um revendedor de carro usados diz que o preço médio de um

Honda 2005 é de pelo menos R$ 23.900,00. Você suspeita que essa afirmação

é incorreta e descobre que uma amostra de 14 veículos similares tem média de

preço de R$ 23.000,00 e desvio padrão de R$ 1.113,00. Há evidências

suficientes para rejeitar a afirmação do revendedor com um nível de

significância de 5%? Assuma que a população é normalmente distribuída.

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

Resumo das etapas aplicadas a qualquer teste de hipóteses:

I. Determinar as hipóteses nula e alternativa que são apropriadas para a

aplicação.

II. Selecionar a estatística de teste que será usada para decidir rejeitar ou

não a hipótese nula.

III. Especificar o nível de significância para o teste.

IV. Usar o nível de significância para desenvolver regra de decisão que

indica os valores críticos da estatística de teste que levará a rejeição de

H0.

V. Coletar os dados amostrais e calcular a estatística de teste.

VI. Comparar o valor da estatística do teste com o(s) valor(es) crítico(s)

especificado(s) na regra de decisão para determinar se H0 deve ser

rejeitado; ou calcular o valor p, baseado na estatística de teste na etapa

V. Usar o valor p para determinar se H0 deve ser rejeitado.




Exercícios de Aplicação

1. Você trabalha para uma agência de defesa do consumidor e quer encontrar

a média de custo de reparos de máquina de lavar. Como parte de seu

estudo, você seleciona aleatoriamente 40 custos de reparos e descobre que

a média é R$ 120,00. O desvio padrão da amostra é R$ 17,50. Construa um

intervalo de confiança de 95% para a média do custo de reparos da

população.

2. Uma amostra aleatória de 48 nadadores de 200 metros tem um tempo

médio de 3,12 minutos e desvio padrão de 0,09 minutos. Construa um

intervalo de confiança de 95% para o tempo médio da população.

3. Determine o tamanho mínimo da amostra necessário se você quiser estar

95% confiante de que a média amostral esteja uma unidade da média

populacional dado . Assuma que a população é normalmente

distribuída.

4. Uma empresa de processamento de queijos quer estimar a média do

conteúdo de colesterol de todas as porções de 30g de queijo. A estimativa

deve estar dentro de 0,5g da média populacional.

(a) Determine o tamanho mínimo de amostra necessário para construir

um intervalo de confiança de 95% para a média populacional. Assuma o

desvio populacional de 2,8g.

(b) Repita a parte (a) usando um intervalo de confiança de 99%.

(c) Qual nível de confiança requer um tamanho de amostra maior?

Explique.

5. Um fabricante de bolas de futebol quer estimar a circunferência média de

bolas de futebol dentro de 0,1 polegadas.

(a) Determine o tamanho mínimo de amostra necessário para construir

um intervalo de confiança de 99% para a média da população. Assuma que

o desvio padrão populacional seja de 0,25 polegadas.

(b) Repita a parte (a) usando um desvio padrão de 0,3 polegadas.

Que desvio padrão requer um maior tamanho de amostra? Explique.




6. Em uma amostra aleatória de 5 fornos de micro-ondas, a média de custos

de reparos era de R$ 75,00 e desvio padrão era R$ 12,50. Construir um

intervalo de confiança de 95% para a média populacional.

7. Em uma amostra aleatória de 7 computadores, a média de custos de

reparos era de R$ 100,00 e desvio padrão de R$ 42,50. Construir um

intervalo de confiança de 95% para a média populacional.

8. Você faz uma pesquisa aleatória de 25 carros esportivos e registra as

milhas por galão para cada. Os dados estão listados a seguir. Construir um

intervalo de confiança de 95% para a média populacional. Assuma que as

milhas por galão são normalmente distribuídas.

15 – 27 – 24 – 24 – 20 – 21 – 24 – 14 – 21 – 25 – 21 – 13 – 21 – 25 – 22 –

21 – 25 – 24 – 22 – 24 – 24 – 22 – 21 – 24 – 24

9. Em uma amostra aleatória de 19 pacientes no departamento de emergência

de um hospital, o tempo médio de espera (em minutos) antes de serem

atendidos pelo médico era de 23 minutos e o desvio padrão era de 11

minutos. Construir um intervalo de confiança de 95% para a média

populacional. Assuma que os tempos de espera são normalmente

distribuídos.

10. Você quer estimar a média dos custos com reparos de máquinas de lavar

louças. A estimativa deve ter margem de erro de $ 10 em relação à média

da população. Determine o tamanho exigido da amostra para construir um

intervalo de 99% de confiança para uma média da população. Suponha que

o desvio padrão da população seja $ 22,50.

11. O conjunto de dados a seguir representa a média de jardas por intercepção

para uma amostra aleatória de recebedores no futebol americano de uma

temporada recente.

11,1 - 14,4 - 12,8 - 12,0 - 15,2 - 13,9 - 11,7 - 13,2 - 11,6 - 13,7

(a) Encontre a média da amostra.

(b) Encontre o desvio padrão da amostra.

(c) Use a distribuição t para construir um intervalo de 90% de confiança

para uma média da população. Suponha que a população do conjunto de

dados seja normalmente distribuída.




12. Em uma amostra aleatória de sete engenheiros aeroespaciais, a renda

média mensal foi de $ 6.824 e o desvio padrão foi de $ 340. Suponha que

as rendas mensais sejam normalmente distribuídas e use uma distribuição t

para construir um intervalo de 95% de confiança para a média da população

de renda mensal de engenheiros aeroespaciais.

13. Uma amostra aleatória de 85 alunos da oitava série tem nota média de 282

com desvio padrão de 35 em um teste nacional de matemática. O resultado

do teste informa o administrador de uma escola estadual que a nota média

no teste para os alunos da oitava série do estado é mais do que 275. Em

, há evidência o suficiente para apoiar a afirmação do

administrador?

14. Uma sociedade de bebedores de chá estima que a média de consumo de

chá por uma pessoa nos Estados Unidos é mais do que 8 galões por ano.

Em uma amostra aleatória de 100 pessoas, você descobre que a média de

consumo de chá é de 7,9 galões por ano, com desvio padrão de 2,67

galões. Em , você pode apoiar a afirmação da sociedade?

15. Uma empresa fabricante de bebidas à base de cola afirma que a média do

conteúdo de cafeína por garrafa de 12 oz é de 40 miligramas. Você quer

testar essa afirmação. Durante os testes, você descobre que uma amostra

aleatória de 30 garrafas de 12 oz de bebida à base de cola tem média de

conteúdo de cafeína de 39,2 miligramas com desvio padrão de 7,5

miligramas. Em , você pode rejeitar a afirmação da empresa?

16. Um fabricante de lâmpadas garante que a média de vida útil de certo tipo de

lâmpada é de pelo menos 750 horas. Uma amostra aleatória de 36

lâmpadas tem média de vida útil de 745 horas com desvio padrão de 60

horas. Em , você tem evidências suficientes para rejeitar a

afirmação do fabricante?

17. Um cientista estima que a média do nível de dióxido de nitrogênio em

Calgary é maior que 32 partes por bilhão. Você quer testar essa estimativa.

Para isso, você determina os níveis de dióxido de nitrogênio para 34 dias

selecionados aleatoriamente.




Os resultados (em partes por bilhão) estão listados a seguir. Em ,

você pode apoiar a estimativa do cientista?

24 – 36 – 44 – 35 – 44 – 34 – 29 – 40 – 39 – 43 – 41 – 32 – 33 – 29 – 29 –

43 – 25 – 39 – 25 – 42 – 29 – 22 – 22 – 25 – 14 – 15 – 14 – 29 – 25 – 27 –

22 – 24 – 18 – 17

18. Um restaurador de micro-ondas diz que a média do custo para conserto de

micro-ondas com problemas é de R$ 100,00. Você trabalha para este

restaurador e quer testar essa afirmação. Você descobre que uma amostra

aleatória de 5 fornos micro-ondas tem uma média de custo para conserto de

R$ 75,00 e um desvio padrão de R$ 12,50. Com , você tem

evidências para dar suporte à afirmação do restaurador?

19. Um ambientalista estima que a média de lixo reciclado por adultos nos EUA

seja maior que 1 libra por pessoa ao dia. Você quer testar essa afirmação.

Você descobre que a média de lixo reciclado por pessoa ao dia para uma

amostra aleatória de 12 adultos nos EUA é de 1,46 libras e o desvio padrão

é 0,28 libras. Com , você pode dar suporte a essa afirmação?

20. Você recebe uma revista de uma grande universidade. A revista indica que

a média do tamanho das salas para cursos integrais é menor que 32

alunos. Você quer testar essa afirmação. Você seleciona 18 salas

aleatoriamente e determina o tamanho de cada uma. Os resultados são

listados a seguir. Com , você pode dar suporte à afirmação do

reitor?

35 – 28 – 29 – 33 – 32 – 40 – 26 – 25 – 29 – 28 – 30 – 36 – 33 – 29 – 27 –

30 – 28 – 25




Gabarito

1.

2.

3. 89

4. (a) 121 porções (b) 208 porções (c) O intervalo de confiança de 99%

requer uma amostra mais larga porque mais informações é necessária a

partir da população como sendo 99% confiante.

5. (a) 42 bolas de futebol (b) 60 bolas de futebol; requer um tamanho

de amostra maior. Devido a variabilidade aumentada na população, um

tamanho maior de amostra é necessário para assegurar a correção

desejada.

6.

7.

8.

9.

10. 34

11. (a) 12,96 (b) 1,351 (c)

12.

13. No nível de significância de 4%, há evidência suficiente para apoiar a

afirmação do administrador de que a nota média dos alunos da 8ª série no

exame é mais do que 275.

14. No nível de significância de 7%, não há evidência suficiente para apoiar a

afirmação da sociedade de bebedores de chá de que a média do consumo

de chá por pessoa nos EUA é mais do que 8 galões por ano.

15. No nível de significância de 1%, há evidência suficiente para rejeitar a

afirmação da empresa de que a média do conteúdo de cafeína para uma

garrafa de 12 oz de refrigerante à base de cola é de 40 miligramas.

16. No nível de significância de 2%, não há evidência suficiente para rejeitar a

afirmação do fabricante de lâmpadas de que a média da vida útil de uma

lâmpada é de pelo menos 750 horas.




17. No nível de significância de 6%, não há evidência suficiente para apoiar a

afirmação do cientista de que a média do nível de dióxido de nitrogênio em

Calgary é maior que 32 partes por bilhão.


afirmação do reparador de forno de micro-ondas de que a média de custo

de reparos para micro-ondas com danos é menos do que R$ 100,00.


afirmação do ambientalista de que a média do lixo reciclado por adultos nos

EUA é mais do que 1 libra por pessoa por dia.


afirmação da revista de que o tamanho médio de uma classe para uma

faculdade de tempo integral é menor que 32 estudantes.

Documents

IntervalosdeConfianaeTestedeHipteses_20140427001148