Upload
julian-coelho
View
536
Download
6
Embed Size (px)
Citation preview
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 122
Intervalos de Confiança
Estimativa Pontual é a estimativa de um único valor para um parâmetro
populacional. A melhor estimativa pontual da média populacional é a média
amostral.
Exemplo: Pesquisadores de mercado usam o número de frases por
propaganda como maneira de medir a legibilidade dos anúncios em revistas.
Os dados a seguir representam uma amostra aleatória do número de frases
encontradas em 50 anúncios. Obtenha uma estimativa pontual da média
populacional µ.
9 - 20 - 18 - 16 - 9 - 9 - 11 - 13 - 22 - 16 - 5 - 18 - 6 - 6 - 5 - 12 - 25 - 17 - 23 - 7
10 - 9 - 10 - 10 - 5 - 11 - 18 - 18 - 9 - 9 - 17 - 13 - 11 - 7 - 14 - 6 - 11 - 12 - 11 - 6
12 - 14 - 11 - 9 - 18 - 12 - 12 - 17 - 11 - 20
Solução:
4,1250
620
n
xx
A estimativa pontual para o comprimento da média de todos os anúncios da
revista é 12,4 frases.
Estimativa Intervalar é um intervalo (ou amplitude) de valores usados para
estimar um parâmetro populacional.
Nível de Confiança c é a probabilidade de que o intervalo estimado contenha
o parâmetro populacional em questão.
Quando o tamanho da amostra é de pelo menos 30, a distribuição amostral
para é normal. O nível de confiança c é área sob a curva normal padrão entre
os valores críticos, . Como a área remanescente é – concluímos
que, a área em cada cauda é
– .
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 123
Exemplo: Se então os 5% da área estão à esquerda de,
e 5% estão à direita de, .
Obs.: Usaremos normalmente níveis de confiança de 80%, 90%, 95% e 99%.
Para tanto, segue uma tabelinha com os correspondentes valores para z.
Dado o nível de confiança c, a margem de erro E, é a maior distância possível
entre a estimativa pontual e o valor do parâmetro que se está estimando, a
dado nível de confiança, c.
nzzE cxc
Para usarmos esta técnica assumimos que o desvio padrão da amostra é
conhecido.
Exemplo: Use os dados do exemplo anterior e o nível de confiança de 95%
para obter o erro máximo da estimativa do número médio de frases em todos
os anúncios de revistas. Assuma que o desvio padrão da amostra seja de
aproximadamente 5.
Solução: A pontuação z que corresponde ao nível de confiança de 95% é de
1,96.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 124
4,150
0,5.96,1
nzzE cxc
Você está 95% confiante de que a margem de erro para a média populacional
é de aproximadamente 1,4 frases.
O intervalo de confiança para a média populacional é o intervalo:
ExEx
A probabilidade de que o intervalo de confiança contenha é .
Intervalo de Confiança para média populacional (Grandes Amostras
).
Exemplo: Construa um intervalo de confiança de 95% para o número médio de
fraes em todos os anúncios de revistas.
Solução: Como o intervalo de confiança é:
ExEx
8,1311 .
Com 95% de confiança, você pode dizer que a média populacional do número
de frases está entre 11 e 13,8.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 125
Tamanho da amostra
Dados um nível de confiança e um erro máximo da estimativa E, o tamanho
mínimo da amostra n necessário para se estimar a média populacional é:
2
E
zn c
Exemplo: Você deseja calcular o número médio de frases em anúncios de
revistas. Quantos anúncios de revista devem ser incluídos na amostra se você
quer ter 95% de confiança de que a média amostral esteja dentro do intervalo
de uma sentença da média populacional.
Solução:
Usando
95c
96,1cz
5,0
04,961
0,5.96,122
E
zn c
A distribuição t de Student
Se a distribuição de uma variável x for aproximadamente normal, então:
Segue uma distribuição t.
Valores críticos de são denotados por .
Algumas propriedades da distribuição t estão apresentadas a seguir:
1. A distribuição t tem forma de sino e é simétrica sobre a média;
2. A distribuição t é uma família de curvas, cada uma determinada por um
parâmetro chamado graus de liberdade. Os graus de liberdades são o
número de escolhas livres deixadas depois que uma amostra estatística tal
como é calculada. Quando usamos a distribuição t para estimar a média
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 126
da população, os graus de liberdades são iguais ao tamanho da amostra
menos um: .
3. A área total sob a curva t igual a 1 ou 100%
4. A média, a mediana e a moda da distribuição t são iguais a zero.
5. Conforme os graus de liberdade aumentam, a distribuição t aproxima a
distribuição normal. Depois de de 30 g.l, a distribuição t está muito próxima
à distribuição normal padrão z.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 127
TABELA t – Student.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 128
Intervalo de Confiança para média populacional (Pequenas Amostras
).
Construir um intervalo de confiança usando a distribuição t é similar a construir
um intervalo de confiança usando a distribuição normal, ambos usam uma
estimativa pontual e uma margem de erro E.
Exemplo: Você seleciona aleatoriamente 16 cafeteiras e mede a temperatura
do café vendido em cada uma delas. A média de temperatura da amostra é de
162º F com desvio padrão da amostra de 10º F. Encontre um intervalo de
confiança de 95% para a temperatura média. Assuma que as temperaturas são
aproximadamente normalmente distribuídas.
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 129
O fluxograma descreve quando usamos a distribuição normal para construir um
intervalo de confiança para média da população e quando usamos a
distribuição t.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 130
Testes de Hipótese Com Uma Amostra
Processo que usa estatísticas amostrais para testar uma afirmação sobre o
valor de um parâmetro populacional. Hipótese é então uma afirmativa sobre
uma propriedade da população.
No teste de hipótese são utilizadas duas hipóteses:
A hipótese nula H0 é a hipótese sobre a qual devem ser obtidas evidências
para rejeitá-la. Contém uma afirmação de igualdade, tal como ≤, = ou ≥. A
hipótese nula é o valor corretamente aceito até que se tenham evidências de
que esse valor não é mais correto. Ho é o ponto de partida do teste de
hipótese.
A hipótese alternativa Ha é a hipótese sobre a qual devem ser obtidas
evidências para aceitá-la. A hipótese alternativa somente será aceita se
surgirem evidências de que o valor da hipótese nula Ho é falsa e contém uma
afirmação de desigualdade, tal como <, ≠ ou >.
As hipóteses H0 e Ha são complementares, assim temos:
Tipos de Erro
Decisões
possíveis
Estados possíveis
Ho verdadeira Ho falsa
Aceitação de Ho Decisão correta Erro do tipo II
Rejeição de Ho Erro do tipo I Decisão correta
Nível de significância
Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual se
sujeitaria a correr o risco de um erro do tipo I é denominada de Nível de
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 131
Significância do Teste. Essa probabilidade, representada frequentemente por
, é geralmente especificada antes da extração de quaisquer amostras, de
modo que os resultados obtidos não influenciem na escolha.
Os três níveis de significância mais comumente usados são
Estatística do Teste Padronizado
Tipos de Testes de Hipótese
Há três tipos de testes de hipótese:
Se Ho: μ ≥ K, o teste é unicaudal a esquerda.
Se Ho: μ ≤ K, o teste é unicaudal a direita.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 132
Se Ho: μ = K, o teste é bicaudal.
Tomando e Interpretando uma decisão
Para concluímos o teste de hipótese, você deve tomar uma decisão e
interpretá-la. Há somente dois resultados possíveis para um teste de hipótese:
1. Rejeitar a hipótese nula;
2. Falhar em rejeitar a hipótese nula.
Regra de decisão baseada em um valor P
1. Se
2. Se
A tabela a seguir ajudará você a interpretar sua decisão.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 133
Teste de Hipótese para Média (Amostras Grandes)
Regiões de Rejeição e Valores Críticos
Uma região de rejeição (ou região crítica) da distribuição amostral é a
amplitude de valores para a qual a hipótese nula não é provável. Se uma
estatística de teste está nessa região, a hipótese nula é rejeitada. Um valor
crítico separa a região de rejeição da região de não rejeição.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 134
Em resumo temos:
Exemplo1: Em um anúncio, uma pizzaria afirma que a média de seu tempo de
entrega é menor que 30 minutos. Uma seleção aleatória de 36 tempos de
entrega tem média amostral de 28,5 minutos e desvio padrão de 3,5 minutos.
Há evidência suficiente para apoiar a decisão em um nível de significância de
1%?
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 135
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
Exemplo2: A Secretaria de Agricultura do Brasil reporta que o custo médio
para se criar um filho até a idade de 2 anos na zona rural é de R$ 10.460,00.
Você acredita que esse valor está incorreto, então você seleciona uma amostra
aleatória de 900 crianças (com idade de 2 anos) e descobre que a média dos
custos é de R$ 10.345,00 com desvio padrão de R$ 1.540,00. Com um nível de
significância de 5%, há evidência suficiente para concluir que a média do custo
é diferente de R$ 10.460,00?
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 136
Teste de Hipótese para Média (Amostras Pequenas)
Regiões de Rejeição e Valores Críticos
Uma região de rejeição (ou região crítica) da distribuição amostral é a
amplitude de valores para a qual a hipótese nula não é provável. Se uma
estatística de teste está nessa região, a hipótese nula é rejeitada. Um valor
crítico separa a região de rejeição da região de não rejeição.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 137
Exemplo1: Um revendedor de carro usados diz que o preço médio de um
Honda 2005 é de pelo menos R$ 23.900,00. Você suspeita que essa afirmação
é incorreta e descobre que uma amostra de 14 veículos similares tem média de
preço de R$ 23.000,00 e desvio padrão de R$ 1.113,00. Há evidências
suficientes para rejeitar a afirmação do revendedor com um nível de
significância de 5%? Assuma que a população é normalmente distribuída.
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
Resumo das etapas aplicadas a qualquer teste de hipóteses:
I. Determinar as hipóteses nula e alternativa que são apropriadas para a
aplicação.
II. Selecionar a estatística de teste que será usada para decidir rejeitar ou
não a hipótese nula.
III. Especificar o nível de significância para o teste.
IV. Usar o nível de significância para desenvolver regra de decisão que
indica os valores críticos da estatística de teste que levará a rejeição de
H0.
V. Coletar os dados amostrais e calcular a estatística de teste.
VI. Comparar o valor da estatística do teste com o(s) valor(es) crítico(s)
especificado(s) na regra de decisão para determinar se H0 deve ser
rejeitado; ou calcular o valor p, baseado na estatística de teste na etapa
V. Usar o valor p para determinar se H0 deve ser rejeitado.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 138
Exercícios de Aplicação
1. Você trabalha para uma agência de defesa do consumidor e quer encontrar
a média de custo de reparos de máquina de lavar. Como parte de seu
estudo, você seleciona aleatoriamente 40 custos de reparos e descobre que
a média é R$ 120,00. O desvio padrão da amostra é R$ 17,50. Construa um
intervalo de confiança de 95% para a média do custo de reparos da
população.
2. Uma amostra aleatória de 48 nadadores de 200 metros tem um tempo
médio de 3,12 minutos e desvio padrão de 0,09 minutos. Construa um
intervalo de confiança de 95% para o tempo médio da população.
3. Determine o tamanho mínimo da amostra necessário se você quiser estar
95% confiante de que a média amostral esteja uma unidade da média
populacional dado . Assuma que a população é normalmente
distribuída.
4. Uma empresa de processamento de queijos quer estimar a média do
conteúdo de colesterol de todas as porções de 30g de queijo. A estimativa
deve estar dentro de 0,5g da média populacional.
(a) Determine o tamanho mínimo de amostra necessário para construir
um intervalo de confiança de 95% para a média populacional. Assuma o
desvio populacional de 2,8g.
(b) Repita a parte (a) usando um intervalo de confiança de 99%.
(c) Qual nível de confiança requer um tamanho de amostra maior?
Explique.
5. Um fabricante de bolas de futebol quer estimar a circunferência média de
bolas de futebol dentro de 0,1 polegadas.
(a) Determine o tamanho mínimo de amostra necessário para construir
um intervalo de confiança de 99% para a média da população. Assuma que
o desvio padrão populacional seja de 0,25 polegadas.
(b) Repita a parte (a) usando um desvio padrão de 0,3 polegadas.
Que desvio padrão requer um maior tamanho de amostra? Explique.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 139
6. Em uma amostra aleatória de 5 fornos de micro-ondas, a média de custos
de reparos era de R$ 75,00 e desvio padrão era R$ 12,50. Construir um
intervalo de confiança de 95% para a média populacional.
7. Em uma amostra aleatória de 7 computadores, a média de custos de
reparos era de R$ 100,00 e desvio padrão de R$ 42,50. Construir um
intervalo de confiança de 95% para a média populacional.
8. Você faz uma pesquisa aleatória de 25 carros esportivos e registra as
milhas por galão para cada. Os dados estão listados a seguir. Construir um
intervalo de confiança de 95% para a média populacional. Assuma que as
milhas por galão são normalmente distribuídas.
15 – 27 – 24 – 24 – 20 – 21 – 24 – 14 – 21 – 25 – 21 – 13 – 21 – 25 – 22 –
21 – 25 – 24 – 22 – 24 – 24 – 22 – 21 – 24 – 24
9. Em uma amostra aleatória de 19 pacientes no departamento de emergência
de um hospital, o tempo médio de espera (em minutos) antes de serem
atendidos pelo médico era de 23 minutos e o desvio padrão era de 11
minutos. Construir um intervalo de confiança de 95% para a média
populacional. Assuma que os tempos de espera são normalmente
distribuídos.
10. Você quer estimar a média dos custos com reparos de máquinas de lavar
louças. A estimativa deve ter margem de erro de $ 10 em relação à média
da população. Determine o tamanho exigido da amostra para construir um
intervalo de 99% de confiança para uma média da população. Suponha que
o desvio padrão da população seja $ 22,50.
11. O conjunto de dados a seguir representa a média de jardas por intercepção
para uma amostra aleatória de recebedores no futebol americano de uma
temporada recente.
11,1 - 14,4 - 12,8 - 12,0 - 15,2 - 13,9 - 11,7 - 13,2 - 11,6 - 13,7
(a) Encontre a média da amostra.
(b) Encontre o desvio padrão da amostra.
(c) Use a distribuição t para construir um intervalo de 90% de confiança
para uma média da população. Suponha que a população do conjunto de
dados seja normalmente distribuída.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 140
12. Em uma amostra aleatória de sete engenheiros aeroespaciais, a renda
média mensal foi de $ 6.824 e o desvio padrão foi de $ 340. Suponha que
as rendas mensais sejam normalmente distribuídas e use uma distribuição t
para construir um intervalo de 95% de confiança para a média da população
de renda mensal de engenheiros aeroespaciais.
13. Uma amostra aleatória de 85 alunos da oitava série tem nota média de 282
com desvio padrão de 35 em um teste nacional de matemática. O resultado
do teste informa o administrador de uma escola estadual que a nota média
no teste para os alunos da oitava série do estado é mais do que 275. Em
, há evidência o suficiente para apoiar a afirmação do
administrador?
14. Uma sociedade de bebedores de chá estima que a média de consumo de
chá por uma pessoa nos Estados Unidos é mais do que 8 galões por ano.
Em uma amostra aleatória de 100 pessoas, você descobre que a média de
consumo de chá é de 7,9 galões por ano, com desvio padrão de 2,67
galões. Em , você pode apoiar a afirmação da sociedade?
15. Uma empresa fabricante de bebidas à base de cola afirma que a média do
conteúdo de cafeína por garrafa de 12 oz é de 40 miligramas. Você quer
testar essa afirmação. Durante os testes, você descobre que uma amostra
aleatória de 30 garrafas de 12 oz de bebida à base de cola tem média de
conteúdo de cafeína de 39,2 miligramas com desvio padrão de 7,5
miligramas. Em , você pode rejeitar a afirmação da empresa?
16. Um fabricante de lâmpadas garante que a média de vida útil de certo tipo de
lâmpada é de pelo menos 750 horas. Uma amostra aleatória de 36
lâmpadas tem média de vida útil de 745 horas com desvio padrão de 60
horas. Em , você tem evidências suficientes para rejeitar a
afirmação do fabricante?
17. Um cientista estima que a média do nível de dióxido de nitrogênio em
Calgary é maior que 32 partes por bilhão. Você quer testar essa estimativa.
Para isso, você determina os níveis de dióxido de nitrogênio para 34 dias
selecionados aleatoriamente.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 141
Os resultados (em partes por bilhão) estão listados a seguir. Em ,
você pode apoiar a estimativa do cientista?
24 – 36 – 44 – 35 – 44 – 34 – 29 – 40 – 39 – 43 – 41 – 32 – 33 – 29 – 29 –
43 – 25 – 39 – 25 – 42 – 29 – 22 – 22 – 25 – 14 – 15 – 14 – 29 – 25 – 27 –
22 – 24 – 18 – 17
18. Um restaurador de micro-ondas diz que a média do custo para conserto de
micro-ondas com problemas é de R$ 100,00. Você trabalha para este
restaurador e quer testar essa afirmação. Você descobre que uma amostra
aleatória de 5 fornos micro-ondas tem uma média de custo para conserto de
R$ 75,00 e um desvio padrão de R$ 12,50. Com , você tem
evidências para dar suporte à afirmação do restaurador?
19. Um ambientalista estima que a média de lixo reciclado por adultos nos EUA
seja maior que 1 libra por pessoa ao dia. Você quer testar essa afirmação.
Você descobre que a média de lixo reciclado por pessoa ao dia para uma
amostra aleatória de 12 adultos nos EUA é de 1,46 libras e o desvio padrão
é 0,28 libras. Com , você pode dar suporte a essa afirmação?
20. Você recebe uma revista de uma grande universidade. A revista indica que
a média do tamanho das salas para cursos integrais é menor que 32
alunos. Você quer testar essa afirmação. Você seleciona 18 salas
aleatoriamente e determina o tamanho de cada uma. Os resultados são
listados a seguir. Com , você pode dar suporte à afirmação do
reitor?
35 – 28 – 29 – 33 – 32 – 40 – 26 – 25 – 29 – 28 – 30 – 36 – 33 – 29 – 27 –
30 – 28 – 25
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 142
Gabarito
1.
2.
3. 89
4. (a) 121 porções (b) 208 porções (c) O intervalo de confiança de 99%
requer uma amostra mais larga porque mais informações é necessária a
partir da população como sendo 99% confiante.
5. (a) 42 bolas de futebol (b) 60 bolas de futebol; requer um tamanho
de amostra maior. Devido a variabilidade aumentada na população, um
tamanho maior de amostra é necessário para assegurar a correção
desejada.
6.
7.
8.
9.
10. 34
11. (a) 12,96 (b) 1,351 (c)
12.
13. No nível de significância de 4%, há evidência suficiente para apoiar a
afirmação do administrador de que a nota média dos alunos da 8ª série no
exame é mais do que 275.
14. No nível de significância de 7%, não há evidência suficiente para apoiar a
afirmação da sociedade de bebedores de chá de que a média do consumo
de chá por pessoa nos EUA é mais do que 8 galões por ano.
15. No nível de significância de 1%, há evidência suficiente para rejeitar a
afirmação da empresa de que a média do conteúdo de cafeína para uma
garrafa de 12 oz de refrigerante à base de cola é de 40 miligramas.
16. No nível de significância de 2%, não há evidência suficiente para rejeitar a
afirmação do fabricante de lâmpadas de que a média da vida útil de uma
lâmpada é de pelo menos 750 horas.
FACULDADE PITÁGORAS DE LINHARES
Prof. Esp. Thiago Magalhães
Estatística e Probabilidade Página 143
17. No nível de significância de 6%, não há evidência suficiente para apoiar a
afirmação do cientista de que a média do nível de dióxido de nitrogênio em
Calgary é maior que 32 partes por bilhão.
18. No nível de significância de 1%, há evidência suficiente para apoiar a
afirmação do reparador de forno de micro-ondas de que a média de custo
de reparos para micro-ondas com danos é menos do que R$ 100,00.
19. No nível de significância de 5%, há evidência suficiente para apoiar a
afirmação do ambientalista de que a média do lixo reciclado por adultos nos
EUA é mais do que 1 libra por pessoa por dia.
20. No nível de significância de 1%, há evidência suficiente para apoiar a
afirmação da revista de que o tamanho médio de uma classe para uma
faculdade de tempo integral é menor que 32 estudantes.