Teste de Hipóteses - bessegato.com.brbessegato.com.br/PUC/iec_transp_10.pdf · 36 Figura 7-8...

Preview:

Citation preview

1

7Teste de Hipóteses

7-1 Aspectos Gerais7-2 Fundamentos do Teste de Hipóteses7-3 Teste de uma Afirmação sobre a Média:

Grandes Amostras7-4 Teste de uma Afirmação sobre a Média :

Pequenas Amostras7-5 Teste de uma Afirmação sobre uma

Proporção

2

7-1 Aspectos GeraisDefinição

HipóteseEm Estatística, é uma alegação ou afirmação sobre uma propriedade de uma população

3

Regra do Evento Raro para Inferência Estatística

Analisar uma amostra para distinguir entre resultados que podem ocorrer facilmente e os que dificilmente ocorrem.

A ocorrência de resultados altamente improváveis pode ser explicada pela ocorrência efetiva de um evento raro, ou de que nossa suposição não está correta.

4

7-2

Fundamentos do Teste de Hipóteses

5

Figura 7-1 Teorema Central do LimiteDistribuição Esperada de Médias Amostrais

Supondo µ = 98,6

z = - 1,96

x = 98,48ou

z = 1,96

x = 98,72ou

Dados amostrais: z = - 6,64

x = 98,20ou

µx = 98,6

Médias amostrais prováveis

6

Componentes de umTeste de Hipóteses

Formal

7

Hipótese Nula: H0

Afirmação sobre valor de parâmetro populacional

Deve conter a condição de igualdade

=, ≥, ou ≤

Testar a Hipótese Nula diretamente

Rejeitar H0 ou não rejeitar H0

8

Hipótese Alternativa: H1

Deve ser verdadeira se H0 é falsa

≠, <, >

‘oposto’ da Hipótese Nula.

9

Nota sobre a Indicação de suas Próprias Afirmações (Hipóteses)

Se você está fazendo uma pesquisa e deseja usar um teste de hipótese para apoiar sua afirmação, esta afirmação deve ser formulada de maneira que se torne a hipótese alternativa (hipótese de pesquisa).

10

Nota sobre o Teste de Validade de uma Afirmação Alheia

A afirmação original às vezes se torna a hipótese nula (porque contém a igualdade) e por vezes passa a ser a hipótese alternativa (porque não contém a desigualdade).

11

Estatística de Testeum valor baseado nos dados amostras que é

usado para tomar uma decisão sobre a rejeição da hipótese nula.

para grandes amostras, testando afirmações sobre médias populacionais

x - µxz =σ n

12

Região CríticaConjunto de todos os valores da estatística de

teste que levam à rejeição da hipótese nula

RegiãoCrítica

13

Nível de Significânciadenotado por αé a probabilidade de rejeitar a Hipótese Nula quando ela é verdadeira.são comuns as escolhas 0,05; 0,01 e 0,10. (É tipicamente predeterminado)

14

Valores CríticosValor, ou valores, que separa(m) a região crítica

dos valores da estatística de teste que não levam à rejeição da hipótese nula.

Não rejeita H0Rejeita H0

Valor Crítico(escore z )

15

Teste Bilateral, Unilateral Esquerdo, Unilateral Direito

As caudas em uma distribuição são as regiões extremas delimitadas por

valores críticos.

16

Teste BilateralH0: µ = 100H1: µ ≠ 100

α é dividido igualmenteentre as duas caudas

da região crítica

Significa menor ou maior que

Não Rejeita H0Rejeita H0 Rejeita H0

100

Valores que são significativamente distantes de 100

17

Teste Unilateral DireitoH0: µ ≤ 100

H1: µ > 100

Valores que são significativamente

distantes de 100100

Não rejeita H0 Rejeita H0

Pontos à direita

18

Teste Unilateral Esquerdo

H0: µ ≥ 100

H1: µ < 100Pontos à Esquerda

Não rejeita H0Rejeita H0

Valores que sãosignificativamentedistantes de 100

100

19

Conclusões no Teste de Hipóteses

Testar sempre a hipótese nula

1. Rejeitar a hipótese nula H0

2. Não rejeitar a hipótese nula H0

É necessário formular corretamente a conclusão final.

Veja Figura 7-4

20

A afirmaçãooriginal contéma condição de

igualdade?

Rejeitar H0?Sim

(A afirmação original contém a igualdadee se torna H0)

Não(A afirmação originalnão contém aigualdade e se torna H1)

Sim

(Rejeitar H0)

“Há evidência suficientepara garantir a rejeição da afirmação deque. . . (afirmação original).”

“Não há evidênciasuficiente para garantir arejeição da afirmação de que. . . (afirmação original).”

“Os dados amostraisapóiam a afirmação de que. . .(afirmação original).”

“Não há evidência amostralpara apoiar a afirmação deque. . . (afirmação original).”

Rejeitar H0?Sim

(RejeitarH0)Não

(Nãorejeitar H0)

Não(Nãorejeitar H0)

(Único caso em que a afirmação original é rejeitada).

(Único caso em que a afirmação original é apoiada

Início

FIGURA 7-4 Terminologia das Conclusões Finais

21

Aceitar versus Não Rejeitaralguns textos usam “aceitar a hipótese nula”

devemos reconhecer que não estamos provando a hipótese nula

estamos dizendo que a evidência amostral não é forte o suficiente para recomendar a rejeição da hipótese nula (tal como um júri decidir que não há evidência suficiente para condenar um acusado)

22

Erro Tipo IO erro de rejeitar a hipótese nula quando ela é verdadeira.

α (alfa) é usado para representar a probabilidade de um erro tipo I.

Exemplo: Rejeitar a afirmação de que a temperatura do corpo é 37ºC, quando aquela média é, de fato, 37ºC.

23

Erro Tipo II

Erro de não rejeitar a hipótese nula quando ela é falsa.

ß (beta) é usado para representar a probabilidade de um erro tipo II.

Exemplo: Não rejeitar a afirmação de que a temperatura do corpo é 37ºC, quando aquela é, de fato, falsa (a média não é 37ºC).

24

Tabela 7-2 Erros Tipo I e Tipo IIVerdadeiro Estado da Natureza

A hipótesenula éfalsa

A hipótesenula é

verdadeira

Erro tipo I(rejeição de uma

H0 verdadeira)α

Decisãocorreta

Decidimos rejeitara hipótese nula

DecisãoErro tipo II

(não rejeição de uma Ho falsa)

β

Decisãocorreta

Não rejeitamos ahipótese nula

25

Controle dos Erros Tipo I e Tipo II

Para α fixo, um aumento do tamanho n da amostra ocasiona uma redução de β.

Para um tamanho n, fixo, de amostra, uma diminuição de α acarreta um aumento de β. Reciprocamente, um aumento de α acarreta a diminuição de β .

Para reduzir α e β, deve-se aumentar o tamanho da amostra.

26

Definição

Poder de um Teste de Hipótesesé a probabilidade (1 - β ) de rejeitar um hipótese nula falsa, que é calculada através de um particular nível de significância α e um particular valor de média que é uma alternativa para o valor suposto verdadeiro na hipótese nula.

27

7-3

Teste de uma Afirmação sobre uma Média: Grandes Amostras

28

Três Métodos Discutidos

1) Método tradicional

2) Método do valor P

3) Intervalos de confiança

29

Hipótesespara testar afirmações sobre média populacional

1) A amostra é uma amostra aleatória simples.

2) A amostra é grande (n > 30).

a) Aplica-se o Teorema Central do Limite

b) Pode-se usar a distribuição normal

3) Se σ é desconhecido, podemos utilizar o desvio-padrão amostral s como uma estimativa para σ.

30

Estatística de Teste para Afirmações sobre µ quando n > 30

x - µxz = σn

O método tradicional (ou clássico) do teste de hipóteses converte uma

estatística amostral importante, em uma estatística de teste que é comparada com

um valor crítico.

31

Método Tradicional (ou Clássico) de Teste de HipótesesFigura 7-5

1. Identificar a afirmação ou hipótese específica a ser testada e colocá-la em forma simbólica.

2. Dar a forma simbólica que deve ser verdadeira quando a afirmação original é falsa.

3. Das 2 expressões simbólicas obtidas até agora, a hipótese nula H0 é a que contém a condição de igualdade. H1 é a outra afirmação.

4. Escolher o nível de significância α com base na gravidade de um erro tipo I. Tomar α pequeno se as conseqüências da rejeição de uma H0 verdadeira são sérias. São muito comuns os valores de 0,05 e 0,01.

5. Identificar a estatística relevante para este teste e determinar sua distribuição amostral.

6. Determinar a estatística de teste, os valores críticos e a região crítica. Esboçar um gráfico e incluir a estatística de teste, o(s) valor(es) crítico(s) e a região crítica.

7. Rejeitar H0 se a estatística de teste está na região crítica. Não rejeitar H0 se a estatística de teste não está na região crítica.

8. Reformular a decisão precedente em termos simples, não-técnicos. (Ver Figura 7-4)

32

Critério de Decisão (Passo 7)

Rejeitar a hipótese nula se a estatística de teste está na região crítica

Não rejeitar a hipótese nula se a estatística de teste não está na região crítica.

33

Método do Valor P para o Teste de Hipóteses

Similar ao método tradicional

a principal diferença é a maneira pela qual é tomada a decisão para rejeitar a hipótese nula.

o procedimento encontra a probabilidade(Valor P) de obter um resultado e rejeita-se a hipótese nula se esta probabilidade é muito baixa.

34

DefiniçãoValor P (ou valor de probabilidade)

é a probabilidade de obter um valor da estatística amostral de teste no mínimo tão extremo como o que resulta dos dados amostrais, na suposição de a hipótese nula ser verdadeira.

Método do Valor P para o Teste de Hipóteses

35

Resultados amostrais incomuns. Diferença significante da hipótese nula.

Valores P pequenos (tais como 0,05 ou menor)

Valor P Interpretação

Os resultados amostrais não são incomuns. Não é uma diferença significante da hipótese nula.

Valores P grandes (acima de 0,05 )

36

Figura 7-8 Determinação dos Valores P

µ µEstatística de teste

Aestatística de

teste está à direita ou à esquerda do

centro?

Valor P = 2 vezesa área à esquerda

da estatística de teste

Valor P = 2 vezesa área à direitada estatística de teste

Início

Valor P = áreaà direita daestatística de teste

µEstatística de teste Estatística de teste

Valor P é duasvezes esta área

Valor P = áreaà esquerda daestatística de teste

tipo de testeQue

?

Unilateral esquerdo Unilateral direito

Bilateral

À direitaÀ esquerda

Valor P é duasvezes esta área

Valor PValor P

µEstatística de teste

37

Procedimento é o mesmo, exceto para os passos 6 e 7

Passo 6: Achar o valor P (como mostrado na Figura 7-8)

Passo 7: Reportar o valor P.

Rejeitar a hipótese nula se o valor P é no máximo igual ao nível de significância α.

Não rejeitar a hipótese nula se o valor P é maior do que o nível de significância α.

38

Teste de Afirmações com Intervalos de Confiança

Uma estimativa intervalar de um parâmetro populacional contém os valores prováveis daquele parâmetro. Devemos, por conseguinte, rejeitar uma afirmação de que o parâmetro populacional tenha um valor que não está compreendido no intervalo de confiança.

39

Razão Subjacente do Teste de Hipóteses

Se, sob uma dada suposição observada, a probabilidade de obtermos a amostra é excepcionalmente pequena, concluímos que a suposição provavelmente não é correta.

Ao testarmos uma afirmação, fazemos uma suposição (hipótese nula) que contém a igualdade. Comparamos então a suposição com os dados amostrais, e formulamos uma das conclusões seguintes:

40

Razão Subjacente do Teste de Hipóteses

Se os resultados amostrais podem ocorrer facilmente quando a suposição (hipótese nula) é verdadeira, atribuímos ao acaso a discrepância relativamente pequena entre a suposição e os resultados amostrais.

Se os resultados amostrais não são susceptíveis de ocorrer com facilidade quando a suposição (hipótese nula) é verdadeira, explicamos a discrepância relativamente grande entre a suposição e os resultados amostrais concluindo que a suposição não é verdadeira.

41

7-4

Teste de uma Afirmação sobre uma Média:

Pequenas Amostras

42

Hipótesespara testar afirmação sobre média populacional

1) A amostra é uma amostra aleatória simples.

2) A amostra é pequena (n ≤ 30).

3) O valor do desvio-padrão populacional σ é desconhecido.

4) A população original tem distribuição essencialmente normal.

43

Estatística de Teste para uma Distribuição t- Student

x -µxsn

t =

Valores CríticosValores tabelados

Graus de liberdade = n -1

Valores t críticos à esquerda da média são negativos.

44

Propriedades Importantes da Distribuição t de Student

1. A distribuição t de Student é diferente para cada tamanho de amostra.

2. A distribuição t de Student tem a mesma forma geral de sino da distribuição normal. Sua forma mais aberta reflete a maior variabilidade esperada em pequenas amostras.

3. A distribuição t de Student tem média t = 0 (tal como a distribuição normal padronizada que tem média z = 0).

4. O desvio-padrão da distribuição t de Student varia com o tamanho da amostra, e é maior do que 1 (ao contrário da distribuição normalpadronizada, em que σ = 1).

5. À medida que o tamanho n da amostra aumenta, a distribuição t deStudent se aproxima da distribuição normal. Para valores de n > 30, as diferenças são tão pequenas que podemos usar os valores críticos z em lugar de elaborar uma tabela muito maior de valores críticos de t. (Os valores na base da Tabela A-3 são iguais aos valores críticos zcorrespondentes da distribuição normal padronizada.)

45

Figura 7-11 Escolha entre a Distribuição Normal e a Distribuição t ao Testar uma Afirmação sobre a Média Populacional µ

n > 30?

Adistribuição da

população é essencialmentenormal ? (Trace um

histograma.)

Não

Sim

Sim

Não

Não

σ éconhecido

?

Use a distribuição normal com

x - µx

σ/ nZ =

(Se σ é desconhecido, use s.)

Use métodos não-paramétricos, que não exijam uma distribuição normal.

Use a distribuição normal com

x - µx

σ/ nZ =

(Este caso é raro.)

Use a distribuição t de Studentcom x - µx

s/ nt =

Início

46

7-5

Teste de uma Afirmação sobre uma Proporção

47

Hipótesespara testar afirmação sobre proporção populacional

1) A amostra é uma amostra aleatória simples.

2) São verificadas as condições para um experimento binomial.

3) As condições np ≥ 5 e n(1-p) ≥ 5 são ambas satisfeitas, de modo que a distribuição binomial das proporções amostrais pode ser aproximada por uma distribuição normal com µ = np e σ = np(1-p)

48

Notação

n = número de provas

p = proporção populacional (usada na hipótese nula)

q = 1 - p

∧p = x/n (proporção amostral)

49

Estatística para Teste de uma Afirmação sobre uma Proporção

p - ppqn

z =

50

Método do Valor P

Conforme descrito anteriormente

Rejeitar a hipótese nula se o valor P é menor ou igual ao

nível de significância α.

51

p algumas vezes é dado diretamente“10% dos carros esportes observados são

vermelhos”está expresso como

p = 0,10

p algumas vezes deve ser calculado“96 das donas de casa pesquisadas tem

TV à cabo e 54 não”, é calculado usando

p = = = 0,64xn

96(96+54)

52

Estatística para Teste de uma Afirmação sobre uma Proporção

p - ppqn

z =

z = = = = x - µ x - np n n p - px np

σ npq npq pqn n

53

8 Inferências com Base em Duas

Amostras

8-1 Aspectos Gerais

8-2 Inferências sobre Duas Médias: Amostras Independentes e Grandes

8-3 Inferências sobre Duas Médias: Amostras Dependentes

54

8-1 Aspectos Gerais

Há muitas situações importantes em que se faz necessário comparar dois conjuntos

de dados amostrais.

55

8-2

Inferências sobre Duas Médias:Amostras Independentes e Grandes

56

DefiniçõesDuas Amostras: Independentes

Os valores amostrais escolhidos de uma população não tem qualquer relação com os valores amostrais extraídos da outra população. Se os valores de uma amostra estão relacionados com os valores de outra amostra, as amostras são dependentes. Estas amostras são freqüentemente chamadas amostras ligadas ou amostras emparelhadas.

57

Suposições

1. As duas amostras são independentes.

2. Os tamanhos das duas amostras são grandes. Ou seja, n1 > 30 e n2 > 30.

3. Ambas as amostras são amostras aleatórias simples.

58

Teste de HipótesesEstatística de Teste para Duas Médias:

Amostras Independentes e Grandes

(x1 - x2) - (µ1 - µ2)

n1 n2+σ1

. σ222

z =

59

Teste de HipótesesEstatística de Teste para Duas Médias:

Amostras Independentes e Grandesσ1 e σ2 : Se σ1 e σ2 não são conhecidos, utilizar em seu

seu lugar s1 e s2 desde que ambas as amostras sejam grandes.

P-valor: Usar o valor calculado da estatística de teste z, e determinar o P-valor através do mesmo procedimento resumido na Figura 7-8.

Valores críticos: Baseado no nível de significância α, determinar os valores críticos através do processo apresentado na Seção 7-2.

60

Coca versus PepsiConjunto de dados fornece pesos (em libras) de amostras de Coca e Pepsi (regulares). As estatísticas amostrais estão mostradas abaixo. Use o nível de significância de 0,01 para testar a afirmação que o peso médio da Coca regular é diferente do peso médio da Pepsi regular.

Coca Pepsin 36 36x 0,81682 0,82410s 0,007507 0,005701

61

Coca Versus Pepsi

62

Afirmação: µ1 ≠ µ2

Ho : µ1 = µ2

H1 : µ1 ≠ µ2

α = 0,01

Coca Versus Pepsi

Não rejeitar H0Rejeitar H0 Rejeitar H0

Z = - 2,575 Z = 2,575µ1 - µ2 = 0ou Z = 0

63

Coca Versus PepsiEstatística de Teste para Duas Médias:

Amostras Independentes e Grandes

z = (0,81682 – 0,82410) - 0

0,005701 20,0075707 2 +36 36

= - 4,63

64

Afirmação: µ1 ≠ µ2

Ho : µ1 = µ2

H1 : µ1 ≠ µ2

α = 0,01

Coca Versus Pepsi

Há evidência significativa para apoiar a afirmação que há uma diferença entre os pesos médios da Coca e da Pepsi.

Não rejeita H0Rejeita H0 Rejeita H0

Dados amostrais:z = - 4,63

Rejeita-se a Hipótese Nula

Z = - 2,575 Z = 2,575µ1 - µ2 = 0ou Z = 0

65

Intervalos de Confiança

(x1 - x2) - E < (µ1 - µ2) < (x1 - x2) + E

n1 n2+σ1 σ2

22

onde E = zα/2

66

8-3

Inferências sobre Duas Médias:Amostras Dependentes

67

Suposições1. Os dados amostrais consistem de amostras

emparelhadas (amostras dependentes de duas populações).

2. As amostras são amostras aleatórias simples.

3. Se o número de pares de dados amostrais é pequeno (n ≤ 30), então a população de diferenças dos valores pareados deve ser aproximadamente normalmente distribuídas.

68

Notação para Amostras Dependentes

µd = média das diferenças d para a população de dados emparelhados

d = valor médio das diferenças d para os dados amostrais emparelhados (igual à média dos valores de x - y )

sd = desvio-padrão das diferenças d para os dados amostrais emparelhados.

n = número de pares de dados.

69

Estatística de Teste para Dados Amostrais EmparelhadosTest Statistic for Matched Pairs

of Sample Data

d - µdsd

t =n

onde graus de liberdade = n - 1

70

Valores Críticos

Se n ≤ 30, os valores críticos são determinados através da Tabela A-3 (distribuição t de student).

Se n > 30, os valores críticos são determinados através da Tabela A- 2 (distribuição normal).

71

Intervalos de Confiança

d - E < µd < d + E

sdonde E = tα/2 n

graus de liberdade = n -1

72

Quanto Estudantes de Estatística (homens) Exageram sua Altura?

Usando os dados amostrais da Tabela 8-1 (com o outlier excluído), construir uma estimativa de um intervalo de 95% de confiança de µd, que é a média das diferenças entre as alturas relatadas pelos alunos(homens) e suas alturas medidas.

73

Tabela 8-1

Alturas Relatadas e Medidas (em polegadas) de Estudantes de Estatística

Estudante A B C D E F G H I J K L

Altura 68 74 82,25 66,5 69 68 71 70 70 67 68 70 Relatada

Altura 66,8 73,9 74,3 66,1 67,2 67,9 69,4 69,9 68,6 67,9 67,6 68,8Medida

Diferença 1,2 0,1 7,95 0,4 1,8 0,1 1,6 0,1 1,4 -0,9 0,4 1,2

outlier

74

Quanto Estudantes de Estatística (homens) Exageram em sua Altura?

d = 0,672727s = 0,825943n = 11tα/2 = 2,228 (determinado através da Tabela

A-3 com 10 graus de liberdade e 0,05 bilateral)

75

Quanto Estudantes de Estatística (homens) Exageram sua Altura?

sdnE = tα/2

E = (2,228)( )0,82594311

= 0,554841

76

0,12 < µd < 1,23

Quanto Estudantes de Estatística (homens) Exageram sua Altura?

A longo prazo, 95% de tais amostras levarão a limites do intervalo de confiança que contêm efetivamente a verdadeira média populacional das diferenças. Note que os limites do intervalo de confiança não contém 0, o que indica que o verdadeiro valor de µd é significativamente diferente de. Há evidência suficiente para apoiar a afirmação de que há diferença entre as alturas relatadas e as alturas medidas de estudantes do sexo masculino.

Recommended