33
8 Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras

Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

  • Upload
    others

  • View
    10

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

8

Estatística Aplicada

Larson Farber

Teste de hipóteses com duas amostras

Page 2: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Testando a diferença

entre duas médias

(amostras grandes

e independentes)

Seção 8.1

Page 3: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Grupo de controle

(placebo)

Grupo experimental

(tratamento)

Para testar o efeito benéfico de um tratamento fitoterápico sobre a memória, você seleciona aleatoriamente duas amostras de pessoas; uma delas receberá o medicamento e a outra tomará um placebo. Um mês depois, os dois grupos são submetidos a um teste de memória e obtêm os resultados a seguir.

A estatística teste resultante é 77 – 73 = 4. Essa diferença é significativa ou pode ser atribuída ao acaso (erro amostral)?

Visão geral

Amostra

1

Amostra

2

Page 4: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Os membros de uma amostra não têm relação com

os membros da outra.

Uma pessoa que recebeu o tratamento fitoterápico

não estava relacionada nem podia ser emparelhada

com outra no grupo de controle.

Grupo experimental Grupo de controle

Amostras independentes

x2

x1x1

x1x1

x1

x1x1

x2

x2x2

x2

Page 5: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Cada membro de uma amostra pode ser emparelhado a um

membro da outra amostra.

Nota antes Nota depois

A nota no teste de memória de cada pessoa da amostra

podia ser registrada antes e depois do tratamento.

Pode-se calcular a diferença para cada par.

Amostras dependentes

x1 x2

x1

x1

x1

x1

x1

x2

x2

x2

x2

x2

Page 6: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Para testar o efeito benéfico de um tratamento

fitoterápico sobre a memória, você seleciona

aleatoriamente uma amostra de 95 pessoas, as

quais receberão o tratamento, e uma amostra de

105 pessoas que tomarão um placebo. Um mês

depois, ambos os grupos submetem-se a um

teste. A nota média do grupo experimental é de

77, com um desvio padrão de 15. No grupo de

controle, a média é 73 e o desvio padrão, 12.

Teste a alegação de que o tratamento

fitoterápico melhora a memória a = 0,01.

Aplicação

Page 7: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

A hipótese nula H0 em geral contém a condição de igualdade.

(Não há diferença entre os parâmetros das duas

populações.)

A hipótese alternativa Ha é verdadeira quando H0 é falsa.

= 0,01.

Essa é a probabilidade de H0 ser verdadeira e você a

rejeitar.

1. Estabeleça as hipóteses nula e alternativa.

(alegação)

2. Estabeleça o nível de significância.

Page 8: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

A distribuição da estatística amostral

é normal, já que as duas amostras são grandes.

z

Região de rejeição

2,33

3. Identifique a distribuição amostral.

5. Determine a

região de rejeição.

4. Determine o valor

crítico.

0 z0 Valor crítico z0

Page 9: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

z = 2,07 não cai na região de rejeição. Não rejeite a

hipótese nula. O valor P é 0,019 > 0,01. Não rejeite H0.

Não há evidência suficiente para aceitar a alegação de que o

tratamento fitoterápico aumenta a memória.

02,33

z

Se as duas amostras

são grandes, você pode

usar s1 e s2 no lugar

de e .

6. Determine a estatística teste.

7. Tome sua decisão.

8. Interprete sua decisão.

1,9332,07 3,74 1,933

Page 10: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Testando a diferença

entre duas médias

(amostras pequenas

e independentes)

Seção 8.2

Page 11: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Quando você não pode colher amostras de 30 ou mais itens, você

pode usar um teste t, se as duas populações forem normalmente

distribuídas. A distribuição amostral depende do fato de as variâncias

populacionais serem ou não iguais.

Se as variâncias das duas populações são iguais, você pode combinar

ou ‘agrupar’ informação das duas amostras, a fim de formar uma

estimativa agrupada do desvio padrão.

g.l. = n1 + n2 – 2

O erro padrão é:

Se as variâncias forem diferentes, o erro padrão será:

E o g.l. será o menor entre

n1 – 1 e n2 – 1.

Testando a diferença entremédias (amostras pequenas)

Page 12: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Cinco pick-ups pequenas e oito SUVs realizaram testes de

colisão a cinco milhas por hora. Para as pick-ups, o

conserto do pára-choques custou em média US$ 1.520,

com um desvio padrão de US$ 403. No caso dos SUVs, o

conserto custou uma média de US$ 937, com um desvio

padrão de US$ 382. Sendo = 0,05, teste a alegação de

que o conserto de pára-choques das pick-ups custa mais

que o dos SUVs. Suponha que as variâncias sejam iguais.

Aplicação

Pick-up SUV

n

s

5

1.520

403

8

937

382

Page 13: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

1. Estabeleça as hipóteses nula e alternativa.

2. Estabeleça o nível de significância.

3. Identifique a distribuição amostral.

= 0,05.

Como as variâncias são iguais, a distribuição da estatística

amostral é uma distribuição t com g.l. = 5 + 8 – 2 = 11.

(alegação)

Page 14: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

t t00

1,796

4. Determine o valor crítico.

5. Determine a

região de rejeição.

6. Determine a

estatística teste.

Se as variâncias forem

iguais, determine o valor

agrupado.

389,77 389,77(0,570) = 222,203

Page 15: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

t = 2,624 cai na região de rejeição. Rejeite a

hipótese nula.

Há evidência suficiente para aceitar a

alegação de que o conserto de pára-choques

das pick-ups custa mais que o dos SUVs.

1,7960

t7. Tome sua decisão.

8. Interprete sua decisão.

222,2032,624

Page 16: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Segundo uma imobiliária, não há diferença

entre a renda média familiar de dois

condomínios. A renda média de 12 famílias do

primeiro condomínio é de US$ 48.250, com

um desvio padrão de US$ 1.200. No segundo

condomínio, 10 famílias têm uma renda média

de US$ 50.375, com um desvio padrão de

US$ 3.400. Suponha que as rendas sejam

normalmente distribuídas e que as variâncias

sejam diferentes. Teste a alegação sendo =

0,01.

Aplicação

Page 17: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Como as variâncias são diferentes, a distribuição da estatística

amostral é uma distribuição t com g.l. = 9. (A menor

amostra tem 10 itens, e 10 – 1 = 9.)

1. Estabeleça as hipóteses nula e alternativa.

2. Estabeleça o nível de significância.

3. Identifique a distribuição amostral.

(alegação)Primeiro Segundo

n

s

12.000

48,250

1.200.000

10.000

50,375

3.400.000

.0,01

Page 18: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

3,250–3,250

–t0t t00

4. Determine os valores

críticos.

5. Determine as

regiões de rejeição.

6. Determine a estatística teste.

1.129,60171.2002 3.4002

(48.250 – 50.375)

1129,60171,88

Page 19: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

t = –1,881 não cai na região de rejeição. Não

rejeite a hipótese nula. (O valor P é 0,087 >

0,01.)

Não há evidência suficiente para rejeitar a alegação de que não

há diferença entre as rendas familiares médias dos dois

condomínios.

–3,250t

3,250

0

7. Tome sua decisão.

8. Interprete sua decisão.

Page 20: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Testando a diferença

entre duas médias

(amostras dependentes)

Seção 8.3

Page 21: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

A distribuição amostral de , a média das diferenças, é uma

distribuição t com n – 1 graus de liberdade (n é o número de pares.)

Se cada valor de uma amostra puder ser emparelhado com um

valor da outra, as amostras serão dependentes.

Calcula-se a diferença, d = x1 – x2, para cada par de dados.

A diferença entre médias:

amostras dependentes

x1 x2

x1

x1

x1

x1

x1

x2

x2

x2

x2

x2

Page 22: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

O desvio padrão de d é 3,39.

A média das diferenças, d, é 59.

A tabela abaixo mostra a freqüência cardíaca (em batidas por

minuto) de cinco pessoas antes e depois de uma sessão de

exercícios físicos. Há evidência suficiente para se concluir que o

exercício acelera a freqüência cardíaca? Use .

Indivíduo

1

2

3

4

5

d

62

63

55

58

57

Antes

65

72

85

78

93

Depois

127

135

140

136

150

0,05

3,39

Aplicação

Page 23: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

(Como há cinco pares de dados, g.l.= 5 – 1 = 4.)

1. Estabeleça as hipóteses alternativa e nula.

2. Estabeleça o nível de significância.

3. Identifique a distribuição amostral.

(alegação)

A distribuição da estatística amostral é uma

distribuição t com g.l. = 4.

0,05

Page 24: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

2,132

t t00

4. Determine o valor crítico.

5. Determine a

região de rejeição.

6. Determine a estatística teste.

38,923,39

Page 25: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

t = 38,92 cai na região de rejeição. Rejeite a

hipótese nula. O valor P é muito próximo de 0.

Há evidência suficiente para aceitar a alegação

de que o exercício acelera a freqüência

cardíaca.

t2,132t00

7. Tome sua decisão.

8. Interprete sua decisão.

Page 26: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Usando o Minitab

Resultados impressos do Minitab

O valor P é 0,0000. Como 0,0000 < 0,05, rejeite

a hipótese nula.

Test of = 0.00 vs > 0.00

Variable

diff.

N

5

Mean

59.00

StDev

3.39

SE

1.52

Mean

5

T

38.90

P

0.0000

Page 27: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Testando a diferença

entre duas proporções

Seção 8.4

Page 28: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

A diferença entre proporções

Se as amostras independentes colhidas de duas

populações forem grandes o bastante,você pode aplicar

um teste para verificar se há diferença entre as proporções

populacionais p1 e p2.

x1 e x2 representam o número de sucessos na

primeira e na segunda amostra, respectivamente.

n1 e n2 representam o tamanho da primeira e da

segunda amostra, respectivamente.

Proporção de sucessos em cada amostra.

Como se supõe que as

proporções sejam iguais,

uma estimativa para o valor

comum será:e

Page 29: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Teste z de duas amostras

A média é p1 – p2 = 0

Se equivalem, cada um, a pelo menos 5,

a distribuição amostral para é normal.

e o desvio padrão:

A estatística teste

padronizada é:

Page 30: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

Aplicação

Ensino privado Ensino público

Em um levantamento com 3.420 alunos do ensino

médio privado, 917 disseram ter fumado nos 30 dias

precedentes. Já em um levantamento com 5.131 alunos

do ensino médio público, 1.503 disseram ter fumado nos

30 dias precedentes. Sendo pode-se aceitar a

alegação de que a proporção de alunos de escola

privada que disseram ter fumado é inferior à proporção

dos alunos do sistema público que disseram ter

fumado? Use

n2 = 5.131

x2 = 1.503

n1 = 3.420

x1 = 917

0,01,

0,01.

0,268 0,293

Page 31: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

A distribuição da estatística amostral

é normal, já que

cada um, a pelo menos 5.equivalem,

1. Estabeleça as hipóteses nula e alternativa.

2. Estabeleça o nível de significância.

3. Identifique a distribuição amostral.

(alegação)

2.420

8.551

2,420

8,5510,283 e 0,717

0,00994

Page 32: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

z

Região de rejeição

Valor crítico z0

–2,33 0

5. Determine a

região de rejeição.4. Determine um valor crítico.

6. Determine a estatística

teste.

(0,268 – 0,293)

0,00009888

0,25

0,009942,514

Page 33: Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

z = –2,514 cai na região de rejeição. Rejeite a

hipótese nula.

–2,33 0

Há evidência suficiente para aceitar a alegação de

que a proporção de estudantes que fumou nos

colégios privados é menor que a observada nos

públicos.

7. Tome sua decisão.

8. Interprete sua decisão.