Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)

8

Estatística Aplicada

Larson Farber

Teste de hipóteses com duas amostras

Testando a diferença

entre duas médias

(amostras grandes

e independentes)

Seção 8.1

Grupo de controle

(placebo)

Grupo experimental

(tratamento)

Para testar o efeito benéfico de um tratamento fitoterápico sobre a memória, você seleciona aleatoriamente duas amostras de pessoas; uma delas receberá o medicamento e a outra tomará um placebo. Um mês depois, os dois grupos são submetidos a um teste de memória e obtêm os resultados a seguir.

A estatística teste resultante é 77 – 73 = 4. Essa diferença é significativa ou pode ser atribuída ao acaso (erro amostral)?

Visão geral

Amostra

1

Amostra

2

Os membros de uma amostra não têm relação com

os membros da outra.

Uma pessoa que recebeu o tratamento fitoterápico

não estava relacionada nem podia ser emparelhada

com outra no grupo de controle.

Grupo experimental Grupo de controle

Amostras independentes

x2

x1x1

x1x1

x1

x1x1

x2

x2x2

x2

Cada membro de uma amostra pode ser emparelhado a um

membro da outra amostra.

Nota antes Nota depois

A nota no teste de memória de cada pessoa da amostra

podia ser registrada antes e depois do tratamento.

Pode-se calcular a diferença para cada par.

Amostras dependentes

x1 x2

x1

x1

x1

x1

x1

x2

x2

x2

x2

x2

Para testar o efeito benéfico de um tratamento

fitoterápico sobre a memória, você seleciona

aleatoriamente uma amostra de 95 pessoas, as

quais receberão o tratamento, e uma amostra de

105 pessoas que tomarão um placebo. Um mês

depois, ambos os grupos submetem-se a um

teste. A nota média do grupo experimental é de

77, com um desvio padrão de 15. No grupo de

controle, a média é 73 e o desvio padrão, 12.

Teste a alegação de que o tratamento

fitoterápico melhora a memória a = 0,01.

Aplicação

A hipótese nula H0 em geral contém a condição de igualdade.

(Não há diferença entre os parâmetros das duas

populações.)

A hipótese alternativa Ha é verdadeira quando H0 é falsa.

= 0,01.

Essa é a probabilidade de H0 ser verdadeira e você a

rejeitar.

1. Estabeleça as hipóteses nula e alternativa.

(alegação)

2. Estabeleça o nível de significância.

A distribuição da estatística amostral

é normal, já que as duas amostras são grandes.

z

Região de rejeição

2,33

3. Identifique a distribuição amostral.

5. Determine a

região de rejeição.

4. Determine o valor

crítico.

0 z0 Valor crítico z0

z = 2,07 não cai na região de rejeição. Não rejeite a

hipótese nula. O valor P é 0,019 > 0,01. Não rejeite H0.

Não há evidência suficiente para aceitar a alegação de que o

tratamento fitoterápico aumenta a memória.

02,33

z

Se as duas amostras

são grandes, você pode

usar s1 e s2 no lugar

de e .

6. Determine a estatística teste.

7. Tome sua decisão.

8. Interprete sua decisão.

1,9332,07 3,74 1,933


entre duas médias

(amostras pequenas

e independentes)

Seção 8.2

Quando você não pode colher amostras de 30 ou mais itens, você

pode usar um teste t, se as duas populações forem normalmente

distribuídas. A distribuição amostral depende do fato de as variâncias

populacionais serem ou não iguais.

Se as variâncias das duas populações são iguais, você pode combinar

ou ‘agrupar’ informação das duas amostras, a fim de formar uma

estimativa agrupada do desvio padrão.

g.l. = n1 + n2 – 2

O erro padrão é:

Se as variâncias forem diferentes, o erro padrão será:

E o g.l. será o menor entre

n1 – 1 e n2 – 1.

Testando a diferença entremédias (amostras pequenas)

Cinco pick-ups pequenas e oito SUVs realizaram testes de

colisão a cinco milhas por hora. Para as pick-ups, o

conserto do pára-choques custou em média US$ 1.520,

com um desvio padrão de US$ 403. No caso dos SUVs, o

conserto custou uma média de US$ 937, com um desvio

padrão de US$ 382. Sendo = 0,05, teste a alegação de

que o conserto de pára-choques das pick-ups custa mais

que o dos SUVs. Suponha que as variâncias sejam iguais.

Aplicação

Pick-up SUV

n

s

5

1.520

403

8

937

382




= 0,05.

Como as variâncias são iguais, a distribuição da estatística

amostral é uma distribuição t com g.l. = 5 + 8 – 2 = 11.

(alegação)

t t00

1,796

4. Determine o valor crítico.

5. Determine a


6. Determine a

estatística teste.

Se as variâncias forem

iguais, determine o valor

agrupado.

389,77 389,77(0,570) = 222,203

t = 2,624 cai na região de rejeição. Rejeite a

hipótese nula.

Há evidência suficiente para aceitar a

alegação de que o conserto de pára-choques

das pick-ups custa mais que o dos SUVs.

1,7960

t7. Tome sua decisão.


222,2032,624

Segundo uma imobiliária, não há diferença

entre a renda média familiar de dois

condomínios. A renda média de 12 famílias do

primeiro condomínio é de US$ 48.250, com

um desvio padrão de US$ 1.200. No segundo

condomínio, 10 famílias têm uma renda média

de US$ 50.375, com um desvio padrão de

US$ 3.400. Suponha que as rendas sejam

normalmente distribuídas e que as variâncias

sejam diferentes. Teste a alegação sendo =

0,01.

Aplicação

Como as variâncias são diferentes, a distribuição da estatística

amostral é uma distribuição t com g.l. = 9. (A menor

amostra tem 10 itens, e 10 – 1 = 9.)




(alegação)Primeiro Segundo

n

s

12.000

48,250

1.200.000

10.000

50,375

3.400.000

.0,01

3,250–3,250

–t0t t00

4. Determine os valores

críticos.

5. Determine as

regiões de rejeição.


1.129,60171.2002 3.4002

(48.250 – 50.375)

1129,60171,88

t = –1,881 não cai na região de rejeição. Não

rejeite a hipótese nula. (O valor P é 0,087 >

0,01.)

Não há evidência suficiente para rejeitar a alegação de que não

há diferença entre as rendas familiares médias dos dois

condomínios.

–3,250t

3,250

0




entre duas médias

(amostras dependentes)

Seção 8.3

A distribuição amostral de , a média das diferenças, é uma

distribuição t com n – 1 graus de liberdade (n é o número de pares.)

Se cada valor de uma amostra puder ser emparelhado com um

valor da outra, as amostras serão dependentes.

Calcula-se a diferença, d = x1 – x2, para cada par de dados.

A diferença entre médias:

amostras dependentes

x1 x2

x1

x1

x1

x1

x1

x2

x2

x2

x2

x2

O desvio padrão de d é 3,39.

A média das diferenças, d, é 59.

A tabela abaixo mostra a freqüência cardíaca (em batidas por

minuto) de cinco pessoas antes e depois de uma sessão de

exercícios físicos. Há evidência suficiente para se concluir que o

exercício acelera a freqüência cardíaca? Use .

Indivíduo

1

2

3

4

5

d

62

63

55

58

57

Antes

65

72

85

78

93

Depois

127

135

140

136

150

0,05

3,39

Aplicação

(Como há cinco pares de dados, g.l.= 5 – 1 = 4.)

1. Estabeleça as hipóteses alternativa e nula.



(alegação)

A distribuição da estatística amostral é uma

distribuição t com g.l. = 4.

0,05

2,132

t t00

4. Determine o valor crítico.

5. Determine a



38,923,39

t = 38,92 cai na região de rejeição. Rejeite a

hipótese nula. O valor P é muito próximo de 0.

Há evidência suficiente para aceitar a alegação

de que o exercício acelera a freqüência

cardíaca.

t2,132t00



Usando o Minitab

Resultados impressos do Minitab

O valor P é 0,0000. Como 0,0000 < 0,05, rejeite

a hipótese nula.

Test of = 0.00 vs > 0.00

Variable

diff.

N

5

Mean

59.00

StDev

3.39

SE

1.52

Mean

5

T

38.90

P

0.0000


entre duas proporções

Seção 8.4

A diferença entre proporções

Se as amostras independentes colhidas de duas

populações forem grandes o bastante,você pode aplicar

um teste para verificar se há diferença entre as proporções

populacionais p1 e p2.

x1 e x2 representam o número de sucessos na

primeira e na segunda amostra, respectivamente.

n1 e n2 representam o tamanho da primeira e da

segunda amostra, respectivamente.

Proporção de sucessos em cada amostra.

Como se supõe que as

proporções sejam iguais,

uma estimativa para o valor

comum será:e

Teste z de duas amostras

A média é p1 – p2 = 0

Se equivalem, cada um, a pelo menos 5,

a distribuição amostral para é normal.

e o desvio padrão:

A estatística teste

padronizada é:

Aplicação

Ensino privado Ensino público

Em um levantamento com 3.420 alunos do ensino

médio privado, 917 disseram ter fumado nos 30 dias

precedentes. Já em um levantamento com 5.131 alunos

do ensino médio público, 1.503 disseram ter fumado nos

30 dias precedentes. Sendo pode-se aceitar a

alegação de que a proporção de alunos de escola

privada que disseram ter fumado é inferior à proporção

dos alunos do sistema público que disseram ter

fumado? Use

n2 = 5.131

x2 = 1.503

n1 = 3.420

x1 = 917

0,01,

0,01.

0,268 0,293

A distribuição da estatística amostral

é normal, já que

cada um, a pelo menos 5.equivalem,




(alegação)

2.420

8.551

2,420

8,5510,283 e 0,717

0,00994

z

Região de rejeição

Valor crítico z0

–2,33 0

5. Determine a

região de rejeição.4. Determine um valor crítico.

6. Determine a estatística

teste.

(0,268 – 0,293)

0,00009888

0,25

0,009942,514

z = –2,514 cai na região de rejeição. Rejeite a

hipótese nula.

–2,33 0

Há evidência suficiente para aceitar a alegação de

que a proporção de estudantes que fumou nos

colégios privados é menor que a observada nos

públicos.



Documents

Estatística Aplicada Larson Farber · Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras. Testando a diferença entre duas médias (amostras grandes e independentes)