8 Estatística Aplicada Larson Farber Teste de hipóteses com duas amostras

Preview:

Citation preview

8

Estatística Aplicada

Larson Farber

Teste de hipóteses com duas amostras

Testando a diferença entre duas médias (amostras grandes e independentes)

Seção 8.1

Grupo de controle(placebo)

Grupo experimental(tratamento)

Para testar o efeito benéfico de um tratamento fitoterápico sobre a memória, você seleciona aleatoriamente duas amostras de pessoas; uma delas receberá o medicamento e a outra tomará um placebo. Um mês depois, os dois grupos são submetidos a um teste de memória e obtêm os resultados a seguir.

A estatística teste resultante é 77 – 73 = 4. Essa diferença é significativa ou pode ser atribuída ao acaso (erro amostral)?

Visão geral

Amostra1

Amostra2

Os membros de uma amostra não têm relação com os membros da outra.

Uma pessoa que recebeu o tratamento fitoterápico não estava relacionada nem podia ser emparelhada com outra no grupo de controle.

Grupo experimental Grupo de controle

Amostras independentes

x2

x1x1

x1x1

x1

x1x1

x2

x2x2

x2

Cada membro de uma amostra pode ser emparelhado a um membro da outra amostra.

Nota antes Nota depois

A nota no teste de memória de cada pessoa da amostra podia ser registrada antes e depois do tratamento.

Pode-se calcular a diferença para cada par.

Amostras dependentes

x1 x2

x1

x1

x1

x1

x1

x2

x2

x2

x2

x2

Para testar o efeito benéfico de um tratamento fitoterápico sobre a memória, você seleciona aleatoriamente uma amostra de 95 pessoas, as quais receberão o tratamento, e uma amostra de 105 pessoas que tomarão um placebo. Um mês depois, ambos os grupos submetem-se a um teste. A nota média do grupo experimental é de 77, com um desvio padrão de 15. No grupo de controle, a média é 73 e o desvio padrão, 12. Teste a alegação de que o tratamento fitoterápico melhora a memória a = 0,01.

Aplicação

A hipótese nula H0 em geral contém a condição de igualdade. (Não há diferença entre os parâmetros das duas populações.)

A hipótese alternativa Ha é verdadeira quando H0 é falsa.

= 0,01. Essa é a probabilidade de H0 ser verdadeira e você a rejeitar.

1. Estabeleça as hipóteses nula e alternativa.

(alegação)

2. Estabeleça o nível de significância.

A distribuição da estatística amostral é normal, já que as duas amostras são grandes.

z

Região de rejeição

2,33

3. Identifique a distribuição amostral.

5. Determine a região de rejeição.

4. Determine o valor crítico.

0 z0 Valor crítico z0

z = 2,07 não cai na região de rejeição. Não rejeite a hipótese nula. O valor P é 0,019 > 0,01. Não rejeite H0.

Não há evidência suficiente para aceitar a alegação de que o tratamento fitoterápico aumenta a memória.

02,33

z

Se as duas amostras são grandes, você pode usar s1 e s2 no lugar de e .

6. Determine a estatística teste.

7. Tome sua decisão.

8. Interprete sua decisão.

1,9332,07 3,74 1,933

Testando a diferença entre duas médias

(amostras pequenas e independentes)

Seção 8.2

Quando você não pode colher amostras de 30 ou mais itens, você pode usar um teste t, se as duas populações forem normalmente distribuídas. A distribuição amostral depende do fato de as variâncias populacionais serem ou não iguais.

Se as variâncias das duas populações são iguais, você pode combinar ou ‘agrupar’ informação das duas amostras, a fim de formar uma estimativa agrupada do desvio padrão.

g.l. = n1 + n2 – 2O erro padrão é:

Se as variâncias forem diferentes, o erro padrão será:

E o g.l. será o menor entren1 – 1 e n2 – 1.

Testando a diferença entremédias (amostras pequenas)

Cinco pick-ups pequenas e oito SUVs realizaram testes de colisão a cinco milhas por hora. Para as pick-ups, o conserto do pára-choques custou em média US$ 1.520, com um desvio padrão de US$ 403. No caso dos SUVs, o conserto custou uma média de US$ 937, com um desvio padrão de US$ 382. Sendo = 0,05, teste a alegação de que o conserto de pára-choques das pick-ups custa mais que o dos SUVs. Suponha que as variâncias sejam iguais.

Aplicação

Pick-up SUV

n

s

5

1.520

403

8

937

382

1. Estabeleça as hipóteses nula e alternativa.

2. Estabeleça o nível de significância.

3. Identifique a distribuição amostral.

= 0,05.

Como as variâncias são iguais, a distribuição da estatística amostral é uma distribuição t com g.l. = 5 + 8 – 2 = 11.

(alegação)

t t00

1,796

4. Determine o valor crítico.

5. Determine a região de rejeição.

6. Determine aestatística teste.

Se as variâncias forem iguais, determine o valor agrupado.

389,77 389,77(0,570) = 222,203

t = 2,624 cai na região de rejeição. Rejeite a hipótese nula.

Há evidência suficiente para aceitar a alegação de que o conserto de pára-choques das pick-ups custa mais que o dos SUVs.

1,7960t7. Tome sua decisão.

8. Interprete sua decisão.

222,2032,624

Segundo uma imobiliária, não há diferença entre a renda média familiar de dois condomínios. A renda média de 12 famílias do primeiro condomínio é de US$ 48.250, com um desvio padrão de US$ 1.200. No segundo condomínio, 10 famílias têm uma renda média de US$ 50.375, com um desvio padrão de US$ 3.400. Suponha que as rendas sejam normalmente distribuídas e que as variâncias sejam diferentes. Teste a alegação sendo = 0,01.

Aplicação

Como as variâncias são diferentes, a distribuição da estatística amostral é uma distribuição t com g.l. = 9. (A menor amostra tem 10 itens, e 10 – 1 = 9.)

1. Estabeleça as hipóteses nula e alternativa.

2. Estabeleça o nível de significância.

3. Identifique a distribuição amostral.

(alegação)Primeiro Segundo

n

s

12.000

48,250

1.200.000

10.000

50,375

3.400.000

.0,01

3,250–3,250–t0t t00

4. Determine os valores críticos.

5. Determine as regiões de rejeição.

6. Determine a estatística teste.

1.129,60171.2002 3.4002

(48.250 – 50.375)

1129,60171,88

t = –1,881 não cai na região de rejeição. Não rejeite a hipótese nula. (O valor P é 0,087 > 0,01.)

Não há evidência suficiente para rejeitar a alegação de que não há diferença entre as rendas familiares médias dos dois condomínios.

–3,250t

3,2500

7. Tome sua decisão.

8. Interprete sua decisão.

Testando a diferença

entre duas médias(amostras

dependentes)

Seção 8.3

A distribuição amostral de , a média das diferenças, é uma distribuição t com n – 1 graus de liberdade (n é o número de pares.)

Se cada valor de uma amostra puder ser emparelhado com um valor da outra, as amostras serão dependentes.

Calcula-se a diferença, d = x1 – x2, para cada par de dados.

A diferença entre médias: amostras dependentes

x1 x2

x1

x1

x1

x1

x1

x2

x2

x2

x2

x2

O desvio padrão de d é 3,39.A média das diferenças, d, é 59.

A tabela abaixo mostra a freqüência cardíaca (em batidas por minuto) de cinco pessoas antes e depois de uma sessão de exercícios físicos. Há evidência suficiente para se concluir que o exercício acelera a freqüência cardíaca? Use .

Indivíduo12

345

d6263

555857

Antes6572

857893

Depois127135

140136150

0,05

3,39

Aplicação

(Como há cinco pares de dados, g.l.= 5 – 1 = 4.)

1. Estabeleça as hipóteses alternativa e nula.

2. Estabeleça o nível de significância.

3. Identifique a distribuição amostral.

(alegação)

A distribuição da estatística amostral é uma distribuição t com g.l. = 4.

0,05

2,132t t00

4. Determine o valor crítico.

5. Determine a região de rejeição.

6. Determine a estatística teste.

38,923,39

t = 38,92 cai na região de rejeição. Rejeite a hipótese nula. O valor P é muito próximo de 0.

Há evidência suficiente para aceitar a alegação de que o exercício acelera a freqüência cardíaca.

t2,132 t00

7. Tome sua decisão.

8. Interprete sua decisão.

Usando o Minitab

Resultados impressos do Minitab

O valor P é 0,0000. Como 0,0000 < 0,05, rejeitea hipótese nula.

Test of = 0.00 vs > 0.00

Variablediff.

N5

Mean59.00

StDev3.39

SE1.52

Mean5

T38.90

P0.0000

Testando a diferença entre duas proporções

Seção 8.4

A diferença entre proporções

Se as amostras independentes colhidas de duas populações forem grandes o bastante,você pode aplicar um teste para verificar se há diferença entre as proporções populacionais p1 e p2.

x1 e x2 representam o número de sucessos na primeira e na segunda amostra, respectivamente.

n1 e n2 representam o tamanho da primeira e da segunda amostra, respectivamente.

Proporção de sucessos em cada amostra.

Como se supõe que as proporções sejam iguais, uma estimativa para o valor comum será:

e

Teste z de duas amostras

A média é p1 – p2 = 0

Se equivalem, cada um, a pelo menos 5,

a distribuição amostral para é normal.

e o desvio padrão:

A estatística teste padronizada é:

Aplicação

Ensino privado Ensino público

Em um levantamento com 3.420 alunos do ensino médio privado, 917 disseram ter fumado nos 30 dias precedentes. Já em um levantamento com 5.131 alunos do ensino médio público, 1.503 disseram ter fumado nos 30 dias precedentes. Sendo pode-se aceitar a alegação de que a proporção de alunos de escola privada que disseram ter fumado é inferior à proporção dos alunos do sistema público que disseram ter fumado? Use

n2 = 5.131

x2 = 1.503n1 = 3.420x1 = 917

0,01,

0,01.

0,268 0,293

A distribuição da estatística amostral é normal, já quecada um, a pelo menos 5.

equivalem,

1. Estabeleça as hipóteses nula e alternativa.

2. Estabeleça o nível de significância.

3. Identifique a distribuição amostral.

(alegação)

2.420

8.551

2,420

8,5510,283 e 0,717

0,00994

z

Região de rejeição

Valor crítico z0

–2,33 0

5. Determine a região de rejeição.

4. Determine um valor crítico.

6. Determine a estatística teste.

(0,268 – 0,293)

0,00009888

0,25

0,009942,514

z = –2,514 cai na região de rejeição. Rejeite a hipótese nula.

–2,33 0

Há evidência suficiente para aceitar a alegação de que a proporção de estudantes que fumou nos colégios privados é menor que a observada nos públicos.

7. Tome sua decisão.

8. Interprete sua decisão.

Recommended