58
1 Comparação entre duas populações

Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

1

Comparação entre duas populações

Page 2: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

AMOSTRAS INDEPENDENTES

2

Page 3: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Comparação entre duas médias

3

Page 4: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Na comparação de duas populações, dispomos de duas

amostras, em que são possíveis as seguintes situações:

Em aplicações práticas é comum que o interesse seja

comparar as médias de duas diferentes populações (ambas

as médias são desconhecidas).

variâncias pop. conhecidas

variâncias pop.

desconhecidas

iguais

diferentes

2 amostras

dependentes

independentes

Discutiremos apenas os testes conhecidos como paramétricos, que assumem que as variáveis se comportam segundo um modelo Normal.

Introdução

4

Page 5: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os sexos. Para isso, selecionou uma amostra aleatória de 50 profissionais, sendo 22 do sexo feminino e 28 do sexo masculino. Sabe-se, de estudos anteriores, que o salário de profissionais da saúde segue uma distribuição normal.

Masculino Feminino

4708 4412 4010 3768

4603 3868 4122 3939

4017 4252 4344 4459

4534 4265 4446 3827

4402 4377 3938 4197

4526 4000 4514 4306

4584 3441 3400 3935

4594 4172 4264 3748

4236 4203 3850 3838

4817 4001 3676 4016

4008 4464 3604 4274

4083 4706

3788 4681

4009 4729 5

Page 6: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Exemplo 1

As duas populações, de onde as amostras são provenientes,

são independentes e normalmente distribuídas;

- a população dos salários de profissionais da saúde do sexo

feminino tem média X e variância X2

X ~ N(X, X2)

- a população dos salários de profissionais da saúde do sexo

masculino tem média Y e variância Y2

Y ~ N(Y, Y2)

Interesse: Comparar as médias das duas populações.

6

Page 7: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

• Hipóteses estatísticas:

da pop. normal com média X e desvio padrão X extrai-se

uma a.a. de tamanho n

H0: X = Y

H1: X Y

ou X > Y

ou X < Y

H0: X - Y = 0

H1: X - Y 0

ou X - Y > 0

ou X - Y < 0

ou, equivalentemente,

usando diferenças

X

X

Xs

x

de amostra da padrão desvio

de amostra da média :

:

da pop. normal com média Y e desvio padrão Y extrai-se

uma a.a. de tamanho m

Ys

Yy

Y

:

de amostra da padrão desvio :

de amostra da média

Obs.: note que os números de observações nas 2 amostras,

n e m, não precisam ser iguais. 7

Page 8: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

grupo 1 grupo 2

população média X

Y

desvio padrão X Y

m n tamanho

sY

sX desvio padrão

média

amostra

x y

Situações possíveis com respeito às variâncias X2 e Y

2:

1. conhecidas: teste Z

2. desconhecidas:

- iguais: teste-t de duas amostras

- diferentes: teste-t modificado

Obs.: O teste de comparação de variâncias pode ser utilizado

como um procedimento preliminar em teste de comparação de

médias, auxiliando a escolha da técnica adequada. 8

Page 9: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

CASO 1: variâncias conhecidas

(1) Hipóteses estatísticas:

H0: X = Y

H1: X < Y

H0: X - Y = 0

H1: X - Y < 0

ou, equivalentemente,

usando diferenças

(2) Estatística de teste

Considere o Exemplo 1, dos salários de profissionais da saúde.

Queremos verificar se o salário das mulheres é menor do que o

dos homens.

Como X e Y são

independentes com distribuição normal, com médias X e Y

e desvio padrão X2 e Y

2, respectivamente, então

• Estimador de X - Y : YX -

• Distribuição amostral do estimador:

,

m

σ

n

σμμNYX YX

YX

22

,~9

Page 10: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Se as variâncias são conhecidas, a estatística de teste é

dada por

m

σ

n

σ

YXZ

YX

22

)(

(2) Estatística de teste

Sob H0, Z ~ N(0,1)

(3) Nível de significância: = 5%

(4) Calcular medidas necessárias:

Tamanho da amostra Média

Masculino (Y) 28 4302,87

Feminino (X) 22 4021,68

Informação dada:

X= 280 e Y= 300

10

Page 11: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

(5A) Região crítica (teste unilateral inferior)

(6A) Decidir e Concluir

A região crítica deve ter a forma: RC = { Z ≤ ztab } ztab = ?

Da tabela da N(0,1), com = 5%, ztab= -1,64

RC = { Z ≤ -1,64}

(4) Calcular medidas necessárias:

415,333,82

19,281

28

300

22

280

87,430268,4021

22

)(obsz

zobs= -3,415 RC rejeita-se H0

(5B) Nível descritivo P

P = P(Z ≤ -3,415) = 0,0003.

(6B) Decidir e Concluir P < rejeita-se H0 11

Page 12: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

A média dos salários das mulheres é menor do que a dos

homens. Quanto menor?

• Intervalo de confiança para a diferença X-Y:

mnzYX

mnzYXP

z

mn

YXzPzZzP

YXtabYX

YXtab

tab

YX

YXtabtabtab

2222

22

)()(

)(

No exemplo:

IC(X-Y;10%) = (-281,19-1,6482,33; -281,19+1,6482,33;)

= (-416,21;-146,17) 12

Page 13: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

CASO 2: variâncias desconhecidas, iguais

(1) Hipóteses estatísticas:

H0: X = Y

H1: X < Y

H0: X - Y = 0

H1: X - Y < 0

ou, equivalentemente,

usando diferenças

(2) Estatística de teste

Exemplo 1: salário de profissionais da saúde. Queremos verificar

se o salário das mulheres é menor do que o dos homens.

Suponha agora: NÃO CONHECEMOS AS VARIÂNCIAS. Temos

apenas a informação de que SÃO IGUAIS (x= Y= ), mas não

sabemos o valor.

Temos que:

,11

mnσμμN

m

σ

n

σμμNYX

YX

YXYX

2

22

,~

,~

13

Page 14: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Assim, )( 1 0,

11

)()(

2

N

mnσ

μμYXZ YX ~

. 2

1)(1)( 222

mn

smsns YX

p

Não conhecemos , precisamos estimar por:

- A estimativa sp2 combina informação de ambas amostras

para se produzir uma estimativa mais confiável de 2;

- Na verdade, sp2 é média ponderada das duas variâncias

amostrais sX2 e sY

2, onde cada variância é ponderada pelos

seus graus de liberdade associados;

- Se n é igual a m, sp2 é a média aritmética simples; caso

contrário, maior peso é dado à variância da maior amostra. 14

Page 15: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

(2) Estatística de teste

)mn

S

YXT

p

11(

)(

2

(3) Nível de significância: = 5%

(4) Calcular medidas necessárias:

Tamanho da amostra Média Desvio padrão

Masculino 28 4302,87 335,74

Feminino 22 4021,68 301,08

s2p= [(22-1)301,082+(28-1)335,742] / (22+28-2) = 103.065

sp = 321,037

Sob H0, T ~ t (n+m-2).

15

Page 16: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

, 3,074-

)28

1

22

1(321,037

4302,87)021,68(

4 obsT

(5A) Região crítica

(6A) Decidir e Concluir

A região crítica deve ter a forma: RC = { T ≤ ttab } ttab = ?

Da tabela da t(48 g.l.), com = 5%, ttab= -1,68

RC = {T ≤ -1,68}

Tobs = -3,074 RC rejeita-se H0

(5B) Nível descritivo P

P= P(T48

≤ -3,074) = 0,0017

(6B) Decidir e Concluir P < rejeita-se H0 16

Page 17: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

• Intervalo de confiança para a diferença X-Y:

No exemplo:

IC(X-Y; 10%) =

= (-281,19-1,68321,0370,285; -281,19+1,68321,0370,285)

= (-434,85;-127,53).

em que ttab é obtido da tabela t com (n+m-2) graus de

liberdade.

17

Page 18: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

CASO 3: variâncias desconhecidas, diferentes

(1) Hipóteses estatísticas:

H0: X = Y

H1: X < Y

H0: X - Y = 0

H1: X - Y < 0

ou, equivalentemente,

usando diferenças

(2) Estatística de teste

Exemplo 1: salário de profissionais da saúde. Queremos verificar

se o salário das mulheres é menor do que o dos homens.

Suponha agora: NÃO CONHECEMOS AS VARIÂNCIAS E

SABEMOS QUE SÃO DIFERENTES (x Y ).

Temos que:

m

σ

n

σμμN~YX YX

YX

22

,

18

Page 19: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Assim, )(

221 0,

)()(N

m

σ

n

σ

μμYXZ

YX

YX ~

Não conhecemos X2 e Y

2 estimamos por sx2 e sY

2.

Finalmente, a estatística de teste, sob H0, é

.

)(

)(22

m

S

n

S

YXT

YX

. / 1)]()(1)()[(

)]()[(22

222

mmsnns

msns

YX

YX

///

//22

Sob H0, T ~ t(), em que é o número de graus de liberdade

dado por

19

Page 20: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

(3) Nível de significância: = 5%

(4) Calcular medidas necessárias:

, -

,,

,,tobs 123

28

74335

22

08301

874302684021

22

.1471)]/(28/28)(335,741)/(22/22)[(301,08

/28)](335,74/22)[(301,082222

222

,

Assim, usamos 47.

20

Tamanho da amostra Média Desvio padrão

Masculino 28 4302,87 335,74

Feminino 22 4021,68 301,08

Page 21: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

(5A) Região crítica

(6A) Decidir e Concluir

A região crítica deve ter a forma: RC = {T ≤ ttab} ttab = ?

Da tabela da t(47 g.l.), com = 5%, ttab= -1,68

RC = { T ≤ -1,68}

tobs = -3,12 RC rejeita-se H0

(5B) Nível descritivo P

P = P(T47

≤ -3,12) = 0,0015

(6B) Decidir e Concluir

P < rejeita-se H0

21

Page 22: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

• Intervalo de confiança para a diferença X - Y:

No exemplo:

IC(X-Y;10%) = (-281,19-1,6890,26; -281,19+1,6890,26)

= (-432,82; -129,56).

em que ttab é obtido da tabela t com graus de liberdade.

22

Page 23: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Comparação entre duas variâncias

23

Page 24: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Um teste de hipóteses importante consiste em verificar se duas populações têm a mesma variância.

Considere uma amostra X1, ...,Xn de uma população com

distribuição N(X, X2) e uma amostra Y1, ...,Ym de uma

população com distribuição N(Y, Y2). Suponha que as duas

amostras sejam independentes.

(1) Hipóteses estatísticas:

(2) Estatística de teste

Se SX2 e SY

2 são as variâncias amostrais respectivas, então a

estatística do teste é

2

2

Y

X

S

SF

H0: 2

X = 2Y

H1: X2 Y

2 ou X2 > Y

2 ou X2 < Y

2

24

Qual é a distribuição de probabilidade de F ?

Page 25: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Se a hipótese nula H0 é verdadeira (X2 = Y

2), a estatística

F possui distribuição de probabilidade F de Snedecor com

n-1 graus de liberdade no numerador e m-1 graus de

liberdade no denominador.

2

)1(~

n

X

X

σ

SnU

2

21

Resultado:

Sejam X ~ N(X, X2) e Y ~ N(Y, Y

2), independentes. Para

amostras aleatórias X1, X2, ..., Xn, de X e Y1, Y2, ..., Ym, de Y,

temos

2

)1(~

m

Y

Y

σ

SmV

2

21

)1;1(~1

1

mnF

mV

nU

S

SF

Y

X

2

2

Se X2 = Y

2, então

25

Page 26: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Obtenção dos valores críticos: Teste bilateral

• Para fixado, encontre na tabela F(n-1; m-1) um valor f2

tal que P(F (n-1; m-1) > f2) = /2 e

• Para fixado, encontre na tabela F(m-1; n-1) (observe

que os g.l. foram trocados) um valor g1 tal que P(F (m-1;

n-1) > g1) = /2 e calculamos f1=1/g1.

(3) Nível de significância:

(4) Calcular medidas necessárias:

Obter SX2 e SY

2, as variâncias amostrais, e calcular F.

(5A) Região crítica

Se H1: X2 > Y

2 ,

Se H1: X2 < Y

2 ,

Se H1: X2 Y

2 ,

RC = {F: F < f }

RC = {F: F < f1 ou F > f2 }

RC = {F: F > f }

26

tabela

Page 27: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

(5B) Nível Descritivo

P = P(F(n-1; m-1) < Fobs)

P = 2 P(F(n-1; m-1) > Fobs) ou

P = 2 P(F(n-1; m-1) < Fobs)

P = P(F(n-1; m-1) > Fobs)

(6) Decidir e concluir

(A) Se Fobs RC, rejeita-se H0

Se Fobs RC, não se rejeita H0

(B) Se P rejeita-se H0

Se P > não se rejeita H0

27

Se H1: X2 Y

2 ,

Se H1: X2 > Y

2 ,

Se H1: X2

< Y2 ,

Page 28: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

28

Intervalo de confiança para o quociente Y2/X

2

com coeficiente de confiança

2

2

22

2

2

2

1222

22

1

2121

1

1)1;1(

X

Y

X

Y

X

Y

YY

XX

S

Sf

S

SfPf

S

SfP

fmV

nUfPfmnFfP

Page 29: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

29

Considere o Exemplo 1, dos salários de profissionais da saúde.

Queremos verificar se a variabilidade do salário das mulheres é

igual à dos homens.

(1) Hipóteses estatísticas: H0: M2 F

2

H1: M2

F2

(2) Estatística de teste

Se SM2 e SF

2 são as variâncias amostrais respectivas,

então a estatística do teste é

27) ;21( ~ 2

2

FS

SF

M

F

(3) Nível de significância = 5%.

(4) Calcular as medidas necessárias

SM = 335,74 e SF = 301,08 804,0 74,335

08,3012

2

obsF

Page 30: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

(5A) Região crítica RC = {F : F < f1 ou F > f2 },

sendo f1 e f2 obtidos por

f2 : encontre na tabela F(21; 27) o valor f2 tal que

P(F(21;27) > f2) = 0,025 f2 = 2,25 (aprox.) e

f1 : encontre na tabela F(27; 21) um valor g1 tal que

P(F (27; 21) > g1) = 0,025 e calculamos f1=1/g1=1/2,34 = 0,427

RC = {F : F < 0,427 ou F > 2,25 },

(6) Decidir e concluir

Fobs = 0,804 RC não se rejeita H0

(5B) Nível descritivo

P = 2 P(F(21; 27) < 0,804) = 2 (1- 0,69) = 0,62 >

não se rejeita H0 30

Dist F

Page 31: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

31

Intervalo de confiança de 95% para o quociente Y2/X

2 :

O valor “1” IC, como esperado.

Page 32: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Comparação entre duas proporções

32

Page 33: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Como vimos para a média, muito frequentemente, podemos estar interessados na comparação de duas proporções de duas populações independentes.

(1) Hipóteses estatísticas: H0: p1 = p2

H1: p1 p2 ou p1 > p2 ou p1 < p2

extraímos uma uma a.a. de tamanho n1 de uma população

com proporção p1; se observamos x1 sucessos na amostra,

então ).ˆ

1

1

11 de pontual (estimador p

n

Xp

Analogamente, selecionamos uma amostra de tamanho n2

da população com proporção p2 e se observamos x2 sucessos,

então ).ˆ

2

2

22 de pontual (estimador p

n

Xp

(2) Estatística de teste

33

Page 34: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

21

2211

nn

pnpnp

ˆˆˆ

A quantidade é uma média ponderada das duas proporções

das amostras, e . p̂

21 pp ˆ ˆ

. 21

2 1

nn

XX

21ˆ - ˆ pp

2

2

1

1121

2121

)))ˆˆ

)ˆˆ

n

pp

n

ppppVar

ppppE

(1(1(

(

2

Se a hipótese nula é verdadeira, temos que p1 = p2 = p, os dados de ambas as amostras podem ser combinados para estimar esse parâmetro comum p, por

34

Page 35: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

)11

)( - (121 nn

pp ˆˆ

Sob a hipótese nula H0, o estimador do erro padrão da

diferença é dado por: 21 p- p ˆ ˆ

• Estatística do teste:

)11

)((1

)(

21

21

nnpp

ppZ

ˆˆ

ˆˆ

Se n1 e n2 são suficientemente grandes, essa estatística,

sob H0, tem uma distribuição normal com média 0 e desvio

padrão 1.

35

Page 36: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

(3) Nível de significância:

(4) Calcular medidas necessárias

(5A) Região crítica

(5B) Nível Descritivo

(6) Decidir e concluir

(A) Se Zobs RC, rejeita-se H0

Se Zobs RC, não se rejeita H0

(B) Se P rejeita-se H0

Se P > não se rejeita H0

36

Page 37: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Exemplo 2 : Para investigar a lealdade de consumidores a um

determinado produto, sorteou-se uma amostra de 200 homens

e 200 mulheres. Foram classificados como tendo alto grau de

fidelidade 100 homens e 120 mulheres. Os dados trazem

evidências de diferença de grau de fidelidade entre os

gêneros? Em caso afirmativo, construa um intervalo de

confiança para a diferença.

37

Sejam: pH: proporção de homens com alto grau de fidelidade

pM: proporção de mulheres com alto grau de fidelidade

Page 38: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

H0: pH = pM

H1: pH pM ,

(1) Hipóteses estatísticas:

(2) Estatística do teste

(3) Fixar o nível de significância do teste : = 5%

)11

)((1

)(

MH

MH

nnpp

ppZ

ˆˆ

ˆˆ

sendo

MH

MMHH

nn

pnpnp

ˆˆˆ

38

Page 39: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

nH = 200 100 com alto grau de fidelidade

0,5200

100ˆ

Hp

0,6200

120ˆ

Mp

nM = 200 120 com alto grau de fidelidade

(4) Calcular as medidas necessárias

• Valor da estatística do teste:

01,2

20020055,055,0

6,050

11)(1

)(

,zobs

0,55

200200

6,02005,0200p̂

39

Page 40: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

P = 2 P(Z -2,01) = 0,044

(5A) Região crítica (teste bilateral)

(5B) Nível Descritivo

= 5% RC = {Z : Z < -1,96 ou Z > 1,96 }

(6) Decidir e concluir

(A) zobs= -2,01 RC, rejeita-se H0

(B) Se P rejeita-se H0

40

Page 41: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

MH pp ˆ ˆ - fornece uma estimativa por ponto para a

verdadeira diferença pH – pM das proporções

populacionais.

ˆˆˆˆ

ˆˆ

M

MM

H

HHMH

n

pp

n

pppp

)(1)(11,96 -

Um intervalo de confiança de 95% para a diferença

pH - pM, usando a aproximação normal, é

Note que o erro padrão da diferença das proporções amostrais

não é o mesmo que aquele usado no teste;

no teste de hipóteses, o erro padrão empregado foi baseado

na suposição de que a hipótese nula era verdadeira (pH=pM =p);

essa suposição não é necessária no cálculo de um intervalo de

confiança.

41

Page 42: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

0,5Hp̂No exemplo, como e , um intervalo de

confiança aproximado de 95% para pH – pM é

0,6Mp̂

)03,0 ;197,0(

)097,01,0 ;097,01,0(

200

)6,01(6,0

200

)5,01(5,096,1 )6,05,0(

Note que, como esperado, o intervalo não contém o valor zero.

42

Page 43: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

AMOSTRAS DEPENDENTES (teste t-pareado)

43

Page 44: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

característica das amostras dependentes (pareadas):

para cada unidade amostral realizamos duas medições.

As medidas são tomadas em um único “indivíduo” em dois

pontos distintos no tempo.

Em geral, observações pareadas correspondem a medidas

tomadas antes e depois de uma dada intervenção -- cada

indivíduo é examinado antes que um certo tratamento seja

aplicado e novamente depois que o tratamento foi completado.

Outro tipo de emparelhamento: o pesquisador “casa” os

indivíduos de um grupo com aqueles de um segundo grupo, de

modo que os membros de um par sejam parecidos (em

relação a características, tais como, a idade e o gênero).

44

Page 45: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Planejamento empregado na tentativa de se controlar

fontes de variação que poderiam influenciar os resultados

da comparação.

Se as medidas são feitas no mesmo sujeito uma certa variabilidade biológica é eliminada -- não temos que nos preocupar com o fato de um sujeito ser mais velho do que outro ou se um é homem e o outro é mulher.

A intenção do emparelhamento é, portanto, fazer uma comparação mais precisa.

45

Page 46: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Exemplo 3: Uma empresa deseja estudar o efeito de uma pausa de

dez minutos para um cafezinho sobre a produtividade de seus

trabalhadores. Para isso, sorteou seis operários, e contou o número

de peças produzidas durante uma semana sem intervalo e uma

semana com intervalo. Os resultados sugerem se há ou não melhora

na produtividade? Caso haja melhora, qual deve ser o acréscimo

médio de produção para todos os trabalhadores da fábrica?

Xi : número de peças produzidas pelo operário i na semana sem intervalo

Operário 1 2 3 4 5 6

Sem intervalo 23 35 29 33 43 32

Com intervalo 28 38 29 37 42 30

Yi : número de peças produzidas pelo operário i na semana com intervalo

46

Page 47: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Efeito do emparelhamento:

eliminar quaisquer distorções que poderiam ser introduzidas

ao se comparar indivíduos que diferem com relação a outras

variáveis, como idade, sexo, peso, etc.

Suponha que os dois grupos de observações possam ser dispostos como a seguir:

Variável de interesse: D = Y – X ,

e uma amostra de D é d1, d2, ...dn (as diferenças amostrais).

Amostra 1 Amostra 2

x1 y1

x2 y2

... ...

xn yn

di = yi - xi

d1 = y1 - x1

d2 = y2 - x 2

...

dn = yn - xn

47

Page 48: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

H0: D = 0

H1: D 0 ou

D < 0 ou

D > 0

O efeito produzido para o i-ésimo indivíduo pode ser

representado pela variável diferença Di = Yi - Xi (“com”–“sem”)

Supondo Di N(D, D2), para i = 1, ..., n,

numa situação geral, queremos testar as hipóteses:

a pausa para o café não produz efeito

A pausa aumenta a

produtividade média

a pausa para o café produz algum efeito

48

Page 49: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

O parâmetro D é estimado pela média amostral das diferenças:

Como não temos informação sobre a variância das diferenças,

estimamos seu valor por SD2, dado por:

n

i

iDn

D1

1

2

1

2 )(1

1DD

nS i

n

i

D

Estatística do teste: nS

DT

D

Sob H0, a estaística T tem distribuição t-Student com

n-1 graus de liberdade.

49

Page 50: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

• A média da amostra fornece uma estimativa por ponto para a

verdadeira diferença das médias das populações D Y - X.

• Em geral supomos que X e Y têm distribuição normal e,

consequentemente, podemos considerar que a distribuição

das diferenças tem distribuição normal.

Obs.: no caso geral, é necessário uma verificação da

suposição de normalidade da diferença Y-X pela análise gráfica

e/ou testes de hipóteses. Se a normalidade não é válida, esse

teste t não se aplica e técnicas não paramétricas de análise

são necessárias.

Comentários

50

Page 51: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Voltando ao exemplo,

gostaríamos de saber se há alguma evidência estatística de

que a pausa para o café aumenta a produtividade.

(1) Hipóteses:

H0: D = 0

H1: D > 0 (“com”-”sem”)

que equivale a H0: X = Y

H1: Y > X

(2) Estatística de teste: . ,~ 0)1( HtnS

DT n

D

sob

(3) Nível de significância: = 5%.

51

Page 52: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Amostra de pares di = yi - xi: 5, 3, 0, 4, -1, -2

(média amostral das diferenças)

(desvio padrão das diferenças)

516

9

6

6

1 ,

d

d i

i

88,2

)(6

1

2

1-6 i

i

D

dd

s

(4) Calcular medidas necessárias

27616882

51,

,

,tobs

Sob a hipótese nula H0,

T tem distribuição t-Student com 6 -1 = 5 graus de liberdade.

(5A) Região Crítica

= 5% RC = {T : T5 2,015 } 52

Page 53: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

(5B) Nível descritivo:

P(T 1,276) 0,15 (valor exato: 0,129)

não há evidência experimental para concluirmos que a pausa para um cafezinho melhora a produtividade média..

(6) Decidir e concluir

(A) tobs = 1,276 RC não se rejeita H0

(B) P > não se rejeita H0

53

Page 54: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Se a hipótese nula H0 é rejeitada:

Interesse: Encontrar um intervalo de confiança para D

esperado. como ,zero"" o contem caso, neste que,

), 3,87 0,87; - (

) 2,371,5 ; 2,371,5 (

)6

2,882,0151,5 ;

6

2,882,0151,5 (90%) ;(

DμIC

)(%)(n

std

n

stdμIC D

nD

nD 1- 1- ; ;

54

Page 55: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

55

volta

Page 56: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

56

volta

Page 57: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

Tabela da distribuição t-Student

tabela

Page 58: Comparação entre duas populações - IME-USPlane/home/MAE0261/Comparacao2pop.pdf · Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os

58

0 1 2 3 4 5 6 7 8 9

0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359

0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753

0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141

0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517

0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879

0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224

0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549

0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852

0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133

0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389

1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621

1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830

1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015

1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177

1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319

1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441

1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545

1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633

1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706

1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767

2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817

2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857

2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890

2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916

2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936

2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952

2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964

2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974

2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981

2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986

3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993

3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995

3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997

3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998

3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998

3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999

3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999

3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999

3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

Distribuição Normal : Valores de P( Z < z ) = A(z)

Segunda decimal de z

Parte

inte

ira e

prim

eira

dec

imal

de

z