29
Teste de hipótese Teste de hipótese 1 a) a) Uma Uma população população b) b) Duas Duas populações populações c) c) Três ou mais Três ou mais populações populações

Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Teste de hipóteseTeste de hipótese

1

a) a) UmaUma populaçãopopulação

b) b) DuasDuas populaçõespopulações

c) c) Três ou maisTrês ou mais populaçõespopulações

Page 2: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Teste Teste para comparação de para comparação de duasduas médiasmédias dededuasduas médiasmédias dede

populaçõespopulações normaisnormais

2

Page 3: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

H0: 1 = 2

H1: 1 2

H0: 1 = 2

H : >

H0: 1 – 2 = 0H1: 1 – 2 0

H0: 1 – 2 = 0H : – > 0

t

Teste bilateral

Teste unilateral à direita

3

H1: 1 > 2

H0: 1 = 2

H1: 1 < 2

H1: 1 – 2 > 0

H0: 1 – 2 = 0H1: 1 – 2 < 0

t0

t0

Teste unilateral à esquerda

Page 4: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Comparar as médias de duas populações Comparar as médias de duas populações

a) dependentes

Duas

1º passo:As variáveis estão ou não relacionadas?

2º passo:As variâncias populacionais

são conhecidas?

3º passo:As variâncias populacionais

são iguais?

Var desconhecida

b) independentes

Var conhecidaDuas

populações

b2) variâncias diferentes

b1) variâncias iguais

4

Page 5: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

a) Populações a) Populações dependentesdependentes

observações pareadasobservações pareadas(Teste (Teste tt--pareadopareado))

Teste para comparação de Teste para comparação de duasduas médiasmédiaspopulaçõespopulações normaisnormais

(Teste (Teste tt--pareadopareado))

São comparadas duas médias populacionais sendo que, para cada unidade amostral, realizou-se duas medições da

característica de interesse.

Correspondem a medidas tomadas antes e após uma dada intervenção.

5

Page 6: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Uma distribuidora de combustíveis deseja verificar se um novo tipo de gasolina é eficaz na revitalização de motores velhos. Selecionou-se 12 automóveis de um

mesmo modelo com mais de 8 anos de uso e, após regulagem dos motores, verifica-se a quilometragem média percorrida com 1 litro de combustível (X). Em seguida, o carro é abastecido com o novo tipo de combustível durante 15

semanas e uma nova aferição é feita (Y).

Automóveis

ExemploExemplo

6

Km/L 1 2 3 4 5 6 7 8 9 10 11 12

Antes (X) 8,1 7,9 6,8 7,8 7,6 7,9 5,7 8,4 8,0 9,5 8,0 6,8

Após (Y) 11,6 8,8 9,9 9,5 11,6 9,1 10,6 10,8 13,4 10,6 10,5 11,4

Como o desempenho dos automóveis foi medido antes e depois das 15 semanas, é razoável assumir que exista alguma

dependência entre as variáveis.

Essa é a típica situação que o teste t-pareado

deve ser utilizado.

Page 7: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Automóveis

1 2 3 4 5 6 7 8 9 10 11 12

Antes (X) 8,1 7,9 6,8 7,8 7,6 7,9 5,7 8,4 8,0 9,5 8,0 6,8

Após (Y) 11,6 8,8 9,9 9,5 11,6 9,1 10,6 10,8 13,4 10,6 10,5 11,4

D = Y – X 3,5 0,9 3,1 1,7 4,0 1,2 4,9 2,4 5,4 1,1 2,5 4,6

Obtendo a variável diferença: Di= Yi – Xi

O efeito produzido pelo i-ésimo indivíduo, pode ser representado pela variável:

7

As hipóteses:H0: D = 0 (O novo combustível não aumenta o rendimento) Ha: D > 0 (O novo combustível aumenta o rendimento)

Fixando =5%, determina-se a região crítica, com base na hipótese

alternativa: D

Di= Yi – Xi

Page 8: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Supondo, para i = 1, ..., n, assumimos, por hipótese, que:

Estima-se a média e variância populacional de D por:

1

ˆ1

2

2

n

md

s

n

iDi

D

n

d

m

n

ii

D

nmNm D

D

2

,~ˆ 2,~ DDi mND

8

n

)1(0 ~

ˆ

n

D

DD t

ns

mmt

n

stmmIC D

nDD

2

)2/;1( 1ˆ%; • A estatística do teste de hipótese

é dada por:

• A estimação intervalar para a média será:

Page 9: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

### 2 pop - pareado

X <- c(8.1, 7.9, 6.8, 7.8, 7.6, 7.9, 5.7, 8.4, 8.0, 9.5, 8.0, 6.8) # antesY <- c(11.6, 8.8, 9.9, 9.5, 11.6, 9.1, 10.6, 10.8, 13.4, 10.6, 10.5, 11.4) # aposD <- Y-X # Diferença

t.test(D, paired = F, conf.level = 0.95, alternative='greater')

2 populações dependentespopulações dependentes

Exemplo 2:Exemplo 2: Desempenho dos automóveis medido antes (X) e após (Y) a aplicação do novo tipo de combustível. α = 5%.

t.test(D, paired = F, conf.level = 0.95, alternative='greater')

# One Sample t-test## data: D# t = 6.5396, df = 11, p-value = 2.097e-05# alternative hypothesis: true mean is greater than 0# 95 percent confidence interval:# 2.133833 Inf# sample estimates:# mean of x # 2.941667

9

Page 10: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

ttab = t(11; 5%) =1,796

4846,6

124,2

09,2

calct

• A média e a variância amostrais de D são:

d = 2,9 e s2=2,4.

t(11)

t0

Ao nível de 5% de significância, como tcalc > ttab , rejeitamos H0 e concluímos que o novo combustível é eficaz na melhora do

rendimento, ou seja, aumenta a km.

10

ttab0

Aumenta quanto? Responda essa pergunta ao pesquisador fazendo a tarefa:

Tarefa: Determine o IC(D, 95%) = IC[(1 – 2), 95%] para esse exemplo.

Page 11: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

b) Populações b) Populações independentesindependentes

Teste para comparação de Teste para comparação de duasduas médiasmédiaspopulaçõespopulações normaisnormais

b) Populações b) Populações independentesindependentes

11

Page 12: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Teste Teste para comparação de para comparação de variânciavariância de de duasduas populaçõespopulaçõesvariânciavariância de de duasduas populaçõespopulações

normaisnormais

12

Page 13: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

22 22

1.1.OO Passo: Passo: Defina as hipóteses

Considere uma amostra de uma população ; e),( 211 mN),...,,(

121 nXXX

uma amostra de uma população ,

sendo essas amostras independentes.

),( 222 mN),...,,(

221 nYYY

Teste para comparação das Teste para comparação das variânciavariância de de duasduas populações normaispopulações normais

22

211

22

210

:

:

H

H22

211

22

210

:

:

H

H

2.2.OO Passo: Passo: Sejam e as variâncias amostrais. Sob H0, a estatística dos teste será:21s

2Ys

)1;1(22

21

21~ nnF

s

sV

13

Page 14: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

3.3.OO Passo:Passo: Dado o nível de significância , estabelecer a RR do teste:

v

1 V

vV

1 2

2

v

2

)1( nV ~

Teste para comparação das Teste para comparação das variânciavariância de de duasduas populações normaispopulações normais

4.4.OO Passo:Passo: Determinar os pontos críticos.

5.5.OO Passo:Passo: Concluir o teste.

RR de H0RA de H0

cvV

1cvV

RR de H0RA de H0RR de H0

2cv

14

Page 15: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Digitadores são treinados em uma empresa em duas turmas distintas:

_Na primeira (Turma J) utiliza-se um método japonês,

_Na segunda (Turma A) utiliza-se um método alemão.

Foram escolhidas duas amostras aleatoriamente (uma de cada turma) e mediu-se o

tempo gasto na realização de uma tarefa para cada aluno. Os dados obtidos foram:

ExemploExemplo

Método Tempo (min)

15

Método Tempo (min)

J 10 13 9 10 14 13 10 15 12 10 9 10 13 14

A 15 12 18 16 15 17 17 15 16 17 11 17 14 -

Ao nível de significância de 10%, é possível afirmar que as variância dessas populações são iguais?

nJ = 14, e s2J = 4,1

nA = 13, e s2A = 4,3

Assim, temos:

Page 16: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

221

220

:

:

AJ

AJ

H

H

1.1.OO Passo: Passo: Defina as hipóteses

2.2.OO Passo: Passo: A estatística dos teste é: )1;1(2

2

~ mn

Y

X Fs

sV

ResoluçãoResolução

9535,03,4

1,42

2

A

Jcalc

s

sV

nJ = 14, e s2J = 4,1

n = 13, e s2 = 4,3

= 10%

16

3,4As

)12;13()113;114( FFVtab

nA = 13, e s2A = 4,3

RR de H0RA de H0RR de H0

V%5

%5%90

0,38 2,66

Ao nível de 10% de significância, aceitamos H0 e concluímos que as

variâncias das duas populações treinadas são iguais.

Page 17: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

b.1) Populações b.1) Populações independentes independentes com com

Teste para comparação de Teste para comparação de duasduas médiasmédiaspopulaçõespopulações normaisnormais

variâncias variâncias desconhecidas iguaisdesconhecidas iguais

17

Page 18: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Suponha duas populações, onde os dados para essas populações são variáveisaleatórias independentes (X1, ..., Xn1) e (Y1, ..., Yn2), respectivamente e queseguem a distribuição Normal. Portanto,

Suponha que para ambas as populações temos a mesma variância (desconhecida!!!) .

Queremos testar se existe diferença entre as médias populacionais, ou seja:

Xi ~ N(m1, 12) , i = 1, 2, ..., n1

Yj ~ N(m2, 22) , j = 1, 2, ..., n2

18

Testar se as médias populacionais são iguais é equivalente a testar se a diferença entre elas é “estatisticamente” igual a 0. Logo podemos reescrever as hipóteses em termos de mD = m1 – m2:

H0: m1 = m2

H1: m1 m2 ou H1: m1 < m2 ou H1: m1 > m2

H0: mD = 0H1: mD 0 ou H1: mD < 0 ou H1: mD > 0

Page 19: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Desta forma, usaremos o estimador (intuitivo)

Do TLC tem-se que se n>30

mD = m1 – m2^ ^ ^

1

21

11 ,~ˆn

mNm

2

22

22 ,~ˆn

mNm

e

19

1n 2

Page 20: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Como as amostras são independentes:

21

212121 )ˆ()ˆ()ˆ)1(ˆ()ˆˆ(ˆ

mm

mEmEmmEmmEmE D

22

22

12121 )ˆ()1()ˆ()ˆ)1(ˆ()ˆˆ(ˆ mVarmVarmmVarmmVarmVar D

Como m1 e m2 têm distribuição normal (se n>30) então:

2

22

1

21

21 ,~ˆnn

mmNmD

2

22

1

21

21 )ˆ()ˆ(nn

mVarmVar

20

^ ^

Page 21: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Como 2 é desconhecida, precisará ser estimada.

Como e são estimadores não viciados dessa variância, usaremos como estimativa para 2 uma combinação deles dada por:

21s

22s

é uma média ponderada entre as variâncias das duas populações e é um estimador não viciado!!!

11

11

2

)ˆ()ˆ(

21

222

211

21

1

22

1

21

2

21

nn

snsn

nn

mYmX

s

n

jj

n

ii

C

• A estimação intervalar para a diferença entre as média será:

21

21

2)2/;2(2121

11ˆˆ%;

21 nnstmmmmIC Cnn

• A estimação intervalar para a diferença entre as média será:

)2(

21

2

020121

21~

11

ˆˆ

nn

C

t

nns

mmmmt

•A estatística do teste é dada por:

Page 22: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Digitadores são treinados em uma empresa em duas turmas distintas:

_Na primeira (Turma J) utiliza-se um método japonês,

_Na segunda (Turma A) utiliza-se um método alemão.

Foram escolhidas duas amostras aleatoriamente (uma de cada turma) e mediu-se o

tempo gasto na realização de uma tarefa para cada aluno. Os dados obtidos foram:

ExemploExemplo

22

Método Tempo (min)

J 10 13 9 10 14 13 10 15 12 10 9 10 13 14

A 15 12 18 16 15 17 17 15 16 17 11 17 14 -

Deseja-se comparar os dois métodos ao nível de significância de 10%.

H0: mJ = mA

H1: mJ mA

Page 23: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

### 2 pop – indep, com var =tempo<- c(10, 13, 9, 10, 14, 13, 10, 15, 12, 10, 9, 10, 13, 14,

15, 12, 18, 16, 15, 17, 17, 15, 16, 17, 11, 17, 14)turma<- factor(c(rep("J",14), rep("A",13))); turmatapply(tempo, turma, mean)tapply(tempo, turma, var)

2 populações independentes2 populações independentesccom variâncias iguaisom variâncias iguais

Exemplo 3:Exemplo 3: Deseja-se comparar os dois métodos de digitação ao nível = 1%: método japonês com o método alemão.

t.test(tempo ~ turma, paired = F, var.equal = T, alternative="two.sided", conf.level =0.99)

Two Sample t-test# # data: tempo by turma# t = 4.7965, df = 25, p-value = 6.313e-05# alternative hypothesis: true difference in means is not equal to 0# 99 percent confidence interval:# 1.597201 6.029173# sample estimates:# mean in group A mean in group J # 15.38462 11.57143 23

Page 24: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Voltando ao exemplo:

nJ = 14, mJ = 11,57 e s2J = 4,1

nA = 13, mA = 15,38 e s2A = 4,3

^

^

Método Tempo (min)

J 10 13 9 10 14 13 10 15 12 10 9 10 13 14

A 15 12 18 16 15 17 17 15 16 17 11 17 14 -

Então: md = 11,57 – 15,38 = – 3,81

2,425

3,4*121,4*13

11

11 222

AJ

AAJJC

nn

snsns

24

nA = 13, mA = 15,38 e s2A = 4,3^

^

Page 25: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Fixando = 0,10, como a hipótese alternativa é bilateral e n < 30, a regiãocrítica tem a forma:

Usando a estatística do teste temos:

83,4

13

1

14

12,4

081,3

11

ˆˆ

21

2

0

nns

mmt

C

DDcalc

Conclusão: Como -4,83 pertence a região crítica, concluímos que os métodos de fato diferem a um

nível de significância de 10%.

25

-ttab ttab

ttab = t(25; 10%)

1,7081–1,7081

Page 26: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Teste para comparação de Teste para comparação de duasduas médiasmédiaspopulaçõespopulações normaisnormais

b.2) Populações b.2) Populações independentes independentes com com

26

variâncias variâncias desconhecidas diferentesdesconhecidas diferentes

Page 27: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

O teste para o caso com as variâncias desconhecidas e desiguais é semelhante ao anterior, mas a quantidade a ser usada para aceitar ou rejeitar H0 é:

)(

2

22

1

21

020121 ~ˆˆ

t

n

s

n

s

mmmmt

11 2

2

2

22

2

1

1

21

2

2

22

1

21

n

n

s

n

n

s

n

s

n

s

, sendo

27

11 21 nn

2

22

1

21

)2/;(2121ˆˆ%;

n

s

n

stmmmmIC

Page 28: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

### 2 pop – indep, com var diferentesY <- c( )pop <- factor(c(rep(“pop1",n1), rep(“pop2",n2)))

2 populações independentes2 populações independentesccom variâncias diferentesom variâncias diferentes

ExemploExemplo 44:: Sendo Y a variável resposta observada 2 populações (pop),usando α = 5%

t.test(Y ~ pop, paired = F, var.equal = FALSE, conf.level =0.95)

28

Page 29: Teste de hipótese - Webnode · Teste de hipótese 1 a) Uma população b) Duas populações c) Três ou maispopulações. Teste para comparação de ... # t = 4.7965, df = 25, p-value

Teste de hipóteseTeste de hipótese

29

a) a) UmaUma populaçãopopulação

b) b) DuasDuas populaçõespopulações

c) c) Três ou maisTrês ou mais populaçõespopulações

???? O que fazer ????