57
Projetos de experimentos com um fator e vários níveis •Projetos completamente aleatorizados •Análise de variância (ANOVA) com um fator Fonte Principal: Pedro Alberto Barbetta (INE - UFSC) www.inf.ufsc.br/~barbetta [email protected]

Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Embed Size (px)

Citation preview

Page 1: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Projetos de experimentos

com um fator e vários níveis

•Projetos completamente aleatorizados•Análise de variância (ANOVA) com um fator

Fonte Principal: Pedro Alberto Barbetta (INE - UFSC)

www.inf.ufsc.br/~barbetta

[email protected]

Page 2: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Porque ANOVA ?

Page 3: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Não Podemos Comparar 2 a 2 ?

Page 4: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Probabilidade de Ocorrer Erro do Tipo I =

A Probabilidade Prob de ocorrer k erros do tipo I em n comparações é dada por:

n kn kkprob k C p 1 p

Probabilidade de ocorrer erros do tipo I:

prob(Erro Tipo I)=prob(1)+prob(2)+...+prob(n)

No exemplo:

prob(Erro Tipo I) =

Page 5: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Exemplo 1: Comparação de três tipos de rede.

• Considere o problema de comparar 3 tipos de rede de

computadores, C1, C2 e C3, em termos do tempo médio

de transmissão de pacotes de dados entre duas

máquinas.

• Experimento (projeto completamente aleatorizado

com um fator): 8 replicações com cada tipo de rede,

aleatorizando a ordem dos 24 ensaios e mantendo fixos

os demais fatores controláveis.

Page 6: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Exemplo 1: Projeto do experimento.

Seqüência número Uso da

dos testes do ensaio rede

1 16 C2

2 14 C2

3 24 C3

4 6 C1

... ... ...

24 11 C3

ensaios de 1 a 8: C1ensaios de 9 a 16: C2ensaios de 17 a 24: C3

Page 7: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Exemplo 1. Dados do experimento:

Seqüência número Tempo de

dos testes do ensaio Rede resposta (y)

1 16 C2 7,8

2 14 C2 8,2

3 24 C3 6,3

4 6 C1 7,2

... ... ... ...

24 11 C2 7,8

Page 8: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Exemplo 1: Perguntas a serem respondidas pela análise estatística.

• Existe diferença real (significativa) entre os 3 tipos de rede?

• Qual é a estimativa do tempo de resposta para cada tipo de rede?

Page 9: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Dados do experimento

Tipo de rede

Replicação C1 C2 C3

1 7,2 7,8 6,3

2 9,3 8,2 6,0

3 8,7 7,1 5,3

4 8,9 8,6 5,1

5 7,6 8,7 6,2

6 7,2 8,2 5,2

7 8,8 7,1 7,2

8 8,0 7,8 6,8

Soma 65,7 63,5 48,1

Média 8,21 7,94 6,01

Page 10: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Notação: (g = 3 tratamentos)

tratamento

(1) (2) (3)

y11 y21 y31

y12 y22 y32

... ... ...

y1n y2n y3n

Média: .1y .2y .3y

Médiaglobal:

..yEstatísticas

Dados

Estatística: função dos elementos da amostra(são estimadores de certos parâmetros de interesse)

Page 11: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Parâmetros: valores reais, mas geralmente desconhecidos

tempo esperado (médio) de resposta;

i tempo esperado (médio) de resposta

sob o tratamento i;

i = i - efeito devido ao tratamento i.

Page 12: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Parâmetros: valores reais, mas geralmente desconhecidos

• Se Y é a variável aleatória que representa a observação do tempo de resposta, tem-se que Y deve ter uma certa densidade de probabilidade f. O parâmetro é o valor esperado desta distribuição: = E{Y}.

• Analogamente: 2 = Var{Y}

• Yi = observação sob o tratamento i, então

i = E{Yi} , i2 = Var{Yi} e i = E{Yi - Y}

Page 13: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

tratamento

(1) (2) (3)

y11 y21 y31

y12 y22 y32

... ... ...

y1n y2n y3n

Média: .1y .2y .3y

Médiaglobal:

..yEstatísticas

Parâmetros 1 2 3

O efeito i = i - pode ser estimado pela estatística:

... yyi

Estimativas de

Page 14: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

tratamento

(1) (2) (3)

y11 y21 y31

y12 y22 y32

... ... ...

y1n y2n y3n

Média: .1y .2y .3y

Médiaglobal:

..y

ijiij ey i = 1, 2, 3j = 1, 2, ..., n

observaçãoefeito do tratamento i

médiaglobal

erro aleatório

= média do fator iii

Page 15: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Hipóteses

• H0: 1 = 2 =...= g = 0 ou µ1 = µ2 =...= µg

• H1: i 0 ou µi µj

para algum i para algum par (i,j)

ijiij ey ijij ey

As observaçõesSob H1: Sob H0:

Page 16: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Sob H0: 1 = 2 =...= g = 0

ijiij ey ijij ey

Page 17: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Sob H1: i 0 para algum i

ijiij ey

Page 18: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Suposições da ANOVA

• As observações são independentes e provêm de distribuições normais com a mesma variância.

• Observa-se que o teste é razoavelmente robusto a estas suposições.

Page 19: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Análise de variância (ANOVA) com um fator

Tratamento

Replicação 1 2 ... g

1 y11 y21... yg1

2 y12 y22... yg2

... ... ... ... ...

n y1n y2n... ygn

Soma y1. y2.... yg.

Média ...

i

iyy ...

.1y .2y .gy i

iyg

y .1

..

g

i

n

jijTot yySQ

1 1

2..

gl = N - 1onde: N = ng

Soma de quadrados total: Graus de liberdade:

Page 20: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Análise de variância (ANOVA) com um fator

Tratamento

Replicação 1 2 ... g

1 y11 y21... yg1

2 y12 y22... yg2

... ... ... ... ...

n y1n y2n... ygn

Soma y1. y2.... yg.

Média ...

i

iyy ...

.1y .2y .gy i

iyg

y .1

..

gl = g - 1

g

ii

g

i

n

jiTrat yynyySQ

1

2...

1 1

2...

Soma de quadrados dos tratamentos: Graus de liberdade:

Page 21: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Análise de variância (ANOVA) com um fator

Tratamento

Replicação 1 2 ... g

1 y11 y21... yg1

2 y12 y22... yg2

... ... ... ... ...

n y1n y2n... ygn

Soma y1. y2.... yg.

Média ...

i

iyy ...

.1y .2y .gy i

iyg

y .1

..

gl = N - g

g

i

n

jiijErro yySQ

1 1

2.

Soma de quadrados do erro: Graus de liberdade:

Page 22: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Análise de variância (ANOVA) com um fator

Fórmulas equivalente às anteriores

Erro

Trat

QM

QMF

Estatística do teste (possíveis valores da razão f):

Page 23: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Graficamente

Page 24: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Graficamente

Page 25: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Teste F• Se H0: 1 = 2 =...= g = 0 for verdadeira, a estatística F tem

distribuição F com (g - 1) graus de liberdade no

numerador e (N - g) graus de liberdade no denominador.Densidade de probabilidade F

possíveis valores da estatística F, sob H 0

dens

idad

e de

pro

babi

lidad

e

0,00

0,25

0,50

0,75

0 1 2 3 4

f

valor p

Page 26: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Regra de decisão

• p

• p >

rejeita H0 (prova-se

estatisticamente H1)

aceita H0 (os dados não

mostram evidência para

afirmar H1)

= nível de significância (probab. tolerável de se rejeitar Ho quando esta for verdadeira)

Usual: = 0,05 = 5%

Page 27: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Exemplo 1: Comparação de três tipos de rede.

• Considere o problema de comparar 3 tipos de rede de

computadores, C1, C2 e C3, em termos do tempo médio

de transmissão de pacotes de dados entre duas

máquinas.

• Experimento (projeto completamente aleatorizado

com um fator): 8 replicações com cada tipo de rede,

aleatorizando a ordem dos 24 ensaios e mantendo fixos

os demais fatores controláveis.

Page 28: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Dados do experimento

Tipo de rede

Replicação C1 C2 C3

1 7,2 7,8 6,3

2 9,3 8,2 6,0

3 8,7 7,1 5,3

4 8,9 8,6 5,1

5 7,6 8,7 6,2

6 7,2 8,2 5,2

7 8,8 7,1 7,2

8 8,0 7,8 6,8

Soma 65,7 63,5 48,1

Média 8,21 7,94 6,01

Page 29: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Exemplo 1Análise de variância (ANOVA)

O teste F rejeita H0, ou seja, existe alguma diferença significativa entre os tratamentos

Fonte da variação SQ gl QM f

Entre grupos 22,99 2 11,50 21,07

Dentro dos grupos 11,46 21 0,55

Total 34,45 23

f = 21,07 valor p < 0,01

Page 30: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Verificação das suposições: análise dos resíduos

(i = 1, 2, ..., g; j = 1, 2, ..., n).iijij yye Resíduos:

  Tempo de resposta Resíduos

Replicação C1 C2 C3 C1 C2 C3

1 7,2 7,8 6,3 -1,01 -0,14 0,29

2 9,3 8,2 6 1,09 0,26 -0,01

3 8,7 7,1 5,3 0,49 -0,84 -0,71

4 8,9 8,6 5,1 0,69 0,66 -0,91

5 7,6 8,7 6,2 -0,61 0,76 0,19

6 7,2 8,2 5,2 -1,01 0,26 -0,81

7 8,8 7,1 7,2 0,59 -0,84 1,19

8 8 7,8 6,8 -0,21 -0,14 0,79

Média 8,21 7,94 6,01 0,00 0,00 0,00

Page 31: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Verificação das suposições: análise dos resíduos

Resíduos x fator

C1 C2 C3

Rede

-1,5

-1,0

-0,5

0,0

0,5

1,0

1,5

Res

íduo

s

Page 32: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Verificação das suposições: análise dos resíduos

Gráfico de probabilidade normal

-1 0 1

Resíduos

-3

-2

-1

0

1

2

3

Val

or e

sper

ado

pela

nor

mal

0,01

0,05

0,15

0,35

0,55

0,75

0,95

0,99

Page 33: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Verificação das suposições: Normalidade

Kolmogorov-Smirnov

Jarque-Beta

D’Agostino-Pearson

Shapiro-Wilk

Lilliefors

Anderson-Darling

Cramer-von Mises

Page 34: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Verificação das suposições: Normalidade Kolmogorov-Smirnov

máx máx1

D g2n

Estatística do Teste

i 0,5g F z F

0,5

i 0,5F

n

gmáx : maior valor calculado de g;

n : tamanho da amostra ou número de parcelas.

F(zi): função de distribuição normal acumulada;

i: número da amostra;

Page 35: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Normalidade Kolmogorov-Smirnov

Tabela 2.2. Valores Críticos da Distribuição Dn

Page 36: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Verificação das suposições: Kolmogorov-Smirnov

Para n>40

Page 37: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Verificação das suposições: Normalidade Shapiro-Wilk

Estatística do Teste

1 – Ordenar em ordem crescente as n observações da amostra2 – Calcular:

3 – Calcular:

Se N é ímpar, despreza-se a observação mediana

Page 38: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Normalidade Shapiro-Wilk

Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.

Page 39: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Normalidade Shapiro-Wilk

Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.

Page 40: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Normalidade Shapiro-Wilk

Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.

Page 41: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Normalidade Shapiro-Wilk

Page 42: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Normalidade Shapiro-Wilk

4 – Calcular a estatística de teste:.

Page 43: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Valores Críticos da Distribuição W da Estatística Shapiro-Wi

Page 44: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Normalidade D’Agostino-Pearson

Page 45: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Normalidade D’Agostino-Pearson

Page 46: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Normalidade D’Agostino-Pearson

Page 47: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Teste de HomocedasticidadeTeste de Hartley

Estatística do Teste:

2max

max 2min

SF

S

onde Smax e Smin são, respectivamente, os valores

máximo e mínimo de desvio padrão estimados para as n amostras.

Rejeitar H0 se Fmax > F(,a,N-1)

Page 48: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Teste de HomocedasticidadeTeste de Cochran

Estatística do Teste:

Rejeitar H0 se C > C(,a,N-1), com:

2max

a2i

i 1

SC

S

1

C( ,a, n)1 a 1 F (1 ) / a, (a 1)*a,n

Page 49: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Teste de HomocedasticidadeTeste de Bartlett

Estatística do Teste:

onde é o índice de significância do teste, a é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra.

Rejeitar H0 se 2 2c a 1

2i i 2

i i ii2

c

i i

n 1 Sn 1 ln n 1 ln S

n 1

1 1 11

3 a 1 n 1 n 1

Page 50: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Teste de HomocedasticidadeTeste de Levene

Estatística do Teste:

onde é o índice de significância do teste, k é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra.

Rejeitar H0 se

Page 51: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Estimação das médias

 Tempo de resposta

  C1 C2 C3

Média 8,21 7,94 6,01

Médias amostrais sob cada tratamento:

Page 52: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Estimação das médias

n

QMtyIC erro

ii .),(

Fonte da variação SQ gl QM f

Entre grupos 22,99 2 11,50 21,07

Dentro dos grupos 11,46 21 0,55

Total 34,45 23

ANOVA:

55,021,88

55,008,221,8%)95,( 1 IC

Page 53: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Estimação das médias

C1 C2 C3

Rede

5,0

5,5

6,0

6,5

7,0

7,5

8,0

8,5

9,0

9,5

Te

mp

o d

e t

ran

sm

issã

o

Estimativas, através de intervalos de 95% de confiança, para o tempo esperado de transmissão, em três tipos de rede.

Page 54: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

O teste consiste em calcular um valor (Dcrít), acima do qual, a diferença entre duas médias amostrais (em absoluto) é significativamente diferente de zero.

, 1 1

2Tr n r

críti j

qD QME

n n

Teste de Tukey (teste para comparação múltipla)

Utilizado quando se deseja comparar todos os pares de médias de r populações, adotando-se um único nível de confiança.

H0 :H1:

0i j 0i j i j

onde representa o valor tabelado (vindo de uma distribuição da amplitude studentizada – “studentized range”) associado ao nível de significância adotado.

, Tr n rq

Page 55: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Distribuição da Amplitude Studentizada

,( ) 0,05r g tabP q q

g

r

Page 56: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

onde, F(1−α ) é o quantil de probabilidade (1-α) da distribuição :

Teste de Scheffé (teste para comparação múltipla)

Neste teste a hipótese nula H0: μi = μj é rejeitada se:

Page 57: Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados Análise de variância (ANOVA) com um fator Fonte Principal: Pedro

Teste de contraste (teste para comparação múltipla)

Um contraste C é uma combinação linear dos totais yi, que permite a comparação das médias dos tratamentos.

a

iii ycC

1

a

iic

1

0

C,1,n a

E

SSF F

MS