Prof. Lorí Viali, Dr. . ufrgs.br/~viali/...

Preview:

Citation preview

Prof. Lorí Viali, Dr.

http://www. ufrgs.br/~viali/

viali@mat.ufrgs.br

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A análise de variância de uma

classificação (One-Way ANOVA) verifica

se as médias de “k” amostras independentes

(tratamentos) diferem entre si.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Um segundo tipo de análise de variância,

denominado de ANOVA de Dupla

Classificação (Two-Way ANOVA) testa se

existe diferença entre duas variáveis

categóricas.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Neste caso, a segunda variável categórica é

denominada de “Bloco”. Assim é possível testar

se existe diferença simultânea entre os

tratamentos (médias das amostras independentes)

e se simultaneamente estas diferenças podem ser

debitadas a segunda variável ou blocos.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Esta ANOVA é de blocos completos, isto é,

cada bloco inclui todos os tratamentos e sem

repetição, isto é, cada bloco apresenta apenas

uma parcela com cada tratamento. Este desenho

pode incluir combinações mais complexas, como

blocos incompletos ou repetição dos tratamentos.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Seja Yij a variável dependente, neste caso o

índice “i” indica o tramento e o índice “j” o

bloco. Por exemplo, a variável Yij pode

representar a “Renda de Pessoas” pertencentes

a “k” categorias profissionais (tratamentos) em

“l” empresas diferentes (blocos).

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Vamos admitir o seguinte modelo

linear:

Yij = µ + αi + βj + uij, com:

0k

1ii =α

=

∑ e 0l

1ji =β

=

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Neste modelo µ é a média geral, αi

representa o efeito dos tratamentos e βj o

efeito dos blocos.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

As hipóteses feitas sobre uij para o

modelo anterior continuam válidas aqui.

Isto é, os termos erro são variáveis aleatórias

independentes com distribuição normal de

média “zero” e desvio padrão “σ2”.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Sejam m, ai e bj as estimativas de µ,

dos αi e dos βj respectivamente. Então o

modelo amostral será:

Yij = m + ai + bj + eij

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Dados os valores observados Yij, as

estimativas dos parâmetros µ, αi e βj podem ser

determinadas através do Método dos Mínimos

Quadrados. Para isto deve-se minimizar a soma

dos quadrados dos resíduos, isto é:

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Derivando e igualando a zero, tem-se:

∑ ∑ -∑ ∑

k

i

l

j

2k

i

l

j

2ij )b-am-Y(ER.Q.SQ jiij===

0)1)(b-am-Y(2m

Q k

1i

l

1jjiij

i

=∑== =

∑ --

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

ek,...,2,1i

0)1)(b-am-Y(2a

Q l

1jjiij

i

=

===

∑ --

l,...,2,1j

0)1)(b-am-Y(2b

Q k

1ijiij

j

=

===

∑ --

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Fazendo n = k.l,

e

k)..., 2, 1, (i YAl

1jiji ==

=

∑∑l

1jj

k

1ii

k

1i

l

1jij BA YG

=== =

=∑=∑=

l) ..., 2, 1, (j YBk

1iijj ==

=

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Obtém-se, o seguinte sistema de equações:

k)..., 2, 1, (i ballmAl

1jjii =++=

=

∑∑l

1jj

k

1ii bkalnmG

==

++=

l) ..., 2, 1, (j bk akmB j

k

1iij =++=

=

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Este sistema tem l + k + 1 equações, com o

mesmo número de incógnitas. Destas equações

apenas k + l – 1 são Linearmente

Independentes. Para resolver este sistema

utilizam-se as restrições sobre ai e bj.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se, então:

0k

1ii =α

=

∑ e 0l

1jj =β

=

m = G/n

ai = (Ai/l ) – (G/n) = (Ai/l ) – m

bj = (Bj/k ) – (G/n) = (Bj/k ) – m

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Substituindo, estes resultados na

expressão dos Mínimos Quadrados, tem-se:

∑ ∑ -

k

i

l

j

2

)n

G

k

B-

l

AY(R.Q.S

jiij +=

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Por definição, a soma dos quadrados

total, a soma dos quadrados dos

tratamentos e a soma dos quadrados dos

blocos são dadas por:

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

∑ ∑ -

k

i

l

j

2)mY(Total.Q.S ij=

∑ -∑

k

i

2k

i

2i )m

l

A(lal.Trat.Q.S i==

∑ -∑

k

i

2l

j

2j )m

k

B(kbkcosBlo.Q.S

j==

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Deve-se notar que todas as somas de

quadrados são somas de nnnn ==== klklklkl parcelas, onde cada

parcela é um quadrado. Assim para obter a soma

de quadrados total, somamos os quadrados dos

desvios dos nnnn ==== klklklkl valores observados em relação as

respectivas estimativas, dadas por mmmm ++++ aaaaiiii ++++ bbbbjjjj....

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Para obter a soma de quadrados de tratamentos

multiplicamos por “l’” as somas dos quadrados das

“k” diferenças de médias estimadas de tratamentos,

dadas por Ai/l, em relação a média “m”, ou seja,

multiplicamos por “l “ a soma dos quadrados das

estimativas dos “k” efeitos de tratamentos.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Finalmente, para se obter a soma dos quadrados

de blocos multiplicamos por “k” as somas dos

quadrados das “l” diferenças de médias estimadas

de blocos, dadas por Bj/k, em relação a média “m”,

ou seja, multiplicamos por “k” as somas dos

quadrados das estimativas dos “n” efeitos de blocos.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Pode-se mostrar através de

manipulação algébrica que:

∑ ∑

∑ ∑ -

k

1i

l

1j

22

k

1i

l

1j

2

n

GY

)mY(Total.Q.S

ij

ij

= =

= =

−=

==

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

e:

n

GA

l

1

)ml

A(lal.Trat.Q.S

2k

1i

2

k

1i

2k

1i

2i

i

i

−=

===

=

==

∑ -∑

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

E também:

n

GB

k

1

)mk

B(kbkcosBlo.Q.S

2l

1j

2

l

1j

2l

1j

2j

j

j

−=

===

=

==

∑ -∑

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Finalmente:

n

GB

k

1A

l

1Y

)n

G

k

B-

l

AY(R.Q.S

2l

1j

2k

1i

2k

1i

l

1j

2

k

i

l

j

2

jiij

jiij

+−−=

=+=

=== =

∑∑∑ ∑

∑ ∑ -

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Resumindo, tem-se então:

SSSS....QQQQ....RRRR ==== SSSS....QQQQ....TotalTotalTotalTotal ---- SSSS....QQQQ....TratTratTratTrat.... ---- SSSS....QQQQ....BlocosBlocosBlocosBlocos

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Bloco

Tratamentos Total do

Bloco1 2 3

1 12 17 21 50505050

2 14 19 23 56565656

3 15 18 19 52525252

4 18 19 18 55555555

5 16 21 22 59595959

6 13 20 19 52525252

Total Trat. 88888888 114114114114 122122122122 324324324324

Dados

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

k = 3; l = 6; n = k.l = 3.6 = 18

G = 324 G2/n = 5832

ΣAi = ΣBi = ΣYij = 324

ΣAi2 = 35624; ΣBi

2 = 17550

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Então:

158n

GY Total.Q.S

k

1i

l

1j

22

ij =−== =

∑ ∑

33,105n

GA

l

1 .Trat.Q.S

2k

1i

2i =−=

=

18n

GB

k

1 cosBlo.Q.S

2l

1j

2j =−=

=

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Portanto:

SSSS....QQQQ....RRRR ==== 158158158158 ---- 105105105105,,,,33333333 ---- 18181818 ==== 34343434,,,,67676767

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O modelo para a análise de variância de dupla

classificação é dado por: Yij = µ + αi + βj + uij,

Considerando µ, αi e βj como valores fixos e

lembrando que Uij são variáveis aleatórias

independentes com média zero e variância σ2, vem:

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

σ+β+α+µ= 22j

2i

22 )Y(E ij

Então:

σ+∑ β+∑α+µ=∑ ∑=== =

2l

1j

2j

k

1i

2i

2k

1i

l

1j

2nkln)Y(E ij

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Como: ∑==

l

1jiji YA

De acordo com o modelo dado e as suas

restrições, tem-se:

Segue, então:

∑+α+µ==

l

1jijii U)(lA

)U(U)(l2)(lAl

1jiji

2l

1jiji

222i ∑+∑α+µ+α+µ=

==

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Mas os termos erros são variáveis com

média zero, assim: σ+α+µ= l)(l)A(E 2222i i

De forma semelhante, tem-se:

σ+β+µ= k)(k)B(E 2222j j

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

E, também: σ+µ= nn)G(E 2222

Então:

σ−+∑ β+∑α===

2l

1j

2j

k

1i

2i )1n(kl)Total.Q.S(E

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Para os tratamentos, tem-se:

σ−µ+σ+∑ α+µ==

222k

1i

2 nk)(l.)Trat.Q.S(E i

0k

1ii =∑α

=

Lembrando que tem-se:

σ−+∑α==

2k

1i

2 )1k(l.)Trat.Q.S(E i

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Para os blocos, obtemos:

σ−+∑ β==

2l

1j

2j )1l(kcos)Blo.Q.S(E

Mas:

SSSS....QQQQ....RRRR ==== SSSS....QQQQ....TotalTotalTotalTotal ---- SSSS....QQQQ....TratTratTratTrat.... ---- SSSS....QQQQ....BlocosBlocosBlocosBlocos

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Então:

E(S.Q.R ) = E(S.Q.Total) - E(S.Q.Trat.) - E(S.Q.Blocos)

Substituindo, segue:

σ=

=σ+−−=

2

2

1)-1)(l-(k

)1lkn(.)sRe.Q.S(E

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Como os Uij são variáveis aleatórias

independentes de média “zero” e variância

constante e igual a σ2, tem-se:

S.Q.Res.)/σ2 apresenta uma distribuição

Qui-Quadrado com (k -1)(l - 1) graus de

liberdade;

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Supondo H0 verdadeira, isto é, que as

médias dos tratamentos são iguais, isto é, os

tratamentos não têm efeitos, ou ainda:

H0: α1 = α2 = ... = αk = 0, tem-se que:

(S.Q.Trat.)/ σ2 tem uma distribuição Qui-

Quadrado com “k - 1” graus de liberade.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Supondo que as médias dos blocos são todas

iguais entre si, ou que o efeito dos blocos é nulo,

ou ainda que: H0: β1 = β2 = ... = βk = 0, tem-se:

(S.Q.Blocos)/σ2 tem uma distribuição Qui-

Quadrado com “l - 1” graus de liberdade.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tomando agora os quadrados médios, isto é,

a soma dos quadrados divididos pelos

respectivos graus de liberdade, pode-se obter a

expectância dos quadrados médios. A tabela

seguinte resume este e outros resultados

relevantes obtidos.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O modelo para a análise de variância de dupla

classificação é dado por: Yij = µ + αi + βj + uij,

Considerando µ, αi e βj como valores fixos e

lembrando que Uij são VA independentes com

média zero e variância σ2, tem-se:

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Objetivos

A Análise de variância (ANOVA) É

utilizada para mostrar os efeitos principais de

variáveis categóricas independentes

(denominadas de fatores) sobre uma variável

quantitativa dependente.

Causa da Variação

Graus de Liberdade

Soma dos Quadrados

Esp. do Quad. Médio

Tratamentos k - 1

Blocos l - 1

Resíduo (k -1)(l - 1) σ2

Total kn - 1

nn

1 GA

2k

1i

2i -∑

=

nk

1 GB

2l

1j

2j -∑

=

n

GY

2k

1i

l

1j

2ij -∑ ∑

= =

σα

2

k

1i

2i

1kl +

=

σ

β2

l

1j

2j

1lk +

=

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

TesteConforme já visto, na análise de variância com

uma classificação, o quociente:

F = (Q.M.Trat.)/(Q.M.Res.)

pode ser utilizado para testar a hipótese:

H0: α1 = α2 = ... = αk = 0,

Este resultado apresenta uma distribuição F

com “k - 1” e “(k - 1)(l - 1)” graus de liberdade.

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Teste

De forma semelhante o quociente:

F = (Q.M.Blocos.)/(Q.M.Res.)

pode ser utilizado para testar a hipótese:

H0: β1 = β2 = ... = βk = 0,

Este resultado apresenta uma distribuição F

com “l - 1” e “(k - 1)(l - 1)” graus de liberdade.

Recommended