Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
A análise de variância de uma
classificação (One-Way ANOVA) verifica
se as médias de “k” amostras independentes
(tratamentos) diferem entre si.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Um segundo tipo de análise de variância,
denominado de ANOVA de Dupla
Classificação (Two-Way ANOVA) testa se
existe diferença entre duas variáveis
categóricas.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Neste caso, a segunda variável categórica é
denominada de “Bloco”. Assim é possível testar
se existe diferença simultânea entre os
tratamentos (médias das amostras independentes)
e se simultaneamente estas diferenças podem ser
debitadas a segunda variável ou blocos.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Esta ANOVA é de blocos completos, isto é,
cada bloco inclui todos os tratamentos e sem
repetição, isto é, cada bloco apresenta apenas
uma parcela com cada tratamento. Este desenho
pode incluir combinações mais complexas, como
blocos incompletos ou repetição dos tratamentos.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Seja Yij a variável dependente, neste caso o
índice “i” indica o tramento e o índice “j” o
bloco. Por exemplo, a variável Yij pode
representar a “Renda de Pessoas” pertencentes
a “k” categorias profissionais (tratamentos) em
“l” empresas diferentes (blocos).
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Vamos admitir o seguinte modelo
linear:
Yij = µ + αi + βj + uij, com:
0k
1ii =α
=
∑ e 0l
1ji =β
=
∑
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Neste modelo µ é a média geral, αi
representa o efeito dos tratamentos e βj o
efeito dos blocos.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
As hipóteses feitas sobre uij para o
modelo anterior continuam válidas aqui.
Isto é, os termos erro são variáveis aleatórias
independentes com distribuição normal de
média “zero” e desvio padrão “σ2”.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Sejam m, ai e bj as estimativas de µ,
dos αi e dos βj respectivamente. Então o
modelo amostral será:
Yij = m + ai + bj + eij
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Dados os valores observados Yij, as
estimativas dos parâmetros µ, αi e βj podem ser
determinadas através do Método dos Mínimos
Quadrados. Para isto deve-se minimizar a soma
dos quadrados dos resíduos, isto é:
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Derivando e igualando a zero, tem-se:
∑ ∑ -∑ ∑
k
i
l
j
2k
i
l
j
2ij )b-am-Y(ER.Q.SQ jiij===
0)1)(b-am-Y(2m
Q k
1i
l
1jjiij
i
=∑== =
∑ --
∂
∂
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
ek,...,2,1i
0)1)(b-am-Y(2a
Q l
1jjiij
i
=
===
∑ --
∂
∂
l,...,2,1j
0)1)(b-am-Y(2b
Q k
1ijiij
j
=
===
∑ --
∂
∂
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Fazendo n = k.l,
e
k)..., 2, 1, (i YAl
1jiji ==
=
∑
∑∑l
1jj
k
1ii
k
1i
l
1jij BA YG
=== =
=∑=∑=
l) ..., 2, 1, (j YBk
1iijj ==
=
∑
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Obtém-se, o seguinte sistema de equações:
k)..., 2, 1, (i ballmAl
1jjii =++=
=
∑
∑∑l
1jj
k
1ii bkalnmG
==
++=
l) ..., 2, 1, (j bk akmB j
k
1iij =++=
=
∑
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Este sistema tem l + k + 1 equações, com o
mesmo número de incógnitas. Destas equações
apenas k + l – 1 são Linearmente
Independentes. Para resolver este sistema
utilizam-se as restrições sobre ai e bj.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Tem-se, então:
0k
1ii =α
=
∑ e 0l
1jj =β
=
∑
m = G/n
ai = (Ai/l ) – (G/n) = (Ai/l ) – m
bj = (Bj/k ) – (G/n) = (Bj/k ) – m
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Substituindo, estes resultados na
expressão dos Mínimos Quadrados, tem-se:
∑ ∑ -
k
i
l
j
2
)n
G
k
B-
l
AY(R.Q.S
jiij +=
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Por definição, a soma dos quadrados
total, a soma dos quadrados dos
tratamentos e a soma dos quadrados dos
blocos são dadas por:
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
∑ ∑ -
k
i
l
j
2)mY(Total.Q.S ij=
∑ -∑
k
i
2k
i
2i )m
l
A(lal.Trat.Q.S i==
∑ -∑
k
i
2l
j
2j )m
k
B(kbkcosBlo.Q.S
j==
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Deve-se notar que todas as somas de
quadrados são somas de nnnn ==== klklklkl parcelas, onde cada
parcela é um quadrado. Assim para obter a soma
de quadrados total, somamos os quadrados dos
desvios dos nnnn ==== klklklkl valores observados em relação as
respectivas estimativas, dadas por mmmm ++++ aaaaiiii ++++ bbbbjjjj....
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Para obter a soma de quadrados de tratamentos
multiplicamos por “l’” as somas dos quadrados das
“k” diferenças de médias estimadas de tratamentos,
dadas por Ai/l, em relação a média “m”, ou seja,
multiplicamos por “l “ a soma dos quadrados das
estimativas dos “k” efeitos de tratamentos.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Finalmente, para se obter a soma dos quadrados
de blocos multiplicamos por “k” as somas dos
quadrados das “l” diferenças de médias estimadas
de blocos, dadas por Bj/k, em relação a média “m”,
ou seja, multiplicamos por “k” as somas dos
quadrados das estimativas dos “n” efeitos de blocos.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Pode-se mostrar através de
manipulação algébrica que:
∑ ∑
∑ ∑ -
k
1i
l
1j
22
k
1i
l
1j
2
n
GY
)mY(Total.Q.S
ij
ij
= =
= =
−=
==
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
e:
n
GA
l
1
)ml
A(lal.Trat.Q.S
2k
1i
2
k
1i
2k
1i
2i
i
i
−=
===
=
==
∑
∑ -∑
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
E também:
n
GB
k
1
)mk
B(kbkcosBlo.Q.S
2l
1j
2
l
1j
2l
1j
2j
j
j
−=
===
=
==
∑
∑ -∑
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Finalmente:
n
GB
k
1A
l
1Y
)n
G
k
B-
l
AY(R.Q.S
2l
1j
2k
1i
2k
1i
l
1j
2
k
i
l
j
2
jiij
jiij
+−−=
=+=
=== =
∑∑∑ ∑
∑ ∑ -
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Resumindo, tem-se então:
SSSS....QQQQ....RRRR ==== SSSS....QQQQ....TotalTotalTotalTotal ---- SSSS....QQQQ....TratTratTratTrat.... ---- SSSS....QQQQ....BlocosBlocosBlocosBlocos
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Bloco
Tratamentos Total do
Bloco1 2 3
1 12 17 21 50505050
2 14 19 23 56565656
3 15 18 19 52525252
4 18 19 18 55555555
5 16 21 22 59595959
6 13 20 19 52525252
Total Trat. 88888888 114114114114 122122122122 324324324324
Dados
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Tem-se:
k = 3; l = 6; n = k.l = 3.6 = 18
G = 324 G2/n = 5832
ΣAi = ΣBi = ΣYij = 324
ΣAi2 = 35624; ΣBi
2 = 17550
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Então:
158n
GY Total.Q.S
k
1i
l
1j
22
ij =−== =
∑ ∑
33,105n
GA
l
1 .Trat.Q.S
2k
1i
2i =−=
=
∑
18n
GB
k
1 cosBlo.Q.S
2l
1j
2j =−=
=
∑
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Portanto:
SSSS....QQQQ....RRRR ==== 158158158158 ---- 105105105105,,,,33333333 ---- 18181818 ==== 34343434,,,,67676767
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
O modelo para a análise de variância de dupla
classificação é dado por: Yij = µ + αi + βj + uij,
Considerando µ, αi e βj como valores fixos e
lembrando que Uij são variáveis aleatórias
independentes com média zero e variância σ2, vem:
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
σ+β+α+µ= 22j
2i
22 )Y(E ij
Então:
σ+∑ β+∑α+µ=∑ ∑=== =
2l
1j
2j
k
1i
2i
2k
1i
l
1j
2nkln)Y(E ij
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Como: ∑==
l
1jiji YA
De acordo com o modelo dado e as suas
restrições, tem-se:
Segue, então:
∑+α+µ==
l
1jijii U)(lA
)U(U)(l2)(lAl
1jiji
2l
1jiji
222i ∑+∑α+µ+α+µ=
==
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Mas os termos erros são variáveis com
média zero, assim: σ+α+µ= l)(l)A(E 2222i i
De forma semelhante, tem-se:
σ+β+µ= k)(k)B(E 2222j j
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
E, também: σ+µ= nn)G(E 2222
Então:
σ−+∑ β+∑α===
2l
1j
2j
k
1i
2i )1n(kl)Total.Q.S(E
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Para os tratamentos, tem-se:
σ−µ+σ+∑ α+µ==
222k
1i
2 nk)(l.)Trat.Q.S(E i
0k
1ii =∑α
=
Lembrando que tem-se:
σ−+∑α==
2k
1i
2 )1k(l.)Trat.Q.S(E i
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Para os blocos, obtemos:
σ−+∑ β==
2l
1j
2j )1l(kcos)Blo.Q.S(E
Mas:
SSSS....QQQQ....RRRR ==== SSSS....QQQQ....TotalTotalTotalTotal ---- SSSS....QQQQ....TratTratTratTrat.... ---- SSSS....QQQQ....BlocosBlocosBlocosBlocos
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Então:
E(S.Q.R ) = E(S.Q.Total) - E(S.Q.Trat.) - E(S.Q.Blocos)
Substituindo, segue:
σ=
=σ+−−=
2
2
1)-1)(l-(k
)1lkn(.)sRe.Q.S(E
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Como os Uij são variáveis aleatórias
independentes de média “zero” e variância
constante e igual a σ2, tem-se:
S.Q.Res.)/σ2 apresenta uma distribuição
Qui-Quadrado com (k -1)(l - 1) graus de
liberdade;
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Supondo H0 verdadeira, isto é, que as
médias dos tratamentos são iguais, isto é, os
tratamentos não têm efeitos, ou ainda:
H0: α1 = α2 = ... = αk = 0, tem-se que:
(S.Q.Trat.)/ σ2 tem uma distribuição Qui-
Quadrado com “k - 1” graus de liberade.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Supondo que as médias dos blocos são todas
iguais entre si, ou que o efeito dos blocos é nulo,
ou ainda que: H0: β1 = β2 = ... = βk = 0, tem-se:
(S.Q.Blocos)/σ2 tem uma distribuição Qui-
Quadrado com “l - 1” graus de liberdade.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Tomando agora os quadrados médios, isto é,
a soma dos quadrados divididos pelos
respectivos graus de liberdade, pode-se obter a
expectância dos quadrados médios. A tabela
seguinte resume este e outros resultados
relevantes obtidos.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
O modelo para a análise de variância de dupla
classificação é dado por: Yij = µ + αi + βj + uij,
Considerando µ, αi e βj como valores fixos e
lembrando que Uij são VA independentes com
média zero e variância σ2, tem-se:
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Objetivos
A Análise de variância (ANOVA) É
utilizada para mostrar os efeitos principais de
variáveis categóricas independentes
(denominadas de fatores) sobre uma variável
quantitativa dependente.
Causa da Variação
Graus de Liberdade
Soma dos Quadrados
Esp. do Quad. Médio
Tratamentos k - 1
Blocos l - 1
Resíduo (k -1)(l - 1) σ2
Total kn - 1
nn
1 GA
2k
1i
2i -∑
=
nk
1 GB
2l
1j
2j -∑
=
n
GY
2k
1i
l
1j
2ij -∑ ∑
= =
σα
2
k
1i
2i
1kl +
−
=
∑
σ
β2
l
1j
2j
1lk +
−
=
∑
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
TesteConforme já visto, na análise de variância com
uma classificação, o quociente:
F = (Q.M.Trat.)/(Q.M.Res.)
pode ser utilizado para testar a hipótese:
H0: α1 = α2 = ... = αk = 0,
Este resultado apresenta uma distribuição F
com “k - 1” e “(k - 1)(l - 1)” graus de liberdade.
Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística
Teste
De forma semelhante o quociente:
F = (Q.M.Blocos.)/(Q.M.Res.)
pode ser utilizado para testar a hipótese:
H0: β1 = β2 = ... = βk = 0,
Este resultado apresenta uma distribuição F
com “l - 1” e “(k - 1)(l - 1)” graus de liberdade.