28
UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA Uma Aplicação de Modelos Lineares Mistos Professor Jomar Antonio Camarinha Filho CURITIBA - PARANÁ SETEMBRO/2003ÍNDICE

Uma Aplicação de Modelos Lineares Mistos · Modelos Mistos Prof. Jomar 1 ÍNDICE 1 INTRODUÇÃO ... 1 INTRODUÇÃO ... Source DF Type I SS Mean Square F Value Pr > F LOC 1

Embed Size (px)

Citation preview

UNIVERSIDADE FEDERAL DO PARANÁ

DEPARTAMENTO DE ESTATÍSTICA

Uma Aplicação de Modelos Lineares Mistos

Professor Jomar Antonio Camarinha Filho

CURITIBA - PARANÁ

SETEMBRO/2003ÍNDICE

Modelos Mistos Prof. Jomar 1

ÍNDICE

1 INTRODUÇÃO..............................................................................................................................................................2

2 EXEMPLOS NUMÉRICOS .......................................................................................................................................3

2.1 - EXEMPLO 1: EXPERIMENTO COM DADOS BALANCEADOS.............................................................................. 32.1.1 - Programa SAS para análise do exemplo .................................................................................................32.1.2 - Saída do PROC GLM..................................................................................................................................42.1.3 - Saída do PROC MIXED..............................................................................................................................5

2.2 - EXEMPLO 2: EXPERIMENTO COM DADOS DESBALANCEADOS....................................................................... 82.2.1 - Saída do PROC GLM..................................................................................................................................82.2.2 - Saída do PROC MIXED............................................................................................................................13

2.3 - EXEMPLO 3: EXPERIMENTO COM DADOS BALANCEADOS E COM UMA CASELA VAZIA........................... 152.3.2 - Saída do PROC MIXED............................................................................................................................19

2.4 - EXEMPLO 4: EXPERIMENTO COM DADOS DESBALANCEADOS E COM UMA CASELA VAZIA .................... 202.4.1 - Saída do PROC GLM................................................................................................................................202.4.2 - Saída do PROC MIXED............................................................................................................................24

BIBLIOGRAFIA.............................................................................................................................................................27

Modelos Mistos Prof. Jomar 2

1 Introdução

Este trabalho tem por finalidade exemplificar a metodologia de modelos lineares

mistos. Utilizou-se 4 exemplos, cada qual com sua peculiaridade em função do

experimento ser ou não completo com dados balanceados ou desbalanceados e na presença

de caselas vazias. O pacote estatística SAS, versão 8, foi utilizado para analisar os

experimentos.

Os dados a seguir referem-se à produtividade de grãos (kg/parcela de 18 m2) de

cinco híbridos de milho avaliados no delineamento inteiramente casualizado com duas

repetições em dois locais:

Híbrido

Local 1 2 3 4 5

2 3.6

2.62

5.88

5.63

5.46

6.62

4.37

3.86

7.0

6.48

3 5.5

7.2

7.17

7.49

9.83

10.74

3.38

7.02

9.35

8.15

Para análise destes dados será considerado o seguinte modelo:

yijk = µ + αj + β i + (αβ )ij + eijk

em que:

yijk é o valor observado

µ é uma constante inerente a todas as observações;

αj é o efeito do j-ésimo local ( j = 1,2) considerado fixo;

βi é o efeito do i-ésimo híbrido (i=1,2, ...,5) , t i ~ NID (0, σ2t)

(αβ )ij é o efeito da interação entre o i-ésimo híbrido e o j-ésimo local, (lt)ij ~ NID (0, σ2tl)

eijk é o erro aleatório associado à observação yijk , eijk ~ NID (0, σ2)

A título de ilustração e discussões provocou-se desbalanceamento e perda de casela

no experimento acima, criando-se deste modo, quatro exemplos.

Modelos Mistos Prof. Jomar 3

2 Exemplos Numéricos

2.1 - Exemplo 1: Experimento com Dados Balanceados

2.1.1 - Programa SAS para análise do exemplo

options nonumber nodate ps=60;

data exemplo;

input loc rep trat pg;

datalines;

2 1 5 7.0

... ... ... ...

3 2 1 5.57

;

proc glm;

class loc rep trat;

model pg=loc|trat;

random trat trat*loc/test;

lsmeans loc/pdiff;

run;

proc mixed ord;

class loc rep trat;

model pg= loc;

random trat trat*loc/ solution;

lsmeans loc/pdiff;

run;

Modelos Mistos Prof. Jomar 4

2.1.2 - Saída do PROC GLM

General Linear Models Procedure

Dependent Variable: PG

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 9 79.23798000 8.80422000 8.32 0.0014

Error 10 10.58800000 1.05880000

Corrected Total 19 89.82598000

R-Square C.V. Root MSE PG Mean

0.882128 16.15100 1.028980 6.371000

Source DF Type I SS Mean Square F Value Pr > F

LOC 1 29.71922000 29.71922000 28.07 0.0003

TRAT 4 42.79438000 10.69859500 10.10 0.0015

LOC*TRAT 4 6.72438000 1.68109500 1.59 0.2517

Source DF Type III SS Mean Square F Value Pr > F

LOC 1 29.71922000 29.71922000 28.07 0.0003

TRAT 4 42.79438000 10.69859500 10.10 0.0015

LOC*TRAT 4 6.72438000 1.68109500 1.59 0.2517

Observa-se que todas as somas de quadrados são idênticas no caso do

balanceamento. Assim, as hipóteses testadas são equivalentes.

Source Type III Expected Mean Square

LOC Var(Error) + 2 Var(LOC*TRAT) + Q(LOC)

TRAT Var(Error) + 2 Var(LOC*TRAT) + 4 Var(TRAT)

LOC*TRAT Var(Error) + 2 Var(LOC*TRAT)

Após o desdobramento dos graus de liberdade do modelo, vê-se que há evidência de diferença

significativa entre os locais. Porém, o padrão do GLM utiliza como denominador para realização dos testes

na análise de variância, para todos os efeitos, o quadrado médio do resíduo, cujo valor é: 1,0588, quando o

quadrado médio apropriado deveria ser àquele associado à interação. Essa conclusão pode ser tirada pela

simples análise das esperanças matemáticas dos quadrados médios. Destarte, em resumo, os quadrados

médios apropriados para testar os efeitos deveriam ser:

• Para o LOCAL, a interação LOC*TRAT;

• Para TRATAMENTOS (híbridos), a interação LOC*TRAT;

• Para a interação LOC*TRAT, o quadrado médio do resíduo.

Modelos Mistos Prof. Jomar 5

Note que, a relação entre Var (Error) + 2 Var (LOC*TRAT) + Q (LOC) e

Var (Error) + 2 Var(LOC*TRAT) fornece um teste exato. Pois, o único termo restante

nessa relação é a forma quadrática associada ao LOCAL. Nos exemplos em que há

desbalanceamento, essa relação torna-se mais complexa, necessitando uma combinação

linear entre dois ao mais graus de liberdade. Daí, o teste passa a ser aproximado.

Tests of Hypotheses for Mixed Model Analysis of Variance

Dependent Variable: PG

Source: LOC

Error: MS(LOC*TRAT)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

1 29.71922 4 1.681095 17.6785 0.0136

Source: TRAT

Error: MS(LOC*TRAT)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

4 10.698595 4 1.681095 6.3641 0.0503

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

4 1.681095 10 1.0588 1.5877 0.2517

Uma vez incluída na programação a opção TEST, nota-se que os quadrados médios

utilizados como denominador coincidem com aqueles ditos apropriados. Mas, não se pode

perder de vista que ao se utilizar o PROC GLM os efeitos aleatórios não são entendidos

como aleatórios, mas como fixos. Motivo pelo qual o teste realizado no quadro de

ANOVA não é correto. Least Squares Means

LOC PG Pr > |T| H0:

LSMEAN LSMEAN1=LSMEAN2

2 5.15200000 0.0003

3 7.59000000

2.1.3 - Saída do PROC MIXED

REML Estimation Iteration History

Modelos Mistos Prof. Jomar 6

Iteration Evaluations Objective Criterion

0 1 44.30868020

1 1 34.73476326 0.00000000

Convergence criteria met.

Após a construção do sistema de equações, o método REML obtém as estimativas

dos efeitos aleatórios que tem por base o método interativo de Newton-Raphson, utilizando

como valores iniciais as estimativas fornecidas pelo MIVIQUEO. Vê-se que no presente

exemplo houve a necessidade de apenas duas iterações para convergência.

Covariance Parameter Estimates (REML)

Cov Parm Estimate Std Error Z Pr > |Z|

TRAT 2.25437500 1.91446807 1.18 0.2390

LOC*TRAT 0.31114750 0.63977568 0.49 0.6267

Residual 1.05880000 0.47350975 2.24 0.0253

É de fundamental importância perceber que o PROC MIXED, ao contrário do

PROC GLM, aceita dentro de sua programação, os efeitos aleatórios como aleatórios.

Sabe-se que os estimadores de máxima verossimilhança (ML) e de máxima verossimilhança restrita

(REML) possuem distribuição assintoticamente normal e têm matriz de variância e covariância

assintoticamente conhecida. Logo, é possível a construção de intervalos e testes de hipóteses sobre os

parâmetros do modelo. A saída referente ao teste de efeitos aleatórios ilustra essa teoria. Testa-se se a

estimativa fornecida pelo método REML difere de zero. Pela análise dos p-value , conclui-se que não há

evidência de tal diferença. Portanto, os efeitos de TRAT e LOC*TRAT devem permanecer no modelo.

Model Fitting Information for PG

Description Value

Observations 20.0000

Res Log Likelihood -33.9083

Akaike's Information Criterion -36.9083

Schwarz's Bayesian Criterion -38.2438

-2 Res Log Likelihood 67.8166

Essa saída, pode ser utilizada para comparar modelos de efeitos fixos, dada uma

estrutura de covariância, quando um modelo é um caso especial do outro. Dados dois

modelos, conseqüentemente duas tabelas, pode-se analisá-las pelo valor de AIC. O modelo

que possuir o maior valor será o escolhido. Detalhes em Perri (1998).

Uma informação também advinda dessa tabela é que o teste da razão de

verossimilhança pode ser construído se utilizando dos valores de -2 Res Log Likelihood

Modelos Mistos Prof. Jomar 7

dos dois modelos sob investigação. Sabe-se que -2 Res Log Likelihood tem distribuição

assintoticamente χ2 com p graus de liberdade, sendo p o número de graus de liberdade

associado a cada um dos modelos.

Solution for Random Effects

Effect LOC TRAT Estimate SE Pred DF t Pr > |t|

TRAT 1 -1.36839569 0.85689155 10 -1.60 0.1414

TRAT 2 0.14455181 0.85689155 10 0.17 0.8694

TRAT 3 1.50999746 0.85689155 10 1.76 0.1085

TRAT 4 -1.44425378 0.85689155 10 -1.69 0.1228

TRAT 5 1.15810020 0.85689155 10 1.35 0.2063

LOC*TRAT 2 1 -0.24934974 0.50777645 10 -0.49 0.6340

LOC*TRAT 2 2 0.16970488 0.50777645 10 0.33 0.7451

LOC*TRAT 2 3 -0.23024630 0.50777645 10 -0.45 0.6599

LOC*TRAT 2 4 0.15075412 0.50777645 10 0.30 0.7726

LOC*TRAT 2 5 0.15913705 0.50777645 10 0.31 0.7604

LOC*TRAT 3 1 0.06048458 0.50777645 10 0.12 0.9075

LOC*TRAT 3 2 -0.14975392 0.50777645 10 -0.29 0.7741

LOC*TRAT 3 3 0.43865526 0.50777645 10 0.86 0.4079

LOC*TRAT 3 4 -0.35008917 0.50777645 10 -0.69 0.5062

LOC*TRAT 3 5 0.00070325 0.50777645 10 0.00 0.9989

As estimativas acima são os BLUP’s para os efeitos aleatórios, que são muito úteis no

melhoramento genético.

Tests of Fixed Effects

Source NDF DDF Type III F Pr > F Ord F

LOC 1 4 17.68 0.0136 0.0013

Least Squares Means

Effect LOC LSMEAN Std Error DF t Pr > |t| Ord t

LOC 2 5.15200000 0.78675568 4 6.55 0.0028 0.0008

LOC 3 7.59000000 0.78675568 4 9.65 0.0006 0.0001

Differences of Least Squares Means

Effect LOC _LOC Difference Std Error DF t Pr > |t| Ord t

LOC 2 3 -2.43800000 0.57984394 4 -4.20 0.0136 0.0055

Para esse exemplo em que não há desbalanceamento a análise realizada pelo PROC

MIXED nos fornece os mesmos resultados obtidos pelo PROC GLM, após a indispensável

inclusão da opção TEST.

Modelos Mistos Prof. Jomar 8

Na área de genética e melhoramento é comum conduzir-se experimentos no intuito

de avaliar o potencial genético de uma população para o melhoramento, nessas situações os

materiais avaliados (genótipos) são por definição aleatórios e os demais fatores, como

locais, por exemplo podem ser considerados de efeitos fixos. O procedimento usual nesse

caso é de se realizar uma análise do experimento através de um modelo misto (genótipos

aleatórios e locais fixo), testar a hipótese de que a variância genética entre estes materiais

seja diferente de zero, o que pode ser realizado pelo PROC GLM. Caso esta hipótese seja

rejeitada, o melhorista terá interesse em identificar quais são os melhores genótipos dentre

os avaliados, para tanto utiliza-se de suas médias ou médias ajustadas. Neste ponto, o

melhorista abandona a pressuposição de que o efeito de genótipos é aleatório e os

considera fixos (pois suas médias não são estimáveis quando estes são considerados

aleatórios) devendo refazer a análise para obtenção das estimativas destas médias. Uma

outra opção seria utilizar a teoria de modelos mistos apresentada neste trabalho, e realizar a

seleção dos materiais com base no BLUP e não nas médias, deste modo o melhorista não

necessita de mudar suas pressuposições no decorrer da análise, além de obter todas as

informações que necessita em um único procedimento SAS, pois o PROC MIXED fornece

as estimativas dos componentes de variância, com seus respectivos testes, testes sobre os

efeitos fixos do modelo, e BLUP’s.

2.2 - Exemplo 2: Experimento com Dados Desbalanceados

Do exemplo 1 eliminou-se três observações: 1ª, 9ª e 16ª, tornando o experimento desbalanceado.

A maioria das dificuldades encontrada quando se utiliza o PROC GLM para

experimentos desbalanceados com modelos mistos pode ser contornada pelo uso do PROC

MIXED.

2.2.1 - Saída do PROC GLM

General Linear Models Procedure

Dependent Variable: PG

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 9 64.57723824 7.17524869 5.23 0.0201

Error 7 9.60275000 1.37182143

Modelos Mistos Prof. Jomar 9

Corrected Total 16 74.17998824

R-Square C.V. Root MSE PG Mean

0.870548 18.57216 1.171248 6.306471

Source DF Type I SS Mean Square F Value Pr > F

LOC 1 22.63801601 22.63801601 16.50 0.0048

TRAT 4 35.23529722 8.80882431 6.42 0.0170

LOC*TRAT 4 6.70392500 1.67598125 1.22 0.3822

Source DF Type II SS Mean Square F Value Pr > F

LOC 1 26.37606667 26.37606667 19.23 0.0032

TRAT 4 35.23529722 8.80882431 6.42 0.0170

LOC*TRAT 4 6.70392500 1.67598125 1.22 0.3822

Source DF Type III SS Mean Square F Value Pr > F

LOC 1 20.68369615 20.68369615 15.08 0.0060

TRAT 4 31.93052500 7.98263125 5.82 0.0219

LOC*TRAT 4 6.70392500 1.67598125 1.22 0.3822

Source DF Type IV SS Mean Square F Value Pr > F

LOC 1 20.68369615 20.68369615 15.08 0.0060

TRAT 4 31.93052500 7.98263125 5.82 0.0219

LOC*TRAT 4 6.70392500 1.67598125 1.22 0.3822

Nesse caso, as somas de quadrados diferem, pois, há o desbalanceamento. Apenas

as somas de quadrados dos tipos III e IV não diferiram devido ausência de casela vazia.

Os exemplos 3 e 4 ilustram o fato.

Source Type I Expected Mean Square

LOC Var(Error) + 1.8154 Var(LOC*TRAT) + 0.0507 Var(TRAT) + Q(LOC)

TRAT Var(Error) + 1.7003 Var(LOC*TRAT) + 3.3403 Var(TRAT)

LOC*TRAT Var(Error) + 1.64 Var(LOC*TRAT)

Source Type II Expected Mean Square

LOC Var(Error) + 1.7733 Var(LOC*TRAT) + Q(LOC)

TRAT Var(Error) + 1.7003 Var(LOC*TRAT) + 3.3403 Var(TRAT)

LOC*TRAT Var(Error) + 1.64 Var(LOC*TRAT)

Source Type III Expected Mean Square

Modelos Mistos Prof. Jomar 10

LOC Var(Error) + 1.5385 Var(LOC*TRAT) + Q(LOC)

TRAT Var(Error) + 1.64 Var(LOC*TRAT) + 3.28 Var(TRAT)

LOC*TRAT Var(Error) + 1.64 Var(LOC*TRAT)

Source Type IV Expected Mean Square

LOC Var(Error) + 1.5385 Var(LOC*TRAT) + Q(LOC)

TRAT Var(Error) + 1.64 Var(LOC*TRAT) + 3.28 Var(TRAT)

LOC*TRAT Var(Error) + 1.64 Var(LOC*TRAT)

Da mesma forma do exemplo 1, os testes para os efeitos do modelo estão

incorretos. Faz-se primordialmente necessária a análise das esperanças dos quadrados

médios para cada um dos tipos (I, II, III e IV).

Assim, discutindo para o efeito fixo LOCAL:

Tipo I:

• não é adequada, pois, não está ajustada para TRAT;

Tipo II:

• pode ser adequada. Porém, o teste será aproximado, pois, a relação entre Var (Error) + 1.7733 Var

(LOC*TRAT) + Q(LOC) e Var (Error) + 1.64 Var (LOC*TRAT) não isola o termo Q(LOC). A

combinação entre quadrados médios, com já discutido, será necessária;

Tipo III:

• Será a mais adequada. Pois, a relação entre Var (Error) + 1.5385 Var (LOC*TRAT) + Q(LOC) e Var

(Error) + 1.64 Var (LOC*TRAT), embora também não proporcione o isolamento da forma quadrática

Q(LOC), fornece um teste de melhor aproximação em relação ao Tipo II. Isso ocorre porque a diferença

entre 1,55385 e 1,64 (Tipo III) é menor que a diferença 1,7333 e 1,64 (Tipo II);

Tipo IV:

• Equivale a do Tipo III.

A seguir, apenas como ilustração e advertência, tem-se os quadros das análises de

variância para todos os tipos. Porém, como discutido opta-se pela Tipo III após a análise

dos quadros das esperanças dos quadrados médios.

Tests of Hypotheses for Mixed Model Analysis of Variance

Dependent Variable: PG

Modelos Mistos Prof. Jomar 11

Source: LOC

Error: 0.0152*MS(TRAT) + 1.0912*MS(LOC*TRAT) - 0.1064*MS(Error)

Denominator Denominator

DF Type I MS DF MS F Value Pr > F

1 22.638016013 3.91 1.8165003666 12.4624 0.0251

Source: TRAT

Error: 1.0368*MS(LOC*TRAT) - 0.0368*MS(Error)

Denominator Denominator

DF Type I MS DF MS F Value Pr > F

4 8.8088243056 3.77 1.6871605659 5.2211 0.0754

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type I MS DF MS F Value Pr > F

4 1.67598125 7 1.3718214286 1.2217 0.3822

Source: LOC

Error: 1.0813*MS(LOC*TRAT) - 0.0813*MS(Error)

Denominator Denominator

DF Type II MS DF MS F Value Pr > F

1 26.376066667 3.52 1.7007096908 15.5089 0.0217

Source: TRAT

Error: 1.0368*MS(LOC*TRAT) - 0.0368*MS(Error)

Denominator Denominator

DF Type II MS DF MS F Value Pr > F

4 8.8088243056 3.77 1.6871605659 5.2211 0.0754

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type II MS DF MS F Value Pr > F

4 1.67598125 7 1.3718214286 1.2217 0.3822

Source: LOC

Error: 0.9381*MS(LOC*TRAT) + 0.0619*MS(Error)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

1 20.683696154 4.44 1.6571495913 12.4815 0.0204

Modelos Mistos Prof. Jomar 12

Source: TRAT

Error: MS(LOC*TRAT)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

4 7.98263125 4 1.67598125 4.7630 0.0799

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

4 1.67598125 7 1.3718214286 1.2217 0.3822

Veja que o quadrado médio apropriado para o teste de LOCAL é dado pela combinação linear de

quadrados médios: 0.9381*MS(LOC*TRAT) + 0.0619*MS(Error) e que os graus de liberdade associado a

esse quadrado médio vale 4,44, ambos os procedimentos visam obter uma melhor aproximação para a

realização do teste.

A obtenção desses resultados são executados das seguintes formas:

A Combinação Linear dos Quadrados Médios 0.9381*MS(LOC*TRAT) +

0.0619*MS(Error):

Primeiramente, deve-se calcular uma estimativa para o denominador apropriado, σ2 + 1.5385 σ2tl .

Do quadro das Esperanças dos Quadrados Médios (Tipo III), tem-se que:

MS(ERROR) é uma estimativa de σ2;

MS(LOC*TRAT) é uma estimativa de σ2 + 1.64 σ2tl .

Depois, isolando-se σ2tl de σ2 + 1.64 σ2

tl , segue:

σ2tl = (MS(LOC*TRAT) - σ2 )/ 1.64

Logo, a estimativa de σ2 + 1.5385 σ2tl fica:

MS(ERROR) + 1,5385 x ((MS(LOC*TRAT) - MS(ERROR))/1.64)=

MS(ERROR) + 0.93810 MS(LOC*TRAT) - 0.93810MS(ERROR)=

= 0.9381*MS(LOC*TRAT) + 0.0619*MS(ERROR) = 1.657153757142.

Agora, o valor de 4,44 do número de graus de liberdade do denominador apropriado é obtido pela

fórmula de Satterthwaite que estima os graus de liberdade pela combinação linear entre os quadrados

médios associada ao quadrado médio apropriado. Assim, sejam MS1, . . . , MSk, quadrados médios

independentes com graus de liberdade df1, . . . , dfk , respectivamente. Então, a combinação linear:

Modelos Mistos Prof. Jomar 13

MS = a1MS1 + a2MS2 + . . . + akMSk

fornece uma aproximação dos graus de liberdade, dada por:

k

2kk

1

211

2

df)MS(a

...df

)MS(a

)MS(df

++

=

Para esse exemplo,

MS = 1.657153757142;

MS1 = 1.37182143; df1 = 7 e a1 = 0.0619;

MS2 = 1.67598125; df2 = 4 e a2 = 0.9381.

Portanto, a estimativa df fica: df = 4,44

Least Squares Means

LOC PG Pr > |T| H0:

LSMEAN LSMEAN1=LSMEAN2

2 5.15100000 0.0060

3 7.47000000

2.2.2 - Saída do PROC MIXED

REML Estimation Iteration History

Iteration Evaluations Objective Criterion

0 1 37.79186016

1 3 32.12320890 0.02440661

2 2 31.87985876 0.00008260

3 1 31.87856824 0.00000015

4 1 31.87856578 0.00000000

Convergence criteria met.

Covariance Parameter Estimates (REML)

Cov Parm Estimate Std Error Z Pr > |Z|

TRAT 1.93776964 1.83183330 1.06 0.2901

LOC*TRAT 0.34141878 0.83881946 0.41 0.6840

Residual 1.28549552 0.64980174 1.98 0.0479

Modelos Mistos Prof. Jomar 14

Model Fitting Information for PG

Description Value

Observations 17.0000

Res Log Likelihood -29.7234

Akaike's Information Criterion -32.7234

Schwarz's Bayesian Criterion -33.7854

-2 Res Log Likelihood 59.4467

Solution for Random Effects

Effect LOC TRAT Estimate SE Pred DF t Pr > |t|

TRAT 1 -1.20821687 0.84389933 7 -1.43 0.1953

TRAT 2 0.22326752 0.84389933 7 0.26 0.7990

TRAT 3 1.51519215 0.84389933 7 1.80 0.1156

TRAT 4 -1.27152457 0.87079772 7 -1.46 0.1876

TRAT 5 0.74128178 0.90683190 7 0.82 0.4406

LOC*TRAT 2 1 -0.25379914 0.53526599 7 -0.47 0.6498

LOC*TRAT 2 2 0.16718349 0.53526599 7 0.31 0.7639

LOC*TRAT 2 3 -0.18213033 0.53526599 7 -0.34 0.7436

LOC*TRAT 2 4 0.12417463 0.54652593 7 0.23 0.8268

LOC*TRAT 2 5 0.14457136 0.54958261 7 0.26 0.8001

LOC*TRAT 3 1 0.04092145 0.53476833 7 0.08 0.9411

LOC*TRAT 3 2 -0.12784562 0.53476833 7 -0.24 0.8179

LOC*TRAT 3 3 0.44909450 0.53476833 7 0.84 0.4288

LOC*TRAT 3 4 -0.34820660 0.53966300 7 -0.65 0.5393

LOC*TRAT 3 5 -0.01396372 0.54932372 7 -0.03 0.9804

Tests of Fixed Effects

Source NDF DDF Type III F Pr > F Ord F

LOC 1 4 13.06 0.0225 0.0028

Least Squares Means

Effect LOC LSMEAN Std Error DF t Pr > |t| Ord t

LOC 2 5.04981290 0.79140606 4 6.38 0.0031 0.0009

LOC 3 7.47525756 0.77747956 4 9.61 0.0007 0.0001

Differences of Least Squares Means

Effect LOC _LOC Difference Std Error DF t Pr > |t| Ord t

LOC 2 3 -2.42544466 0.67127483 4 -3.61 0.0225 0.0100

Nota-se que o p-value para o teste para o efeito fixo dado pelo PROC GLM, depois das devidas

correções, é 0,0204, aproximadamente dez vezes maior que o fornecido pelo PROC MIXED (0,0028). E, as

estimativas dadas pelo LSMEANS nas duas declarações também diferem. Isso ocorre porque, como já dito, o

Modelos Mistos Prof. Jomar 15

GLM não reconhece os efeitos aleatórios como aleatórios.

Conclui-se, portanto, que o PROC MIXED é mais apropriado na presença de desbalanceamento.

2.3 - Exemplo 3: Experimento com Dados Balanceados e com uma Casela

Vazia.

Do exemplo 1 eliminou-se apenas a casela referente ao tratamento 4 no local 2

tornando o experimento incompleto, porém, balanceado.

2.3.1 - Saída do PROC GLM

General Linear Models Procedure

Dependent Variable: PG

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 8 67.92790000 8.49098750 7.31 0.0037

Error 9 10.45795000 1.16199444

Corrected Total 17 78.38585000

R-Square C.V. Root MSE PG Mean

0.866584 16.27926 1.077958 6.621667

Source DF Type I SS Mean Square F Value Pr > F

LOC 1 21.09756250 21.09756250 18.16 0.0021

TRAT 4 42.39421875 10.59855469 9.12 0.0031

LOC*TRAT 3 4.43611875 1.47870625 1.27 0.3413

Source DF Type II SS Mean Square F Value Pr > F

LOC 1 30.83025625 30.83025625 26.53 0.0006

TRAT 4 42.39421875 10.59855469 9.12 0.0031

LOC*TRAT 3 4.43611875 1.47870625 1.27 0.3413

Source DF Type III SS Mean Square F Value Pr > F

LOC 1 30.83025625 30.83025625 26.53 0.0006

TRAT 4 42.39421875 10.59855469 9.12 0.0031

LOC*TRAT 3 4.43611875 1.47870625 1.27 0.3413

Source DF Type IV SS Mean Square F Value Pr > F

LOC 1* 30.83025625 30.83025625 26.53 0.0006

Modelos Mistos Prof. Jomar 16

TRAT 4* 36.46199231 9.11549808 7.84 0.0052

LOC*TRAT 3 4.43611875 1.47870625 1.27 0.3413

* NOTE: Other Type IV Testable Hypotheses exist which may yield different SS.

Embora a análise de variância esteja incorreta, dado que os quadrados médios para os

denominadores não são os apropriados, vê-se que as somas de quadrados dos Tipos II, III e IV são iguais.

Logo, os testes serão equivalentes. Porém, na verdade, isso só ocorre porque há apenas dois níveis para o

efeito fixo LOCAL. Caso houvesse mais de dois níveis a hipótese do Tipo III será diferente da do Tipo IV.

Esse fato pode ser visto pelo fator TRAT.

Source Type I Expected Mean Square

LOC Var(Error) + 2 Var(LOC*TRAT) + 0.2222 Var(TRAT) + Q(LOC)

TRAT Var(Error) + 2 Var(LOC*TRAT) + 3.5 Var(TRAT)

LOC*TRAT Var(Error) + 2 Var(LOC*TRAT)

Source Type II Expected Mean Square

LOC Var(Error) + 2 Var(LOC*TRAT) + Q(LOC)

TRAT Var(Error) + 2 Var(LOC*TRAT) + 3.5 Var(TRAT)

LOC*TRAT Var(Error) + 2 Var(LOC*TRAT)

Source Type III Expected Mean Square

LOC Var(Error) + 2 Var(LOC*TRAT) + Q(LOC)

TRAT Var(Error) + 2 Var(LOC*TRAT) + 3.5 Var(TRAT)

LOC*TRAT Var(Error) + 2 Var(LOC*TRAT)

Source Type IV Expected Mean Square

LOC Var(Error) + 2 Var(LOC*TRAT) + Q(LOC)

TRAT Var(Error) + 2 Var(LOC*TRAT) + 3.3846 Var(TRAT)

LOC*TRAT Var(Error) + 2 Var(LOC*TRAT)

De modo análogo ao exemplo 2, pode-se perceber que o quadrado médio apropriado será o da

interação (LOC*TRAT). Mas, consegue-se isolar a forma quadrática sem a necessidade de se encontrar

combinações lineares dos quadrados médios, pois, os coeficientes de var (LOC*TRAT) são iguais e de valor

2.

Com a introdução do comando /TEST, tem-se as especificações dos testes apropriados e suas saídas

são:

Tests of Hypotheses for Mixed Model Analysis of Variance

Dependent Variable: PG

Modelos Mistos Prof. Jomar 17

Source: LOC

Error: 0.0635*MS(TRAT) + 0.9365*MS(LOC*TRAT)

Denominator Denominator

DF Type I MS DF MS F Value Pr > F

1 21.0975625 5.63 2.057744246 10.2528 0.0203

Source: TRAT

Error: MS(LOC*TRAT)

Denominator Denominator

DF Type I MS DF MS F Value Pr > F

4 10.598554687 3 1.47870625 7.1675 0.0687

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type I MS DF MS F Value Pr > F

3 1.47870625 9 1.1619944444 1.2726 0.3413

Tests of Hypotheses for Mixed Model Analysis of Variance

Dependent Variable: PG

Source: LOC

Error: MS(LOC*TRAT)

Denominator Denominator

DF Type II MS DF MS F Value Pr > F

1 30.83025625 3 1.47870625 20.8495 0.0197

Source: TRAT

Error: MS(LOC*TRAT)

Denominator Denominator

DF Type II MS DF MS F Value Pr > F

4 10.598554687 3 1.47870625 7.1675 0.0687

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type II MS DF MS F Value Pr > F

3 1.47870625 9 1.1619944444 1.2726 0.3413

Tests of Hypotheses for Mixed Model Analysis of Variance

Dependent Variable: PG

Source: LOC

Modelos Mistos Prof. Jomar 18

Error: MS(LOC*TRAT)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

1 30.83025625 3 1.47870625 20.8495 0.0197

Source: TRAT

Error: MS(LOC*TRAT)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

4 10.598554687 3 1.47870625 7.1675 0.0687

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

3 1.47870625 9 1.1619944444 1.2726 0.3413

Tests of Hypotheses for Mixed Model Analysis of Variance

Dependent Variable: PG

Source: LOC

Error: MS(LOC*TRAT)

Denominator Denominator

DF Type IV MS DF MS F Value Pr > F

1 30.83025625 3 1.47870625 20.8495 0.0197

Source: TRAT

Error: MS(LOC*TRAT)

Denominator Denominator

DF Type IV MS DF MS F Value Pr > F

4 9.1154980769 3 1.47870625 6.1645 0.0835

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type IV MS DF MS F Value Pr > F

3 1.47870625 9 1.1619944444 1.2726 0.3413

Least Squares Means

LOC PG

LSMEAN

2 Non-est

3 7.59000000

Devido à casela vazia não foi possível estimar a média para o local 2.

Modelos Mistos Prof. Jomar 19

2.3.2 - Saída do PROC MIXED

REML Estimation Iteration History

Iteration Evaluations Objective Criterion

0 1 40.79014622

1 4 32.82324801 .

2 1 32.72284896 0.00046929

3 1 32.71465207 0.00000618

4 1 32.71454991 0.00000000

Convergence criteria met.

Covariance Parameter Estimates (REML)

Cov Parm Estimate Std Error Z Pr > |Z|

TRAT 2.89164548 2.48942264 1.16 0.2454

LOC*TRAT 0.18364199 0.70053050 0.26 0.7932

Residual 1.16203526 0.54778868 2.12 0.0339

Model Fitting Information for PG

Description Value

Observations 18.0000

Res Log Likelihood -31.0603

Akaike's Information Criterion -34.0603

Schwarz's Bayesian Criterion -35.2192

-2 Res Log Likelihood 62.1206

As explicações para esses quadros são as mesmas dadas para o exemplos

anteriores. Solution for Random Effects

Effect LOC TRAT Estimate SE Pred DF t Pr > |t|

TRAT 1 -1.33971806 0.92834675 9 -1.44 0.1829

TRAT 2 0.24566459 0.92834675 9 0.26 0.7973

TRAT 3 1.67648348 0.92834675 9 1.81 0.1044

TRAT 4 -1.89016849 1.03059372 9 -1.83 0.0999

TRAT 5 1.30773849 0.92834675 9 1.41 0.1925

LOC*TRAT 2 1 -0.11743665 0.40641319 9 -0.29 0.7792

LOC*TRAT 2 2 0.13704290 0.40641319 9 0.34 0.7437

LOC*TRAT 2 3 -0.13813896 0.40641319 9 -0.34 0.7417

LOC*TRAT 2 5 0.11853270 0.40641319 9 0.29 0.7772

LOC*TRAT 3 1 0.03235413 0.40584541 9 0.08 0.9382

LOC*TRAT 3 2 -0.12144129 0.40584541 9 -0.30 0.7716

Modelos Mistos Prof. Jomar 20

LOC*TRAT 3 3 0.24460871 0.40584541 9 0.60 0.5616

LOC*TRAT 3 4 -0.12004041 0.41983698 9 -0.29 0.7814

LOC*TRAT 3 5 -0.03548113 0.40584541 9 -0.09 0.9322

Tests of Fixed Effects

Source NDF DDF Type III F Pr > F Ord F

LOC 1 3 18.78 0.0227 0.0016

Least Squares Means

Effect LOC LSMEAN Std Error DF t Pr > |t|

LOC 2 4.93870788 0.89427688 3 5.52 0.0117

LOC 3 7.59000000 0.85513801 3 8.88 0.0030

Differences of Least Squares Means

Effect LOC _LOC Difference Std Error DF t Pr > |t| Ord t

LOC 2 3 -2.65129212 0.61182839 3 -4.33 0.0227 0.0070

Observa-se, novamente, que existem diferenças nos resultados entre as duas

declarações. Uma vez que, além da perda da casela o GLM ignora o efeito aleatório.

Utilizando-se o PROC MIXED é possível obter a estimativa da média ajustada mesmo na presença

de caselas vazias.

2.4 - Exemplo 4: Experimento com Dados Desbalanceados e com uma

Casela Vazia

Do exemplo 2 eliminou-se a casela referente ao tratamento 4 no local 2 tornando o

experimento desbalanceado e incompleto. Esse caso é visto na literatura como o mais

complexo, requerendo, portanto uma atenção redobrada.

2.4.1 - Saída do PROC GLM

General Linear Models Procedure

Modelos Mistos Prof. Jomar 21

Dependent Variable: PG

Sum of Mean

Source DF Squares Square F Value Pr > F

Model 8 61.13707333 7.64213417 5.54 0.0256

Error 6 8.27430000 1.37905000

Corrected Total 14 69.41137333

R-Square C.V. Root MSE PG Mean

0.880793 18.10933 1.174330 6.484667

Source DF Type I SS Mean Square F Value Pr > F

LOC 1 22.19425190 22.19425190 16.09 0.0070

TRAT 4 33.69007669 8.42251917 6.11 0.0261

LOC*TRAT 3 5.25274474 1.75091491 1.27 0.3662

Source DF Type II SS Mean Square F Value Pr > F

LOC 1 27.79442193 27.79442193 20.15 0.0042

TRAT 4 33.69007669 8.42251917 6.11 0.0261

LOC*TRAT 3 5.25274474 1.75091491 1.27 0.3662

Source DF Type III SS Mean Square F Value Pr > F

LOC 1 24.38116364 24.38116364 17.68 0.0057

TRAT 4 31.21982080 7.80495520 5.66 0.0310

LOC*TRAT 3 5.25274474 1.75091491 1.27 0.3662

Source DF Type IV SS Mean Square F Value Pr > F

LOC 1* 24.38116364 24.38116364 17.68 0.0057

TRAT 4* 21.22892317 5.30723079 3.85 0.0697

LOC*TRAT 3 5.25274474 1.75091491 1.27 0.3662

* NOTE: Other Type IV Testable Hypotheses exist which may yield different SS.

Source Type I Expected Mean Square

LOC Var(Error) + 1.8071 Var(LOC*TRAT) + 0.3405 Var(TRAT) + Q(LOC)

TRAT Var(Error) + 1.6903 Var(LOC*TRAT) + 2.8482 Var(TRAT)

LOC*TRAT Var(Error) + 1.5439 Var(LOC*TRAT)

Source Type II Expected Mean Square

LOC Var(Error) + 1.7018 Var(LOC*TRAT) + Q(LOC)

TRAT Var(Error) + 1.6903 Var(LOC*TRAT) + 2.8482 Var(TRAT)

LOC*TRAT Var(Error) + 1.5439 Var(LOC*TRAT)

Source Type III Expected Mean Square

Modelos Mistos Prof. Jomar 22

LOC Var(Error) + 1.4545 Var(LOC*TRAT) + Q(LOC)

TRAT Var(Error) + 1.6265 Var(LOC*TRAT) + 2.7908 Var(TRAT)

LOC*TRAT Var(Error) + 1.5439 Var(LOC*TRAT)

Source Type IV Expected Mean Square

LOC Var(Error) + 1.4545 Var(LOC*TRAT) + Q(LOC)

TRAT Var(Error) + 1.5366 Var(LOC*TRAT) + 2.6098 Var(TRAT)

LOC*TRAT Var(Error) + 1.5439 Var(LOC*TRAT)

De forma similar ao exemplo 2 conclui-se que o Tipo IV é a que fornecerá uma

melhor aproximação para o teste em comparação com as dos Tipos III e IV. Pois, 1,5366

(Tipo IV) está mais próximo de 1,5439 que 1,6265 (Tipo III). A do Tipo I não é vista como

apropriada. Caso o efeito TRAT fosse fixo, a do Tipo IV seria, também, a escolhida.

Tests of Hypotheses for Mixed Model Analysis of Variance

Dependent Variable: PG

Source: LOC

Error: 0.1195*MS(TRAT) + 1.0397*MS(LOC*TRAT) - 0.1592*MS(Error)

Denominator Denominator

DF Type I MS DF MS F Value Pr > F

1 22.194251905 4.98 2.6076392036 8.5112 0.0333

Source: TRAT

Error: 1.0949*MS(LOC*TRAT) - 0.0949*MS(Error)

Denominator Denominator

DF Type I MS DF MS F Value Pr > F

4 8.4225191729 2.60 1.7861922756 4.7153 0.1379

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type I MS DF MS F Value Pr > F

3 1.7509149123 6 1.37905 1.2697 0.3662

Tests of Hypotheses for Mixed Model Analysis of Variance

Dependent Variable: PG

Source: LOC

Modelos Mistos Prof. Jomar 23

Error: 1.1023*MS(LOC*TRAT) - 0.1023*MS(Error)

Denominator Denominator

DF Type II MS DF MS F Value Pr > F

1 27.79442193 2.57 1.788946551 15.5368 0.0384

Source: TRAT

Error: 1.0949*MS(LOC*TRAT) - 0.0949*MS(Error)

Denominator Denominator

DF Type II MS DF MS F Value Pr > F

4 8.4225191729 2.60 1.7861922756 4.7153 0.1379

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type II MS DF MS F Value Pr > F

3 1.7509149123 6 1.37905 1.2697 0.3662

Tests of Hypotheses for Mixed Model Analysis of Variance

Dependent Variable: PG

Source: LOC

Error: 0.9421*MS(LOC*TRAT) + 0.0579*MS(Error)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

1 24.381163636 3.29 1.7294020661 14.0980 0.0281

Source: TRAT

Error: 1.0535*MS(LOC*TRAT) - 0.0535*MS(Error)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

4 7.8049552007 2.76 1.7708252309 4.4075 0.1387

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type III MS DF MS F Value Pr > F

3 1.7509149123 6 1.37905 1.2697 0.3662

Tests of Hypotheses for Mixed Model Analysis of Variance

Dependent Variable: PG

Modelos Mistos Prof. Jomar 24

Source: LOC

Error: 0.9421*MS(LOC*TRAT) + 0.0579*MS(Error)

Denominator Denominator

DF Type IV MS DF MS F Value Pr > F

1 24.381163636 3.29 1.7294020661 14.0980 0.0281

Source: TRAT

Error: 0.9953*MS(LOC*TRAT) + 0.0047*MS(Error)

Denominator Denominator

DF Type IV MS DF MS F Value Pr > F

4 5.3072307927 3.02 1.7491627772 3.0342 0.1932

Source: LOC*TRAT

Error: MS(Error)

Denominator Denominator

DF Type IV MS DF MS F Value Pr > F

3 1.7509149123 6 1.37905 1.2697 0.3662

Least Squares Means

LOC PG

LSMEAN

2 Non-est

3 7.63300000

Especificando, assim, os testadores adequados.

2.4.2 - Saída do PROC MIXED

REML Estimation Iteration History

Iteration Evaluations Objective Criterion

0 1 33.79284544

1 4 29.32765763 .

2 2 29.10771846 0.00330471

3 1 29.05112462 0.00038671

4 1 29.04504334 0.00000735

5 1 29.04493511 0.00000000

Convergence criteria met.

Covariance Parameter Estimates (REML)

Modelos Mistos Prof. Jomar 25

Cov Parm Estimate Std Error Z Pr > |Z|

TRAT 2.16347433 2.39192133 0.90 0.3657

LOC*TRAT 0.48026042 1.18015518 0.41 0.6840

Residual 1.29693898 0.70732788 1.83 0.0667

Model Fitting Information for PG

Description Value

Observations 15.0000

Res Log Likelihood -26.4687

Akaike's Information Criterion -29.4687

Schwarz's Bayesian Criterion -30.3161

-2 Res Log Likelihood 52.9373

Solution for Random Effects

Effect LOC TRAT Estimate SE Pred DF t Pr > |t|

TRAT 1 -0.93832819 0.93266044 6 -1.01 0.3532

TRAT 2 0.23846422 0.90338217 6 0.26 0.8006

TRAT 3 1.52330107 0.90338217 6 1.69 0.1427

TRAT 4 -1.58415783 1.02222907 6 -1.55 0.1722

TRAT 5 0.76072073 0.96137844 6 0.79 0.4589

LOC*TRAT 2 1 -0.35089330 0.63094658 6 -0.56 0.5982

LOC*TRAT 2 2 0.27381062 0.62578874 6 0.44 0.6770

LOC*TRAT 2 3 -0.15160742 0.62578874 6 -0.24 0.8166

LOC*TRAT 2 5 0.22869010 0.64226818 6 0.36 0.7340

LOC*TRAT 3 1 0.14259783 0.63725385 6 0.22 0.8304

LOC*TRAT 3 2 -0.22087496 0.62329949 6 -0.35 0.7352

LOC*TRAT 3 3 0.48975851 0.62329949 6 0.79 0.4619

LOC*TRAT 3 4 -0.35166042 0.65202934 6 -0.54 0.6091

LOC*TRAT 3 5 -0.05982095 0.64089268 6 -0.09 0.9287

Tests of Fixed Effects

Source NDF DDF Type III F Pr > F Ord F

LOC 1 3 11.87 0.0411 0.0043

Least Squares Means

Effect LOC LSMEAN Std Error DF t Pr > |t| Ord t

LOC 2 4.87301360 0.88607513 3 5.50 0.0118 0.0030

LOC 3 7.61064618 0.83792348 3 9.08 0.0028 0.0005

Modelos Mistos Prof. Jomar 26

Differences of Least Squares Means

Effect LOC _LOC Difference Std Error DF t Pr > |t| Ord t

LOC 2 3 -2.73763258 0.79447682 3 -3.45 0.0411 0.0150

Para esse caso, cabe a mesma discussão feita para os exemplos 2 e 3.

Modelos Mistos Prof. Jomar 27

Bibliografia

GRAYBIL,F.A. Theory and application of the linear model. Duxbury, North State, Massachusetts, 1976,

__p.

HARTLEY,H.O. ; RAO, J.N.K. Maximum likelihood estimation for the mixed analysis of variance model.

Biometrika, 54, p. 93-108, 1967.

HENDERSON,C.R. Estimation of variance and covariance components, Biometrics, 17:226-52, 1953

SEARLE, S.R. Linear Models for Unbalanced data. New York: John Wiley, 1987. 536p.

SEARLE, S.R. Linear models . New York, John Wiley & Sons, 1971. 532p.

SEARLE, S.R. Variance Component . New York, John Wiley & Sons, 1992. 501p.