14
Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos Alberto Alves Varella Novembro-2006

Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Embed Size (px)

Citation preview

Page 1: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Regressão Múltipla para Dados Repetidos

Análise Multivariada Aplicada as Ciências Agrárias

Universidade Federal Rural do Rio de JaneiroCPGA-Solos

Carlos Alberto Alves VarellaNovembro-2006

Page 2: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Introdução

• Quando temos duas ou mais respostas para o mesmo tratamento;

• SQTratamentos é decomposto em SQregressão e SQFalta de ajustamento;

• O ajuste do modelo é avaliado pelo teste para falta de ajustamento.

Regressão Linear Múltipla para Dados com Repetição

Page 3: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Tratamentos (X)

Repetições (Y) Total de tratamentos

Média de tratamentos

1 2

2 5 5 10 5,0

4 5 7 12 6,0

6 7 8 15 7,5

8 8 9 17 8,5

10 9 12 21 10,5

Análise de variância da regressão com o teste para falta de ajustamento

• Exemplo para dados de um delineamento experimental inteiramente casualizado. Tratamentos são 5 níveis de uma mesma variável.

iYiT

Regressão Linear Múltipla para Dados com Repetição

N=número de observações = 10; n=número de tratamentos = 5;r=número de repetições; G=total de observações=75.

Page 4: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Obtenção da variância residual ou erro puro• A variância residual é obtida por ANOVA;• O modelo estatístico para delineamento

inteiramente causalizado é:

Regressão Linear Múltipla para Dados com Repetição

.

;

;

;

puroerroresíduoe

tratamentodeefeitot

stratamentodemédia

respostaY

ij

i

ij

ijiij etY

Page 5: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

ANOVA para delineamento inteiramente casualizado

Regressão Linear Múltipla para Dados com Repetição

F.V. G.L. S.Q. Q.M.

Tratamentos 4 37,00

Resíduo 5 7,50 1,50

Total 9 44,50

50,441075

125,2

22

2

1

,

2

N

YcsendocYSQTotal

N

ii

ji ij

00,371075

211210211 2

222

1

2

cTr

tosSQTratamenn

ii

50,700,3750,44 SQTratSQTotalSQR

.550,155,7

ˆ 22 glncomsQMR e

Page 6: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Neste caso não tem sentido aplicar o teste F

• O teste F tem como hipótese nula a igualdade das médias de fatores da variação;

• De fato o que estamos analisando são níveis de um mesmo fator, então só temos um fator e não tem sentido a aplicação do teste F;

• A estatística utilizada para avaliar o efeito de níveis de um mesmo fator quantitativo é a análise de variância da regressão.

Regressão Linear Múltipla para Dados com Repetição

Page 7: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

É preciso conhecer o fenômeno para depois modelar, ou melhor, tentar

imitar o mundo real.• Neste caso estamos usando dois

modelos: ANOVA e REGRESSÃO

Regressão Linear Múltipla para Dados com Repetição

ijiij etY

iii eXY 10

• Cada valor distinto de X é considerado com um diferente tratamento.

• Neste caso, usado apenas para obter o erro puro=variância residual da estimativa.

• Cada valor distinto de X é considerado com um diferente valor de X.

• De fato é o que ocorre no mundo real. • Este é o modelo que devemos usar para avaliar o efeito da

variação de X sobre o fenômeno.

Page 8: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Podemos adotar 3 estratégias diferentes para a análise da regressão1. Utilizando as observações individualizadas2. Utilizando os totais de tratamentos3. Utilizando a média de tratamentos

• A estratégia utilizada não altera o resultado da análise;A equação de regressão será a mesma, isto é, mesmo intercepto e mesmos regressores.

Regressão Linear Múltipla para Dados com Repetição

Page 9: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Primeiro caso: utilizando as observações individualizadas

1

0

ˆ

ˆˆ,

504

75',

44060

6010',

101

101

81

81

61

61

41

41

21

21

,

12

9

9

8

8

7

7

5

5

5

YXXXXY

ii XY 675,045,3ˆ

Regressão Linear Múltipla para Dados com Repetição

675,0

45,3

504

75

1060

60440

8001ˆ

''ˆ'ˆ' 1

YXXXYXXX

Page 10: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Segundo caso: utilizando os totais de tratamentos

1

0

ˆ

ˆˆ,

504

75',

22030

305',

101

81

61

41

21

,

21

17

15

12

10

YXXXXY

ii XY 675,045,3ˆ

Regressão Linear Múltipla para Dados com Repetição

675,0

45,3

504

75

530

30220

2001

21ˆ

''1ˆ'ˆ' 1

YXXXr

YXXXr

Page 11: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

675,0

45,3

252

5,37

530

30220

2001ˆ

''ˆ'ˆ' 1

YXXXYXXX

Terceiro caso: utilizando a média de tratamentos

1

0

ˆ

ˆˆ,

252

5,37',

22030

305',

101

81

61

41

21

,

51,10

5,8

5,7

0,6

0,5

YXXXXY

ii XY 675,045,3ˆ

Regressão Linear Múltipla para Dados com Repetição

Page 12: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Seleção de modelos de regressão utilizando o teste F para falta de ajustamento

Regressão Linear Múltipla para Dados com Repetição

regressão

falta deajustamento

erro puro

F

modelo podeser selecionado

ns

*modelo

inadequado

F

modeloinadequado

ns

*modelo pode

ser selecionado

MODELO

Page 13: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Análise de variância da regressão com o teste para falta de ajustamento: observações individualizadas

55,02750,02ˆ.

05,895,598607''ˆ'

45,3650,56295,59850,562504

75675,045,3''ˆ

50,4450,562607'

2

1

I

iii YYroajustamentdeSQfalta

YXYYoSQregressãSQtotalregressãodaSQresíduo

cyXoSQregressã

cYYSQtotal

Regressão Linear Múltipla para Dados com Repetição

Cálculo da soma de quadrados para a falta de ajustamento

2 5 4,8 0,20 0,0400

4 6 6,15 -0,15 0,0225

6 7,5 7,50 0,00 0,0000

8 8,5 8,85 -0,35 0,1225

10 10,5 10,20 0,30 0,0900

0,00 0,2750

iX iY iY ii YY ˆ 2ii YY

Page 14: Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos

Resultado da análise de variância da regressão com o teste para falta de ajustamento

**= p<0,01; n.s=p>0,05

Regressão Linear Múltipla para Dados com Repetição

FV GL SQ QM F

Regressão 1 36,45 36,45 24,30**

Resíduo da regressão

8 8,05 1,00

Falta de ajustamento

3 0,55 0,18 0,12ns

Resíduo 5 7,50 1,50

Total 9 44,50