Regressao Linear Multipla

View
999
Download
6
Category

Documents

Preview:

Citation preview

Graduação em Engenharia Agronômica – UFRRJ, 1983.Graduação em Engenharia Agronômica – UFRRJ, 1983. Mestrado em Fitotecnia – UFRRJ, 1999.Mestrado em Fitotecnia – UFRRJ, 1999. Doutorado em Engenharia Agrícola – UFV, 2004. Doutorado em Engenharia Agrícola – UFV, 2004. Professor Adjunto, UFRRJ-IT-DE.Professor Adjunto, UFRRJ-IT-DE. Áreas de atuação: Mecanização Agrícola, Agricultura de Áreas de atuação: Mecanização Agrícola, Agricultura de

Precisão, Projeto de máquinas e Estatística Multivariada.Precisão, Projeto de máquinas e Estatística Multivariada.

Pós-Graduação em Agronomia - CPGA-SolosAnálise Multivariada Aplicada as Ciências Agrárias

Professor: Professor: Carlos Alberto Alves Varella

Ensinar modelagem estatística de Ensinar modelagem estatística de fenômenos naturais aos alunos de pós-fenômenos naturais aos alunos de pós-graduação utilizando técnicas da graduação utilizando técnicas da estatística multivariada. estatística multivariada.

Objetivo da disciplinaObjetivo da disciplina

Ementa da disciplinaEmenta da disciplina

Regressão linear múltiplaRegressão linear múltipla Regressão linear múltipla para dados repetidosRegressão linear múltipla para dados repetidos Validação da prediçãoValidação da predição Correlação múltiplaCorrelação múltipla Análise de componentes principaisAnálise de componentes principais Análise discriminante de FisherAnálise discriminante de Fisher Análise de variância multivariada - MANOVAAnálise de variância multivariada - MANOVA Análise de variáveis canônicasAnálise de variáveis canônicas

AvaliaçõesAvaliações

Uma ProvaUma ProvaTrabalhos semanaisTrabalhos semanaisTrabalho final: Cada aluno deverá Trabalho final: Cada aluno deverá

apresentar um seminário e um apresentar um seminário e um trabalho escrito sobre aplicações de trabalho escrito sobre aplicações de técnicas da estatística multivariada em técnicas da estatística multivariada em sua tese. sua tese.

Recursos computacionaisRecursos computacionais

SAS: recomendado para análises SAS: recomendado para análises estatísticas multivariadas por Revistas estatísticas multivariadas por Revistas de nível internacional.de nível internacional.

Local para baixar arquivos da Local para baixar arquivos da disciplina pela Internetdisciplina pela Internet

http://www.ufrrj.br/institutos/it/deng/http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htmvarella/multivariada.htm

Universidade Federal Rural do Rio de Janeiro CPGA-CS

Modelos LinearesModelos Lineares(revisão)(revisão)

Modelos linearesModelos linearesSeja Y a variável que queremos Seja Y a variável que queremos

predizer a partir de um conjunto de predizer a partir de um conjunto de variáveis preditoras Xvariáveis preditoras X11, X, X22, ..., X, ..., Xpp. .

Então podemos escrever:Então podemos escrever:

Y representa a resposta;Y representa a resposta; XX11,X,X22,..., X,..., Xpp são as variáveis estudadas; são as variáveis estudadas; εε representa outro conjunto de variáveis não representa outro conjunto de variáveis não

consideradas no estudo;consideradas no estudo;

,X,,X,XfY p21

Requisitos da funçãoRequisitos da função

Deve prestar-se ao tratamento Deve prestar-se ao tratamento matemático;matemático;

Deve ser adequada para o conjunto Deve ser adequada para o conjunto de dados em estudo;de dados em estudo;

Deve ser simples ou pelo menos mais Deve ser simples ou pelo menos mais simples dentre as concorrentes.simples dentre as concorrentes.

Condição para que um modelo seja linearCondição para que um modelo seja linear

Um modelo para as observações Y será Um modelo para as observações Y será linear se:linear se:

Este modelo é definido como Modelo Linear de Este modelo é definido como Modelo Linear de Gauss-Markov-Normal.Gauss-Markov-Normal.

)Y(

2,N~,Y

Vamos estudar o caso em que os erros são Vamos estudar o caso em que os erros são normalmente distribuídos, independentes e normalmente distribuídos, independentes e homocedásticos.homocedásticos.

A superfície de respostaA superfície de resposta

O modelo linear é a chave do negócio, isto é, tem O modelo linear é a chave do negócio, isto é, tem inúmeras aplicações na estatística multivariada.inúmeras aplicações na estatística multivariada.

É a superfície gerada pelos valores da É a superfície gerada pelos valores da variável de resposta. O modelo linear para variável de resposta. O modelo linear para uma única variável de resposta ‘Y’ com ‘p’ uma única variável de resposta ‘Y’ com ‘p’ variáveis preditoras é:variáveis preditoras é:

.n,,2,1i

eXXXY ipipi22i110i

YYii = superfície de resposta = superfície de respostan = número de observações;n = número de observações;p = número de variáveis preditoras.p = número de variáveis preditoras.

Duas situações são Duas situações são encontradas na modelagemencontradas na modelagem

1.1. A matriz X’X de variáveis preditoras A matriz X’X de variáveis preditoras ‘X’ é de posto coluna completo. Neste ‘X’ é de posto coluna completo. Neste caso o modelo é chamado de posto caso o modelo é chamado de posto completo ou modelo de regressão. É o completo ou modelo de regressão. É o modelo que estamos estudando;modelo que estamos estudando;

2.2. A matriz X’X de variáveis preditoras A matriz X’X de variáveis preditoras ‘X’ é de posto coluna incompleto. ‘X’ é de posto coluna incompleto. Neste caso o modelo é chamado de Neste caso o modelo é chamado de posto incompleto é o modelo da posto incompleto é o modelo da ANOVA (ANalysis Of VAriance) ANOVA (ANalysis Of VAriance)

Conseqüências da estimação

Posto ou Rank de matrizesPosto ou Rank de matrizes Número de linhas ou colunas linearmente Número de linhas ou colunas linearmente

independentes de uma matriz.independentes de uma matriz.

Em nosso caso, o posto é o número de Em nosso caso, o posto é o número de colunas linearmente independentes da matriz colunas linearmente independentes da matriz X’X, sendo X a matriz dos valores das X’X, sendo X a matriz dos valores das variáveis preditoras ou “independentes”variáveis preditoras ou “independentes”

No programa computacional MATLAB o No programa computacional MATLAB o comando comando rank rank faz uma estimativa do faz uma estimativa do posto de matrizes. posto de matrizes.

Conseqüências da estimação

Condições para que a matriz X’X Condições para que a matriz X’X seja de posto coluna completoseja de posto coluna completo

O posto ou rank da matriz X’X deve ser O posto ou rank da matriz X’X deve ser igual a ‘p+1’, ou seja:igual a ‘p+1’, ou seja:

1pX'Xposto

pp é o número de variáveis preditoras é o número de variáveis preditoras estudas no modelo.estudas no modelo.

Conseqüências da estimação

Condições para que a matriz Condições para que a matriz X’X tenha inversa (X’X)X’X tenha inversa (X’X)-1-1

As matrizes que possuem inversa são As matrizes que possuem inversa são chamadas NÃO SINGULARES.chamadas NÃO SINGULARES.

Somente matrizes quadradas podem Somente matrizes quadradas podem ser não singulares. Contudo, nem toda ser não singulares. Contudo, nem toda matriz quadrada é não singular;matriz quadrada é não singular;

Conseqüências da estimação

Quando uma matriz quadrada é Quando uma matriz quadrada é singular?singular?

Seu determinante é nulo; Seu determinante é nulo; det(X’X)det(X’X)Ao menos uma de suas raízes Ao menos uma de suas raízes

características é nula. As raízes características é nula. As raízes características são os autovalores da características são os autovalores da matriz; matriz; eig(X’X)eig(X’X)

Seu posto é menor que p; Seu posto é menor que p; rank(X’X)rank(X’X)Não é definida positiva ou negativa.Não é definida positiva ou negativa.

Conseqüências da estimação

Matriz definida positiva (negativa)Matriz definida positiva (negativa)

Quando todos os autovalores são Quando todos os autovalores são positivos (negativos).positivos (negativos).

Conseqüências da estimação

Regressão Linear MúltiplaRegressão Linear Múltipla

IntroduçãoIntroduçãoÉ uma técnica da estatística multivariada É uma técnica da estatística multivariada

utilizada para a predição de valores de utilizada para a predição de valores de uma ou mais variáveis de resposta uma ou mais variáveis de resposta (dependentes) a partir de diversas (dependentes) a partir de diversas variáveis preditoras ou independentes.variáveis preditoras ou independentes.

JOHNSON, R. A.; WICHERN, D. W. JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical Applied multivariate statistical analysisanalysis. 5th ed. Upper Saddle River, . 5th ed. Upper Saddle River, New Jersey: Prentice-Hall, 2002, 767 p.New Jersey: Prentice-Hall, 2002, 767 p.

Pode também ser utilizada para estudar o Pode também ser utilizada para estudar o efeito dos preditores sobre as variáveis de efeito dos preditores sobre as variáveis de resposta.resposta.

Primeiro trabalho sobre o assunto: Primeiro trabalho sobre o assunto: Regression Towards Mediocrity in Heredity Regression Towards Mediocrity in Heredity Stature. Journal of the Anthropological Stature. Journal of the Anthropological Institute, 15 (1885). 246-263.Institute, 15 (1885). 246-263.

Mediocridade em função da estatura Mediocridade em função da estatura hereditáriahereditária

Estatística UNIVARIADA. Segundo Estatística UNIVARIADA. Segundo JOHNSON & WICHERN (2002) nesse JOHNSON & WICHERN (2002) nesse artigo o autor não percebeu a importância artigo o autor não percebeu a importância da técnica para análises multivariadas.da técnica para análises multivariadas.

Introdução (Cont.) Introdução (Cont.)

Modelagem da Regressão Modelagem da Regressão LinearLinear

Pressuposições da modelagem Pressuposições da modelagem

O modelo utilizado é o de Gauss-Markov-NormalO modelo utilizado é o de Gauss-Markov-Normal Pressupõe Pressupõe que a resposta apresenta uma média. que a resposta apresenta uma média.

Pressupõe ainda que essa média contem erros Pressupõe ainda que essa média contem erros provenientes de medições aleatórias e de outras provenientes de medições aleatórias e de outras fontes não explicitadas pelo modelo.fontes não explicitadas pelo modelo.

O erro, e conseqüentemente a resposta, são O erro, e conseqüentemente a resposta, são tratados como variáveis aleatórias, que o tratados como variáveis aleatórias, que o comportamento é caracterizado assumindo-se comportamento é caracterizado assumindo-se uma distribuição NORMAL para os dados uma distribuição NORMAL para os dados experimentais.experimentais.

Este método consiste em se determinar o Este método consiste em se determinar o estimador que minimiza a soma do estimador que minimiza a soma do quadrado das diferenças entre valores quadrado das diferenças entre valores observados e valores preditos pelo modelo. observados e valores preditos pelo modelo.

linear modelo o é XY

de estimador o ˆ determinar Queremos

Estimadores dos parâmetros pelo Estimadores dos parâmetros pelo método dos mínimos quadradosmétodo dos mínimos quadrados

O erro do modelo na forma matricial é:O erro do modelo na forma matricial é:

pnn2n1

2p2212

1p2111

XXX1

O problema consiste em se ajustar um O problema consiste em se ajustar um modelo de regressão.modelo de regressão.

O erro da modelagemO erro da modelagemEstimadores dos parâmetros pelo método dos mínimos quadrados

Modelo de regressãoModelo de regressão

O estimador de beta é chamado de beta O estimador de beta é chamado de beta chapéu e pode ser determinado por outros chapéu e pode ser determinado por outros métodos de minimização do erro, como por métodos de minimização do erro, como por exemplo o método da máxima exemplo o método da máxima verossimilhança.verossimilhança.

.n,,2,1i,XˆXˆXˆˆY pipi22i110i

Estimadores dos parâmetros pelo método dos mínimos quadrados

O método dos mínimos quadradosO método dos mínimos quadrados

Sabendo que o erro do modelo é:Sabendo que o erro do modelo é:

Então o somatório ao quadrado das Então o somatório ao quadrado das diferenças dos erros pode ser diferenças dos erros pode ser representado na forma matricial por:representado na forma matricial por:

2XYZ

De acordo com o método temos que De acordo com o método temos que minimizar Zminimizar Z

Estimadores dos parâmetros pelo método dos mínimos quadrados

Minimização da função ZMinimização da função Z

As matrizes Y’XAs matrizes Y’Xββ e e ββ’X’Y uma é a ’X’Y uma é a transposta da outra e são de dimensão transposta da outra e são de dimensão 1x1, então as matrizes são iguais.1x1, então as matrizes são iguais.

2XYZ

X'X'Y'X'X'YY'YZ

XY'X''YZ

XYXYZ '

Estimadores dos parâmetros pelo método dos mínimos quadrados

X'X'Y'X'2Y'YZ

Diferenciando a função ZDiferenciando a função Z

dX'X'X'X'dY'X'd2dZ

As matrizes (dAs matrizes (dββ’)X’X’)X’Xββ e e ββ’X’X(d’X’X(dββ) uma é a ) uma é a transposta da outra e são de dimensão 1x1, transposta da outra e são de dimensão 1x1, então as matrizes são iguais.então as matrizes são iguais.

Y'XX'X'd2dZ

X'X'd2Y'X'd2dZ

Estimadores dos parâmetros pelo método dos mínimos quadrados

Fazendo com que a diferencial Fazendo com que a diferencial de Z seja igual a zerode Z seja igual a zero

Para que a diferencial de Z seja zeroPara que a diferencial de Z seja zero

0dZ

0Y'XX'X'd2

Para que dZ seja zero, (X’XPara que dZ seja zero, (X’Xββ-X’Y) -X’Y) deve ser igual a zero.deve ser igual a zero.

0Y'XˆX'X

Estimadores dos parâmetros pelo método dos mínimos quadrados

O beta chapéuO beta chapéuAssim é chamado o vetor estimador Assim é chamado o vetor estimador

dos parâmetros de beta. dos parâmetros de beta. O vetor beta chapéu é determinado O vetor beta chapéu é determinado

resolvendo-se o sistema de equações resolvendo-se o sistema de equações normais: normais:

Y'XˆX'X

Estimadores dos parâmetros pelo método dos mínimos quadrados

Solução do sistema de equações normaisSolução do sistema de equações normais

Multiplicando-se ambos os membros do sistema de Multiplicando-se ambos os membros do sistema de

equações porequações por

Y'XˆX'X

1X'X

Temos:Temos: Y'XX'XˆX'XX'X 11

Y'XX'Xˆ 1 O modelo de regressão pressupõe um beta chapéu O modelo de regressão pressupõe um beta chapéu

único não tendencioso (blue). Mas isso precisa de único não tendencioso (blue). Mas isso precisa de

ser testado.ser testado.

Estimadores dos parâmetros pelo método dos mínimos quadrados

O modelo que estamos estudando é o O modelo que estamos estudando é o Linear de Gauss-Markov-Normal.Linear de Gauss-Markov-Normal.

2,N~,XY

modelo do erro o é esteXY

Regressão Linear Múltipla

Conseqüências da estimaçãoConseqüências da estimação

A média do modelo linearA média do modelo linear

Quando trabalhos com dados Quando trabalhos com dados experimentais assumimos que o estimador experimentais assumimos que o estimador da média ‘x barra’ pode representar a da média ‘x barra’ pode representar a média ‘média ‘μμ’ da população’ da população. Mas depois . Mas depois precisamos testar se isso é verdadeiro.precisamos testar se isso é verdadeiro.

'.' média

como conhecido também população, da

matemática esperança a éX Y

Conseqüências da estimação

.ˆ o , de estimador

do e X preditoras variáveis de valores de

linear combinação uma de função em

Y para obtidos valores é, isto modelo,

pelo preditos valores os sãoˆXY

Quando trabalhos com dados experimentais Quando trabalhos com dados experimentais determinamos o beta chapéu a partir de determinamos o beta chapéu a partir de amostras da população. Por isso é que amostras da população. Por isso é que precisamos testar se esse beta é mesmo precisamos testar se esse beta é mesmo estimador não tendencioso.estimador não tendencioso.

Os valores preditos pelo modeloOs valores preditos pelo modeloConseqüências da estimação

desvio.ou

resíduo de chamado também ajustado,

modelo do erro o é ˆXYYYˆ

O erro do modelo de regressãoO erro do modelo de regressão

Este é o erro que calculamos quando Este é o erro que calculamos quando trabalhamos com dados experimentais.trabalhamos com dados experimentais.

É um vetor que descreve a distribuição É um vetor que descreve a distribuição dos dados experimentais. Muitas dos dados experimentais. Muitas inferências sobre nossos dados podem inferências sobre nossos dados podem ser feitas analisando-se esse vetor. ser feitas analisando-se esse vetor.

Conseqüências da estimação

O que queremos modelarO que queremos modelar

fenômeno. do modelagem na erro o é :ˆ

estudado; fenômeno do modelagem a é :Y

modelar; queremos que fenômeno o é :Y

ˆYY

Quando trabalhos com dados Quando trabalhos com dados experimentais assumimos que nossas experimentais assumimos que nossas observações são capazes de modelar observações são capazes de modelar o fenômeno, e depois testamos.o fenômeno, e depois testamos.

Conseqüências da estimação

Prática 1 Prática 1 Na tabela abaixo apresentamos os valores de uma Na tabela abaixo apresentamos os valores de uma

amostra de 6 observações das variáveis Yamostra de 6 observações das variáveis Y ii, X, X1i1i e X e X2i2i. .

YYii XX1i1i XX2i2i

1,51,5 00 00

6,56,5 11 22

10,010,0 11 44

11,011,0 22 22

11,511,5 22 44

16,516,5 33 66

Fonte: Apostila de INF 664 Modelos Lineares. Adair José Regazzi,UFV, Viçosa, 2002.

Montar do sistema de equações normais Montar do sistema de equações normais

631

421

221

411

211

001

Quando a regressão é com intercepto adicionados Quando a regressão é com intercepto adicionados uma coluna de uns na matriz de dados. uma coluna de uns na matriz de dados.

X com intercepto

X sem intercepto

5,16

5,11

0,11

0,10

5,6

5,1

Resposta Y

Prática 1

Obtenção da matriz X’XObtenção da matriz X’X

Esta matriz é obtida multiplicando-se a Esta matriz é obtida multiplicando-se a transposta da matriz X por ela mesma.transposta da matriz X por ela mesma.

763618

36199

1896

631

421

221

411

211

001

642420

322110

111111

X'X

Prática 1

Obtenção da matriz X’YObtenção da matriz X’YEsta matriz é obtida multiplicando-se a Esta matriz é obtida multiplicando-se a

transposta da matriz X pelo vetor Y.transposta da matriz X pelo vetor Y.

220

111

5,16

5,11

0,11

0,10

5,6

5,1

642420

322110

111111

Y'X

Prática 1

Sistema de equações normaisSistema de equações normais Estimativa de beta pelos método dos Estimativa de beta pelos método dos

mínimos quadradosmínimos quadrados

220

763618

36199

1896

B 1

Prática 1

regressão de equação a é :X13X2Y

s.regressore os são: e

regressão; de equação da intercepto o é :ˆ

2i1ii

Programa na linguagem MATLABPrograma na linguagem MATLAB

Exemplos de comandos do Programa Exemplos de comandos do Programa computacional MATLABcomputacional MATLAB

Resultados obtidos no Programa Resultados obtidos no Programa computacional MATLABcomputacional MATLAB

Vetor de parâmetrosVetor de parâmetros

Posto da matrizPosto da matriz

Determinante da matrizDeterminante da matriz

Autovalores da matrizAutovalores da matriz

Análise de Variância da Análise de Variância da Regressão LinearRegressão Linear

A análise de variância da regressão é a A análise de variância da regressão é a estatística utilizada para testar os estatística utilizada para testar os regressores. A hipótese nula é que todos os regressores. A hipótese nula é que todos os regressores são iguais e zero. Caso isso não regressores são iguais e zero. Caso isso não ocorra o resultado da análise é significativo, ocorra o resultado da análise é significativo, isto é, rejeita-se a hipótese nula.isto é, rejeita-se a hipótese nula.

A análise de variância não testa o intercepto.A análise de variância não testa o intercepto.

Análise de variância da Análise de variância da regressão linear regressão linear

0: 210 pH

Algumas Pressuposições do Algumas Pressuposições do ModeloModelo

Beta chapéu é um estimador não Beta chapéu é um estimador não tendencioso:tendencioso:

A esperança do erro do modelo é zero e a A esperança do erro do modelo é zero e a esperança da variância dos erros é esperança da variância dos erros é constante:constante:

2IVe

Variâncias e Covariâncias do Vetor Variâncias e Covariâncias do Vetor Estimador dos ParâmetrosEstimador dos Parâmetros

O vetor estimador dos parâmetros é beta O vetor estimador dos parâmetros é beta chapéu:chapéu:

21' )X'X(])ˆ()ˆ[()ˆ(Cov

A covariância deste vetor é:A covariância deste vetor é:

21 ˆ)'()ˆ( XXCov 21)'()ˆ( sXXCov

ss22 é o Quadrado médio do resíduo. é o Quadrado médio do resíduo.

Soma de Quadrado do ResíduoSoma de Quadrado do ResíduoSoma dos quadrados dos desvios entre os Soma dos quadrados dos desvios entre os

valores observados e os estimados pela valores observados e os estimados pela equação de regressão.equação de regressão.

1iii YYsReSQ

Escrito na forma matricial é:Escrito na forma matricial é:

Y'X'ˆY'YsReSQ

Soma de Quadrado TotalSoma de Quadrado Total

Matricialmente podemos escrever:Matricialmente podemos escrever:

YSQTotal

1iin

cY'YSQTotal Y'uu'Yn

uu é um vetor de 1’s de dimensão n x 1. é um vetor de 1’s de dimensão n x 1.

Soma de Quadrado da RegressãoSoma de Quadrado da Regressão

Na forma matricial escrevemos:Na forma matricial escrevemos:

1ii YYgReSQ

Y'uu'Yn

1Y'X'ˆgReSQ

Esquema da análise de variância Esquema da análise de variância da regressãoda regressão

n =número de observações;n =número de observações; p =número de variáveisp =número de variáveis Análise para dados não repetidosAnálise para dados não repetidos

Causa de Causa de variaçãovariação GLGL SQSQ QMQM FF

RegressãoRegressão pp SQReg/pSQReg/p

ResíduoResíduo n-p-1n-p-1 SQRes/n-p-1SQRes/n-p-1

TotalTotal n-1n-1

cY'X'ˆ

Y'X'ˆY'Y

cY'Y

sReQM

gReQM

Teste F dos parâmetrosTeste F dos parâmetros

Se os erros eSe os erros ei i têm distribuição normal e se o têm distribuição normal e se o quocientequociente

0p21

É o mesmo que testar se: É o mesmo que testar se:

sReQM

gReQMF

tem distribuição F (central) com p e n-p-1 tem distribuição F (central) com p e n-p-1 graus de liberdade.graus de liberdade.

0:H p210

F é utilizado para testar a hipótese:F é utilizado para testar a hipótese:

Quando o teste F é significativo?Quando o teste F é significativo?

Quando F é maior que o tabelado;Quando F é maior que o tabelado;Quando rejeitamos a hipótese nula;Quando rejeitamos a hipótese nula;Contudo não é possível concluir quais Contudo não é possível concluir quais

parâmetros são significativos;parâmetros são significativos;Exceto para o caso particular de Exceto para o caso particular de p=1p=1..

Teste Teste tt dos parâmetros dos parâmetrosUtilizado para testar hipótese a respeito dos Utilizado para testar hipótese a respeito dos

parâmetros da regressão .parâmetros da regressão .

gl. 1)-p-(n a associado,)ˆ(s

ˆt

A estatística utilizada é:A estatística utilizada é:

O teste é significativo quando t é maior que o O teste é significativo quando t é maior que o valor tabelado.valor tabelado.

Hipóteses a Respeito dos Parâmetros Hipóteses a Respeito dos Parâmetros no Modelo Linearno Modelo Linear

A hipótese de nulidade pode ser construída a A hipótese de nulidade pode ser construída a partir de partir de mm combinações lineares independentes combinações lineares independentes

'c:H0

c’ é uma matriz com c’ é uma matriz com mm linhas e linhas e p+1p+1 colunas colunas

]cccc['c p210

θθ é um vetor é um vetor mm-dimensional de constantes -dimensional de constantes conhecidas.conhecidas.

Estatística F usada para testar a Estatística F usada para testar a hipótese Hhipótese H00:c’:c’==θθ

0 ˆm

)ˆ'C(]C)X'X('C[)'ˆ'C()H(F

Sendo verdadeira a hipótese de nulidade a Sendo verdadeira a hipótese de nulidade a estatística estatística F(HF(H00)) tem distribuição tem distribuição FF com com mm

e e n-posto[X]=n-p-1n-posto[X]=n-p-1 graus de liberdade. graus de liberdade.

Estatística de WaldEstatística de WaldPara teste F simultâneo dos parâmetrosPara teste F simultâneo dos parâmetros

Exemplo: testar a hipótese Exemplo: testar a hipótese HH00::11==22=0=0

Posto [c’]=Posto [c’]=mm=2=2

0e0:H0

100

010'c:H 210

100

010ˆ'c

3ˆ'c

Exemplo: testar a hipótese Exemplo: testar a hipótese HH00::11==22=0=0

3354

54132

240

1c)x'x('c 1

6132

654

633

c)x'x('c11

50,1251

6132

654

633

Rejeita-se a hipótese HRejeita-se a hipótese H00::11==22=0=0

Exemplo: testar a hipótese Exemplo: testar a hipótese HH00::11==22=0=0

00,1126

00,3

1pn

y'x'ˆy'yQMRsˆ 22

**0 75,62

)00,1(2

50,125)H(F

82,30)3;2(F %1

Estatística Estatística t t usada para testar a usada para testar a hipótese Hhipótese H00:c’:c’==θθ

Podemos usar Podemos usar tt para testar hipóteses a para testar hipóteses a respeito de combinações lineares dos respeito de combinações lineares dos parâmetrosparâmetros

gl. 1)-p-(n a ,)ˆ'(ˆ

'ˆ'associado

cct

GLR)X(poston1pn

Teste Simultâneo dos Teste Simultâneo dos ParâmetrosParâmetros

Testa uma única hipótese;Testa uma única hipótese;Testa um vetor de betas;Testa um vetor de betas;Não é o mesmo que testar os betas Não é o mesmo que testar os betas

separadamente.separadamente. Isto é, Isto é, testartestar

Não é o mesmo que testarNão é o mesmo que testar

0:He0:H 2110

0:Hou0:H

10210

Programa SAS (reg_cap1.sas)Programa SAS (reg_cap1.sas)proc reg data=sas.ind_v9;

/*ndvi rnir gnir arvi savi gndvi*/

model N = gndvi;

output out=p p=yhat r=resid;

print p;

run;

quit;

proc reg;

model yhat=N;

test N=1, intercept=0;

run;

plot yhat*N;

run;

quit;

Output do SAS – Análise de variância do Output do SAS – Análise de variância do modelo de regressãomodelo de regressão

The SAS System 23:15 Thursday, October 7, 2009 5The SAS System 23:15 Thursday, October 7, 2009 5

The REG ProcedureThe REG Procedure

Model: MODEL1Model: MODEL1

Dependent Variable: N NDependent Variable: N N

Analysis of VarianceAnalysis of Variance

Sum of MeanSum of Mean

Source DF Squares Square F Value Pr > FSource DF Squares Square F Value Pr > F

Model 6 20710 3451.59735 4.39 0.0293Model 6 20710 3451.59735 4.39 0.0293

Error 8 6290.41589 786.30199Error 8 6290.41589 786.30199

Corrected Total 14 27000Corrected Total 14 27000

Root MSE 28.04108 R-Square 0.7670Root MSE 28.04108 R-Square 0.7670

Dependent Mean 60.00000 Adj R-Sq 0.5923Dependent Mean 60.00000 Adj R-Sq 0.5923

Coeff Var 46.73513Coeff Var 46.73513

Teste t dos beta-chapéu do modelo de Teste t dos beta-chapéu do modelo de regressãoregressão

Parameter EstimatesParameter Estimates

Parameter StandardParameter Standard

Variable Label DF Estimate Error t Value Pr > |t|Variable Label DF Estimate Error t Value Pr > |t|

Intercept Intercept 1 1835.59747 1483.61562 1.24 0.2511Intercept Intercept 1 1835.59747 1483.61562 1.24 0.2511

NDVI NDVI 1 -15182 19298 -0.79 0.4541NDVI NDVI 1 -15182 19298 -0.79 0.4541

RNIR RNIR 1 -1698.66240 3814.27214 -0.45 0.6679RNIR RNIR 1 -1698.66240 3814.27214 -0.45 0.6679

GNIR GNIR 1 -413.90081 2665.47402 -0.16 0.8804GNIR GNIR 1 -413.90081 2665.47402 -0.16 0.8804

ARVI ARVI 1 546.46984 283.26026 1.93 0.0898ARVI ARVI 1 546.46984 283.26026 1.93 0.0898

SAVI SAVI 1 8350.10834 13196 0.63 0.5445SAVI SAVI 1 8350.10834 13196 0.63 0.5445

GNDVI GNDVI 1 594.04446 2908.94995 0.20 0.8433GNDVI GNDVI 1 594.04446 2908.94995 0.20 0.8433

Dependent PredictedDependent Predicted

Obs Variable Value ResidualObs Variable Value Residual

1 0 -16.4019 16.40191 0 -16.4019 16.4019

2 0 -3.4152 3.41522 0 -3.4152 3.4152

3 0 19.8021 -19.80213 0 19.8021 -19.8021

4 30.0000 30.9970 -0.99704 30.0000 30.9970 -0.9970

5 30.0000 68.5033 -38.50335 30.0000 68.5033 -38.5033

6 30.0000 47.8805 -17.88056 30.0000 47.8805 -17.8805

7 60.0000 67.1267 -7.12677 60.0000 67.1267 -7.1267

8 60.0000 99.6748 -39.67488 60.0000 99.6748 -39.6748

9 60.0000 61.1820 -1.18209 60.0000 61.1820 -1.1820

10 90.0000 68.4044 21.595610 90.0000 68.4044 21.5956

11 90.0000 65.1605 24.839511 90.0000 65.1605 24.8395

12 90.0000 78.0660 11.934012 90.0000 78.0660 11.9340

13 120.0000 97.4010 22.599013 120.0000 97.4010 22.5990

14 120.0000 116.5953 3.404714 120.0000 116.5953 3.4047

15 120.0000 99.0235 20.976515 120.0000 99.0235 20.9765

Sum of Residuals -3.6067E-11Sum of Residuals -3.6067E-11

Sum of Squared Residuals 6290.41589Sum of Squared Residuals 6290.41589

Predicted Residual SS (PRESS) 28335Predicted Residual SS (PRESS) 28335

Níveis de N preditos pelo modeloNíveis de N preditos pelo modelo

Gráfico: Predito x ObservadoGráfico: Predito x Observado

ConclusãoConclusão

O modelo de regressão multivariado O modelo de regressão multivariado proposto não pode ser utilizado para proposto não pode ser utilizado para predizer níveis de N aplicados no solo. predizer níveis de N aplicados no solo.

FIMFIM

Recommended