View
999
Download
6
Category
Preview:
Citation preview
Graduação em Engenharia Agronômica – UFRRJ, 1983.Graduação em Engenharia Agronômica – UFRRJ, 1983. Mestrado em Fitotecnia – UFRRJ, 1999.Mestrado em Fitotecnia – UFRRJ, 1999. Doutorado em Engenharia Agrícola – UFV, 2004. Doutorado em Engenharia Agrícola – UFV, 2004. Professor Adjunto, UFRRJ-IT-DE.Professor Adjunto, UFRRJ-IT-DE. Áreas de atuação: Mecanização Agrícola, Agricultura de Áreas de atuação: Mecanização Agrícola, Agricultura de
Precisão, Projeto de máquinas e Estatística Multivariada.Precisão, Projeto de máquinas e Estatística Multivariada.
Pós-Graduação em Agronomia - CPGA-SolosAnálise Multivariada Aplicada as Ciências Agrárias
Professor: Professor: Carlos Alberto Alves Varella
Ensinar modelagem estatística de Ensinar modelagem estatística de fenômenos naturais aos alunos de pós-fenômenos naturais aos alunos de pós-graduação utilizando técnicas da graduação utilizando técnicas da estatística multivariada. estatística multivariada.
Objetivo da disciplinaObjetivo da disciplina
Ementa da disciplinaEmenta da disciplina
Regressão linear múltiplaRegressão linear múltipla Regressão linear múltipla para dados repetidosRegressão linear múltipla para dados repetidos Validação da prediçãoValidação da predição Correlação múltiplaCorrelação múltipla Análise de componentes principaisAnálise de componentes principais Análise discriminante de FisherAnálise discriminante de Fisher Análise de variância multivariada - MANOVAAnálise de variância multivariada - MANOVA Análise de variáveis canônicasAnálise de variáveis canônicas
AvaliaçõesAvaliações
Uma ProvaUma ProvaTrabalhos semanaisTrabalhos semanaisTrabalho final: Cada aluno deverá Trabalho final: Cada aluno deverá
apresentar um seminário e um apresentar um seminário e um trabalho escrito sobre aplicações de trabalho escrito sobre aplicações de técnicas da estatística multivariada em técnicas da estatística multivariada em sua tese. sua tese.
Recursos computacionaisRecursos computacionais
SAS: recomendado para análises SAS: recomendado para análises estatísticas multivariadas por Revistas estatísticas multivariadas por Revistas de nível internacional.de nível internacional.
Local para baixar arquivos da Local para baixar arquivos da disciplina pela Internetdisciplina pela Internet
http://www.ufrrj.br/institutos/it/deng/http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htmvarella/multivariada.htm
Universidade Federal Rural do Rio de Janeiro CPGA-CS
Modelos LinearesModelos Lineares(revisão)(revisão)
Modelos linearesModelos linearesSeja Y a variável que queremos Seja Y a variável que queremos
predizer a partir de um conjunto de predizer a partir de um conjunto de variáveis preditoras Xvariáveis preditoras X11, X, X22, ..., X, ..., Xpp. .
Então podemos escrever:Então podemos escrever:
Y representa a resposta;Y representa a resposta; XX11,X,X22,..., X,..., Xpp são as variáveis estudadas; são as variáveis estudadas; εε representa outro conjunto de variáveis não representa outro conjunto de variáveis não
consideradas no estudo;consideradas no estudo;
,X,,X,XfY p21
Requisitos da funçãoRequisitos da função
Deve prestar-se ao tratamento Deve prestar-se ao tratamento matemático;matemático;
Deve ser adequada para o conjunto Deve ser adequada para o conjunto de dados em estudo;de dados em estudo;
Deve ser simples ou pelo menos mais Deve ser simples ou pelo menos mais simples dentre as concorrentes.simples dentre as concorrentes.
f
Condição para que um modelo seja linearCondição para que um modelo seja linear
Um modelo para as observações Y será Um modelo para as observações Y será linear se:linear se:
Este modelo é definido como Modelo Linear de Este modelo é definido como Modelo Linear de Gauss-Markov-Normal.Gauss-Markov-Normal.
)Y(
2,N~,Y
Vamos estudar o caso em que os erros são Vamos estudar o caso em que os erros são normalmente distribuídos, independentes e normalmente distribuídos, independentes e homocedásticos.homocedásticos.
A superfície de respostaA superfície de resposta
O modelo linear é a chave do negócio, isto é, tem O modelo linear é a chave do negócio, isto é, tem inúmeras aplicações na estatística multivariada.inúmeras aplicações na estatística multivariada.
É a superfície gerada pelos valores da É a superfície gerada pelos valores da variável de resposta. O modelo linear para variável de resposta. O modelo linear para uma única variável de resposta ‘Y’ com ‘p’ uma única variável de resposta ‘Y’ com ‘p’ variáveis preditoras é:variáveis preditoras é:
.n,,2,1i
eXXXY ipipi22i110i
YYii = superfície de resposta = superfície de respostan = número de observações;n = número de observações;p = número de variáveis preditoras.p = número de variáveis preditoras.
Duas situações são Duas situações são encontradas na modelagemencontradas na modelagem
1.1. A matriz X’X de variáveis preditoras A matriz X’X de variáveis preditoras ‘X’ é de posto coluna completo. Neste ‘X’ é de posto coluna completo. Neste caso o modelo é chamado de posto caso o modelo é chamado de posto completo ou modelo de regressão. É o completo ou modelo de regressão. É o modelo que estamos estudando;modelo que estamos estudando;
2.2. A matriz X’X de variáveis preditoras A matriz X’X de variáveis preditoras ‘X’ é de posto coluna incompleto. ‘X’ é de posto coluna incompleto. Neste caso o modelo é chamado de Neste caso o modelo é chamado de posto incompleto é o modelo da posto incompleto é o modelo da ANOVA (ANalysis Of VAriance) ANOVA (ANalysis Of VAriance)
Conseqüências da estimação
Posto ou Rank de matrizesPosto ou Rank de matrizes Número de linhas ou colunas linearmente Número de linhas ou colunas linearmente
independentes de uma matriz.independentes de uma matriz.
Em nosso caso, o posto é o número de Em nosso caso, o posto é o número de colunas linearmente independentes da matriz colunas linearmente independentes da matriz X’X, sendo X a matriz dos valores das X’X, sendo X a matriz dos valores das variáveis preditoras ou “independentes”variáveis preditoras ou “independentes”
No programa computacional MATLAB o No programa computacional MATLAB o comando comando rank rank faz uma estimativa do faz uma estimativa do posto de matrizes. posto de matrizes.
Conseqüências da estimação
Condições para que a matriz X’X Condições para que a matriz X’X seja de posto coluna completoseja de posto coluna completo
O posto ou rank da matriz X’X deve ser O posto ou rank da matriz X’X deve ser igual a ‘p+1’, ou seja:igual a ‘p+1’, ou seja:
1pX'Xposto
pp é o número de variáveis preditoras é o número de variáveis preditoras estudas no modelo.estudas no modelo.
Conseqüências da estimação
Condições para que a matriz Condições para que a matriz X’X tenha inversa (X’X)X’X tenha inversa (X’X)-1-1
As matrizes que possuem inversa são As matrizes que possuem inversa são chamadas NÃO SINGULARES.chamadas NÃO SINGULARES.
Somente matrizes quadradas podem Somente matrizes quadradas podem ser não singulares. Contudo, nem toda ser não singulares. Contudo, nem toda matriz quadrada é não singular;matriz quadrada é não singular;
Conseqüências da estimação
Quando uma matriz quadrada é Quando uma matriz quadrada é singular?singular?
Seu determinante é nulo; Seu determinante é nulo; det(X’X)det(X’X)Ao menos uma de suas raízes Ao menos uma de suas raízes
características é nula. As raízes características é nula. As raízes características são os autovalores da características são os autovalores da matriz; matriz; eig(X’X)eig(X’X)
Seu posto é menor que p; Seu posto é menor que p; rank(X’X)rank(X’X)Não é definida positiva ou negativa.Não é definida positiva ou negativa.
Conseqüências da estimação
Matriz definida positiva (negativa)Matriz definida positiva (negativa)
Quando todos os autovalores são Quando todos os autovalores são positivos (negativos).positivos (negativos).
Conseqüências da estimação
Regressão Linear MúltiplaRegressão Linear Múltipla
IntroduçãoIntroduçãoÉ uma técnica da estatística multivariada É uma técnica da estatística multivariada
utilizada para a predição de valores de utilizada para a predição de valores de uma ou mais variáveis de resposta uma ou mais variáveis de resposta (dependentes) a partir de diversas (dependentes) a partir de diversas variáveis preditoras ou independentes.variáveis preditoras ou independentes.
JOHNSON, R. A.; WICHERN, D. W. JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical Applied multivariate statistical analysisanalysis. 5th ed. Upper Saddle River, . 5th ed. Upper Saddle River, New Jersey: Prentice-Hall, 2002, 767 p.New Jersey: Prentice-Hall, 2002, 767 p.
Pode também ser utilizada para estudar o Pode também ser utilizada para estudar o efeito dos preditores sobre as variáveis de efeito dos preditores sobre as variáveis de resposta.resposta.
Primeiro trabalho sobre o assunto: Primeiro trabalho sobre o assunto: Regression Towards Mediocrity in Heredity Regression Towards Mediocrity in Heredity Stature. Journal of the Anthropological Stature. Journal of the Anthropological Institute, 15 (1885). 246-263.Institute, 15 (1885). 246-263.
Mediocridade em função da estatura Mediocridade em função da estatura hereditáriahereditária
Estatística UNIVARIADA. Segundo Estatística UNIVARIADA. Segundo JOHNSON & WICHERN (2002) nesse JOHNSON & WICHERN (2002) nesse artigo o autor não percebeu a importância artigo o autor não percebeu a importância da técnica para análises multivariadas.da técnica para análises multivariadas.
Introdução (Cont.) Introdução (Cont.)
Modelagem da Regressão Modelagem da Regressão LinearLinear
Pressuposições da modelagem Pressuposições da modelagem
O modelo utilizado é o de Gauss-Markov-NormalO modelo utilizado é o de Gauss-Markov-Normal Pressupõe Pressupõe que a resposta apresenta uma média. que a resposta apresenta uma média.
Pressupõe ainda que essa média contem erros Pressupõe ainda que essa média contem erros provenientes de medições aleatórias e de outras provenientes de medições aleatórias e de outras fontes não explicitadas pelo modelo.fontes não explicitadas pelo modelo.
O erro, e conseqüentemente a resposta, são O erro, e conseqüentemente a resposta, são tratados como variáveis aleatórias, que o tratados como variáveis aleatórias, que o comportamento é caracterizado assumindo-se comportamento é caracterizado assumindo-se uma distribuição NORMAL para os dados uma distribuição NORMAL para os dados experimentais.experimentais.
Este método consiste em se determinar o Este método consiste em se determinar o estimador que minimiza a soma do estimador que minimiza a soma do quadrado das diferenças entre valores quadrado das diferenças entre valores observados e valores preditos pelo modelo. observados e valores preditos pelo modelo.
linear modelo o é XY
de estimador o ˆ determinar Queremos
Estimadores dos parâmetros pelo Estimadores dos parâmetros pelo método dos mínimos quadradosmétodo dos mínimos quadrados
O erro do modelo na forma matricial é:O erro do modelo na forma matricial é:
XY
p
1
0
pnn2n1
2p2212
1p2111
n
2
1
n
2
1
,
XXX1
XXX1
XXX1
X,
Y
Y
Y
Y,
e
e
e
O problema consiste em se ajustar um O problema consiste em se ajustar um modelo de regressão.modelo de regressão.
O erro da modelagemO erro da modelagemEstimadores dos parâmetros pelo método dos mínimos quadrados
Modelo de regressãoModelo de regressão
O estimador de beta é chamado de beta O estimador de beta é chamado de beta chapéu e pode ser determinado por outros chapéu e pode ser determinado por outros métodos de minimização do erro, como por métodos de minimização do erro, como por exemplo o método da máxima exemplo o método da máxima verossimilhança.verossimilhança.
.n,,2,1i,XˆXˆXˆˆY pipi22i110i
p
1
0
ˆ
ˆ
ˆ
ˆ
Estimadores dos parâmetros pelo método dos mínimos quadrados
O método dos mínimos quadradosO método dos mínimos quadrados
Sabendo que o erro do modelo é:Sabendo que o erro do modelo é:
XY
Então o somatório ao quadrado das Então o somatório ao quadrado das diferenças dos erros pode ser diferenças dos erros pode ser representado na forma matricial por:representado na forma matricial por:
2XYZ
De acordo com o método temos que De acordo com o método temos que minimizar Zminimizar Z
Estimadores dos parâmetros pelo método dos mínimos quadrados
Minimização da função ZMinimização da função Z
As matrizes Y’XAs matrizes Y’Xββ e e ββ’X’Y uma é a ’X’Y uma é a transposta da outra e são de dimensão transposta da outra e são de dimensão 1x1, então as matrizes são iguais.1x1, então as matrizes são iguais.
2XYZ
X'X'Y'X'X'YY'YZ
XY'X''YZ
XYXYZ '
Estimadores dos parâmetros pelo método dos mínimos quadrados
X'X'Y'X'2Y'YZ
Diferenciando a função ZDiferenciando a função Z
dX'X'X'X'dY'X'd2dZ
As matrizes (dAs matrizes (dββ’)X’X’)X’Xββ e e ββ’X’X(d’X’X(dββ) uma é a ) uma é a transposta da outra e são de dimensão 1x1, transposta da outra e são de dimensão 1x1, então as matrizes são iguais.então as matrizes são iguais.
Y'XX'X'd2dZ
X'X'd2Y'X'd2dZ
Estimadores dos parâmetros pelo método dos mínimos quadrados
Fazendo com que a diferencial Fazendo com que a diferencial de Z seja igual a zerode Z seja igual a zero
Para que a diferencial de Z seja zeroPara que a diferencial de Z seja zero
0dZ
0Y'XX'X'd2
Para que dZ seja zero, (X’XPara que dZ seja zero, (X’Xββ-X’Y) -X’Y) deve ser igual a zero.deve ser igual a zero.
0Y'XˆX'X
Estimadores dos parâmetros pelo método dos mínimos quadrados
O beta chapéuO beta chapéuAssim é chamado o vetor estimador Assim é chamado o vetor estimador
dos parâmetros de beta. dos parâmetros de beta. O vetor beta chapéu é determinado O vetor beta chapéu é determinado
resolvendo-se o sistema de equações resolvendo-se o sistema de equações normais: normais:
Y'XˆX'X
Estimadores dos parâmetros pelo método dos mínimos quadrados
Solução do sistema de equações normaisSolução do sistema de equações normais
Multiplicando-se ambos os membros do sistema de Multiplicando-se ambos os membros do sistema de
equações porequações por
Y'XˆX'X
1X'X
Temos:Temos: Y'XX'XˆX'XX'X 11
Y'XX'Xˆ 1 O modelo de regressão pressupõe um beta chapéu O modelo de regressão pressupõe um beta chapéu
único não tendencioso (blue). Mas isso precisa de único não tendencioso (blue). Mas isso precisa de
ser testado.ser testado.
Estimadores dos parâmetros pelo método dos mínimos quadrados
O modelo que estamos estudando é o O modelo que estamos estudando é o Linear de Gauss-Markov-Normal.Linear de Gauss-Markov-Normal.
2,N~,XY
modelo do erro o é esteXY
Regressão Linear Múltipla
Conseqüências da estimaçãoConseqüências da estimação
A média do modelo linearA média do modelo linear
Quando trabalhos com dados Quando trabalhos com dados experimentais assumimos que o estimador experimentais assumimos que o estimador da média ‘x barra’ pode representar a da média ‘x barra’ pode representar a média ‘média ‘μμ’ da população’ da população. Mas depois . Mas depois precisamos testar se isso é verdadeiro.precisamos testar se isso é verdadeiro.
'.' média
como conhecido também população, da
matemática esperança a éX Y
Conseqüências da estimação
.ˆ o , de estimador
do e X preditoras variáveis de valores de
linear combinação uma de função em
Y para obtidos valores é, isto modelo,
pelo preditos valores os sãoˆXY
Quando trabalhos com dados experimentais Quando trabalhos com dados experimentais determinamos o beta chapéu a partir de determinamos o beta chapéu a partir de amostras da população. Por isso é que amostras da população. Por isso é que precisamos testar se esse beta é mesmo precisamos testar se esse beta é mesmo estimador não tendencioso.estimador não tendencioso.
Os valores preditos pelo modeloOs valores preditos pelo modeloConseqüências da estimação
desvio.ou
resíduo de chamado também ajustado,
modelo do erro o é ˆXYYYˆ
O erro do modelo de regressãoO erro do modelo de regressão
Este é o erro que calculamos quando Este é o erro que calculamos quando trabalhamos com dados experimentais.trabalhamos com dados experimentais.
É um vetor que descreve a distribuição É um vetor que descreve a distribuição dos dados experimentais. Muitas dos dados experimentais. Muitas inferências sobre nossos dados podem inferências sobre nossos dados podem ser feitas analisando-se esse vetor. ser feitas analisando-se esse vetor.
Conseqüências da estimação
O que queremos modelarO que queremos modelar
fenômeno. do modelagem na erro o é :ˆ
estudado; fenômeno do modelagem a é :Y
modelar; queremos que fenômeno o é :Y
ˆYY
Quando trabalhos com dados Quando trabalhos com dados experimentais assumimos que nossas experimentais assumimos que nossas observações são capazes de modelar observações são capazes de modelar o fenômeno, e depois testamos.o fenômeno, e depois testamos.
Conseqüências da estimação
Prática 1 Prática 1 Na tabela abaixo apresentamos os valores de uma Na tabela abaixo apresentamos os valores de uma
amostra de 6 observações das variáveis Yamostra de 6 observações das variáveis Y ii, X, X1i1i e X e X2i2i. .
YYii XX1i1i XX2i2i
1,51,5 00 00
6,56,5 11 22
10,010,0 11 44
11,011,0 22 22
11,511,5 22 44
16,516,5 33 66
Fonte: Apostila de INF 664 Modelos Lineares. Adair José Regazzi,UFV, Viçosa, 2002.
Montar do sistema de equações normais Montar do sistema de equações normais
631
421
221
411
211
001
X
Quando a regressão é com intercepto adicionados Quando a regressão é com intercepto adicionados uma coluna de uns na matriz de dados. uma coluna de uns na matriz de dados.
X com intercepto
63
42
22
41
21
00
X
X sem intercepto
5,16
5,11
0,11
0,10
5,6
5,1
Y
Resposta Y
Prática 1
Obtenção da matriz X’XObtenção da matriz X’X
Esta matriz é obtida multiplicando-se a Esta matriz é obtida multiplicando-se a transposta da matriz X por ela mesma.transposta da matriz X por ela mesma.
763618
36199
1896
631
421
221
411
211
001
642420
322110
111111
X'X
Prática 1
Obtenção da matriz X’YObtenção da matriz X’YEsta matriz é obtida multiplicando-se a Esta matriz é obtida multiplicando-se a
transposta da matriz X pelo vetor Y.transposta da matriz X pelo vetor Y.
220
111
57
5,16
5,11
0,11
0,10
5,6
5,1
642420
322110
111111
Y'X
Prática 1
Sistema de equações normaisSistema de equações normais Estimativa de beta pelos método dos Estimativa de beta pelos método dos
mínimos quadradosmínimos quadrados
1
3
2
220
11
57
763618
36199
1896
B
B
B 1
2
1
0
Prática 1
regressão de equação a é :X13X2Y
s.regressore os são: e
regressão; de equação da intercepto o é :ˆ
2i1ii
21
0
Programa na linguagem MATLABPrograma na linguagem MATLAB
Exemplos de comandos do Programa Exemplos de comandos do Programa computacional MATLABcomputacional MATLAB
Resultados obtidos no Programa Resultados obtidos no Programa computacional MATLABcomputacional MATLAB
Vetor de parâmetrosVetor de parâmetros
Posto da matrizPosto da matriz
Determinante da matrizDeterminante da matriz
Autovalores da matrizAutovalores da matriz
Análise de Variância da Análise de Variância da Regressão LinearRegressão Linear
A análise de variância da regressão é a A análise de variância da regressão é a estatística utilizada para testar os estatística utilizada para testar os regressores. A hipótese nula é que todos os regressores. A hipótese nula é que todos os regressores são iguais e zero. Caso isso não regressores são iguais e zero. Caso isso não ocorra o resultado da análise é significativo, ocorra o resultado da análise é significativo, isto é, rejeita-se a hipótese nula.isto é, rejeita-se a hipótese nula.
A análise de variância não testa o intercepto.A análise de variância não testa o intercepto.
Análise de variância da Análise de variância da regressão linear regressão linear
0: 210 pH
Algumas Pressuposições do Algumas Pressuposições do ModeloModelo
Beta chapéu é um estimador não Beta chapéu é um estimador não tendencioso:tendencioso:
ˆ
A esperança do erro do modelo é zero e a A esperança do erro do modelo é zero e a esperança da variância dos erros é esperança da variância dos erros é constante:constante:
2IVe
Variâncias e Covariâncias do Vetor Variâncias e Covariâncias do Vetor Estimador dos ParâmetrosEstimador dos Parâmetros
O vetor estimador dos parâmetros é beta O vetor estimador dos parâmetros é beta chapéu:chapéu:
21' )X'X(])ˆ()ˆ[()ˆ(Cov
A covariância deste vetor é:A covariância deste vetor é:
21 ˆ)'()ˆ( XXCov 21)'()ˆ( sXXCov
ss22 é o Quadrado médio do resíduo. é o Quadrado médio do resíduo.
Soma de Quadrado do ResíduoSoma de Quadrado do ResíduoSoma dos quadrados dos desvios entre os Soma dos quadrados dos desvios entre os
valores observados e os estimados pela valores observados e os estimados pela equação de regressão.equação de regressão.
2n
1iii YYsReSQ
Escrito na forma matricial é:Escrito na forma matricial é:
Y'X'ˆY'YsReSQ
Soma de Quadrado TotalSoma de Quadrado Total
Matricialmente podemos escrever:Matricialmente podemos escrever:
n
Y
YSQTotal
2n
1iin
1i
2i
cY'YSQTotal Y'uu'Yn
1c
uu é um vetor de 1’s de dimensão n x 1. é um vetor de 1’s de dimensão n x 1.
Soma de Quadrado da RegressãoSoma de Quadrado da Regressão
Na forma matricial escrevemos:Na forma matricial escrevemos:
2n
1ii YYgReSQ
Y'uu'Yn
1Y'X'ˆgReSQ
Esquema da análise de variância Esquema da análise de variância da regressãoda regressão
n =número de observações;n =número de observações; p =número de variáveisp =número de variáveis Análise para dados não repetidosAnálise para dados não repetidos
Causa de Causa de variaçãovariação GLGL SQSQ QMQM FF
RegressãoRegressão pp SQReg/pSQReg/p
ResíduoResíduo n-p-1n-p-1 SQRes/n-p-1SQRes/n-p-1
TotalTotal n-1n-1
cY'X'ˆ
Y'X'ˆY'Y
cY'Y
sReQM
gReQM
Teste F dos parâmetrosTeste F dos parâmetros
Se os erros eSe os erros ei i têm distribuição normal e se o têm distribuição normal e se o quocientequociente
0p21
É o mesmo que testar se: É o mesmo que testar se:
sReQM
gReQMF
tem distribuição F (central) com p e n-p-1 tem distribuição F (central) com p e n-p-1 graus de liberdade.graus de liberdade.
0:H p210
F é utilizado para testar a hipótese:F é utilizado para testar a hipótese:
Quando o teste F é significativo?Quando o teste F é significativo?
Quando F é maior que o tabelado;Quando F é maior que o tabelado;Quando rejeitamos a hipótese nula;Quando rejeitamos a hipótese nula;Contudo não é possível concluir quais Contudo não é possível concluir quais
parâmetros são significativos;parâmetros são significativos;Exceto para o caso particular de Exceto para o caso particular de p=1p=1..
Teste Teste tt dos parâmetros dos parâmetrosUtilizado para testar hipótese a respeito dos Utilizado para testar hipótese a respeito dos
parâmetros da regressão .parâmetros da regressão .
gl. 1)-p-(n a associado,)ˆ(s
ˆt
i
ii
A estatística utilizada é:A estatística utilizada é:
O teste é significativo quando t é maior que o O teste é significativo quando t é maior que o valor tabelado.valor tabelado.
Hipóteses a Respeito dos Parâmetros Hipóteses a Respeito dos Parâmetros no Modelo Linearno Modelo Linear
A hipótese de nulidade pode ser construída a A hipótese de nulidade pode ser construída a partir de partir de mm combinações lineares independentes combinações lineares independentes
'c:H0
c’ é uma matriz com c’ é uma matriz com mm linhas e linhas e p+1p+1 colunas colunas
]cccc['c p210
θθ é um vetor é um vetor mm-dimensional de constantes -dimensional de constantes conhecidas.conhecidas.
m
2
1
Estatística F usada para testar a Estatística F usada para testar a hipótese Hhipótese H00:c’:c’==θθ
2
11
0 ˆm
)ˆ'C(]C)X'X('C[)'ˆ'C()H(F
Sendo verdadeira a hipótese de nulidade a Sendo verdadeira a hipótese de nulidade a estatística estatística F(HF(H00)) tem distribuição tem distribuição FF com com mm
e e n-posto[X]=n-p-1n-posto[X]=n-p-1 graus de liberdade. graus de liberdade.
Estatística de WaldEstatística de WaldPara teste F simultâneo dos parâmetrosPara teste F simultâneo dos parâmetros
Exemplo: testar a hipótese Exemplo: testar a hipótese HH00::11==22=0=0
Posto [c’]=Posto [c’]=mm=2=2
0e0:H0
0
100
010'c:H 210
2
1
0
0
1
3
1
3
2
100
010ˆ'c
1
3
0
0
1
3ˆ'c
Exemplo: testar a hipótese Exemplo: testar a hipótese HH00::11==22=0=0
3354
54132
240
1c)x'x('c 1
6132
654
654
633
c)x'x('c11
50,1251
3
6132
654
654
633
13
Rejeita-se a hipótese HRejeita-se a hipótese H00::11==22=0=0
Exemplo: testar a hipótese Exemplo: testar a hipótese HH00::11==22=0=0
00,1126
00,3
1pn
y'x'ˆy'yQMRsˆ 22
**0 75,62
)00,1(2
50,125)H(F
82,30)3;2(F %1
Estatística Estatística t t usada para testar a usada para testar a hipótese Hhipótese H00:c’:c’==θθ
Podemos usar Podemos usar tt para testar hipóteses a para testar hipóteses a respeito de combinações lineares dos respeito de combinações lineares dos parâmetrosparâmetros
gl. 1)-p-(n a ,)ˆ'(ˆ
'ˆ'associado
cV
cct
GLR)X(poston1pn
Teste Simultâneo dos Teste Simultâneo dos ParâmetrosParâmetros
Testa uma única hipótese;Testa uma única hipótese;Testa um vetor de betas;Testa um vetor de betas;Não é o mesmo que testar os betas Não é o mesmo que testar os betas
separadamente.separadamente. Isto é, Isto é, testartestar
Não é o mesmo que testarNão é o mesmo que testar
0:He0:H 2110
0
0:Hou0:H
2
10210
Programa SAS (reg_cap1.sas)Programa SAS (reg_cap1.sas)proc reg data=sas.ind_v9;
/*ndvi rnir gnir arvi savi gndvi*/
model N = gndvi;
output out=p p=yhat r=resid;
print p;
run;
quit;
proc reg;
model yhat=N;
test N=1, intercept=0;
run;
plot yhat*N;
run;
quit;
Output do SAS – Análise de variância do Output do SAS – Análise de variância do modelo de regressãomodelo de regressão
The SAS System 23:15 Thursday, October 7, 2009 5The SAS System 23:15 Thursday, October 7, 2009 5
The REG ProcedureThe REG Procedure
Model: MODEL1Model: MODEL1
Dependent Variable: N NDependent Variable: N N
Analysis of VarianceAnalysis of Variance
Sum of MeanSum of Mean
Source DF Squares Square F Value Pr > FSource DF Squares Square F Value Pr > F
Model 6 20710 3451.59735 4.39 0.0293Model 6 20710 3451.59735 4.39 0.0293
Error 8 6290.41589 786.30199Error 8 6290.41589 786.30199
Corrected Total 14 27000Corrected Total 14 27000
Root MSE 28.04108 R-Square 0.7670Root MSE 28.04108 R-Square 0.7670
Dependent Mean 60.00000 Adj R-Sq 0.5923Dependent Mean 60.00000 Adj R-Sq 0.5923
Coeff Var 46.73513Coeff Var 46.73513
Teste t dos beta-chapéu do modelo de Teste t dos beta-chapéu do modelo de regressãoregressão
Parameter EstimatesParameter Estimates
Parameter StandardParameter Standard
Variable Label DF Estimate Error t Value Pr > |t|Variable Label DF Estimate Error t Value Pr > |t|
Intercept Intercept 1 1835.59747 1483.61562 1.24 0.2511Intercept Intercept 1 1835.59747 1483.61562 1.24 0.2511
NDVI NDVI 1 -15182 19298 -0.79 0.4541NDVI NDVI 1 -15182 19298 -0.79 0.4541
RNIR RNIR 1 -1698.66240 3814.27214 -0.45 0.6679RNIR RNIR 1 -1698.66240 3814.27214 -0.45 0.6679
GNIR GNIR 1 -413.90081 2665.47402 -0.16 0.8804GNIR GNIR 1 -413.90081 2665.47402 -0.16 0.8804
ARVI ARVI 1 546.46984 283.26026 1.93 0.0898ARVI ARVI 1 546.46984 283.26026 1.93 0.0898
SAVI SAVI 1 8350.10834 13196 0.63 0.5445SAVI SAVI 1 8350.10834 13196 0.63 0.5445
GNDVI GNDVI 1 594.04446 2908.94995 0.20 0.8433GNDVI GNDVI 1 594.04446 2908.94995 0.20 0.8433
Dependent PredictedDependent Predicted
Obs Variable Value ResidualObs Variable Value Residual
1 0 -16.4019 16.40191 0 -16.4019 16.4019
2 0 -3.4152 3.41522 0 -3.4152 3.4152
3 0 19.8021 -19.80213 0 19.8021 -19.8021
4 30.0000 30.9970 -0.99704 30.0000 30.9970 -0.9970
5 30.0000 68.5033 -38.50335 30.0000 68.5033 -38.5033
6 30.0000 47.8805 -17.88056 30.0000 47.8805 -17.8805
7 60.0000 67.1267 -7.12677 60.0000 67.1267 -7.1267
8 60.0000 99.6748 -39.67488 60.0000 99.6748 -39.6748
9 60.0000 61.1820 -1.18209 60.0000 61.1820 -1.1820
10 90.0000 68.4044 21.595610 90.0000 68.4044 21.5956
11 90.0000 65.1605 24.839511 90.0000 65.1605 24.8395
12 90.0000 78.0660 11.934012 90.0000 78.0660 11.9340
13 120.0000 97.4010 22.599013 120.0000 97.4010 22.5990
14 120.0000 116.5953 3.404714 120.0000 116.5953 3.4047
15 120.0000 99.0235 20.976515 120.0000 99.0235 20.9765
Sum of Residuals -3.6067E-11Sum of Residuals -3.6067E-11
Sum of Squared Residuals 6290.41589Sum of Squared Residuals 6290.41589
Predicted Residual SS (PRESS) 28335Predicted Residual SS (PRESS) 28335
Níveis de N preditos pelo modeloNíveis de N preditos pelo modelo
Gráfico: Predito x ObservadoGráfico: Predito x Observado
ConclusãoConclusão
O modelo de regressão multivariado O modelo de regressão multivariado proposto não pode ser utilizado para proposto não pode ser utilizado para predizer níveis de N aplicados no solo. predizer níveis de N aplicados no solo.
FIMFIM
Recommended