Apostila Regressão

  • Upload
    juaci

  • View
    214

  • Download
    1

Embed Size (px)

Citation preview

ModelosdeRegressaoClariceGarciaBorgesDemetrioDepartamentodeCienciasExatas,ESALQ,USPCaixaPostal913418-900Piracicaba,SPEmail: [email protected]: 01934294346SlvioSandovalZocchiDepartamentodeCienciasExatas,ESALQ,USPCaixaPostal913418-900Piracicaba,SPEmail: [email protected]: 0193429434616deoutubrode2008ii ClariceG.B.Demetrio&SilvioS.ZocchiPrefacioEstas notas saoresultantes de varios anos de lecionamentodadisciplinaLCERegressaoeCovari ancia,AgradecimentosOa autores agradecem a todos que direta ou indiretamente contriburam para a realizacao dessetexto.Sumario1 Conceitosgerais 11.1 Naturezadasvari aveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.1 Relac oesentretiposdevariaveisetiposdeerros. . . . . . . . . . . . . . 21.1.2 Func oeslinearesenaolineares(especicac aodafunc aof(.)) . . . . . . . 41.1.3 Tiposdemodelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.2 Diagramasdedispersao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 Regressaolinearsimples 192.1 Introducao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.2 Modeloestatstico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.3 Estimacaodosparametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.4 UmaformaalternativaparaomodeloderegressaolinearsimplesVariavel Xcentrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.5 AnalisedevarianciaetesteF . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.6 Estimacaoporintervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382.7 Testesdehipotesesparaosparametros . . . . . . . . . . . . . . . . . . . . . . . 432.8 Exemplodeaplicac ao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452.9 Regressaolinearporanamorfose. . . . . . . . . . . . . . . . . . . . . . . . . . . 482.10 Testeparafaltadeajuste(outestedelinearidade) . . . . . . . . . . . . . . . . . 502.11 Coecientededeterminacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 592.12 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613 RegressaoLinearM ultipla 713.1 Modeloestatstico-Notac aomatricial . . . . . . . . . . . . . . . . . . . . . . . 713.2 EstimacaodosparametrosMetododosquadradosmnimos . . . . . . . . . . 743.3 Notacaomatricialalternativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 803.4 AnalisedevarianciaetesteF . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80iiiiv ClariceG.B.Demetrio&SilvioS.Zocchi3.5 CoecientedeDeterminac aoM ultiplo. . . . . . . . . . . . . . . . . . . . . . . . 963.6 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 973.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1034 AnalisedeResduoseDiagnosticos 1074.1 Introducao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1074.2 Tiposderesduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1084.3 Estatsticasparadiagnosticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1104.4 Tiposdegracos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1144.5 Exemplo-Regressaolinearsimples . . . . . . . . . . . . . . . . . . . . . . . . . 1184.6 Exemplo-Regressaolinearm ultipla . . . . . . . . . . . . . . . . . . . . . . . . . 1224.7 FamliaBox-Coxdetranformac oes . . . . . . . . . . . . . . . . . . . . . . . . . 1234.8 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1294.9 Transformac aoefunc aodeligac ao . . . . . . . . . . . . . . . . . . . . . . . . . . 1404.10 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1425 Correlacoeslinearessimpleseparciais 1495.1 Correlacaolinearsimples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1495.1.1 Introduc ao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1495.1.2 Distribuic aonormalbidimensional . . . . . . . . . . . . . . . . . . . . . . 1505.1.3 Momentosdadistribuicaonormalbivariada . . . . . . . . . . . . . . . . 1515.1.4 Correlac aolinearsimplesnapopulac ao . . . . . . . . . . . . . . . . . . . 1525.1.5 Estimac aodosparametrosdadistribuic aonormalbivariada . . . . . . . 1535.1.6 Correlac aolinearsimplesnaamostra . . . . . . . . . . . . . . . . . . . . 1545.1.7 Testesdehipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1545.1.8 Intervalodeconancapara . . . . . . . . . . . . . . . . . . . . . . . . . 1575.2 Correlacoesparciais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1575.2.1 Introduc ao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1575.2.2 Denic ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1585.2.3 Estimativadocoecientedecorrelac aoparcial . . . . . . . . . . . . . . . 1615.2.4 Testesdehipoteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1615.3 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1625.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1656 MetodosdeSelecaodeVariaveis 1756.1 Introducao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1756.2 Criteriosusadosnaselec aodevari aveis . . . . . . . . . . . . . . . . . . . . . . . 1766.3 Metodosdeselec aodevariaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . 178ModelosdeRegressao v6.4 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1816.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1847 PolinomiosOrtogonais 1917.1 Introducao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1917.2 Construcaodospolinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1937.3 AnalisedeVari ancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1967.4 Dadoscomrepeticao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1977.5 Dadosnaoequidistantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1987.6 EquivalenciadasformulasobtidaseasusadasporPimentelGomes(2000) . . 1987.7 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1997.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201Captulo1Conceitosgerais1.1 NaturezadasvariaveisUmproblemacomumemEstatstica eoestudodarelac aoentreduasvari aveisXeY ,istoe,procura-seumafunc aodeXqueexpliqueYX, Y Yf(X).Emgeral,arelacaonaoeperfeita. Ospontosnaosesituamperfeitamentesobreafunc aoquerelacionaasduasvariaveis. Mesmoseexisteumarelac aoexataentreasvariaveiscomo temperatura e pressao, utuac oes em torno da curva aparecerao devido a erros de medidas.Freq uentemente, otipodecurvaaserajustadaesugeridoporevidenciaempricaouporargumentosteoricos. Omodeloaseradotadodependedevariosfatores,porexemplo,naturezadasvariaveis, relacaolinearounao, homogeneidadedevarianciasounao, tiposdeerros,independenciadoserrosetc.A natureza das variaveis Xe Ypode variar, isto e, elas podem ser xas (ou contro-ladas) ou aleatorias. Alem disso, ambas podem ser medidas com ou sem erro (de mensuracao).Deformaesquematica,tem-se:X___xa_comerrosemerroaleatoria_comerrosemerroY___xa_comerrosemerroaleatoria_comerrosemerro12 ClariceG.B.Demetrio&SilvioS.Zocchioquesugere16combina coespossveisentreXeY .Assim,porexemplo,seXrepresentaavari avelsexo, elaeumavari aveldeclassicac ao, xa, medidasemerro,quepodeassumirovalor0,sefeminino,ou1semasculinoouvice-versa;Xrepresenta um n umero (xado) de frutos (2, 3, 4) por ramo em um determinado ano eY , o n umero de gemas orferas nos mesmos ramos no ano seguinte, tem-se que Xe xa,semerroeYealeatoria,semerrodemensuracao;Xrepresenta as quantidades 30,60 e 90kg de nitrogenio/ha colocadas no solo,ela e xa,possivelmente,medidacomerro;Xrepresenta quantidades de nitrogenio no solo e Yquantidades de nitrogenio na planta,ambas saoaleatorias, possivelmente, medidas comerro. Pode-se, porem, controlar Xatravesdaespecicac aodedeterminadascaractersticasdosolo.1.1.1 Relacoesentretiposdevariaveisetiposdeerros(i)Considerando-seXxa(oucontrolada),tem-se:XCE= XCS + eXsendoXCE:Xcontrolada,medidacomerroXCS:Xcontrolada,medidasemerroeX:errodemedidaemX.Comoexemplos,tem-sedosesdepesticidas,deadubosetc.(ii)Considerando-seY xa(oucontrolada),tem-seYCE= YCS +eYsendoYCE:Y controlada,medidacomerroYCS:Y controlada,medidasemerroeY:errodemedidaemY .ModelosdeRegressao 3(iii)Considerando-sequeXeumavari avelaleatoriacomdistribuicaodemediaX,tem-se:XAS= X+ XeXAE= X+ X+eX= XAS +eXsendoXAE:Xaleatoria,medidacomerroXAS:Xaleatoria,medidasemerroXeerroaleatorioeXeerrodemensurac ao.Comoexemplos,tem-sequantidadesdenutrientesencontradasnosolo.(iv)Considerando-sequeYeumavari avelaleatoriacomdistribuicaodemediaY ,tem-se:YAS= Y+ YeYAE= Y+ Y+eY= YAS +eYsendoYAE:Y aleatoria,medidacomerroYAS:Y aleatoria,medidasemerroYeerroaleatorioeYeerrodemensurac ao.Comoexemplos, tem-sequantidadesdenutrientesencontradasnaplanta, medidasdecomprimento,peso,volumeetc.Na maior parte dos casos, tanto Xcomo Ysao medidas com erros e o que se procurafazer e tornar esses erros desprezveis. Apenas como exemplos, sejam alguns casos das 16 com-binac oespossveisentreXeY .Caso1: YCSvsXCS(Y controladosemerroversusXcontroladosemerro).Esse e um problema matematico (modelo determinstico) em que Y= f(X). Comoexemplo,tem-sealeifsica:E= rJ4 ClariceG.B.Demetrio&SilvioS.ZocchisendoE,tensao,J,intensidadedacorrenteer,resistencia.Se,porem,forem observados n pares de valores E,J, as medidas observadas depen-deraodaprecisaodosequipamentos, estando, portanto, sujeitasaerros, epode-seestimarratravesdeumaequacaoderegressaoquepassapelaorigem.Caso2: YCEvsXCS(Y controladacomerroversusXcontroladasemerro).Nessecaso,avari avelY estaafetadaporapenasumtipodeerro,isto e,YCE= f(XCS) + eY.Emgeral,considera-sequeE(eY ) = 0,eportanto,E(YCE) = f(XCS).Caso3: YASvsXCS(Y aleatoriasemerroversusXcontroladasemerro).Nessecaso,tambem,avariavelY estaafetadaporapenasumtipodeerro,isto e,YAS= f(XCS) + Y= Y+Y.Caso4: YAEvsXCS(Y aleatoriacomerroversusXcontroladasemerro).Nessecaso,avari avelY estaafetadapordoistiposdeerros,isto e,YAE= f(XCS) + Y+ eY= Y+ Y+eYse a func ao f(.) for conhecida. Se f(.) nao e conhecida, ou quando Ye afetada por kvariaveis,isto e,Y= g(X, X1, X2, , Xk) + Y+ eYsendog(X, X1, X2, , Xk) = f(X) + h(X1, X2, , Xk),pode-seterY= f(XCS) + Y+Y+ eY= Y+Y+Y+ eYem que Ye o erro devido `a nao consideracao de todas as vari aveis que afetam Y , isto e, tem-se,tambem,umerrodeespecicac aodomodelo.1.1.2 Funcoeslinearesenaolineares(especicacaodafuncaof(.))Nos estudos de regressao busca-se relacionar uma vari avel aleatoria Ycom uma ou mais vari aveisXs, atraves da especicac ao da func ao f(.). No caso em que Ydepende apenas de uma variavelX,isto e,Y= f(X, 0, 1, , k) + eYModelosdeRegressao 5tem-sequef(.) elinearnosparametros0, 1, , ksefi= h(X), i = 0, 1, , k,sendoh(X)dependenteapenasdeX.Outrocasocomum econsiderarY= f(X1, X2, , Xk, 0, 1, , k) + eYque elinearnosparametrossefi= h(X1, X2, , Xk),isto e,h(.) dependeapenasdeX1, X2, , Xk. Sepelomenosumadasderivadasparciaisfidepende de pelo menos um dos parametros, entao, f(.) e uma funcao nao linear dos parametros.Comoexemplosdefunc oeslineares,tem-se:(i)f(X, 0) = 0,pois,f0= 1,(ii)f(X, 0, 1) = 0 + 1X,pois,f0= 1ef1= X,(iii)f(X, 0, 1) = 0 + 11X,pois,f0= 1ef1=1X,(iv)f(X1, X2, X3, 0, 1, 2, 3) = 0 + 1X1 + 2X2 + 3X3,pois,f0= 1,f1= X1,f2= X2ef3= X3,(v)f(X, 0, 1, 2, 3) = 0 + 1X + 2X2+ 3X3,pois,f0= 1,f1= X,f2= X2ef3= X3(vi)f(X, 0, 1) = 0 + 1log(X),pois,f0= 1ef1= log(X).Comoexemplosdefunc oesnaolineares,podemsercitadas:(i)f(X, 0, 1, 2) = 0sen(1X +2),pois,f0= sen(1X + 2),f1= 0Xcos(1X + 2)ef2= 0cos(1X + 2),(ii)f(X, 0, 1, 2) = 0 + 1e2X,pois,f0= 1,f1= e2Xef2= 1Xe2X6 ClariceG.B.Demetrio&SilvioS.Zocchi(iii)f(X, 0, 1, 2) =0 + 1X1 + 2X,pois,f0=11 + 2X,f1=X1 + 2Xef2= (0 +1X)X(1 + 2X)2.1.1.3 TiposdemodelosEm func ao da natureza das vari aveis X e Y , diferentes tipos de modelos podem ser considerados.Se Xe Ysao xos, tem-se um modelo determinstico. Se Ye aleatorio, tres tipos de modelospodemserconsideradosModelotipoI,emqueosXssaoxos.ModelotipoII,emqueosXssaoaleatorios.ModeloMisto,emquepartedosXssaoxoseparte,aleatorios.Observacao: Seraconsiderado,aqui,apenasocasoemqueosY saoaleatorios.Para o ModelotipoI, os valores da vari avelXsao selecionados pelo pesquisador,nao havendo variac ao aleatoria associada aeles. A selec ao dosXs pode envolver umconjuntoespeccodevaloresouvaloresqueestaosimplesmentedentrodeumaamplitudedevariacao.Assim, porexemplo, arespostaauminseticidapodesermedidaparaumaserieespeccadedoses, enquantoquepesodocorpohumanopodeserobtidoparaumaamplitudedealturasrestritas por umadescricao(faixaetarea, racaetc). Quandovalores esperados estaosendoconsiderados, os mesmos Xs sao usados ao denir uma amostragem repetida que e a sua base.EstesXsdevemsermedidossemerro.Valoresdavariavel X, porexemplo, horasdeluzarticial, nveisdetemperatura,quantias de produtos e espacamentos entre plantios podemser igual ouconvenientementeespacadosparaoaumentodaecienciadotratamento.Medida de Ysem erro nao e um requisito teorico, desde que o erro de medida tenhauma distribuic ao com media conhecida, geralmente, considerada igual a zero. A variancia de Ye,ent ao,asomadeumavari anciabiologica(ououtra)emYeavari anciadeerrodemedida.Eimportante,naturalmente,manteroserrosdemedidasemummnimo.SuponhaqueoModelotipoIsejaapropriadoequeoproblemasejaespecicadodeumadasformasquesesegue.1. Assume-sequeexisteumarelac aofuncional oumatematicaentreXeY masquesaopossveiserrosobservacionaisemY . Oproblemaeestimaressarelac ao. SeosXssaomedidossemerros(narealidade,Xpossuierrospequenos,porem,paraestudosteoricosconsidera-se que nao os tem) como na Figura 1.1, ent ao, ha uma unica linha de regressaodadaporE(Y | X) = E(Y ) = + X.ModelosdeRegressao 7Figura1.1: ErrosdemedidaemY Figura1.2: ErrosdemedidaemXeY2. Seos Xs sao, tambem, medidos comerro, ent ao, deve-sevisualizar umadistribuicaobivariadaparacadapontodaretaverdadeira(Figura1.2). Paraestimararelac aofun-cionaldevemseradotadosprocedimentosespeccos(modelofuncionaldentrodoestudodeModelosderegressaocomerrosdemedidas).3. Existe uma relac ao estatstica ou associac ao entre Xe Y . Inicialmente, uma distribuic aobivariada sobre o plano X, Ye apropriada. Entretanto, Xe restrita em lugar de aleatoriacomo na Figura 1.3. Conseq uentemente, so ha uma regressao signicativa a ser estimada,aquela de Yem relac ao a X. Erros de medidas em Xou Ysao provavelmente desprezveisemrelac ao`aamplitudeescolhidadosXsou`avariac aoaleatoriadosY s.ParaoModelotipoII, ambosXeY saoaleatorios. Esteeocasoclassicoderegressao bivariada, assumindo-se normalidade (Figura 1.4). Nesse caso a amostragem aleatoriae de indivduos, em que sao feitos pares de medidas. A escolha de qual variavel e dependente edeterminadapeloproblema. Asduaslinhasderegressaosaopossveis,istoe,Y |XeX|Y . SeXeY saovariaveisaleatoriascomerrosdemedidastem-seomodeloestrutural dateoriadeModelosderegressaocomerrosdemedidas.1.2 DiagramasdedispersaoAntes de se iniciar qualquer analise de regressao de um conjunto de dados, e impor-tantequeseplotemosparesdedadosemdiagramasdedispersao, paraquesetenhaideiaarespeitodotipoderelac aoexistenteentreasvari aveis, davariabilidadeassociadaaelasedapresenca de pontos atpicos. Entretanto, esses gracos devem ser olhados com cuidado quandoexistem duas ou mais variaveis explanatorias, pois eles nao levam em consideracao a correlac aoexistenteentreelas. Assim, porexemplo, aFigura1.5mostraqueexisteumarelac aolinearentreasvariaveisY eX,existemdoispontosdiscrepanteseumaaparenteheterogeneidadede8 ClariceG.B.Demetrio&SilvioS.ZocchiFigura1.3: Restric oesemX Figura1.4: Superfcienormalbivariadavari ancias.Figura1.5: Gracodedispersao1.3 Exemplos1. OsdadosdaTabela1.1(SnedecoreCochran, 1967)referem-seaumexperimento, emque9amostrasdesolosforampreparadas,variando-seosnveisdefosforoorganico(X).Nessas amostras foi plantado milho e, apos 38 dias, as plantas foram colhidas e o conte udodefosforofoi determinado. Emseguida, determinou-se, por umaexpressao, ofosforodisponvel(Y)paraaplantanosolo.Nesse caso, a vari avel X e xa. A Figura 1.6 mostra que existe uma relacao linear entre asvariaveisY eX. On umerodeobservacoes erelativamentepequenoparaquesepossamfazerconsiderac oessobrepontosdiscrepantesevariabilidade.ModelosdeRegressao 9Tabela1.1: ValoresdefosforoorganicoXedefosforodisponvel(Y )X (ppm) 1 4 5 9 13 11 23 23 28Y (ppm) 64 71 54 81 93 76 77 95 1090 5 10 15 20 2560708090100110XYFigura1.6: GracosdedispersaodeY emrelacaoaX,Tabela1.1.2. Os dados daTabela1.2(Duarte, 1989) referem-seaumexperimentodeirrigacaoembatata plantada emterra roxa estruturada (solo argiloso) emque forammedidas aslaminas (L, mm) de agua a diferentes distancias do aspersor e as correspondentes produ-tividades (P, t/ha). Em geral, para esse tipo de solo, o excesso de agua causa diminuic aodeprodutividade.Tabela1.2: Valores de laminas (L, mm) de aguaadiferentes distancias doaspersor e ascorrespondentesprodutividades(P,t/ha)L 285 380 400 425 455 490 520 550 575 615 680 785P 14,94 15,98 21,21 22,71 22,38 24,83 24,42 30,59 29,96 31,07 29,80 22,61Nesse caso, a vari avel X e aleatoria, mas pode ser considerada controlada se for de interessedo pesquisador. A Figura 1.7 mostra que existe uma relacao linear entre as vari aveis Pe L,e, embora o n umero de observacoes seja pequeno, parece que existe um ponto discrepanteouquearelac aonao elinear.3. Paes de Camargoet al (1982), estudandoaconstruc aode umtensiometrode leituradireta, obtiveramosresultadosqueaparecemnaTabela1.3paravaloresdealturasdacamara no tensiometro (X), em mm, e tensao da agua no solo (Y ), em mb. Ver Pereira&Arruda(1987).10 ClariceG.B.Demetrio&SilvioS.Zocchi300 400 500 600 700 80015202530LPFigura1.7: GracosdedispersaodePemrelacaoaL,Tabela1.2.Tabela1.3: Valoresdealturasdacamaranotensiometro(X), emmm, etensaodaaguanosolo(Y ),emmbX 9 12 30 42 57 102 147 210 290Y 217 291 439 515 603 681 716 746 7550 50 100 150 200 250 300200300400500600700XYFigura1.8: GracosdedispersaodeY emrelacaoaX,Tabela1.3.Nessecaso, avariavel Xexa. AFigura1.8mostraqueexisteumarelac aonaolinearentreasvari aveisY eXenenhumpontodiscrepante.4. Os dados da Tabela 1.4 (Snedecor e Cochran, 1967) referem-se a medidas de concentra coesde fosforo inorganico (X1) e fosforo organico (X2) no solo e de conte udo de fosforo (Y ) nasplantascrescidasnaquelesolo. Oobjetivodessetipodeexperimento eestudararelacaoexistenteentreoconte udodefosforonaplantaeduasfontesdefosforonosolo.ModelosdeRegressao 11Tabela 1.4: Valores de concentracoes de fosforo inorganico (X1) e fosforo organico (X2) no soloedeconte udodefosforo(Y )Amostra X1X2Y Amostra X1X2Y1 0,4 53 64 10 12,6 58 512 0,4 23 60 11 10,9 37 763 3,1 19 71 12 23,1 46 964 0,6 34 61 13 23,1 50 775 4,7 24 54 14 21,6 44 936 1,7 65 77 15 23,1 56 957 9,4 44 81 16 1,9 36 548 10,1 31 93 17 26,8 58 1689 11,6 29 93 18 29,9 51 99X120 30 40 50 600510152025302030405060X20 5 10 20 30 60 100 1406080100140YFigura1.9: Gracosdedispersaoparaasvari aveisduasaduas,Tabela1.4.Nessecaso,asvari aveisX1eX2saoaleatorias,maspodemserconsideradascontroladassefordeinteressedopesquisador. AFigura1.9mostraosgracosdedispersaoparaasvariaveisduasaduas. Pode-severque,aparentementenaoexisterelacaolinearentreasvariaveis Ye X1e Ye X2e, em ambos os casos, aparece um ponto discrepante. Ja entreX1eX2,existeumarelac aolinearcomumaaparenteheterogeneidadedevariancias.12 ClariceG.B.Demetrio&SilvioS.Zocchi5. OsdadosdaTabela1.5(ZambrosieAlleoni,2002)referem-searesultadosdeumexper-imentoemblocoscasualizadosplanejadoparaestudaroefeitodacalagemsobreaCTCdosolomedidapordoismetodosdiferentes.Tabela 1.5: Valores de CTC direta e indireta, em mmolc/kg, na profundidade de 5 a 10 cm, 18mesesaposacalagemincorporadaaosolo,segundoadosedecalcario,emt/habloco1 bloco2 bloco3 bloco4Dose direta indireta direta indireta direta indireta direta indireta0,00 38,80 83,00 38,80 90,70 45,60 85,80 50,20 85,502,00 59,20 87,60 53,00 84,60 57,20 97,50 62,80 80,804,90 60,60 106,60 73,30 111,40 79,30 102,40 77,90 112,407,80 68,80 177,00 90,70 112,20 84,50 125,60 73,80 106,400 2 4 6 8406080100120140160180DoseCTC0 2 4 6 8406080100120DoseCTCFigura 1.10: Gracos de dispersao de CTC direta e indireta em relac ao `a dose, com a observacao177, 00ecorrigida,respectivamente,Tabela1.5.Nessecaso, avari avekXexa. AFigura1.10mostraqueexisteumarelac aolinearentreasmedidasdeCTCeasdosesdecalcario,emt/ha,paraambososmetodoseque,aparentemente,ha um paralelismo entre as retas a serem ajustadas. Nessa analise inicialfoi detectadaapresencadeumdadosdiscrepante(177, 00)correspondenteaobloco1,dose 7, 80 e CTC indireta. Em conversa com o pesquisador responsavel foi vericado quese tratava de um erro grosseiro de transcric ao de dados e que o valor correto era (124, 00).6. OsdadosdaTabela5.1(Steel eTorrie, 1980)referem-seaumestudosobrearespostada cultura do milho como funcao da quantidade de fosfato, porcentagem de saturacao debases(X2)eslica(X3)emsolosacidos. Aresposta(Y ), emporcentagem, foi medidacomo a diferenca entre as producoes (em lb/acre) nas parcelas recebendo fosfato e aquelasnaorecebendofosfato(X1), divididapelasproducoesdasparcelasrecebendofosfato, eModelosdeRegressao 13multiplicadaspor100. Considerando-seessesdados, foiobtidaavari avelprodutividadeY1dasparcelasrecebendofosfato,dadaporY1= X1(1 +Y100).Tabela 1.6: Dados de resposta da cultura do milho (Y ) ao fosfato, em porcentagem, produtivi-dadenatestemunha(X1), emlb/acre, porcentagemdesaturac aodebases(X2)epHdosolo(X3)Y X1X2X3Y X1X2X388 844 67 5,75 18 1262 74 6,1080 1678 57 6,05 18 4624 69 6,0542 1573 39 5,45 4 5249 76 6,1537 3025 54 5,70 2 4258 80 5,5537 653 46 5,55 2 2943 79 6,4020 1991 62 5,00 -2 5092 82 6,5520 2187 69 6,40 -7 4496 85 6,50Y11000 3000 5000 5.0 5.5 6.0 6.5100030005000100030005000X1X240506070801000 3000 50005.05.56.06.540 60 80X3Figura1.11: Gracosdedispersaoparaasvari aveisduasaduas,Tabela5.1.Nessecaso, asvariaveisX1, X2eX3saoaleatorias, eointeressedopesquisadoresta,principalmentenoestudodecorrelac oes entreas variaveis.. NaFigura5.1podemser14 ClariceG.B.Demetrio&SilvioS.Zocchivistososgracosdedispersaoparaasvari aveisduasaduas. Observa-sequeexisteumacorrelac aolineargrandeepositivaentreasvari aveisX1eX2.1.4 Exerccios1.4.1Paracadaumdos conjuntos dedados apresentados aseguir, discutaanaturezadasvari aveis, facaospossveisdiagramasdedispersaoediscutaarelacaoentreasvari aveis, ten-dencia,dispersaoepontosatpicos.1. Osdadosqueseseguem(SnedecoreCochran,1967)referem-seamedidasdealturasdefeijao(Y ),durante7semanas(amostrasaleatoriasindependentes)Idadeemsemanas(X) 1 2 3 4 5 6 7Alturasemcm(Y ) 5 13 16 23 33 38 402. Os dados que se seguem (Snedecor e Cochran, 1967) referem-se a um experimento, em que9 amostras de solos foram preparadas, variando-se os nveis de fosforo organico (X). Nessasamostrasfoi plantadomilhoe, apos38dias, asplantasforamcolhidaseoconte udodefosforofoideterminado. Aseguir,determinou-se,porumaexpressaoofosforodisponvel(Y)paraaplantanosolo.X (ppm) 1 4 5 9 13 11 23 23 28Y (ppm) 64 71 54 81 93 76 77 95 1093. Os dados que se seguem (Steel e Torrie, 1980) referem-se a peso medio (X) de 50 galinhaseconsumodealimentos(Y ),para10linhagensWhiteLeghorn.Amostra 1 2 3 4 5 6 7 8 9 10X 4,6 5,1 4,8 4,4 5,9 4,7 5,1 5,2 4,9 5,1Y 87,1 93,1 89,8 91,4 99,5 92,1 95,5 99,3 93,4 94,44. Osdadosqueseseguem(MeadeCurnow,1980)referem-seaconcentracoesdeCO2(X)aplicadas sobre folhas de trigo a uma temperatura de 350C e a quantias de CO2(Y, cm3/dm2/hora)absorvidopelasfolhas.ModelosdeRegressao 15Amostra 1 2 3 4 5 6 7 8 9 10 11X 75 100 100 120 130 130 160 190 200 240 250Y 0,00 0,65 0,50 1,00 0,95 1,30 1,80 2,80 2,50 4,30 4,505. Os dados que se seguem (Ryan, Joiner e Ryan Jr., 1976) referem-se a medidas de diametroa 4,5 pes acima do solo (D, polegadas) e altura (H, pes) de 21 cerejeiras (black cherry)empeedevolume(V , pesc ubicos) dearvoresderrubadas. Oobjetivodessetipodeexperimentoevericardequeformaessasvariaveisestaorelacionadaspara, atravesdemedidas nas arvores em pe, poder predizer o volume de madeira em uma area de oresta(AlleghenyNational Forest).Amostra X1X2Y Amostra X1X2Y1 8,3 70 10,3 17 12,9 85 33,82 8,6 65 10,3 18 13,3 86 27,43 8,8 63 10,2 19 13,7 71 25,74 10,5 72 16,4 20 13,8 64 24,95 10,7 81 18,8 21 14,0 78 34,56 10,8 83 19,7 22 14,2 80 31,77 11,0 66 15,6 23 14,5 74 36,38 11,0 75 18,2 24 16,0 72 38,39 11,1 80 22,6 25 16,3 77 42,610 11,2 75 19,9 26 17,3 81 55,411 11,3 79 24,2 27 17,5 82 55,712 11,4 76 21,0 28 17,9 80 58,313 11,4 76 21,4 29 18,0 80 51,514 11,7 69 21,3 30 18,0 80 51,015 12,0 75 19,1 31 20,6 87 77,016 12,9 74 22,26. Osdadosqueseseguem(SnedecoreCochran, 1967)referem-seaumestudodarelacaoexistente entre duas fontes de fosforo no solo e o conte udo de fosforo no solo. Foram feitasmedidasdeconcentracoesdefosforoinorganico(X1)efosforoorganico(X2)nosoloedeconte udodefosforo(Y )nasplantascrescidasnaquelesolo.16 ClariceG.B.Demetrio&SilvioS.ZocchiAmostra X1X2Y Amostra X1X2Y1 0,4 53 64 10 12,6 58 512 0,4 23 60 11 10,9 37 763 3,1 19 71 12 23,1 46 964 0,6 34 61 13 23,1 50 775 4,7 24 54 14 21,6 44 936 1,7 65 77 15 23,1 56 957 9,4 44 81 16 1,9 36 548 10,1 31 93 17 26,8 58 1689 11,6 29 93 18 29,9 51 997. Osdadosqueseseguem(Steel eTorrie, 1980)referem-sean umerosdeovospostospor14galinhasen umerosdefolculosovulados.no. deovos 39 29 46 28 31 25 49 57 51 21 42 38 34 47no. defolculos 37 34 52 26 32 25 55 65 44 25 45 26 29 308. Osdadosqueseseguem(Duarte, 1989)referem-seaumexperimentodeirrigacaoembatata plantada emterra roxa estruturada (solo argiloso) emque forammedidas aslaminas (L, mm) de agua a diferentes distancias do aspersor e as correspondentes produ-tividades (P, t/ha). Em geral, para esse tipo de solo, o excesso de agua causa diminuic aodeprodutividade.L 285 380 400 425 455 490 520 550 575 615 680 785P 14,94 15,98 21,21 22,71 22,38 24,83 24,42 30,59 29,96 31,07 29,80 22,611.4.2Omanejodeirrigac aoeumapreocupacaoconstanteparaaquelesquefazemusodela,pois e anti-econ omico irrigar a uma velocidade superior `aquela da inltracao (a agua ira escor-rerenaoinltrar). Emfunc aodisso,saoconduzidosensaiosquetemcomonalidadeestimarasequac oesdeinltracaoacumuladaemrelac aoaotempoacumuladoedevelocidadedeinl-trac ao em relacao ao tempo acumulado e `a velocidade basica de inltracao para um solo. Essasequac oessaoimportantesparaadeterminac aodotempodeirrigacaoparaatingirumadeter-minadalaminadeagua, nocasodeirrigacaosupercial eparaaescolhadotipodeaspersorquedeveterintensidadedeaplicac aomenordoqueavelocidadedeinltrac aobasica.ModelosdeRegressao 17Os dados que se seguem referem-se a tempos acumulados (T, minutos) de observac aoe correspondentes medidas de inltracao acumulada (I, cm) da agua no solo, usando o metododoinltometrodeanel.T I T I T I1 0,8 16 3,9 96 13,82 1,3 26 4,7 126 16,94 1,8 36 6,9 156 20,06 2,1 51 8,6 186 23,511 3,1 66 10,1 216 26,4Baseando-senosdadosapresentados,a) calculeavelocidadedeinltracaoV (cm/min),dadaporV= 1/T;b) discutaanaturezadasvari aveis: tempoacumulado, inltracaoacumuladaevelocidadedeinltrac ao;c) facadiagramas de dispersaoparainltracaoacumuladaversus tempoacumulado, ve-locidadedeinltrac aoversus tempoacumuladoediscutaarelac aoentreas variaveis,tendencia,dispersaoepontosatpicos;d) calculeavelocidadedeinltracaobasicaaproximada(mediados ultimoscincovalores)ObservacaoEmgeral,naliteratura(Bernardo,S.1989,ManualdeIrrigac ao),saopropostosos modelos nao lineares para estimar as equac oes de inltracao acumulada em relac ao a tempoacumuladoedevelocidadedeinltrac aoemrelac aoatempoacumulado:I= aTb+cT e V= dTb1+couI= aTbe V= dTb1emquea, b, cedsaoparametrosaseremestimadosecrefere-se`avelocidadedeinltrac aobasica.1.4.3Mostrequais func oes das queseseguemsaolineares nos parametros equais saonaolineares.a) f(X, 0, 1) = 0 + 1X2b) f(X, 0, 1) = 0 + 1X3c) f(X, 0, 1) =00 + 1X18 ClariceG.B.Demetrio&SilvioS.Zocchid) f(X, 0, 1, 2) = 2 exp{exp(0 + 1X)}e) f(X, 0, 1, 2) = 0 + 1X2f) f(X, 0, 1, 2) = 0 + 1XI{X0} + 2XI{X>0}g) f(X1, X2, 1, 2) = 1X1 + 2X2h) f(X1, X2, 0, 1, 2, 12) = 0 + 1X1 + 2X2 + 12X1X2i) f(X1, X2, 0, 1, 2) =exp(0 + 1X1 + 2X2)1 + exp(0 + 1X1 + 2X2)Captulo2Regressaolinearsimples2.1 IntroducaoAteoriadeRegressaoteveorigemnoseculoXIXcomGalton. Emumdeseustrabalhoseleestudouarelac aoentreaalturadospaisedoslhos(XieYi),procurandosabercomoaalturadopai inuenciavaaalturadolho. Notouqueseopai fossemuitoaltooumuitobaixo,olhoteriaumaalturatendendo`amedia. Porisso,elechamouderegressao,ouseja,existeumatendenciadeosdadosregredirem`amedia.Autilizac aodemodelosderegressao,podeterporobjetivos:i) Predicao. Umavez que se esperaque umaparte (que se desejaque sejaamaior)davariac aodeYeexplicadapelas vari aveis X, ent ao, pode-seutilizar omodeloparaobtervaloresdeYcorrespondentesavaloresdeXquenaoestavamentreosdados. Esseprocesso denomina-se predicao e, em geral, sao usados valores de X que estao dentro dointervalo de variac ao estudado. A utilizacao de valores fora desse intervalo recebe o nomede extrapolacao e, deve ser usada com muito cuidado, pois o modelo adotado pode naosercorretoforadointervaloestudado. Este,talvez,sejaousomaiscomumdosmodelosderegressao.ii) Selecao de variaveis. Freq uentemente, naose temideiade quais sao as vari aveisqueafetamsignicativamenteavariacaodeY. Pararesponderaessetipodequestao,conduzem-seestudosondeestapresenteumgranden umerodevari aveis. Aanalisederegressaopodeauxiliarnoprocessodeselecaodevariaveis,eliminandoaquelascujacon-tribuic aonaosejaimportante.iii) Estimacaodeparametros. Dadoummodeloeumconjuntodedados(amostra)refe-rente`asvariaveisrespostaepreditoras,estimarparametros,ouainda,ajustaromodeloaosdados, signicaobtervalores(estimativas)paraosparametros, poralgumprocesso,tendoporbaseomodeloeosdadosobservados. Emalgunscasos,ovalordocoecientetem valor por si so. Como exemplo, pode-se citar o estudo de estabilidade de variedades.1920 ClariceG.B.Demetrio&SilvioS.ZocchiEm outros casos, o interesse esta em uma func ao dos parametros. Como exemplo, pode-secitarocalculodedosesletais.iv) Inferencia. Oajustedeummodeloderegressaotem, emgeral, porobjetivosbasicos,alem de estimar os parametros, realizar inferencias sobre eles, tais como testes de hipoteseseintervalosdeconanca.Emgeral, asvari aveisXssaochamadasvariaveisindependentesouexplana-toriasoucarriers, enquantoqueavari avel Yechamadavariavel dependenteoures-posta.2.2 ModeloestatsticoSuponha que a relac ao verdadeira entre X e Ye uma linha reta, e que cada observac aoY,emcadanveldeX, eumavari avelaleatoria(Figura2.1).Figura2.1: ErrosemY Figura2.2: Interpreta caodoscoecientesEnt ao,ovaloresperadodeYparacadavalordeX eE(Y |X) = 0 + 1Xsendoqueosparametrosdaequacaodareta,0e1,saoconstantesdesconhecidas.Verica-sequeparaX=0, 0representaopontoondearetacortaoeixodosYseporissoechamadointercepto(oucoecientelinear). Ja1echamadocoecientederegressaooucoecienteangulardareta,pois,dainterpretacaogeometricadaderivadatem-se1= tgModelosdeRegressao 21sendo o angulo que a reta forma com o eixo dos Xs. Alem disso, tem-se que para um aumentode1unidadedeXhaumaumentode1unidadesnaE(Y |X)(Figura2.2).Assim, dados n pares de valores, (X1, Y1), (X2, Y2), , (Xn, Yn), se for admitido queY e func ao linear de X, pode-se estabelecer uma regressao linear simples, cujo modelo estatsticoeYi= 0 +1Xi + i, i = 1, 2, , nsendo0e1osparametrosaseremestimados.Aoseestabeleceressemodelo,pressupoe-seque:(i) Arelac aoentreYeX elinear.(ii) OsvaloresdeXsaoxos(oucontrolados).(iii) Amediadoerro enula,isto e,E(i) = 0.(iv) ParaumdadovalordeX,avari anciadoerroiesempre2,isto e,Var(i) = E(2i) [E(i)]2= E(2i) = 2oqueimplicaemVar(Yi) = E[YiE(Yi)]2= E(2i) = 2.Diz-se,ent ao,queoerroehomocedastico,ouquesetemhomocedasticia(doerrooudavariaveldependente).(v) Oerrodeumaobservac ao eindependentedoerrodeoutraobservac ao,isto e,Cov(i, i ) = E(ii ) E(i)E(i ) = E(ii ) = 0, para i = i

.(vi) Oserrostemdistribuicaonormal.Logo, combinando(iii), (iv)e(v)tem-sei N(0, 2)e, portanto, Yi N(0+1Xi, 2). A suposic ao de normalidade e necessaria para a elaborac ao dos testes de hipoteses eobtenc aodeintervalosdeconanca.2.3 EstimacaodosparametrosOproblemaagoraeestimarosparametros0e1detalformaqueosdesviosdosvaloresobservadosemrelacaoaosestimadossejammnimos(Figura2.4).22 ClariceG.B.Demetrio&SilvioS.ZocchiFigura2.3: RegressaolinearIssoequivaleaminimizarocomprimentodovetor=(1, 2, , n)

. Usandoanormaeuclideanaparaavaliarocomprimentode,tem-se:Z=|| ||2=n

i=12i=n

i=1[YiE(Yi)]2=n

i=1[Yi01Xi]2Deseja-se, portanto, estimar 0 e 1 tais que Z seja mnima. Esse metodo e chamadometododosmnimosquadrados. Paraisso,obtem-seasderivadasparciais:___Z0= 2

ni=1[Yi01Xi](1)Z1= 2

ni=1[Yi01Xi](Xi)efazendo-seZ0= 0 eZ1= 0,obtem-seasequac oesnormais:

ni=1[Yi01Xi] = 0 n0 +1

ni=1Xi=

ni=1Yi(2.1)

ni=1[Yi01Xi]Xi= 0 0

ni=1Xi +1

ni=1X2i=

ni=1XiYi(2.2)De(2.1)tem-se0=1nn

i=1Yi1nn

i=1Xi(2.3)ouModelosdeRegressao 230=Y 1X.(2.4)Substituindo-se(2.3)em(2.2)tem-se1=

ni=1XiYi

ni=1 Xi

ni=1 Yin

ni=1X2i (

ni=1 Xi)2n=n

ni=1XiYi

ni=1Xi

ni=1Yin

ni=1X2i (

ni=1Xi)2=

ni=1(XiX)(YiY )

ni=1(XiX)2ou, ainda, considerando-se xi= XiX e yi= YiY , e como

ni=1xi=

ni=1(XiX) = 0e

ni=1yi=

ni=1(YiY ) = 0,tem-seasexpressoesequivalentes:1=

ni=1xiYi

ni=1x2i=

ni=1Xiyi

ni=1x2i=

ni=1xiyi

ni=1x2i. (2.5)Obtendo-seasderivadasparciaisdesegundaordemdeZemrelac aoa0ea1,tem-se:2Z20= 2n

i=11 = 2n > 0,2Z01= 2n

i=1Xie2Z21= 2n

i=1X2i .Portanto,2Z202Z012Z012Z21=2n 2

ni=1Xi2

ni=1Xi2

ni=1X2i= 4_nn

i=1X2i (n

i=1Xi)2_= 4nn

i=1(XiX)2 0,oquemostraqueZemnimapara0e1. Logo, aretaestimadapelometododosmnimosquadrados edadapor:Yi=0 +1Xi.Asoluc aodosistemadeequac oesnormaispossuiasseguintespropriedades:a) Oponto( X,Y ) eumpontodaretaestimadaYi=0 +1Xi. (Verique!)24 ClariceG.B.Demetrio&SilvioS.Zocchib) Usando-se(2.1),tem-se:n

i=1 i=n

i=1(YiYi) =n

i=1(Yi01Xi) = 0decorrendoquen

i=1Yi=n

i=1Yi.c) Usando-se(2.2),tem-se:n

i=1Xi i=n

i=1Xi(YiYi) =n

i=1Xi(Yi01Xi) = 0,decorrendoquen

i=1XiYi=n

i=1XiYi.d) Usando-se(b)e(c),tem-se

ni=1Yi i= 0n

i=1Yi i=n

i=1(0 +1Xi) i=0n

i=1 i +1n

i=1Xi i= 0.e) Osestimadoresdequadradosmnimos0e1saofuncoeslinearesdasobservac oesYis,isto e,1=n

i=1(XiX)(YiY )n

i=1(XiX)2=n

i=1(XiX)Yin

i=1(XiX)2=n

i=1(XiX)n

i=1(XiX)2Yi1=n

i=1ciYi(2.6)sendoci=(XiX)n

i=1(XiX)2=xin

i=1x2i, (2.7)0=Y 1X=n

i=1Yinn

i=1ciYiX=n

i=1(1n ciX)Yi,ModelosdeRegressao 250=n

i=1diYi, (2.8)sendodi=1n ciX. (2.9)Notequee.1)

ni=1ci= 0n

i=1(XiX)

ni=1(XiX)2=1

ni=1(XiX)2n

i=1(XiX) = 0.e.2)

ni=1ciXi= 1n

i=1(XiX)Xi

ni=1(XiX)2=

ni=1(XiX)2

ni=1(XiX)2= 1.e.3)

ni=1di= 1(Prove!)e.4)

ni=1diXi= 0(Prove!)f) Osestimadoresdemnimosquadradosde0ede1saonaoviesados,isto e,E(0) = 0e E(1) = 1Apartirde(2.6),tem-seE(1) = E_n

i=1ciYi_=n

i=1E(ciYi) =n

i=1ciE(0 + 1Xi + i) = 0n

i=1ci + 1n

i=1ciXieusando-se(e.1)e(e.2)tem-se:E(1) = 1.Apartirde(2.3),tem-se:E( 0) = E(Y 1X) =

ni=1 E(Yi)n1X=1nn

i=1(0 +1Xi) 1X= 0 +1X1X.Portanto,26 ClariceG.B.Demetrio&SilvioS.ZocchiE(0) = 0.Facaomesmo,usando(e.3)e(e.4).g) A vari ancia dos estimadores de mnimos quadrados de 0 e 1 e mnima entre as varianciasdequaisqueroutrosestimadoreslineares(emY )de0e1(TeoremadeGauss).Dado que0=Y1X e1=

ni=1xiYi

ni=1x2ie lembrando-se que os Yis saoindependentes,tem-se:g.1) Var(1) = Var_ni=1xiYi

ni=1x2i_=1(

ni=1x2i)2n

i=1Var(xiYi) =1(

ni=1x2i)2n

i=1x2i2Portanto,Var(1) =2

ni=1x2i. (2.10)g.2) Var(0) = Var(Y 1X) = Var(Y ) +X2Var(1) 2 XCov(Y , 1)masVar(Y ) =1n2n

i=1Var(Yi) =1n2n2=2neCov(Y , 1) = Cov_ni=1Yin,

ni=1xiYi

ni=1x2i_=1n

ni=1x2iCov_n

i=1Yi,n

i=1xiYi_=1n

ni=1x2in

i=1xiVar(Yi) =1n

ni=1x2in

i=1xi2Cov(Y ,1) = 0.(2.11)Logo,Var( 0) =2n+X22

ni=1x2i0Var(0) =_1n+X2

ni=1x2i_2. (2.12)ModelosdeRegressao 27g.3) Cov(0, 1) = Cov(Y X1, 1) = Cov(Y , 1) XVar(1)oqueimplicaem:Cov(0, 1) = X

ni=1x2i2. (2.13)g.4) Var(Yi) = Var(0 +1Xi) = Var(0) + X2i Var(1) + 2XiCov(0, 1)Var(Yi) =_1n+X2

ni=1x2i+ X2i1

ni=1x2i2XiX

ni=1x2i_2=_1n+1

ni=1x2i(X2i 2XiX +X2)_2=_1n+(XiX)2

ni=1x2i_2Var(Yi) =_1n+x2i

ni=1x2i_2. (2.14)TeoremadeGaussConsidere o ModeloI estabelecido e suas pressuposic oes. Sejam0e1os estimadoresnaoviesadosdemnimosquadradosde0e1e= a10 +a21umacombinac aolinearde 0 e 1. Entao, dentre todos os estimadores imparciais de , lineares em Y , o estimador = a10 + a21temvari anciamnima, istoe, seT =

ni=1liYi, emquelisaoconstantesarbitrariaseE(T) = ,ent ao,Var( ) Var(T).Demonstracao:i) Oestimador deenao-viesado.E( ) = E(a10 + a21) = a10 + a21= .28 ClariceG.B.Demetrio&SilvioS.Zocchiii) Oestimador deetambemlinearemY .Usando-se(2.6)e(2.8),tem-se: = a10 + a21= a1n

i=1diYi + a2n

i=1ciYi=n

i=1(a1di + a2ci)Yi=n

i=1iYisendoi= a1di + a2ci, (2.15)ci=(XiX)

ni=1(XiX)2,di=1n ciX.Portanto, elinearemY.ii) Avarianciade edadapor:Var( ) = Var(a10 + a21) = a21Var(0) + a22Var(1) + 2a1a2Cov(0, 1)eusando-se(2.10),(2.12)e(2.13),tem-se:Var( ) =_a21n+(a2a1X)2

ni=1x2i_2.iv) Porimposic aooestimadorT=

ni=1liYienaoviesado, istoe, E(T)=, oqueimplicaem:E(T) = E(n

i=1liYi) =n

i=1liE(0 + 1Xi + i)= 0n

i=1li + 1n

i=1liXi= a10 + a21.Portanto,ModelosdeRegressao 29a1=n

i=1li(2.16)ea2=n

i=1liXi. (2.17)v) Var(T) = Var(

ni=1liYi) =

ni=1l2iVar(Yi)Logo,Var(T) =

ni=1l2i2.vi) Cov(T, )=Cov(

ni=1liYi,

ni=1iYi)=

ni=1liiVar(Yi)=

ni=1lii2e, usando-se(2.15)e(2.9),tem-seCov(T, ) =n

i=1li(a1di + a2ci)2=n

i=1li_a1n ciXa1 + a2ci_2=n

i=1li_a1n+ (a2Xa1)ci_2eainda,usando-se(2.7),(2.16)e(2.17),tem-seCov(T, ) =_a1

ni=1lin+ (a2Xa1)

ni=1li(XiX)

ni=1x2i_2=_a21n+ (a2Xa1)(a2Xa1)

ni=1x2i_2.Portanto,Cov(T, ) =_a21n+(a2Xa1)2

ni=1x2i_2= Var( ).vii) Var(T )0 Var(T ) = Var(T) + Var( ) 2Cov(T, ) = Var(T) Var( ).Portanto,Var( ) Var(T).30 ClariceG.B.Demetrio&SilvioS.ZocchiAssim:1) SeT= ,isto e,sei= li=a1n+ (a2Xa1)ci,ent ao,Var( ) = Var(T).2) Casocontr ario,isto e,sei = li,entao,Var( ) < Var(T).Casosespeciais1) Sea1= 0ea2= 1,ent ao, =1. Logo,1eoestimadornaoviesado,devari anciamnimade1.2) Sea1= 1ea2= 0,ent ao, =0. Logo,0eoestimadornaoviesado,devari anciamnimade0.3) Sea1=1ea2=X0, entao, =YX0=0 +1X0. Logo,YX0eoestimadornaoviesado,devari anciamnimadeE(YX0).g) ComoYi N(0+ 1Xi, 2), e, alemdisso,0e1saocombina coeslinearesdosYis,ent ao,0 N(0, Var(0))(2.18)pois,E(0) = 0e Var(0) = (1n+X2

ni=1x2i)2e1 N(1, Var(1))(2.19)pois,E(1) = 1eVar(1) =2

ni=1x2i.Alemdisso,Yi N(0 + 1Xi, Var(Yi))(2.20)pois,E(Yi) = 0 + 1Xie Var(Yi) =_1n+x2i

ni=1x2i_2.Observacao: Oproblemaaqui eque2edesconhecidoeprecisaserestimado(veritem2.6.3).ModelosdeRegressao 312.4 UmaformaalternativaparaomodeloderegressaolinearsimplesVariavelXcentradaUmaformareparametrizadacomque se apresentaomodelode regressaolinearsimpleseobtidapelautilizacaodavariavelpreditoracentrada, istoe, pelautilizac aodexi=XiXcomovari avelpreditora. Assim,tem-se:Yi= 0 + 1Xi + i= (0 +1X) + 1(XiX) + i= + 1xi + i(2.21)Deformasemelhanteaoquefoifeitonoitem(2.3),napagina16,tem-se:Z=|| ||2=n

i=12i=n

i=1[YiE(Yi|Xi)]2=n

i=1[Y i 1xi]2queminimizadoleva`aestimativadequadradosmnimosdedadapor: =Y(2.22)e`aestimativaparao1dadapelaexpressao(2.5) napagina18, comvari anciadadapelaexpressao(2.10)napagina20. Mostra-se,aindaque,E( ) = ,V ar( ) =1n2(2.23)eCov( ,1) = 0.(2.24)Ve-se, portanto, que os estimadores de quadrados mnimos, e1, nao sao correla-cionados,poisCov( , 1) = 0.32 ClariceG.B.Demetrio&SilvioS.Zocchi2.5 AnalisedevarianciaetesteFObtencaodassomasdequadradosPelaFigura2.4, ve-sequeodesviodeumadeterminadaobservac aoemrelac aoaovalorestimadocorrespondentepodeserdecompostodaseguinteforma: i= YiYi= (YiY ) (YiY )isto e,desvionaoexplicadopelomodelo=desviototal -desviodevidoaomodelo.Figura2.4: Decomposicaodosdesvios i= YiYi= (YiY ) (YiY )Tem-se, entao, que asomade quadrados dos desvios (parte naoexplicadapelomodelo) edadapor:n

i=1 2i=n

i=1(YiYi)2=n

i=1(YiY Yi +Y )2=n

i=1[(YiY ) (YiY )]2=n

i=1(YiY )22n

i=1(YiY )(YiY ) +n

i=1(YiY )2.ModelosdeRegressao 33Mas,jafoivistoem(b),napagina19,quen

i=1 i= 0 n

i=1Yi=n

i=1Yie,em(d),napagina19,quen

i=1Yi i=n

i=1Yi(YiYi) = 0 n

i=1Y2i=n

i=1YiYi.Ent ao,

ni=1(YiY )(YiY ) =

ni=1(YiY )2e,portanto,n

i=1 2i=n

i=1(YiY )2n

i=1(YiY )2.Mas,n

i=1(YiY )2=n

i=1(0 +1XiY )2=n

i=1(Y 1X +1XiY )2=21n

i=1(XiX)2=21n

i=1x2i=(

ni=1xiYi)2

ni=1x2iquepordependerdocoeciente1echamadasomadequadradosderegressao. Tem-se, por-tanto,SQRes = SQTotal SQRegou,aindaSQTotal = SQReg + SQResistoe, avariabilidadetotal dosdados(medidapelaSQTotal)podesersubdivididaemduaspartes:- umapartequedependedamagnitudedocoeciente1, istoe, dependedequantoomodeloexplica(medidapelaSQReg);- outraque depende dafaltade ajuste domodelooude quantoomodelonaoexplica(medidapelaSQRes).34 ClariceG.B.Demetrio&SilvioS.ZocchiNote-sequeaSQReg,alemdedependerdamagnitudedocoecientederegressao,depende, tambem, dasomadequadradosdedesviosdosXs. Portanto,eimportantequeosvalores de Xsejam bem escolhidos, de forma que a variacao que representada adequadamenteequeamagnitudedaSQRegpossaseratribudabasicamenteaocoecientederegressao.ValoresperadodasSomasdeQuadradosa) SQTotalDadoque SQTotal=

ni=1(YiY )2,emqueYi= 0 + 1Xi + ieY= 0 + 1X + ,ent ao,YiY= 1(XiX) + i = 1xi +i eSQTotal =n

i=1(YiY )2=n

i=1(1xi+i )2= 21n

i=1x2i +n

i=1(i )2+21n

i=1(i )xi.Portanto,E(SQTotal) = 21n

i=1x2i+E_n

i=1(i )2_+ 21E_n

i=1(i )xi_Mas, lembrandoqueE(i)=0, V ar(i)=E(2i)=2equeosissaoindependentes,isto e,parai = i

cov(i, i ) = E(ii ) = 0,tem-seE_n

i=1(i )xi_=n

i=1E(i )xi= 0eE_n

i=1(i )2_=n

i=1E(i )2=n

i=1E(2i 2i + 2) =n

i=1_E(2i) 2E(i ) + E( 2)=n

i=1___22E_i1 + 2 + + nn_+ E___n

i=11 + 2 + +nn_2_____=n

i=1_222n+2n_= (n 1)2.Ent ao,ModelosdeRegressao 35E(SQTotal) = 21

ni=1x2i+(n 1)2. (2.25)b) SQRegDadoqueSQReg=

ni=1(YiY )2=21

ni=1x2ieque

ni=1xiXi=

ni=1x2item-se:E(SQReg) = E_21n

i=1x2i_=n

i=1x2iE(21) =n

i=1x2i1(

ni=1x2i)2E_n

i=1xiYi_2=1

ni=1x2iE_n

i=1xi(0 + 1Xi + i)_2=1

ni=1x2iE_0n

i=1xi + 1n

i=1xiXi +n

i=1xii_2=1

ni=1x2iE_1n

i=1xiXi +n

i=1xii_2=1

ni=1x2iE__21_n

i=1x2i_2+ 21n

i=1x2in

i=1xii +_n

i=1xii_2__= 21n

i=1x2i+ 21n

i=1xiE(i) +1

ni=1x2iE_n

i=1xii_2= 21n

i=1x2i+1

ni=1x2in

i=1x2i2= 21n

i=1x2i+2E(SQReg) = 21

ni=1x2i+ 2. (2.26)c) SQResComoSQRes=SQTotal -SQReg,ent ao,usando-se(2.25)e(2.26),tem-se:36 ClariceG.B.Demetrio&SilvioS.ZocchiE(SQRes) = E(SQTotal)E(SQReg) = 21n

i=1x2i+(n1)221n

i=1x2i2= (n2)2E(SQRes) = (n 2)2. (2.27)EstimadordavarianciaresidualDadoqueE(SQRes) = (n 2)2,comoconsequencia,tem-seque:E_SQResn 2_= 2,e,portanto,umestimadornaoviesadopara2edadopor 2=SQResn 2= QMRes.Tem-se, entao, apartirde(2.10), (2.12)e(2.13), asvari anciasecovarianciaesti-madas,substituindo-se2porQMRes.IndependenciaentreparametrosestimadoseSQResConformeseravisto, matricialmente, noitem(3.4)tem-sequeSQReseindependentede0,1e .DistribuicaodasSomasdeQuadradosConformeseravistonoitem(3.4)tem-se:12SQTotal =12n

i=1(YiY )2=12n

i=1y2i 2_n 1,12221n

i=1x2i_,12SQReg=12n

i=1(YiY )2 2_1,12221n

i=1x2i_e12SQRes =12n

i=1(YiYi)2 2(n 2).ModelosdeRegressao 37IndependenciadasSQRegeSQResDadoqueSQReg=n

i=1(YiY )2eSQRes =n

i=1(YiYi)2,eainda,Yi= +1xi=Y+1xieYiY=1xi,entao,usando-se(2.10)e(2.11),tem-se:Cov(YiY , YiYi) = Cov(1xi, YiY 1xi)= Cov(1xi, Yi) Cov(1xi,Y ) V ar(1xi)= xiCov(

ni=1xiYi

ni=1x2i, Yi) xiCov(1,Y ) x2iV ar(1)= x2i2

ni=1x2ix2i2

ni=1x2i= 0pois, Cov(1,Y ) =0(pagina22), e, comoos Yis temdistribuic aonormal, issoimplicanaindependenciadasSQRegeSQRes.QuadrodaanalisedavarianciaetesteFOinteresseagora etestarahipoteseH0: 1= 0versusHa: 1 = 0,isto e,serealmenteexisteumarelacaolinearentreY eX. Jafoivistoque:12SQRes 2n2e12SQReg 21,sendo =1221n

i=1x2io parametro de nao centralidade, e, alem disso, sao independentes. Logo,sobH0: 1= 0,= 0,12SQReg 21(central)e38 ClariceG.B.Demetrio&SilvioS.ZocchiF=SQReg2SQRes(n 2)2 F1,n2.Portanto,rejeita-seahipoteseH0: 1= 0,aumnvelde100%deprobabilidade,se:Fcalc> F1,n2;ousePr(F1,n2> Fcalc) < sendo,emgeral,= 0, 05ou= 0, 01.Apartirdosresultadosobtidos, pode-seobteroesquemadoquadrodaanalisedavari anciaetesteFmostradosnaTabela2.1.Tabela2.1: Esquemadeanalisedevari anciaetesteFCausasdevariac ao G.L. S.Q. Q.M. E(Q.M.) FRegressaolinear 1(

ni=1xiYi)2

ni=1x2iSQReg12+21

ni=1x2iQMRegQMResResduo n 2 pordiferencaSQResn 22Total n 1

ni=1Y2iCsendoC=(

ni=1Yi)2n.2.6 EstimacaoporintervaloOmetodoutilizadoaqui paraaconstrucaode umintervalode conancaseraometododaquantidadepivotal. SeQ=q(Y1, Y2, . . . , Yn; ), istoe, umafuncaodaamostraaleatoriaY1, Y2, . . . , Ynede,oparametrodeinteresseetemumadistribuicaoqueindependede , ent ao Q e uma quantidade pivotal. Logo, para qualquer xo, tal que 0 < < 1, existemq1eq2,dependendode,taisqueP[q1< Q < q2] = 1 ModelosdeRegressao 39eapartirdessaexpressao,pode-seobterumintervalodeconancaparacomumcoecientedeconanca1 .Dadoomodelodenidopor(2.21),jafoivistoque N(, 2n ),0 N_0,_1n+X2

ni=1x2i_2_e1 N_1,2

ni=1x2i_.Poroutrolado,tem-seque12SQRes 2n2 W= (n 2)QMRes2 2n2edadaumavari avelaleatoriaZ N(0, 1)e,alemdisso,sendoZeQMResindependentes,Q =Z_Wn 2 tn2que eofundamentoparaaconstruc aodosintervalosdeconancaqueseseguem.IntervalodeconancaparaDadoqueZ= _V ( )= _2n N(0, 1)ent ao, _2n(n 2)2(n 2)QMRes= _V ( ) tn2e um intervalo de conanca para , com um coeciente de conanca 1 e obtido a partir de:P__t2 _V ( ) t2__= 1 40 ClariceG.B.Demetrio&SilvioS.Zocchiobtendo-seP_ t2_QMResn + t2_QMResn_= 1 ouainda,dadaasimetriadadistribuicaotpode-seescrever:IC[]1: tn2;2_QMResn.Intervalodeconancapara0Deformasemelhante,tem-se:Z=00_V (0)=00_1n+X2

ni=1x2i_2 N(0, 1) e00_1n+X2

ni=1x2i_QMRes tn2.Logo,IC[0]1:0tn2;2_1n+X2

ni=1x2i_QMRes.Intervalodeconancapara1Deformasemelhante,tem-se:Z=11_V (1)=11_1

ni=1x2i2 N(0, 1) e11_1

ni=1x2iQMRes tn2.Logo,IC[1]1:1tn2;2QMRes

ni=1x2i.ModelosdeRegressao 41IntervalodeconancaparaE(Yi) = 0 + 1Xi= + 1xiJafoivistoqueaaproximac aodemnimosquadradosparaYiedadaporYi=0 +1Xi= +1xicomE(Yi) = E(Yi) = 0 + 1Xi= + 1xieV (Yi) =_1n+x2i

ni=1x2i_2.Alemdisso,Yi N_E(Yi),_1n+x2i

ni=1x2i_2_.Logo,Zi=YiE(Yi)_V (Yi)eYiE(Yi)_1n+x2i

ni=1x2i_QMRes tn2.Portanto,IC[E(Yi)]1:Yitn2;2_1n+x2i

ni=1x2i_QMRes.IntervalodeprevisaoparaYh= 0 +1Xh +h= +1xh +h(Intervalodeprevisao)Freq uentemente, hainteresse emse estimar ovalor de umanovaobservac aoYhrelativaaovalorXhdavari avelpreditora,istoe,deseja-sepreverovalordavariavelrespostaparaumanovaobservacaoX= Xh.OestimadordeYh= 0 +1Xh +h= +1xh + hedadopor:42 ClariceG.B.Demetrio&SilvioS.ZocchiYh=0 +1Xh= +1xheoerrodeprevisao e(YhYh) = (00) + (11)Xhh= ( ) + (11)xhhobtendo-se:E(YhYh) = 0 E(Yh) = E(Yh) E(Yh) = 0 + 1Xh= + 1xh= Yhh = YheV (YhYh) = V (Yh) + V (Yh) =_1n+x2h

ni=1x2i+ 1_2pois,YheYhsaovari aveisaleatoriasindependentes,pelapressuposicao(v)dapagina16.Para avaliar a precisao deYh como previsao do valor da nova observa cao, determina-seointervalodeprevisaoparaYh. Umavezque, paradeterminadovalor (Xh) davariavelpreditora, os valores de Yvariam em torno de sua verdadeira media, isto e, em torno de E(Yh)comvariancia2,avari anciaqueinteressa e2+V (Yh). Logo,IC[Yh]1:Yhtn2;2_1n+x2h

ni=1x2i+ 1_QMRes.A Figura 10 mostra o aspecto que, em geral, assumem o intervalo de conanca paraE(Yh)eointervalodeprevisaoparaYh.Oconceitodeintervalodeprevisaoeanalogoaodeintervalodeconanca, comadiferenca de que, enquanto o intervalo de conanca refere-se a uma constante (o parametro 1,porexemplo),ointervalodeprevisaorefere-seaumavariavelaleatoria(Yh,nocaso).ModelosdeRegressao 43Figura2.5: Intervalodeconanca(....) paraE(Yh)eintervalodeprevisao(---)paraYh2.7 TestesdehipotesesparaosparametrosTestedehipotesesparaEmfunc aodoquejafoivistotem-sequeotestedahipotese:H0: = 0versus___Ha1: < 0Ha2: > 0Ha3: = 0eobtidoapartirde: 0_V ( ) tn2.Assim,obtem-se:tcalc= 0_QMResne,aumnvelde100%deprobabilidade,rejeita-seH0,emfavorde:Ha1: < 0setcalc< tn2;ouseP(tn2< tcalc) < ;44 ClariceG.B.Demetrio&SilvioS.ZocchiHa2: > 0setcalc> tn2;ouseP(tn2> tcalc) < ;Ha3: = 0se |tcalc| > tn2;2ouseP(|tn2| > |tcalc|) < ;istoe, asregioesderejeicaodeH0saodadaspelosintervalosdet correspondentes`asareashachuradasnasFiguras2.6,2.7e2.8,respectivamente.Figura2.6: H0vsHa1Figura2.7: H0vsHa2Figura2.8: H0vsHa3Testedehipotesespara0Deformasemelhante,obtem-seotestedehipotesespara0,isto e,otestede:H0: 0= 00versus___Ha1: 0< 00Ha2: 0> 00Ha3: 0 = 00eobtidoapartirde:tcalc=000_1n+X2

ni=1x2i_QMRescomregioesderejeicaodeH0dadaspelosintervalosdetcorrespondentes`asareashachuradasnasFiguras2.6,2.7e2.8,respectivamente.Observacao: Um caso particular importante e aquele em que 00= 0, isto e, a retapassapelaorigem.ModelosdeRegressao 45Testedehipotesespara1Deformasemelhante,obtem-seotestedehipotesespara1,isto e,otestede:H0: 1= 10versus___Ha1: 1< 10Ha2: 1> 10Ha3: 1 = 10eobtidoapartirde:tcalc=110QMRes

ni=1x2icomregioesderejeicaodeH0dadaspelosintervalosdetcorrespondentes`asareashachuradasnasFiguras2.6,2.7e2.8,respectivamente.Observacao: No caso particular em que 10= 0 (teste bilateral), tem-se que t2calc=Fcalc.2.8 ExemplodeaplicacaoConsidere o Exerccio n umero 1 do item 1.4.1 da pagina 14. Usando-se, por exemplo,oSAS,obtem-seosresultadosdaTabela2.2Tabela2.2: Esquemadeanalisedevari anciaetesteFCausasdevariac ao G.L. S.Q. Q.M. FRegressaolinear 1 1.056,57 1.056,57 225,49**Resduo 5 23,43 4,68Total 6 1.080,00F1,5;0,05= 6, 61, F1,5;0,01= 16, 26 eP(F1;5> 225, 49) = 0, 0000237ComoFcalc=225, 49 >F1,5;0,01=16, 26ou, ainda, P(F1;5>225, 49) 0, 31) = 0, 767isto e, nao se rejeita H0 ao nvel de 5% de probabilidade, o que indicaria a possiblidade do ajustedeumaretapassandopelaorigem, eoquenessecasoeperfeitamenteexplicadonapratica,poisnodia0aplantateraaltura0.Aestatsticat paraotestedahipoteseH0: 1=0versus Ha: 1 =0, comoesperado, e:tcalc= 15, 01 =_225, 49 =_Fcalc.Intervalos de conanca, com coecientes de conanca de 95% de probabilidade, para0epara1saodadospor:IC(0)0,95: (5, 275; 4, 132)eIC(1)0,95: (5, 091; 7, 195),mostrando que existem evidencias de que 0nao e signicativamente diferente de zero (o inter-valopara0inclui ozero)aonvel de5%deprobabilidade, enquantoque1oe(ointervalonaoincluiozero),conrmandooresultadoobtidopelotesteF.Saoobtidos,ainda,osresultadosapresentadosaseguir.ModelosdeRegressao 47X YY s(Y ) LIICLSICLIIPLSIP1 5 5,57 1,48 1,78 9,36 -1,16 12,302 13 11,71 1,16 8,74 14,69 5,40 18,023 16 17,86 0,92 15,50 20,21 11,82 23,904 23 24,00 0,82 21,90 26,10 18,05 29,955 33 30,14 0,92 27,79 32,49 24,10 36,186 38 36,28 1,16 33,31 39,26 29,98 42,607 40 42,43 1,48 38,64 46,22 35,70 49,16emqueLIICeLSICsaooslimitesdointervalodeconancaparaE(Yh), comumcoecientedeconancade95%deprobabilidade, eLIIPeLSIPsaooslimitesdointervalodeprevisaoparaYh, comumcoecientedeconancade95%deprobabilidade. AFigura14, mostraosintervalos de conanca para E(Yh) e de previsao para Yh, bem como a reta estimada e os valoresobservados.Figura2.9: IntervalodeconancaparaE(Yh)eintervalodeprevisaoparaYhOProgramaemSASutilizado,paraessescalculos,foi:options nodate nonumber ps=65;data feijao;input x y;cards;1 52 1348 ClariceG.B.Demetrio&SilvioS.Zocchi3 164 235 336 387 40;proc reg;model y=x/clm cli;run;2.9 RegressaolinearporanamorfoseExistemdeterminados tipos de modelos naolineares que atraves de umatrans-formac aotornam-selineareseosparametrosdomodeloinicial podem, entao, serestimadosatravesdefunc oesdeles. Geralmente, essasestimativassaousadascomovaloresiniciaisparaumprocessoiterativo. Comoexemplospodemsercitados:ModelodeCobb-Douglas,muitousadonaareadeEconomia,edadopor:R = ZsendoRarendabrutaeZ,aareaplantada.Paralinearizaressemodelobastausarafuncaologartmicaetem-se:log R = log + log Z Y= 0 +1XsendoY =log Ranovavariavel resposta, X=log Z, anovavari avel explicativaeporumaregressaolinear simples estimam-se os parametros 0e 1, e consequentemente, = e0e=1.Polin omios inversos, cujas curvas sao hiperbolicas, muito usados para descrever arelac aoexistenteentrepesoedensidadedeplantas, crescimentodeplantas ebalancode ons, produtividadeedosesdeadubo, velocidadedereac aoeconcentrac aodesubs-tratoemreac oesqumicasdeenzimas(EquacaodeMichaelis-Menten). Avantagemdos polinomios inversos em relac ao aos polinomios ordinarios, e que, em geral, sao funcoesModelosdeRegressao 49naonegativas, limitadas(porassntotas)enaosimetricas, oquepodemuitasvezesex-plicarmelhorfenomenosqueocorremnapratica(Nelder,1966). Podemserescritos,porexemplo,dentreoutras,naformalinearZW= Z + W=ZZ + .em que We a vari avel resposta (peso, altura, produtividade, velocidade de reacao) e Zea vari avel explicativa (densidade de plantas, balanco de ons, dose de adubo, concentrac aodesubstrato). Verica-seque, `amedidaqueZaumenta, Wtendeparaumaassntotasuperior1,isto e,limZZZ + =1,e que para valores deZsucientemente pequenos,We aproximadamente proporcional a1Z. Temcomocasoslimites,umaretaquando = 0eumaconstantequando= 0.Naformaquadratica,tem-se:ZW= Z + + Z2W=ZZ + +Z2em que We a variavel resposta e Ze a variavel explicativa. Para valores de Zsuciente-mente pequenos, We aproximadamente proporcional a 1Ze para valores grandes de Zeaproximadamenteproporcionala(Z)1. OvalormaximodeWocorreparaZ=_e edadopor12 + ,talquenaoafetaaposic aodomaximo,massomenteovalorqueWassume.Aobtenc aodeestimativasiniciaispara,epodemserobtidaslinearizando-seessesmodelosdaseguinteforma:1W= + 1Z Y= 0 + 1Xe1W= + 1Z+Z Y= 0 + 1X1 +2X2sendoqueY =1Wenovavari avel resposta, X=1Z, X1=1ZeX2=Zsaoasnovasvariaveis explicativas e por uma regressao linear simples estimam-se os parametros 0, 1e2,econsequentemente, =0,=1e =2.50 ClariceG.B.Demetrio&SilvioS.Zocchi2.10 Testeparafaltadeajuste(outestedelinearidade)JafoivistoqueoQMRes =1n 2n

i=1 2i=1n 2n

i=1(YiYi)2daanalisedevarianciadaregressao eumaestimativanaotendenciosadavarianciadoerrooudavari anciaresidual(2), sobasuposicaodequeomodeloajustadoecorreto. Suponhaqueomodeloproposto eE(Yi) = (Xi) Yi= (Xi) +i(2.28)equeomodelocorretoseriaE(Yi) = (Xi) Yi= (Xi)+i. (2.29)comE(i) = 0eV ar(i) = E[(i)2] = 2.Comparando-seos dois modelos, tem-sequeotermoBi=(Xi) (Xi) estaraincludoemide(2.28). Logo,E(i) = Bie E(2i) = E[(i+ Bi)2] = 2+B2i,sendoqueBi=(Xi) (Xi)eovies, comomostraaFigura15, nocasoemque(Xi)=0 + 1Xie(Xi) = 0 + 1Xi + 2X2i . Issomostraqueaoseusaromodelo(2.28),seeleforcorreto Bi= 0 e o QMRes sera uma estimativa nao tendenciosa para a variancia residual, istoe,E(QMRes) = 2;se,poroutrolado,naoforcorreto,ent ao,E(QMRes) = 2+1n 2B2i .Nessecasoemque(2.28)eomodeloderegressaolinearsimples, umgracopodemostraressafaltadeajuste. Ja, quandosetemmodelosmaiscomplicados, ouent ao, maisdeumavari avel explanatoria, camaisdifcil. Necessariosetorna, portanto, aobtenc aodeumaestimativadavari anciaresidual 2queindependadomodelo. Issoepossvel atravesdoplanejamentodecoletadeobservac oesrepetidasdeY paracadaXdistinto, comomostraaFigura16,paraumdeterminadoXi. ConsidereknveisdeXiparaosquaissaoobservadosnivaloresdeY (Tabela2.3).Essaoutraestimativade2edadapeloQuadradoMediodoResduodeumaanalise de vari ancia em que cada valor distinto de X e considerado como se fosse um tratamentoModelosdeRegressao 51Figura2.10: ModeloslinearequadraticoTabela2.3: ValoresdeY correspondentesaknveisdeXiX Y Totais MediasX1Y11Y12 Y1n1T1= Y1.Y1X2Y21Y22 Y2n2T2= Y2.Y2 XkYk1Yk2 YknkTk= Yk.Yka que esta submetida a vari avel Y . Tem-se, entao, dois resduos: aquele a que se chama desviosderegressao(ouresduodaregressao)eoresduopropriamentedito(ouerropuro).Tem-se,entao,queamediadasobservac oesparaonveli edadaporYi=Yi1 + Yi2 + + Yininie,pode-seterE(Yi) = (Xi) (modeloproposto) ou E(Yi) = (Xi) (modelocorreto).Logo,dij= YijYie1n kn

i=1d2ij= 2erropuro.PelaFigura17tem-se:52 ClariceG.B.Demetrio&SilvioS.ZocchiFigura2.11: Valoresrepeti-dosdeXiFigura2.12: DecomposicaodedesviostotaisFigura2.13: Decomposic aodedesviosdetratamentos(YijY ) = (YijYi) + (YiY ),e,portanto,k

i=1ni

j=1(YijY )2=k

i=1ni

j=1(YijYi)2+k

i=1ni

j=1(YiY )2+ 2k

i=1ni

j=1(YijYi)(YiY )=k

i=1ni

j=1(YijYi)2+k

i=1ni

j=1(YiY )2isto e,SQTotal = SQErroPuro + SQTratemqueSQTotal =

ki=1

nij=1(YijY )2=

ki=1

nij=1Y2ijCC=(

ki=1

nij=1Yij)2N, sendoN=k

i=1niSQTrat =

ki=1

nij=1(YiY )2=

ki=1ni(YiY )2=

ki=1T2iniCSQErroPuro =

ki=1

nij=1(YijYi)2= SQTotal SQTratpois,k

i=1ni

j=1(YijYi)(YiY ) =k

i=1(YiY )ni

j=1(YijYi) =k

i=1(YiY )(Yi.niYi.ni) = 0.ModelosdeRegressao 53Narealidadeissoeequivalenteaomodelomatematicocorrespondenteaumensaiointeiramentecasualizado(emqueostratamentossaoosnveisdeX)dadopor:Yij= + i + ijsendoqueieoefeitodoi-esimotratamento, edandoorigemaoesquemadeAnalisedeVarianciaapresentadonaTabela2.4.Tabela2.4: Esquemadeanalisedevari anciaCausasdevariac ao G.L. S.Q.EntrenveisdeX k 1 SQTratResduo N k SQResTotal N 1 SQTotalOinteresse, agora, estaemvericarseexisteumarelac aolinearentreasmediasdetratamentos(nveis deX) eos Xis, istoe, desdobrar os (k 1) graus deliberdadedetratamentosem1graudeliberdadeparaRegressaolineare(k 2)grausdeliberdadeparadesviosderegressao. Assim,tem-seomodeloparamediasdetratamentos,dadopor:E(Yi) = 0 + 1Xi= + 1xisendoE(Yi)estimadopor:Yi=0 +1Xi= +1xi.Tem-se,entao,paraumdadoXi(Figura18)YiY= (YiYi) + (YiY )ouseja,EntrenveisdeX=faltadeajuste+efeitodomodelo.Portanto,k

i=1ni

j=1(YiY )2=k

i=1ni

j=1(YiYi)2+k

i=1ni

j=1(YiY )2+ 2k

i=1ni

j=1(YiYi)(YiY )sendo54 ClariceG.B.Demetrio&SilvioS.Zocchik

i=1ni

j=1(YiYi)(YiY ) = 0 (Prove!).Ent ao,SQTrat=SQDesviosdeReg+SQRegemqueSQReg=k

i=1ni

j=1(YiY )2=k

i=1ni(YiY )2=k

i=1ni(0 +1XiY )2=21k

i=1nix2i.Mas,comoE(Yi) = 0 + 1Xi= + 1xitem-sequeYij= 0 + 1Xi + ij= + 1xi + ije,portanto,ij= Yij01Xi= Yij 1xi.Logo,Z(0, 1) =k

i=1ni

j=12ij=k

i=1ni

j=1(Yij01Xi)2epelopelometododosmnimosquadrados,___Z0= 2

ki=1

nij=1(Yij01Xi)(1)Z1= 2

ki=1

nij=1(Yij01Xi)(Xi)___

ki=1

nij=1Yij0

ki=1ni1

ki=1niXi= 0

ki=1

nij=1XiYij0

ki=1niXi1

ki=1niX2i= 0___N 0 +1

ki=1niXi=

ki=1

nij=1Yij=

ki=1niYi0

ki=1niXi +1

ki=1niX2i=

ki=1

nij=1XiYij=

ki=1niXiYi.Logo,ModelosdeRegressao 550=Y 1Xe1=

ki=1niXiYi

ki=1niXi

ki=1niYiN

ki=1niX2i (

ki=1niXi)2N=

ki=1ni(XiX)(YiY )

ki=1ni(XiX)21=

ki=1nixiYi

ki=1nix2i.Portanto,SQReg=21k

i=1nix2i=(

ki=1nixiYi)2

ki=1nix2ieSQD=SQTrat-SQRegcandoonovoquadrodaanalisedevari anciadadopelaTabela2.5.Tabela2.5: Esquemadeanalisedevari anciaCausasdevariac ao G.L. S.Q. Q.M. FRegressaolinear 1 SQReg QMReg FRegDesviosderegressao k 2 SQD QMD FDEntrenveisdeX k 1 SQTrat QMTrat FTratResduo N k SQRes QMResTotal N 1 SQTotalVerica-sequeE(QMD) = E_SQDk 2_= 2+

ki=1ni[(Xi) (0 + 1Xi)]2k 2.56 ClariceG.B.Demetrio&SilvioS.ZocchiInteressa, inicialmente, testarafaltadeajuste(oulinearidade)domodelo, istoe,testarahipotese:H0: (X) = 0 +1X (X) 01X= 0.SobessahipoteseE(QMD) = 2e12SQD 2k2.Alemdisso,12SQRes 2Nk.LogoaestatsticaFD=QMDQMRes Fk2,Nk.Portanto, rejeita-se H0, a um nvel de 100% de probabilidade, se FD> Fk2,Nk;ousePr(Fk2,Nk>FD) 6, 98) =0, 1812>0, 05, naoserejeitaH0, aonvel de5%deprobabilidade. Ve-se, ainda, queoteste para a hipotese H0: 1= 0 e signicativo ao nvel de 5% de probabilidade, indicandoaevidenciadatendencialinear,istoe,arelacaoexistenteentreconsumodealimentosepesomediodasgalinhas. AFigura2.18mostraaretaajustadaeosvaloresobservados.58 ClariceG.B.Demetrio&SilvioS.ZocchiTabela2.8: AnalisedevarianciaCausasdevaria cao G.L. S.Q. Q.M. FRegressaolinear 1 90,83 90,83 62,93*Desviosderegressao 6 41,88 6,98 4,84nsEntrenveisdeX 7 132,71Resduo 2 2,89 1,443Total 9 135,60F6;2;0,05= 19, 33,F6;2;0,01= 99, 33ePr(F6;2> 4, 84) = 0, 1812F1,2;0,05= 18, 51,F1,2;0,01= 98, 50ePr(F1;2> 62, 33) = 0, 01554.5 5.0 5.5889092949698PesoConsumoFigura2.18: RetaajustadaevaloresobservadosConvem observar que esse exemplo tem um n umero pequeno de observa coes e, alem disso,apenasumdospesos(5, 1)estarepetidotresvezes.Se a faltadeajuste fosse signicativa, concluir-se-ia que o modelo linear utilizado nao eraoadequado, havendonecessidadedeseutilizarummodelodegraumaior. Oquadradomedio residual nao estimaria corretamente a vari ancia residual (2), pois estaria incluindoumerrosistematicodevidoaousodeummodeloinadequado.e) UmprogramaemSASparaobtenc aodosresultadosdositens(a),(b)e(c) e:options nodate nonumber ps=25; data EXEMPLO1; /* Exercicio 3, pag. 9 */input X Y; /* X = peso medio, Y = consumo de alimentos */FA=X;cards;4.6 87.1ModelosdeRegressao 595.1 93.14.8 89.84.4 91.45.9 99.54.7 92.15.1 95.55.2 99.34.9 93.45.1 94.4;proc reg;model Y=X;run;proc glm;class X;model Y=X;run;title "Teste para falta de ajuste";proc glm;class FA;model Y= X FA/SS1;run;2.11 CoecientededeterminacaoEdenidoporR2=SQRegSQTotal= 1 SQResSQTotaleindicaaproporcaodavariac aodeY que eexplicadapelaregressao. Noteque0 R2 1.E, portanto, umamedidadescritivadaqualidadedoajusteobtido. Entretanto, ovalor docoeciente dedeterminacao dependedon umero deobservac oesdaamostra,tendendoacrescerquandondiminui; nolimiteparan=2, tem-sesempreR2=1, poisdoispontosdeterminamumaretaeos desvios sao, portanto, nulos. Numatentativadecorrec aodesse60 ClariceG.B.Demetrio&SilvioS.Zocchiproblema, foi denidoocoecientededeterminacaoajustadoparagrausdeliberdade,indicadoporR2. Tem-seque:1 R2= 1 SQRegSQTotal=SQResSQTotalOcoecientededeterminacaoajustado edenidopor:1 R2=1n 2SQRes1n 1SQTotal=n 1n 2(1 R2)ouainda,R2= R21n 2(1 R2)Excluindo-seocasoemqueR2=1, tem-sequeR2 0eX> 0.(b) Func aoexponencial: Y= 0 exp(1X),Y> 0e0> 0.(c) Func aologartmica: Y= 0 + 1 ln X,X> 0.(d) Func aohiperbolica: Y=X0X 1,X> 1/0eY> 0.(e) Func aologsticacomdoisparametros: Y=exp(0 + 1X)1 + exp(0 +1X),0 < Y< 1(f) Func aodeGompertzcomdoisparametros: Y= exp[exp(0 + 1X)],0 < Y< 1.ModelosdeRegressao 6513. Facaumestudocompletodasfunc oesrelacionadasnoitemanterior, ouseja, paracadaumadelas:(a) Obtenhaosconjuntosdomnioeimagem.(b) ObtenhaosintervalosdeXparaosquaisafunc aoecrescenteeaquelesparaosquaisela edecrescente.(c) Estudeafunc aoquanto`aconcavidadeeaexistenciadepontosdeinexao.(d) Veriquesehaassntotasverticaisouhorizontais.(e) Construagracosrepresentativosdoseucomportamento.14. PaesdeCamargoetal (1982), estudandoaconstrucaodeumtensiometrodeleituradireta, obtiveramos resultados que se seguemparavalores de alturas dacamaranotensiometro(X),emmm,etensaodaaguanosolo(Y ),emmb.X 9 12 30 42 57 102 147 210 290Y 217 291 439 515 603 681 716 746 755Fonte: PaesdeCamargo,A.;Grohmann,F.;PaesdeCamargo,M.B.(1982)Tensiometrosimplesdeleituradireta. PesquisaAgropecuariaBrasileira,17(12):1763-1772.Pede-se:(a) Ajustar a func ao hiperbolica (12d) aos dados observados utilizando as transformacoesnecessarias.(b) Construirodiagramadedispersaoincluindoafunc aoajustada.(c) Obteraassntotahorizontaldafuncaoajustadaeinterpret a-la.Nota: Esteexercciofoi apresentadopor Pereira, A.R. &Arruda, H.V. (1987).Ajustepraticodecurvasnapesquisabiologica. Fundac ao Cargill, Campinas, SP, pag. 14-15.15. Osdadosqueseseguemreferem-seavaloressimuladosdeXieYi(i = 1, . . . , 6).X 0 2 3 4 6 9Y 13,464 9,025 7,389 4,953 4,055 2,718Construa o diagrama de dispersao e, com base nele, escolha uma das func oes apresentadasno2oexerccio. Emseguida,ajuste-autilizandoastransformacoesnecessarias.66 ClariceG.B.Demetrio&SilvioS.Zocchi16. Emumestudodacalagemparaasucessaobatata-triticale-milho, Quaggio, J.A. etal. (1985) obtiveramos resultados parateor decalcionosoloX, emmeq/100cm3eporcentagemdetuberculosmadurosY ,apresentadosaseguir.X 0,1 0,2 0,2 0,4 0,5 0,8 1,0 1,6 3,2Y 63 79 80 86 88 89 93 93 96Fonte: Quaggio,J.A.;Ramos,V.J.;Bataglia,O.C.;vanRaij,B.;Sakai,M.(1985)Calagemparaasucessaobatata-triticale-milhousandocalarioscomdiferentesteoresdemagnesio. Bragantia,44(1): 391-406.Pede-seajustaromodeloYi= 0 +1Xi+ iaessesdados,utilizandoastransformac oesnecessarias.17. Considereaamostrade10paresdevaloresXi, YiapresentadosnaTabela2.9, osdadosrelativos aos Exerccios 1 e 2 do item 1.4.1 (pagina 14 e 15) e o modelo de regressao linearsimplesYi= 0 + 1Xi +i.Supondoquei N(0, 2),Cov(i, i ) = 0,(i = i

)equeXexa,pede-se:(a) Determineasestimativasdosparametros.(b) Facaaanalisedevarianciadaregressao.(c) Teste a hipotese H0: 0= 0 contra Ha: 0 = 0, a um nvel de signicancia = 0, 05.(d) Teste a hipotese H0: 1= 0 contra Ha: 1 = 0, a um nvel de signicancia = 0, 05.(e) Determineovalordocoecientededeterminacao.(f) Determineovalordocoecientededeterminacaocorrigido.(g) Construa os intervalos de conanca para E(Yi) (i = 1, . . . , n), com um coeciente deconancade95%deprobabilidade.(h) DetermineaestimativadeYhparaXh=(X3 + X4)/2(mediaentreoterceiroeoquartovaloresdeX)econstruaointervalodeprevisaoparaYhcomumcoecientedeconancade95%deprobabilidade.18. ConsidereoconjuntodedadosX 2a a 0 a 2aY 0 0 3 6 6ModelosdeRegressao 67Tabela2.9: ValoresdeXieYi(i = 1, . . . , 10).X 0 1 1 2 3 3 4 5 5 6Y 3 2 3 5 4 4 7 6 7 9Fonte: HOFFMAN,R.&VIEIRA,S.(1983). AnalisedeRegressao. UmaIntroducao`aEconometria. 2aed. Ed,Hucitec,SaoPaulo,pag.124.sendoaumaconstantepositivanaonula,eomodeloderegressaoYi= 0 + 1Xi +i.Supondoquei N(0, 2),Cov(i, i ) = 0,(i = i

)equeXexa,pede-se:(a) Obterasestimativasdemnimosquadrados0e1de0e1.(b) Obterasestimativasdasvarianciasecovari anciasde0e1.(c) Obter oquadrodaanalise de vari anciae tirar conclusoes comumnvel de sig-nicancia5%.(d) TestarahipoteseH0: 1= 0aumnveldesignicancia5%.(e) TestarahipoteseH0: 0= 0aumnveldesignicancia5%.(f) Obterosintervalosde95%conancapara0e1.(g) Obterosintervalosde95%deconancaparaE(Yi),(i = 1, . . . , n).(h) Obter os intervalos de 95% de previsao para Y , para X=Xi+Xi+12, (i = 1, . . . , n1).19. ConsidereoseguintemodeloderegressaoYi= 0 +1(XiXk) + i, (i = 1, . . . , k, . . . , n).Supondoquei N(0, 2),Cov(i, i ) = 0,(i =i

)equeXexa,obtenhaoesquemadoquadrodaanalisedevari ancia.20. ConsidereosdadosdaTabela2.9. Pede-se:(a) Fazer o teste para falta de ajuste da regressao linear a um nvel de 5% signicancia.(b) Obteraequacaodaretaeerepresenta-laemumgracojuntamentecomosvaloresobservados.21. Os dados da Tabela 2.10 sao provenientes de um ensaio inteiramente casualizado e referem-se a concentrac oes de CO2 aplicadas (X) sobre folhas de trigo a uma temperatura de 35oCequantidadesdeCO2absorvido(Y )pelasfolhas,emcm3/dm2/h.68 ClariceG.B.Demetrio&SilvioS.ZocchiTabela2.10: ConcentracoesdeCO2aplicado(X)sobrefolhasdetrigoaumatemperaturade35oCequantidadesdeCO2absorvido(Y )pelasfolhas,emcm3/dm2/h.X Y75 0,00100 0,65 0,50 0,40120 1,00130 0,95 1,30160 1,80 1,80 2,10190 2,80200 2,50 2,90 2,45 3,05240 4,30250 4,50Fonte: MEAD,R.&CURNOV,R.N.(1983). Statistical MethodsinAgricultureandExperimental Biology. Chapman&Hall,pag.140.Pede-se:(a) Fazer o teste para falta de ajuste da regressao linear a um nvel de 5% signicancia.(b) Obteraequacaodaretaeerepresent a-laemumgracojuntamentecomasmedias(observadas)paradoses.Tabela 2.11: Doses de radiac ao gama (X) aplicadas sobre explantes de abacaxi e pesos (Y ) dosmesmos,emg,45diasaposairradiac ao.X Y0 9,45 10,84 10,12 11,14 10,30 11,04 11,45 12,23 9,46 12,7530 10,14 10,73 9,02 0,91 1,35 6,89 1,14 8,98 9,18 0,8240 8,61 5,48 8,88 9,23 6,15 8,86 7,32 7,66 9,63 5,7050 6,46 5,88 7,14 2,49 8,33 6,93 6,18 4,14 6,75 5,5060 7,22 5,49 0,45 6,00 5,05 0,15 4,97 3,52 7,07 9,9370 2,46 4,45 5,04 6,19 4,15 5,49 4,65 2,78 5,98 0,7080 3,75 5,75 2,94 0,23 2,22 2,65 2,61 4,13 2,80 4,95Fonte: MarciaScherer(2002). Induc aodemutac aovisandoomelhoramentodeabacaxi.ModelosdeRegressao 6922. Os dados da Tabela 2.11 sao provenientes de um ensaio inteiramente casualizado e referem-se a pesos (Y ), em g, de explantes de abacaxi, 45 dias apos terem recebido diferentes dosesderadiac aogama(X). Pede-se:(a) Fazer o teste para falta de ajuste da regressao linear a um nvel de 5% signicancia.(b) Obteraequacaodaretaeerepresent a-laemumgracojuntamentecomasmedias(observadas)paradoses.23. Os dados da Tabela 2.12 referem-se a producoes de ruibarbo para enlatamento, por datasdecolheita,deumexperimentoemblocosaoacaso. Pede-se:Tabela2.12: Producoesderuibarboparaenlatamento.BlocosDatadecolheita I II III IV03/5 21.2 21.4 12.0 17.207/5 19.3 17.4 24.5 30.211/5 22.8 29.0 18.5 24.515/5 26.0 34.0 33.0 30.219/5 43.5 37.0 25.1 23.523/5 32.1 30.5 35.7 32.327/5 33.0 32.2 35.4 35.4Fonte: MEAD,R.&CURNOV,R.N.(1983)StatisticalMethodsinAgricultureandExperimentalBiology. Chapman&Hall,pag. 145.(a) Fazeraanalisedevarianciaparaensaiosemblocosaoacaso.(b) Fazerotesteparafaltadeajustedaregressaolinearaumnvelde5%signicancia(desdobrarTratamentosemRegressaoLineareDesviosdeRegressao).(c) Obteraequac aodaretaparaasmediasdetratamentoseerepresent a-laemumgracojuntamentecomasmedias(observadas)detratamentos.70 ClariceG.B.Demetrio&SilvioS.ZocchiCaptulo3RegressaoLinearM ultipla3.1 Modeloestatstico-NotacaomatricialTem-se uma regressao linear m ultipla quando se admite que a vari avel resposta (Y )efunc aodeduasoumaisvari aveisexplicativas(regressoras). Omodeloestatsticodeumaregressaolinearm ultiplacomkvariaveisregressoras(X1, X2, . . . , Xk) e:Yi= 0 + 1Xi1 + 2Xi2 +. . . +kXik + iou,naformareparametrizadacomvari aveiscentradas:Yi= +1xi1 + 2xi2 +. . . +kxik +iem que = 0+1X1+2X2+. . . +kXke xij= XijXj, sendoXj=1nn

i=1Xij, j= 1, . . . , k.Emnotac aomatricial,omodeloderegressaolinearm ultiplaca:Y= X + = +, (3.1)emqueYeovetor,dedimensoesn 1,davariavelaleatoriaY ;Xeamatriz,dedimensoesn p,conhecidadodelineamento,ecomosempreocorreemmodelosderegressao,amenosdemulticolinearidade,edepostocompletop=k + 1,sendop=k + 1on umerodeparametros;eovetor,dedimensoesp 1,deparametrosdesconhecidos; eovetor,dedimensoesn 1edevari aveisaleatoriasnaoobservaveis,isto e,7172 ClariceG.B.Demetrio&SilvioS.ZocchiY=__Y1Y2 Yn__, X=__1 X11X12. . . X1k1 X21X22. . . X2k 1 Xn1Xn2. . . Xnk__ou X=__1 x11x12. . . x1k1 x21x22. . . x2k 1 xn1xn2. . . xnk__, =__012 k__ou =__12 k__e =__12 n__ouainda,Y =__Y1Y2 Yn__=__1 X11X12. . . X1k1 X21X22. . . X2k 1 Xn1Xn2. . . Xnk____012 k__+__12 n__=__0 + 1X11 +2X12 + . . . + kX1k + 10 + 1X21 +2X22 + . . . + kX2k + 2 0 + 1Xn1 + 2Xn2 + . . . + kXnk + n__.ou,comvari aveiscentradas,Y =__Y1Y2 Yn__=__1 x11x12. . . x1k1 x21x22. . . x2k 1 xn1xn2. . . xnk____12 k__+__12 n__=__ + 1x11 + 2x12 +. . . +kx1k +1 + 1x21 + 2x22 +. . . +kx2k +2 +1xn1 +2xn2 +. . . +kxnk + n__.ModelosdeRegressao 73Deformasemelhanteaoquefoi vistoemregressaolinear simples, tem-seas su-posicoes:(i) avari avelrespostaYefunc aolineardasvari aveisexplicativasXj,j= 1, 2, . . . , k;(ii) asvari aveisexplicativasXjsaoxas;(iii) E(i) = 0,ouseja,E() = 0,sendo0umvetordezerosdedimensoesn 1;(iv) oserrossaohomocedasticos,isto e,V ar(i) = E(2i) = 2;(v) oserrossaoindependentes,isto e,Cov(i, i ) = E(ii ) = 0,i = i

;(vi) oserrostemdistribuicaonormal.Logo, combinando-se (iv) e (v) tem-se V ar() = E(T) = I2, sendo Iuma matrizidentidade, de dimensoes nn. Portanto, considerando-se, tambem, (vi) tem-se N(0, I2)eYN(X, I2), pois, E(Y )==X e V ar(Y )=V ar()=I2. Asuposic aodenormalidade enecessariaparaaelaboracaodostestesdehipoteseseobtencaodeintervalosdeconanca.Casoparticular: Nomodeloderegressaolinearsimples,Yi= 0 +1Xi + i= + 1xi + i, (3.2)tem-seY=__Y1Y2 Yn__, X=__1 X11 X2 1 Xn__, =_01_e =__12 n__ouainda,Y=__Y1Y2 Yn__=__1 X11 X2 1 Xn___01_+__12 n__=__0 + 1X1 + 10 + 1X2 + 2 0 + 1Xn + n__(3.3)=__1 x11 x2 1 xn___1_+__12 n__=__ + 1x1 + 1 + 1x2 + 2 + 1xn + n__.74 ClariceG.B.Demetrio&SilvioS.Zocchi3.2 EstimacaodosparametrosMetododosquadradosmnimosOn umerodeparametrosaseremestimadosep=k+ 1. Seexistiremapenaspobservac oes,aestimac aodosparametrosreduz-seaumproblemamatematicoderesoluc aodeumsistemadepequac oesapincognitas,naosendopossvelfazerqualqueranaliseestatstica.Deve-se,portanto,tern > p.Ummetodoutilizadoparaaestimacaodosp(p Fp1,np;ouseP(F1,n2> Fcalc) < ,emque,emgeral,= 0, 05ou= 0, 01.ModelosdeRegressao 89QuadrodaanalisedavarianciaetesteFApartirdosresultadosobtidos, pode-seobteroesquemadoquadrodaanalisedavari ancia e teste F mostrados na Tabela 13. Essa forma de apresenta cao da analise e chamada,poralgunsautores,deanaliseparcial.A soma de quadrados de regressao e a reduc ao na soma de quadrados residual devido`a inclusao dos parametros 1, 2, . . . , k (ou das vari aveis X1, X2, . . . , Xk) no modelo Y= 0+,isto e, SQReg= R(1, 2, . . . , k|0) = R(0, 1, 2, . . . , k)R(0), sendo R(0, 1, 2, . . . , k)asomadequadradosderesduosparaomodeloY =0 + 1X1 + . . . + kXk+ eR(0)asomadequadradosderesduosparaomodeloY= 0 + .Tabela3.1: Esquemadeanalisedevari anciaetesteFCausas de variacao G.L. S.Q. Q.M. E(Q.M.) FRegressao k = p 1TXTY CSQRegp 12+1p 1TXT1X1 F=QMRegQMResResduo n p por diferencaSQResn p2Total n 1

ni=1Y2iCC =(

ni=1Yi)2n.Outrotipodeanaliseeaanaliseseq uencial, emqueosparametrosvaosendoadi-cionadosaomodeloseq uencialmente. Considerando-se,porexemplo,umavariavelrespostaYeduasvari aveisX1eX2regressoras,omodelocompletopoderiaserE(Y ) = 0 + 1X1 + 2X2eoquadrodeAnalisedeVari anciaseq uencial poderiaseroapresentadonaTabela14, sendoR(1|0)areducaonasomadequadradosresidualdevido`ainclusaodoparametro1(oudavari avel X1)nomodeloY =0+ ; R(2|0, 1)areduc aonasomadequadradosresidualdevido`ainclusaodoparametro2(oudavariavelX2)nomodeloY= 0 + 1X1 + Nesse caso as hipoteses testadas pelo teste Fsao de acordo com a ordem estabelecidanoquadrodeanalisedevariancia,isto e,(i)F1paratestar H0: 1= 0 ignorando X2(i)F2paratestar H0: 2= 0 ajustadopara X190 ClariceG.B.Demetrio&SilvioS.ZocchiTabela3.2: Esquemadeanalisedevarianciaseq uencialetesteFCausasdevariac ao G.L. S.Q. Q.M. F01 R(0)1|01 R(1|0) = R(0, 1) R(0) F12|1, 01 R(2|0, 1) = R(0, 1, 2) R(0, 1) F2Par ametros 3 R()Resduo n 3 pordiferencaSQResn pTotal n YTYTestesdeHipotesesSejacTumacombinac aolineardosparametroseseuestimadorcT. Ent ao, doteoremadeGauss-Markov,cT N(cT, cT(XTX)1c2)e,portanto,Z=cT cT_cT(XTX)1c N(0, 1)pois,E(Z) = 0eV ar(Z) = 1. Poroutrolado,W= (n p)QMRes2 2np.Logo,Z_Wn p=cT cT_cT(XTX)1cQMRes tnp.Portanto,rejeita-se,aumnvel100%deprobabilidade,ahipoteseH0: cT= cT0emfavordeHa1: cT < cT0setcalc< tnp;ouseP(tnp< tcalc) < ;Ha2: cT > cT0setcalc> tnp;ouseP(tnp> tcalc) < ;Ha3: cT = cT0se |tcalc| > tnp;2ouseP(|tnp| > |tcalc|) < ;sendotcalc=cT cT0_cT(XTX)1cQMRes.ModelosdeRegressao 91Assim, por exemplo, noteste dahipotese H0: 1=0 ignorando X2tem-secT=(0, 1, 0)etcalc=1s(1), sendo1calculadoparaomodeloignorandoX2. NotestedahipoteseH0: 1= 2queequivaleaH0: 12= 0,tem-secT= (0, 1, 1).PrincpiodoResduoCondicionalTestes de hipoteses mais gerais podem ser feitos atraves da comparac ao de modeloseousodoPrincpiodoResduoCondicional. Sejaomodelocompleto(oumodeloc)dadoporYi= 0 + 1Wi1 + 2Wi2 +. . . +kWik + i(modeloc)sendoE(i)=0, V ar(i)=E(2i)=2, E(ii )=0, i N(0, 2)eWij, funcoesdeXij.Assim,porexemplo,Yi= 0 + 1Xi1 + 2Xi2 + 3Xi3 +iouYi= 0 + 1Xi1 +2Xi2 + 3X2i1 + 4X2i2 + 5Xi1Xi2 + i.Matricialmente,tem-se:Y= Wcc +cem que Ye o vetor das observacoes, de dimensoes n1; Wc e a matriz do modelo, de dimensoesnp, sendo p = k +1 o n umero de parametros; c e o vetor, de dimensoes p1, de parametrosdesconhecidoseceovetor,dedimensoesn 1,devariaveisaleatoriasnaoobservaveis.Pelometododosquadradosmnimos,tem-seque:c= (WTcWc)1WTcY ,Yc= Wcc,SQPc= SQP(0, 1, . . . , k) =TcWTcY ,comp = k + 1grausdeliberdade,SQTotal(naocorrigida) = YTY ,comngrausdeliberdade,SQResc= YTY TcWTcY ,comn pgrausdeliberdade.Suponhaquesedesejatestarahipotese:H0: m+1= m+2= . . . = k= 0 (m < k).SobH0,tem-seomodeloreduzido(oumodelor)Yi= 0 + 1Wi1 + 2Wi2 +. . . +mWim + i(modelor)92 ClariceG.B.Demetrio&SilvioS.ZocchicomrepresentacaomatricialdadaporY= Wrr +rem que Wr e a matriz do modelo, de dimensoes nr, sendo r = m+1 o n umero de parametros;reovetor, dedimensoesr 1, deparametrosdesconhecidosereovetor, dedimensoesn 1,doserros.Pelometododosquadradosmnimos,tem-seque:r= (WTrWr)1WTrY ,Yr= Wrr,SQPc= SQP(0, 1, . . . , m) =TrWTrY ,comr = m + 1grausdeliberdade,SQTotal(naocorrigida) = YTY ,comngrausdeliberdade,SQResr= YTY TrWTrY ,comn rgrausdeliberdade.Logo, areducaodaSQResduodevido`aadic aodosparametrosm+1, m+2, . . . , kaomodelor edadaporR(m+1, m+2, . . . , k|0, 1, . . . , m) = SQResrSQResc= SQPcSQPrcom(p r)grausdeliberdade,oque econhecidocomoPrincpiodoResduoCondicional.Assimsatisfeitasaspressuposic oesestabelecidasparaomodelo,tem-seF=R(m+1, m+2, . . . , k|0, 1, . . . , m)p rSQRescn p=SQResrSQRescp rQMResc Fpr,nperejeita-seH0,aumnvelde100%deprobabilidade,seF> Fpr,np;.Exemplo1: SejaocasoparticularemqueWij= Xij,isto e,Yi= 0 + 1Xi1 +2Xi2 + . . . + kXik +i(modeloc) (3.16)eahipoteseasertestadaH0: j= 0 paraalgum1 j koqueequivaleaomodeloreduzidoYi= 0 + 1Xi1 + 2Xi2 +. . . +j1Xi,j1 + j+1Xi,j+i +. . . +kXik + i(modelor)ModelosdeRegressao 93comm = p 1parametrosaseremestimados.AmatrizWreovetorrcam,ent ao,Wr=__1 X11. . . X1,j1X1,j+1. . . X1k1 X21. . . X2,j1X2,j+1. . . X2k 1 Xn1. . . Xn,j1Xn,j+1. . . Xnk__e r=__01 j1j m1__=__01 j1j+1 k__.Logo,SQPr=TrWTrY ,comr = p 1grausdeliberdade,SQResr= YTY SQPrcom(n p + 1) grausdeliberdadeeareduc aonasomadequadradosdoresduodevido`ahipoteseH0edadaporR(H0) = SQResrSQResccom1 graudeliberdadeoqueleva`aestatsticaF=R(j|0, 1, . . . , j1, j+1, . . . k)QMResc=SQResrSQRescQMResc F1,np.erejeita-seH0: j= 0,aumnvelde100%deprobabilidade,seF> F1,np;.Essamesmahipotesepodesertestadapelotestet,isto e,t =j0s(j)=js(j) t1emquejes(j)saoestimadossobomodelocompleto(oumodeloc). Verica-sequeF= t2.Essa eachamadaanaliseparcial,poisosssaoestimadosconjuntamente.Exemplo2: Usando-seomesmomodelocdadopor(3.16)eahipoteseasertestadaH0: 1= 2= vs Ha: 1 = 2tem-sequeomodeloreduzidocaYi= 0 + Xi1 + Xi2 + . . . + kXik + iou,aindaYi= 0 + Xi+ 3Xi3 + . . . + kXik + i(modelor)94 ClariceG.B.Demetrio&SilvioS.Zocchicomm = p 1parametrosaseremestimadoseXi= Xi1 + Xi2.AmatrizWreovetorrcam,ent ao,Wr=__1 X11 + X12X13. . . X1k1 X21 + X22X23. . . X2k 1 Xn1 + Xn2Xn3. . . Xnk__e r=__012 m1__=__03 k__.Logo,SQResr= YTY SQPrcom(n p + 1) grausdeliberdadeeareduc aonasomadequadradosdoresduodevido`ahipoteseH0edadaporR(H0) = SQResrSQResccom1 graudeliberdadeoqueleva`aestatsticaF=R(H0)QMResc F1,nperejeita-seH0: 1= 2,aumnvelde100%deprobabilidade,seF> F1,np;.Exemplo3: Sejaomodelocdadopor(3.16)eotestedahipotese:H0:_1= 22= 1quecorrespondeaomodeloreduzidoYi= 0 + 2Xi1 +Xi2 +3Xi3 + . . . + kXik +icomm = p 2parametrosaseremestimados,ou,aindaZi= 0 +3Xi3 + . . . + kXik +i(modelor)sendo que Zi= Yi2Xi1Xi2e a nova vari avel resposta, sendo o termo 2Xi1 +Xi2conhecidocomooset. Ent ao,ModelosdeRegressao 95Wr=__1 X13X14. . . X1k1 X23X24. . . X2k 1 Xn3Xn4. . . Xnk__e r=__012 m2__=__034 k__.A reducao na soma de quadrados do resduo devido `a hipotese H0: 1= 2 e 2= 1edadapor:R(H0) = SQResrSQResccom2 grausdeliberdadeoqueleva`aestatsticaF=R(H0)2QMResc F2,nperejeita-seH0: 1= 2 e 2= 1,aumnvelde100%deprobabilidade,seF> F2,np;.Exemplo4: Sejaomodelocdadopor(3.16)eotestedahipotese:H0:_122= 431 + 22= 6Resolvendo-seosistemadeequac oespara1e2,essahipotese eequivalenteaH0:___1= 3 + 232=32 3quecorrespondeaomodeloreduzidoYi= 0 + (3 + 23)Xi1 + (32 3)Xi2 + 3Xi3 + . . . + kXik + icomm = p 2parametrosaseremestimados,ou,aindaZi= 0 +3Xi+ . . . + kXik + i(modelor)em que Zi= Yi3Xi132Xi2 e a nova vari avel resposta, Xi= 2Xi1Xi2+Xi3, sendo o termo3Xi1 +32Xi2conhecidocomooset. Entao,96 ClariceG.B.Demetrio&SilvioS.ZocchiWr=__1 X1X14. . . X1k1 X2X24. . . X2k 1 XnXn4. . . Xnk__e r=__012 m2__=__034 k__.Logo,F=R(H0)2QMResc F2,nperejeita-seH0: 1 22=43e 1 + 22=6, aumnvel de100%deprobabilidade, seF> F2,np;.3.5 CoecientedeDeterminacaoM ultiploEusadocomoumamedidadescritivadaqualidadedoajusteobtido,denidoporR2=SQRegSQTotal= 1 SQResSQTotaleindicaaproporcaodavariac aodeY que eexplicadapelaregressao. Noteque0 R2 1.Entretanto, ovalordocoecientededeterminacaodeveserusadocomprecauc ao,pois dependedon umerodeobservacoes daamostra, tendendoacrescer quandondiminui.Alemdisso,esemprepossveltorna-lomaior,pelaadicaodeumn umerosucientedetermos.Assim,se,porexemplo,naohapontosrepetidos(maisdoqueumvalorY paramesmosXs)umaregressaom ultiplacomn 1 = kvariaveisregressorasdaraumajusteperfeito(R2= 1)parandados. Quandohavaloresrepetidos, R2naoseranuncaigual a1, poisomodelonaopoderaexplicaravariabilidadedevidoaoerropuro.EmboraR2aumenteseseadicionaumanovavari avelaomodelo,istonaosignicanecessariamentequeonovomodelo esuperioraoanterior. Amenosqueasomadequadradosresidual do novo modelo seja reduzida de uma quantia igual ao quadrado medio residual original,onovomodeloteraumquadradomedioresidualmaiordoqueooriginal,devido`aperdade1graudeliberdade. Narealidadeessenovomodelopoderaserpiordoqueoanterior.AmagnitudedeR2, tambem, dependedaamplitudedevariac aodasvari aveisre-gressoras. Geralmente, R2aumentaracommaioramplitudedevariac aodosXsediminuir aemcasocontrario. Assim, umvalor grandedeR2poderaser grandesimplesmenteporqueos Xs variaramemumaamplitudemuitogrande. Por outroladoR2poderaser pequenoModelosdeRegressao 97porqueasamplitudesdosXsforammuitopequenasparapermitirqueumarelacaocomYfossedetectada.Dessaforma, ve-sequeR2naodeveser consideradosozinho, mas semprealiadoaoutrosdiagnosticosdomodelo. Numatentativadecorrec aodosproblemasapontados, foidenido o coecientededeterminacaoajustado para graus de liberdade, indicado porR2.Tem-seque:1 R2= 1 SQRegSQTotal=SQResSQTotal.Ocoecientededeterminacaoajustado edenidopor:1 R2=1n pSQRes1n 1SQTotal=n 1n p(1 R2) R2= R21n p(1 R2)Excluindo-seocasoemqueR2=1, tem-sequeR2 # Homogeneidade de vari^ancias? #> ncv.test(mod2) # Non-constant Variance Score TestNon-constant Variance Score TestVariance formula: ~ fitted.valuesChisquare = 0.2837042 Df = 1 p = 0.59428364.6 Exemplo-Regressaolinearm ultiplaModelosdeRegressao 123ContinuandoaanalisedosdadosdoExemplo5doitem1.3.1referentesamedidasdeconcentracoesdefosforoinorganico(X1)efosforoorganico(X2)nosoloedeconte udodefosforo(Y )nasplantascrescidasnaquelesolo,pode-severnaFigura4.6umconjuntopadraode gracos de resduos e diagnosticos, obtido pelo uso do pacote estatstico R, apos o ajuste domodelo. Observa-seumapossvel inadequacaodomodelo, destacandoa17aobservacaocomoinuenteecomresduoelevado. Sugere, poroutrolado, queumatransformacaodavari avelrespostaYtalvezsejanecessaria.60 80 100400204060Fitted valuesResidualsResiduals vs Fitted1710132 1 0 1 210123Theoretical QuantilesStandardized residualsNormal QQ plot17101360 80 1000.00.51.01.5Fitted valuesStandardized residualsScaleLocation plot1710135 10 150.00.20.40.60.8Obs. numberCooks distanceCooks distance plot176 10Figura4.6: ConjuntopadraodegracosparadiagnosticosdoR-Semtransformac ao.4.7 FamliaBox-Coxdetranformac oesConformejafoivisto,omodelolinearclassico evalidosobaspressuposicoes:(i) simplicidadedeestruturaparaovaloresperadodavariavelresposta(aditividadedomo-delo);(ii) independenciadoserros;(iii) homogeneidadedevarianciase124 ClariceG.B.Demetrio&SilvioS.Zocchi(iv) normalidadeaproximadadeerrosaditivos.Senaoforpossvel satisfazeraessesrequisitosnaescalaoriginal dosdados, podeserqueumatransformac aonaolineardosdadospossaproduzirhomogeneidadedevarianciasedistribuicaoaproximadamentenormal.Indicac oes paraanecessidade de umatransformacaode dados podemser uteis.Assim, nocasodedadosnao-negativos, como, porexemplo, volumes, medidasdetempoatequeumeventoocorra, podeserqueumatransformacaologartmicaleveaumadistribuic aoaproximadamentenormal. Naturalmente,setodososdadosestiveremlongedozerocomumadispersaopequena, atransformac aonaoteramuitoefeito. Se, porem, arazaoentreomaioreomenorvaloresforemtermosdepotenciasde10, umatransformacaoseradesejavel. UmaoutraalternativaeousodateoriadeModelos Lineares Generalizados emqueseusamou-trasdistribuicoes, diferentesdanormal, paraamodelagemdosdados. Assim, ousodeumatransformac ao logartmica e diferente do uso de uma distribuic ao normal com func ao de ligac aologartmica. Noprimeirocasotem-sequeosdadosnaescalaoriginal temumadistribuic aolog-normalenquantoquenosegundotemdistribuic aonormal(Aitkinetal,1989).Box&Cox(1964)propuseramumafamliadetransformac oesdadaporY () =___Y1 = 0log(Y ) = 0(4.1)sendooparametrodatransformac aoeY avariavel resposta. Naausenciadeumatrans-formac ao, = 1.Para observacoes (Yi, xTi ),i = 1, 2, . . . , ne xTi= (Xi1, Xi2, . . . , Xik) assume-se queexistealgumtalqueYi() N(xTi , 2), i = 1, . . . , nouseja, oobjetivoe determinar (ouumaescalapara Y ), tal que sejamverdadeiras aspressuposicoes:(i) osresduossejamnormais;(ii) avari anciasejahomogenea(constante)e(iii) omodelosejaaditivo.Ometodo mais usado para a estimac ao do parametro e o metodo do perldeverossimilhanca. Consisteemconsiderar ummodelocomp + 2parametros, istoe, os pparametrosde,2e,eestima-losemdoisestagios:ModelosdeRegressao 125(a) Para xado, obter as estimativas de maxima verossimilhanca para () e 2(). Considerando-sequeYi() N(xTi , 2), i = 1, . . . , n,ent ao,f(Yi(); , 2, ) = (22)1/2exp{[Yi() xTi ]T[Yi() xTi ]/(22)},eafuncaodeverossimilhancaparaovetorY () edadapor:L(, 2, ; Y ) = (22)n/2exp{[Y () X]T[Y () X]/(22)}ou,exprimindo-seemtermosdavariaveloriginalY ,usando(4.1),caL(, 2, ; Y ) = (22)n/2exp{[Y () X]T[Y () X]/(22)}JsendoJ,ojacobianodatransformac aodenidopor:J=n

i=1dYi()dYi=n

i=1Y1i.Ologaritmodafunc aodeverossimilhancaca,entao,(, 2, ; Y ) = n2ln(2)122[Y ()X]T[Y ()X]+(1)n

i=1ln(Yi)+constanteDerivando-se(, 2, ; Y )emrelacaoaea2,obtem-seasderivadasparciais:___=12XT[Y () X]2= n22+12(2)2[Y () X]T[Y () X]queigualadasa0resultamem:() = (XTX)1XTY () e 2() =S()n=1n[Y () X]T[Y () X]Asubstituicaodaestimativademaximaverossimilhanca 2()pelademnimosquadra-dos,isto e,por 2() =S()n pnaoafetaoproximopasso.126 ClariceG.B.Demetrio&SilvioS.Zocchi(b) Substituindo-seosresultadosobtidosem(, 2, ; Y )obtem-selmax() = n2ln( 2) + ( 1)n

i=1ln(Yi) + constanteEssaexpressaoparcialmentemaximizada, outambemchamadadeperl deverossimi-lhanca(narealidadeperldologaritmodafuncaodeverossimilhan ca) e,portanto,umafunc aodequedependedasomadequadradosresidual, S()edojacobiano. Ocorre,porem,queassomasdequadradosresiduaisobtidasparadiferentesvaloresdenaosaocomparaveis,poisdependedagrandezadasobservacoes.Umaformamais simples, poremequivalente, paralmax()eobtida, usando-seaformanormalizadadatransformacao,isto e,usando-seZ() =Y ()J1/ne, sendoJ=

ni=1Y1i, tem-sequeJ1/n=Y1, emqueY eamediageometricadasob-servac oes. Logo,Z() =Y ()Y1=___Y1 Y1 = 0Y log(Y ) = 0. (4.2)Verica-se que o jacobiano dessa transformac ao, em relacao `a vari avel original, passaa ser igual a 1 e, portanto, o logaritmo da funcao de verossimilhanca parcialmente maximizadapodeserescritocomo

max() = n2ln( 2) + constantesendo 2=R()n=1n[Z() X]T[Z() X] =1nZ()[I() H]Z() e() =(XTX)1XTZ(). Tem-se,portanto,queR() easomadequadradosresidualdeZ().Aestimativademaximaverossimilhanca,,eovalordequemaximizalmax(),ou,equivalentemente,minimizaR(). Tem-se,entao,queummetodopraticoparaseobtersegueospassos:(i) escolhe-seumagradedevalorespara,de-2a2;(ii) paracadavalorxadode,obtem-se()eR()(ouS()senaoforutilizadaatrans-formac aonormalizada);(iii) faz-seumgracodospares(, R())(ou(, S())senaoforutilizadaatransformacaonormalizada);ModelosdeRegressao 127(iv) escolhe-seovalordeparaoqualogracopassapelomnimo.NoRisso efeito,utilizando-seoscomandos:library(MASS)boxcox(modelo, data= nome)depoisdeajustadoomodelodesejadoaosdados. Ogracoresultantemostra, tambem, umintervalodeconancapara, comumcoecientedeconancaigual a95%deprobabilidade.Ha interesse, ainda em se obter um intervalo de conanca para por dois motivos. O primeirodeles e para vericar se o intervalo contem o valor = 1, o que indicaria nao haver necessidadede transformac ao. Osegundo, paraidenticar se ointervalocobre algumvalor de cujainterpretac aosejamaissimples. Umintervalodeconanca, comumcoecientedeconancade100(1 )%para eobtidoapartirdosvaloresparaosquais{ : 2[max() max()] 21,}.Ent ao, um intervalo de conanca, com um coeciente de conanca aproximadamenteiguala95%deprobabilidade,incluiratodososvaloresdeparaosquais{ : 2[max() max()] 3, 84}.Umprocedimentopraticoseriatracar umaretanogracode max() contra,passandopeloponto

max() 123, 84A reta corta a curva em dois pontos e os s correspondentes a esses pontos formamointervalodeconancaaproximadopara.VariavelconstrudaUmamaneiradesevericaranecessidadedetransformacaodevari aveis(respostaouexplanatorias) eatravesdousodeumavari avelconstrudacomoumavari aveladicionalnomodelo. Essa vari avel construda podera ser usada com o teste da razao de verossimilhanca ou,ent ao,comoaddedvariableplotouopartial residual plot.(i) Transformac aoparaavariavelrespo