50
REGRESSÃO ESPACIAL Vitor Vieira Vasconcelos BH1350 – M étodos e Técnicas de Análise da I nformação para o Planejamento Agosto de 2016

Regressão Espacial

Embed Size (px)

Citation preview

  • REGRESSO ESPACIAL

    Vitor Vieira Vasconcelos

    BH1350 Mtodos e Tcnicas de Anlise da Informao para o PlanejamentoAgosto de 2016

  • Anlise de regresso uma ferramenta estatsticaque utiliza a relao entre duas ou mais variveis talque uma varivel possa ser explicada (Y varivelresposta/ sada/dependente) pela outra ou outras (X variveis indicadoras/ preditoras/ explicativas/independentes).

    Y = aX + b

    NETER J. et al. Applied Linear Statistical Models. Boston, MA: McGraw-Hill, 1996.

    ANLISE DE REGRESSO

  • 1. Seleo e Preparao das Variveis

    2. Escolha e Ajuste do Modelo de Regresso

    3. Diagnstico para verificar se o modelo ajustado adequado

    Ajuste do modelo (R2, Teste F, Testes t para coef., etc.)

    Multicolinearidade (FIV)

    Anlise dos Resduos

    Etapas da Anlise de Regresso

  • Se modelo for adequado, resduos devem refletir as propriedades impostas pelo termo de erro do modelo.

    LINEARIDADE DO MODELO

    Anlise dos Resduos

    No Linearidade

    0

    X

    Res

    duo

  • NORMALIDADE DOS RESDUOS: Suposio essencial paraque os resultados do ajuste do modelo sejam confiveis.

    Anlise dos Resduos

    Outros diagnsticos: Shapiro-Wilk, Anderson-Darling, Kolmogorov-Smirnov

  • HOMOCEDASTICIDADE (Varincia Constante)

    Anlise dos Resduos

    Outros diagnsticos: Teste de Breush-Pagan, Goldfeld-Quandt

    0

    X

    Varincia No ConstanteR

    esd

    uo

  • PRESENA DE OUTLIERS

    Grfico resduos padronizados vs. Valores Ajustados

    Anlise dos Resduos

    Pontos Influentes: DFFITS, DFBETA, Distncia de Cook.

    -0,4

    -0,2

    0

    0,2

    0,4

    0,6

    0,8

    1

    150 155 160 165 170 175 180 185

    X

    Res

    duos

    Pad

    roni

    zado

    s

    Grf2

    -0.1696266546

    -0.0698989019

    -0.0600693077

    -0.1106245625

    -0.1472892613

    0.166985996

    -0.0809941879

    -0.0753388472

    -0.0688066131

    -0.2577014824

    0.8664075394

    X

    Resduos Padronizados

    Plan1

    Altura (cm)Peso (kg)

    1747378.006-0.300232159177.705767840979.5236-1.81783215913.3045137588-0.1696266546

    1616664.564-1.277683168263.286316831864.0354-0.74908316820.5611255928-0.0698989019

    1706473.870.244257307774.114257307774.758-0.64374269230.4144046539-0.0600693077

    1809484.211.276473540285.486473540286.672-1.18552645981.4054729869-0.1106245625

    1827986.2781.198350219187.476350219189.0548-1.57844978092.491503711-0.1472892613

    1647267.6661.733133103769.399133103767.60961.78953310373.20242872920.166985996

    1566259.394-2.183587639657.210412360458.0784-0.86798763960.7534025425-0.0809941879

    1686471.802-0.234181243371.567818756772.3752-0.80738124330.651864472-0.0753388472

    1769080.0741.09502252681.16902252681.9064-0.7373774740.5437255392-0.0688066131

    1758179.04-1.086700649577.953299350580.715-2.76170064957.6269904773-0.2577014824

    17579.049080.7159.28586.2112250.8664075394

    10.7166657463

    RESUMO DOS RESULTADOS

    Estatstica de regresso

    R mltiplo0.9941211196

    R-Quadrado0.9882768005

    R-quadrado ajustado0.9868114006

    Erro padro1.0929712355

    Observaes10

    ANOVA

    glSQMQFF de significao

    Regresso1805.6379153266805.6379153266674.4075631590.0000000052

    Resduo89.55668897371.1945861217

    Total9815.1946043003

    CoeficientesErro padroStat tvalor-P95% inferiores95% superioresInferior 95,0%Superior 95,0%

    Interseo-117.71357506587.4110370089-15.88354975480.0000002471-134.8034681061-100.6236820254-134.8034681061-100.6236820254

    Varivel X 11.12690773890.043393746325.96935815840.00000000521.02684151581.22697396191.02684151581.2269739619

    Plan1

    Altura (cm)

    Peso (kg)

    Plan2

    X

    Y

    Plan3

    X

    Resduos Padronizados

    Altura (cm)Peso (kg)

    17473

    16166

    17064

    18094

    18279

    16472

    15662

    16864

    17690

    17581

    Media170.674.5

    D. padrao8.4011.26

    CV4.9215.11

    RESUMO DOS RESULTADOS

    Estatstica de regresso

    R mltiplo0.7712134719

    R-Quadrado0.5947702193

    R-quadrado ajustado0.5441164967

    Erro padro7.6006954036

    Observaes10

    ANOVA

    glSQMQFF de significao

    Regresso1678.3354350567678.335435056711.7418856660.0089992881

    Resduo8462.164564943357.7705706179

    Total91140.5

    CoeficientesErro padroStat tvalor-P95% inferiores95% superioresInferior 95,0%Superior 95,0%

    Interseo-101.908575031551.5375273363-1.97736640270.0833878754-220.754403042516.9372529794-220.754403042516.9372529794

    Altura (cm)1.03404791930.30176699733.42664349850.00899928810.33817152571.72992431290.33817152571.7299243129

    RESULTADOS DE RESDUOSRESULTADOS DE PROBABILIDADE

    ObservaoPrevisto(a) Peso (kg)ResduosResduos padroPercentilPeso (kg)

    178.0157629256-5.0157629256-0.6999385824562

    264.57313997481.42686002520.19911514921564

    373.8795712484-9.8795712484-1.37867223742564

    484.22005044149.77994955861.36477025173566

    586.2881462799-7.2881462799-1.01704463544572

    667.67528373274.32471626730.60350455525573

    759.40290037832.59709962170.36241948726579

    871.8114754098-7.8114754098-1.09007405387581

    980.08385876429.91614123581.38377549798590

    1079.04981084491.95018915510.27214456769594

    Altura (cm)

    Resduos

    Altura (cm) Plotagem de resduos

    Peso (kg)

    Previsto(a) Peso (kg)

    Altura (cm)

    Peso (kg)

    Altura (cm) Plotagem de ajuste de linha

    Percentil da amostra

    Peso (kg)

    Plotagem de probabilidade normal

  • INDEPENDNCIA

    Grfico resduos padronizados vs. Valores Ajustados

    Anlise dos Resduos

    Outros Diagnsticos: Teste de Durbin-Watson

    Autocorrelao espacial: Mapa dos resduos, ndice de Moran

    X

    0

    Erros Correlacionados

    Res

    duo

  • MODELO ADEQUADO

    Anlise dos Resduos

    0

    Res

    duo

    X

  • DADOS ESPACIAISCaso a hiptese de independncia espacial das observaes seja FALSA DEPENDNCIA ESPACIAL

    EFEITOS ESPACIAIS: Se existir forte tendncia ou correlao espacial, os resultados sero influenciados, apresentando associao estatstica onde no existe (e vice-versa)

    Anlise dos Resduos

  • Como verificar?Medir a autocorrelao espacial dos resduos da

    regresso (ex. ndice de Moran dos resduos)

    Dica para o trabalho final do curso

    Exportar tabela com os resduos do modelo de regresso (SPSS) Unir esta tabela com o shapefile original (unio no QGIS) e

    visualizar os resduos (Mapa dos resduos) Os resduos esto espacialmente correlacionados? Calcular o ndice

    de Moran dos resduos no GeoDa (com teste de pseudo-significncia)

    Anlise dos Resduos

  • So Jos dos CamposCrescimento Populacional 91-00 X Densidade Populacional 91

    1. Mapear os resduos da regresso ndcios de correlao

    2. ndice de Moran sobremapa de resduosI=0,45

    3. Testes de pseudo-significncia indicam autocorrelaoespacial significativa

    Exemplo

  • As observaes no so independentes espacialmente.

    Portanto... temos uma violao das nossas premissas.

    Dependendo da natureza da dependncia, parmetros estimados pelo mtodo dos mnimos quadrados ser ineficiente ou inconsistente.

    E agora?

    Autocorrelao Espacial Constatada!!!

  • Incorpora a estrutura de dependncia espacial no modelo

    PREMISSA: Assumimos que conhecemos a estrutura de dependncia

    espacial (ela no estimada) Premissa forte? Sim! Porm no to forte quanto assumir que todas as

    observaes so independentes espacialmente Matrizes de ponderao tipicamente consideradas:

    contiguidade (rainha, torre... e em diferentes ordens de contiguidade) ou distncia (n vizinhos mais prximos...);

    Regresso Espacial

  • Podem ser globais ou locais

    Globais: inclui no modelo de regresso um parmetro para capturar a estrutura de autocorrelaoespacial na rea de estudo como um todo.

    Locais: parmetros variam continuamente no espao

    Regresso Espacial

  • Global LocalEstatsticas dizem respeito regio como um todo (1 valor)

    Disagregaes locais das estatsticas globais (Muitosvalores)

    Estatsticas globais e no mapeveis

    Estatsticas locais e mapeveis

    nfase nas similaridades da regio nfase nas diferenas ao longo do espao

    Procura regularidades ou leis Procura por excees ou hot-spots locais

    Ex.: Regresso Clssica, Spatial Lag, Spatial Error

    Ex.: GWR, Regimes Espaciais

    Adaptado de: Fotheringham, A.S., Brunsdon, C., and Charlton, M.E., 2002, Geographically Weighted Regression: The Analysis of Spatially Varying Relationships, Chichester: Wiley.

    Global vs. Local

  • PREMISSA possvel capturar a estrutura de correlao espacial num

    nico parmetro (adicionado ao modelo de regresso).

    AlternativasSpatial Lag Models (SAR): atribuem a autocorrelao

    espacial varivel resposta Y. (Spatial Autoregressive Modeling)

    Spatial Error Models (CAR): atribuem a autocorrelao ao erro. (Conditional Autoregressive Modeling)

    Modelos com Efeitos Espaciais Globais

  • PREMISSA: A varivel Yi afetada pelos valores da varivel resposta nas reas vizinhas a i.

    Y = WY + X +

    = coeficiente espacial autoregressivo - medida de correlaoespacial ( = 0, se autocorrelao nula - hiptese nula)

    W = matriz de proximidade espacialWY expressa a dependncia espacial em Y

    Exemplo: Valor dos imveis

    Modelo Spatial Lag

  • Modelo Spatial Error

    PREMISSA: As observaes so interdependentes graas a variveis no mensuradas, e que so espacialmente correlacionadas

    Ou seja: efeitos espaciais so um rudo!

    Por que ele ocorre? Porque no conseguimos modelar todas as caractersticas de uma unidade geogrfica que podem influenciar as regies vizinhas.

    Assume que, se pudssemos adicionar as variveis certas para remover o erro do modelo, o espao no importaria mais.

  • MODELO:

    Y = X + = W +

    W = erro com efeitos espaciais = medida de correlao espacial = componente do erro com varincia constante e no

    correlacionada.

    Modelo Spatial Error

  • DIAGNSTICO PARA AUXILIAR NA ESCOLHA DE UM MODELO OU OUTRO

    Testes Multiplicadores de Langrange(Langrange Multiplier Tests, Anselin et al. 1996)

    Executa regresso dos resduos em relao s variveis originais e aos resduos das reas vizinhas

    LM-Lag: testes para dependncia em relao s variveis originais nas reas vizinhas lag dependence

    LM-Error: testes para dependncia em relao aos resduosnas reas vizinhas - error dependence

    Se ambos forem significativos, utilizar LM-Lag e LM-Error robustos

    Spatial Lag & Spatial Error

  • Motivaes diferentes, porm prximosem termos formais.

    Ambos partem do pressuposto de queo processo espacial analisado estacionrio

    e pode ser capturado em um nico parmetro.

    Spatial Lag & Spatial Error

  • Porm isto nem sempre verdade!

    importante verificar se padres diversos de associao espacial esto presentes.

    Uma Soluo Exploratria:

    Indicadores Locais de Autocorrelao Espacial

  • Distribuio dos valores de correlao local para o ndice de excluso

    Indicadores Locais de Associao Espacial (LISA)

    No significantes

    p = 0.05 [95% (1,96s)]p = 0.01 [99% (2,54s)]p = 0.001 [99,9% (3,2s)]

    % Excluso

  • Modelos de Regresso com Efeitos Espaciais DISCRETOSVariaes espaciais modeladas de maneira discreta.

    Regimes Espaciais

    Modelos de Regresso com Efeitos Espaciais CONTNUOSVariaes espaciais modeladas de forma contnua, com

    parmetros variando no espao.

    Geographically Weighted Regression GWR. [Regresso Geograficamente Ponderada]

    Quantitative Geography; A. S. Fotheringham, C. Brunsdon, M. Charlton, 2000 (print 2004)

    Modelos com Efeitos Espaciais Locais

  • A ideia regionalizar a rea de estudo obtendo sub-regies com seu padro prprio.

    Realizar regresses separadas para cada sub-regio.

    Regimes Espaciais

  • Regionalizaes da rea de estudo

    Diferentes tipos de variabilidade espacial

    Mtricas: Diagrama de espalhamento e ndices locais e globais regionalizao tipo k-medias espacial

    Ex: Regimes espaciais para ndice de excluso

    Regimes Espaciais

  • 1. Anlise grfica dos resduos2. Mapear os resduos concentrao de resduos

    negativos ou positivos em parte do mapa indicapresena de autocorrelao espacial

    3. ndice de Moran dos resduos4. Indicadores de qualidade de ajuste dos modelos

    baseados no coeficiente de determinao (R2) seroincorretos.

    5. Utilizao do AIC critrio de informao de Akaike, aavaliao do ajuste penalizada por funo donmero de parmetros ( prefervel o modelo com omenor valor AIC).

    Diagnstico de Modelos de Efeitos Espaciais

  • Longevidade X Renda emSo Jos dos Campos

    RegressoSimples

    Spatial Lag Regimes Espaciais

    R2 ajustado 0.280 0.586 0.80

    AIC 379.84 306.51 260.09

    ndice de Moran dos resduos

    0.620 0.01 0.02

    Comparao das Regresses

  • Ajusta um modelo de regresso a cada ponto observado, ponderando todas as demais observaes como funo da distncia a este ponto.

    Y(i) = (i)X +

    Y(i): varivel que representa o processo no ponto i.(i): parmetros estimados no ponto i.

    Quantitative Geography; A. S. Fotheringham, C. Brunsdon, M. Charlton, 2000 (print 2004)

    GWR Geographically Weighted Regression

  • y = b0 + b1x1 + e regresso clssica simples com um preditor

    b0 , b1 so os mesmos para toda rea

    Se existe alguma variao geogrfica na relao essavariao fica includa como erro.

    GWR Geographically Weighted Regression

  • y(i) = b0(i) + b1(i) x1 + e(i) GWR

    b0(i), b1(i) para cada ponto i do espao h um b0 e b1 diferentes

    Existe uma funo (kernel) sobre cada ponto do espaoque determina todos os pontos da regresso localque ponderada pela distncia. Pontos maisprximos do ponto central tem maior peso.

    Assim como no kernel a escolha da largura da banda importante (pode ser fixa ou adaptvel densidade dos dados)

    GWR Geographically Weighted Regression

  • GWR Geographically Weighted Regression

  • Adaptado de: Fotheringham, A.S., Brunsdon, C., and Charlton, M.E., 2002, Geographically Weighted Regression: The Analysis of Spatially Varying Relationships, Chichester: Wiley.

    LARGURA DE BANDA

    FUNO DE PONDERAO

    GWR Geographically Weighted Regression

  • Modelos Locais vs. Modelos Globais

    Mesmas tcnicas de anlise do ajuste do modelo,porm comparao problemtica

    GWR apresentar sempre melhores ajustes poisenvolve o ajuste de muito mais parmetros

    Sugesto: medida AICc, que leva em considerao acomplexidade do modelo e a quantidade de casosamostrados.

    Ajuste do Modelo GWR

  • Os parmetros podem ser apresentados visualmente paraidentificar como se comportam espacialmente osrelacionamentos entre as variveis.

    Ex: Crescimento Pop. (resposta) X Densidade Pop. (preditora)

    GWR Geographically Weighted Regression

  • Ex: Crescimento Pop. (resposta) X Densidade Pop. (preditora)Mapa de resduos (I = 0,04) :

    GWR Geographically Weighted Regression

  • Consumo de gua per Capita (resposta) X Renda per capita (preditora)

    CARMO, Roberto Luiz do; DAGNINO, Ricardo Sampaio; FEITOSA, Flvia da Fonseca; JOHANSEN, Igor Cavallini; CRAICE, Carla. Populao, Renda e ConsumoUrbano de gua no Brasil: Interfaces e Desafios. XX Simpsio Brasileiro de Recursos Hdricos. 17 a 22 de novembro de 2013. Bento Gonalves, RS.

    Distribuio espacial de consumo residencial de gua e renda da populao em 2010. Fonte: SNIS (2010) e IBGE (2010).

    EXEMPLO

  • Cons

    umo

    de

    gua

    per C

    apita

    (m

    3/di

    a/an

    o)

    Renda per Capita (R$)

    Anlise Exploratria

  • Consumo de gua per Capita (resposta) X Renda per capita (preditora)

    CARMO, Roberto Luiz do; DAGNINO, Ricardo Sampaio; FEITOSA, Flvia da Fonseca; JOHANSEN, Igor Cavallini; CRAICE, Carla. Populao, Renda e Consumo Urbano de gua n Brasil: Interfaces e Desafios. XX Simpsio Brasileiro de Recursos Hdricos. 17 a 22 de novembro de 2013. Bento Gonalves, RS.

    MODELO DE REGRESSO LINEAR GLOBAL

    Varivel

    Desvio Padro

    Estatstica t

    (constante)

    4,25.(10-3)

    4,55.(10-4)

    9,3

    RENDA

    41.(10-6)

    8,2.(10-7)

    49

    Coeficiente de determinao: R2 = 0,36

    Teste F: F = 2499,1

  • Mas ser que esta relao, entre consumo de gua erenda, ocorre da mesma

    maneira em todo o pas???

    O ESPAO IMPORTA!!!

  • Consumo de gua per Capita (resposta) X Renda per capita(preditora)GWR:

    CARMO, Roberto Luiz do; DAGNINO, Ricardo Sampaio; FEITOSA, Flvia da Fonseca; JOHANSEN, Igor Cavallini; CRAICE, Carla. Populao, Renda e Consumo Urbano de gu no Brasil: Interfaces e Desafios. XX Simpsio Brasileiro de Recursos Hdricos. 17 a 22 de novembro de 2013. Bento Gonalves, RS.

    GWR Geographically Weighted Regression

  • Consumo de gua per Capita (resposta) X Renda per capita(preditora)

    CARMO, Roberto Luiz do; DAGNINO, Ricardo Sampaio; FEITOSA, Flvia da Fonseca; JOHANSEN, Igor Cavallini; CRAICE, Carla. Populao, Renda e Consumo Urbano de guno Brasil: Interfaces e Desafios. XX Simpsio Brasileiro de Recursos Hdricos. 17 a 22 de novembro de 2013. Bento Gonalves, RS.

    Os menores coeficientes estimados para a varivel RENDA foram observados em municpios do Estado do Rio Grande do Sul ...

    ....e os maiores em Alagoas.

    GWR Geographically Weighted Regression

  • GWR Geographically Weighted RegressionConsumo de gua per Capita (resposta)

    X Renda per capita(preditora)

    CARMO, Roberto Luiz do; DAGNINO, Ricardo Sampaio; FEITOSA, Flvia da Fonseca; JOHANSEN, Igor Cavallini; CRAICE, Carla. Populao, Renda e Consumo Urbano de gu no Brasil: Interfaces e Desafios. XX Simpsio Brasileiro de Recursos Hdricos. 17 a 22 de novembro de 2013. Bento Gonalves, RS.

    Regio do Municpio de Traipu (AL) maior coeficiente estimadoUm aumento de R$ 1 na renda per capita da populao est associado a um incremento do consumo de gua de 100,3 ml/dia/hab.

    Regio do municpio de Floriano Peixoto (RS) um dos menores coeficientes significativos (t-valor > 1,96): Um aumento de R$ 1 na renda per capita da populao est associado a um aumento do consumo de 10,22 ml/dia/hab.

    Hipteses???

  • CARMO, Roberto Luiz do; DAGNINO, Ricardo Sampaio; FEITOSA, Flvia da Fonseca; JOHANSEN, Igor Cavallini; CRAICE, Carla. Populao, Renda e Consumo Urbano de guano Brasil: Interfaces e Desafios. XX Simpsio Brasileiro de Recursos Hdricos. 17 a 22 de novembro de 2013. Bento Gonalves, RS.

    De maneira geral, as regies apresentadas comoaquelas onde a elevao da renda est relacionada aum maior incremento do consumo (reas maisescuras) tendem a coincidir com as reas onde oaumento do poder de consumo que acompanhouo recente processo de estabilizao econmica,crescimento econmico e ampliao dos programasredistributivos apresentou os maiores impactos nareduo da pobreza e extrema pobreza do pas.

    Consideraes sobre os Resultados

  • CARMO, Roberto Luiz do; DAGNINO, Ricardo Sampaio; FEITOSA, Flvia da Fonseca; JOHANSEN, Igor Cavallini; CRAICE, Carla. Populao, Renda e Consumo Urbano de guano Brasil: Interfaces e Desafios. XX Simpsio Brasileiro de Recursos Hdricos. 17 a 22 de novembro de 2013. Bento Gonalves, RS.

    So regies onde a reduo da pobreza ampliou demaneira expressiva o acesso a recursos bsicos para amanuteno de vida desta populao, entre eles agua potvel.

    J em regies como a Sul, caracterizada por nveismais elevados de renda, um aumento na renda tendea gerar um impacto menor no aumento do consumode bens essenciais como a gua e, provavelmente,maior no consumo de bens de outra natureza.

    Consideraes sobre os Resultados

  • Spatial Regression Analysis: A Workbook (Luc Anselin): http://geodacenter.asu.edu/system/files/rex1.pdf

    Fitting and Interpreting Spatial Regression Models: An Applied Survey (Roger Bivand): http://www.nek.lu.se/ryde/NordicEcont09/Papers/bivand.pdf

    Tutoriais

    http://geodacenter.asu.edu/system/files/rex1.pdfhttp://www.nek.lu.se/ryde/NordicEcont09/Papers/bivand.pdf

  • GeoDandice de Moran, LISA maps, Regresso Clssica e Espacial (Spatial Lag & Spatial Error)

    GeodaSpaceRegresso Clssica e Espacial (Regimes Espaciais, Spatial Lag & Spatial Error)

    SPRING e Terraviewndice de Moran, LISA map

    GWR 4.0GWR

    Softwares

  • PRTICARegresso Espacial

    Spatial Lag e Spatial Error com o Software GeoDa GWR com o Software GWR 4.0

    REGRESSO ESPACIALNmero do slide 2Nmero do slide 3Nmero do slide 4Nmero do slide 5Nmero do slide 6Nmero do slide 7Nmero do slide 8Nmero do slide 9Nmero do slide 10Nmero do slide 11Nmero do slide 12Nmero do slide 13Nmero do slide 14Nmero do slide 15Nmero do slide 16Nmero do slide 17Nmero do slide 18Nmero do slide 19Nmero do slide 20Nmero do slide 21Nmero do slide 22Nmero do slide 23Nmero do slide 24Nmero do slide 25Nmero do slide 26Nmero do slide 27Nmero do slide 28Nmero do slide 29Nmero do slide 30Nmero do slide 31Nmero do slide 32Nmero do slide 33Nmero do slide 34Nmero do slide 35Nmero do slide 36Nmero do slide 37Nmero do slide 38Nmero do slide 39Nmero do slide 40Nmero do slide 41Nmero do slide 42Nmero do slide 43Nmero do slide 44Nmero do slide 45Nmero do slide 46Nmero do slide 47Nmero do slide 48Nmero do slide 49Nmero do slide 50