25
UNIVERSIDADE FEDERAL DO ABC MTI – Métodos e Técnicas de Análise de Informação para o Planejamento Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São Bernardo do Campo 2015

UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

Embed Size (px)

Citation preview

Page 1: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

UNIVERSIDADE FEDERAL DO ABC

MTI – Métodos e Técnicas de Análise de Informação para o

Planejamento

Qualidade de vida, desenvolvimento econômico e infraestrutura

sanitária

Guilherme Lamounier Maschietto Almeida

RA: 21045112

São Bernardo do Campo

2015 

Page 2: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

INTRODUÇÃO O trabalho tem como tema principal o estudo da relação entre qualidade                       

de vida, desenvolvimento econômico e infraestrutura sanitária. Uma vez que o                     desenvolvimento econômico proporciona uma série de melhorias na sociedade,                 é possível esperar uma relação direta na melhoria da qualidade de vida dos                         indivíduos. Além disso, a infraestrutura sanitária se insere no contexto como                     uma condição essencial à manutenção da saúde e do bem estar de um                         indivíduo, trazendo assim diversas melhorias para a qualidade de vida. 

Apesar disso, assumindo as peculiaridades e as características               exclusivas de cada parte de um país tão vasto geograficamente, culturalmente                     e socialmente, estas relações entre desenvolvimento econômico, infraestrutura               sanitária e qualidade de vida podem ter diferentes intensidades conforme a                     região, possivelmente também pela conjuntura de outras variáveis               socioeconômicas e por características históricas. Este trabalho busca analisar                 essas relações, verificar e dimensioná­las conforme sua distribuição espacial                 no Brasil. 

Como variáveis de interesse, foram escolhidos três indicadores que                 representariam os conceitos de desenvolvimento econômico, infraestrutura             sanitária e qualidade de vida. Dessa forma, foram adotados indicadores                   amplamente utilizados e reconhecidos para desenvolvimento econômico e               qualidade de vida, isto é, PIB Per Capta e IDH, e um índice foi composto para                               dimensionar infraestrutura sanitária, a porcentagem da população atendida por                 esgotamento sanitário.   

METODOLOGIA DO TRABALHO 

Para o desenvolvimento do trabalho será adotada uma abordagem                 estatística, e para o processamento dos dados serão utilizados os softwares                     IBM SPSS, QGIS, GeoDa e GWR, dos quais somente o primeiro é de domínio                           privado, estando os demais sobre licensas públicas. 

Para iniciar as análises, se faz primeiramente necessário possuir os                   dados de interesse, assim a primeira etapa consiste em elaborar um banco de                         dados adequado ao estudo. Neste momento, são procuradas fontes confiáveis                   e mais completas possíveis, e será necessário triangular informações entre                   diferentes bases, o que requer que existam variáveis em comum para                     consolidarmos adequadamente as diferentes bases de dados. Uma vez em                   posse dos dados, está formada a arquitetura base para toda a sequência do                         trabalho. Neste trabalho, todos os dados são referentes ao ano de 2010. 

O trabalho prossegue pela análise das variáveis de interesse, isto é,                     IDH, PIB Per Capta e porcentagem da população atendida com esgotamento                     sanitário. Em um primeiro momento, são analisadas as distribuições de cada                     variável e seu comportamento ao longo do espaço geográfico. Para isso, será                       necessário realizar a composição dos arquivos vetoriais com a informação                   

Page 3: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

espacial com os arquivos dos bancos de dados que contêm as informações                       dos indicadores. Durante a análise, é estudado se as variáveis necessitam de                       transformações particulares para que possam compor um modelo adequado. 

Tendo as variáveis adequadas e devidamente validadas, é iniciado o                   trabalho de composição de modelos. Primeiramente, as variáveis são                 analisadas por meio da abordagem da regressão linear clássica, e dependendo                     da distribuição dos resíduos é avaliada a necessidade de uma abordagem                     espacial. 

A partir de validada a necessidade de uma abordagem espacial, as                     variáveis são regredidas a partir de metodologias diferentes, e desta vez as                       relações de autocorrelação espacial são levadas em consideração no modelo.                   Assim, espera­se que os resíduos gerados pelos novos modelos estejam                   menos autocorrelacionados, isto é, tenham uma menor relação espacial por                   terem sido ajustados de alguma forma à sua distribuição geográfica. Com isso,                       as novas estatísticas apontariam que os modelos espaciais estariam                 capturando melhor a variação da variável dependente com base na variação                     das variáveis independentes. 

Os modelos finais são então analisados, assim como sua dispersão e                     seus resíduos, e é também analisado o mapa que indica a força de                         representação do modelo em cada região, se o modelo final for espacial. Por                         fim, se faz necessária a discussão conceitual do modelo e seus parâmetros,                       etapa onde se consolida o conhecimento gerado no estudo das estatísticas,                     trazendo os números para uma realidade reflexiva.  

PREPARAÇÃO DOS DADOS E ANÁLISE EXPLORATÓRIA 

 Histograma IDH  

 Analisando a dispersão do IDH, podemos observar um comportamento                 

de amostragem que segue uma normal. 

Page 4: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

  Índice de Moran Local – Autocorrelação Espacial  

 Através do Índice de Moran podemos perceber que há autocorrelação                   

espacial positiva.                

Page 5: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

   Cluster Map – IDH 

 Através do Cluster Map, podemos identificar as regiões dos Clusters,                   

isto é, as regiões em vermelho representam o cluster High­High, onde                     concentram­se valores altos de IDH. Por meio do mapa é possível observar                       que a região sudeste concentra o Cluster de alto IDH, enquanto o conjunto                         Low­Low, representando baixo IDH, concentra­se mais ao nordeste do Brasil, o                     que reflete uma característica socieconômica histórica do país onde o sudeste                     concentraria qualidade de vida ao se inserir como região de centralização                     econômica do pais, enquanto muitas regiões do nordeste ainda são                   relativamente esquecidas pela política pública.           

Page 6: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

    Histograma Log PIB Per Capta 

Na distribuição do PIB Per Capta, a variável foi normalizada através do                       PIB, isto é, como havia uma cauda longa devido à variável não ter um limite                             superior, a distribuição apresentava­se como uma log­normal. Para realizar a                   normalização, foi utilizada a conversão via logarítmo em base 10, diminuindo                     assim a amplitude e a distribuição das variáveis. Como podemos observar, a                       distribuição foi corretamente transformada em uma normal.  Índice de Moran Local – Autocorrelação Espacial  

Page 7: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

  

Podemos novamente encontrar um Índice de Moran indicando uma                 autocorrelação espacial positiva.  Cluster Map – Log PIB Per Capta 

Page 8: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

  

No mapa de Clusters, podemos aplicar o mesmo raciocínio presente na                     estrutura espacial do IDH, de modo que a região High­High concentra­se no                       sudeste e a região Low­Low estaria concentrada mais na região nordeste. Além                       de diversos problemas climáticos que desfavoreceram o desenvolvimento               econômico da região, há um grave processo histórico que tornou crônica a                       situação do nordeste, o que naturalmente torna a região extremamente                   sensível à políticas públicas.               

Page 9: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

Histograma:  Porcentagem da população atendida com esgotamento sanitário  

  Diferentemente das outras variáveis estudadas, aqui não foi possível                 

observar claramente uma distribuição normal. Assim, foi constatada que a                   realidade brasileira tem uma situação sanitária curiosa, de modo que a                     distribuição aponta para concentrações mais ao extremo, ou seja, existem mais                     municípios com atendimento de esgotamento sanitário muito baixo ou muito                   alto do que entre o meio da distribuição.  Índice de Moran Local – Autocorrelação Espacial  

 Mais uma vez foi possível observar um Índice de Moran que representa                       

uma autocorrelação espacial positiva. 

Page 10: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

 Cluster Map:  Porcentagem da população atendida com esgotamento sanitário 

 No Cluster Map, a região do Cluster High­High seguiu em linha com os                         

raciocínios anteriores, concentrando a maior parte do Cluster na região                   Sudeste. Em contrapartida, o Cluster Low­Low parece revelar que as regiões                     de baixo atendimento de infraestrutura sanitária são regiões que estão mais às                       margens do país, isto é, regiões que se distanciam dos grandes centros                       econômicos, o que faz sentido e conversa com o processo histórico de                       desenvolvimento de infraestrutura do país.  

 

 

 

 

 

 

 

 

Page 11: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

 

 

ANÁLISE DE REGRESSÃO CLÁSSICA  

Primeiro Modelo – Infraestrutura Sanitária (Somente) 

 

Segundo Modelo – Log PIB Per Capta (Somente) 

Page 12: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

 

 

Terceiro Modelo  Composição entre Infraestrutura Sanitária e PIB Per Capta 

Page 13: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

 

É possível observar que o modelo composto com as duas variáveis                     independentes, PIB Per Capta e (%) da população atendida com esgotamento                     sanitário, foi melhor do que os modelos com cada uma das variáveis isoladas,                         de modo que foi possível observar o aumento do R² e do R² ajustado. 

 

 

 

 

 

Testes de Pseudo­Significância das Variáveis 

Page 14: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

IDH 

 

 

Log PIB Per Capta 

 

 

 

Page 15: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

 

 

Porcentagem da população atendida com Infraestrutura Sanitária 

 

Como foi possível observar, os testes de pseudo­significância indicam                 um p­valor suficiente para rejeitarmos a hipótese nula de que não há                       autocorrelação espacial, e no teste do modelo linear é possível observar um                       teste de moran indicando autocorrelação espacial. 

 

Histograma dos Resíduos 

 

Como podemos observar, os resíduos estão normalmente distribuídos. 

Page 16: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

Dispersão entre valores previstos e resíduos 

 

De acordo com os testes de Breusch­Pagan, Koenker­Bassett e White,                   não há heterocedasticidade, ou seja, a variância dos resíduos é constante.                     Esta distribuição constante também pode ser observada com base no gráfico                     acima, onde a dispersão é contínua e não faz um formato em forma de funil,                             isto é, não apresenta um comportamento diferente em alguma escala da                     distribuição. 

 

Page 17: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

Índice de Moran Local dos Resíduos – Modelo Clássico

 

Analisando o Índice de Moran dos resíduos, é possível observar que há                       autocorrelação espacial, isto é, há uma relação espacial presente nos resíduos                     e, assim, é um indicativo de que uma regressão espacial pode apresentar um                         modelo mais coerente. 

 

 

 

 

 

 

 

 

 

 

 

Page 18: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

 

Dispersão Residual no Espaço – Cluster Map 

 

 

 

O Cluster Map dos resíduos do modelo linear apontam para uma região                       High­High que estaria amplamente espaçada entre a região sul e sudeste,                     enquanto o Cluster Low­Low acompanha a região nordeste, assim como nos                     outros indicadores. 

 

 

 

 

 

 

 

 

Page 19: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

 

 

ANÁLISE DE REGRESSÃO ESPACIAL  Modelos de Regressão Espacial Variável dependente: IDH Variáveis independentes: Log de PIB Per Capta & Infraestrutura Sanitária 

Spatial Error: 

 

 

 

 

 

 

Page 20: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

 

 

 

Spatial Lag: 

 

 

Modelo mais aderente: Spatial Error 

Foi possível observar que dentre os modelos com efeitos espaciais                   globais, o que mais adaptou­se foi o Spatial Error, indicando que a explicação                         para efeitos espaciais como ruídos e como frutos de outras variáveis seriam                       maiores do que fatores de vizinhança. 

 

 

Page 21: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

 

 

 

 

Índice de Moran Local dos Resíduos do modelo Spatial Error: 

 

Podemos observar que o Índice de Moran dos resíduos caiu                   consideravelmente, eliminando a autocorrelação espacial presente nesta             distribuição e, assim, representando um modelo muito mais sólido e adaptado à                       realidade espacial das variáveis. 

Page 22: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

Mapa de Autocorrelação dos Resíduos – Cluster Map

 

É possível observar uma diminuição das áreas dos Clusters. 

Dispersão de Valores Previstos x Resíduos: 

 

Novamente, de acordo com a dispersão dos resíduos, não há                   heterocedasticidade no modelo. 

Page 23: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

Histograma dos Resíduos: 

 

É possível observar a distribuição normal dos resíduos, indicando                 também a adaptabilidade do modelo. 

 

 

Apesar de os modelos anteriores capturarem a relação espacial entre as                     variáveis, estas seriam modelagens com variações espaciais modeladas de                 maneira discreta. Há a possibilidade de analisarmos o comportamento de                   variações espaciais modeladas de maneira contínua, com parâmetros variando                 no espaço, o que poderia gerar um modelo mais bem adaptado às diferentes                         regiões e diferentes relações espaciais dos dados. Dessa forma, prosseguiu­se                   o estudo de um modelo Geographically Wheighted Regression (GWR –                   Regressão Geograficamente Ponderada). 

 

 

 

 

 

 

 

 

 

Page 24: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

 

 

Modelo GWR: 

 

 

Mapa de representatividade do Modelo GWR:

 

Os resultados indicaram um modelo ainda mais bem adaptado às                   nuances geográficas dos dados, isto é, a modelagem contínua permitiu que os                       parâmetros variassem no espaço, permitindo uma combinação maior e mais                   precisa entre as variáveis e, assim, indica que o GWR foi o melhor modelo                           

Page 25: UNIVERSIDADE FEDERAL DO ABC - Flávia Feitosa · Qualidade de vida, desenvolvimento econômico e infraestrutura sanitária Guilherme Lamounier Maschietto Almeida RA: 21045112 São

entre os analisados. Além disso, através do mapa do R² é possível observar                         que as relações entre as variáveis estudadas encontram­se mais fortes na                     região sudeste especificamente, e também que são mais fortes nas regiões                     mais próximas ao litoral do que no interior, o que poderia ser um reflexo dos                             problemas endêmicos relacionados à deficiência histórica do planejamento de                 infraestrutura destas regiões. 

 

 

CONCLUSÃO  

Podemos observar que há uma relação entre qualidade de vida, desenvolvimento econômico e infraestrutura sanitária, e esta relações pôde ser dimensionada através dos indicadores IDH, PIB Per Capta e população atendida com esgotamento sanitário. Por meio das análises das variáveis, regressões lineares e espaciais, foi possível observar que as relações entre estas variáveis são melhores descritas a partir de sua disposição espacial. 

Analisando os mapas das distribuições, podemos concluir que há uma grande segregação entre clusters, especialmente entre as regiões sudeste e nordeste, de modo que a intensidade das relações se mostrou mais forte no sudeste.  

Os modelos espaciais ajustaram­se mais corretamente à natureza dos dados, mostrando­se muito mais eficientes. Como reflexo das diferenças geográficas, sociais e econômicas, foi possível constatar regiões muito mais sensíveis às relações estudadas, indicando que a qualidade de vida pode depender mais de outros fatores nas outras regiões. 

  REFERÊNCIAS BIBLIOGRÁFICAS 

Secretaria Nacional de Saneamento Ambiental, Ministério das Cidades.

<http://www.snis.gov.br/>

Censo 2010, IBGE. <http://censo2010.ibge.gov.br/>

Notas de Aula. Prof. Dra. Flávia F. Feitosa. Métodos e Técnicas de Análise da

Informação para o Planejamento.

“Análise Espacial de Áreas”. Gilberto Câmara, Marilia Sá Carvalho, Oswaldo Gonçalves

Cruz, Virgínia Correa.

GeoDa Center for geospatial analysis and computation. <https://geodacenter.asu.edu/>