Upload
phungkien
View
216
Download
0
Embed Size (px)
Citation preview
UNIVERSIDADE FEDERAL DO ABC
MTI – Métodos e Técnicas de Análise de Informação para o
Planejamento
Qualidade de vida, desenvolvimento econômico e infraestrutura
sanitária
Guilherme Lamounier Maschietto Almeida
RA: 21045112
São Bernardo do Campo
2015
INTRODUÇÃO O trabalho tem como tema principal o estudo da relação entre qualidade
de vida, desenvolvimento econômico e infraestrutura sanitária. Uma vez que o desenvolvimento econômico proporciona uma série de melhorias na sociedade, é possível esperar uma relação direta na melhoria da qualidade de vida dos indivíduos. Além disso, a infraestrutura sanitária se insere no contexto como uma condição essencial à manutenção da saúde e do bem estar de um indivíduo, trazendo assim diversas melhorias para a qualidade de vida.
Apesar disso, assumindo as peculiaridades e as características exclusivas de cada parte de um país tão vasto geograficamente, culturalmente e socialmente, estas relações entre desenvolvimento econômico, infraestrutura sanitária e qualidade de vida podem ter diferentes intensidades conforme a região, possivelmente também pela conjuntura de outras variáveis socioeconômicas e por características históricas. Este trabalho busca analisar essas relações, verificar e dimensionálas conforme sua distribuição espacial no Brasil.
Como variáveis de interesse, foram escolhidos três indicadores que representariam os conceitos de desenvolvimento econômico, infraestrutura sanitária e qualidade de vida. Dessa forma, foram adotados indicadores amplamente utilizados e reconhecidos para desenvolvimento econômico e qualidade de vida, isto é, PIB Per Capta e IDH, e um índice foi composto para dimensionar infraestrutura sanitária, a porcentagem da população atendida por esgotamento sanitário.
METODOLOGIA DO TRABALHO
Para o desenvolvimento do trabalho será adotada uma abordagem estatística, e para o processamento dos dados serão utilizados os softwares IBM SPSS, QGIS, GeoDa e GWR, dos quais somente o primeiro é de domínio privado, estando os demais sobre licensas públicas.
Para iniciar as análises, se faz primeiramente necessário possuir os dados de interesse, assim a primeira etapa consiste em elaborar um banco de dados adequado ao estudo. Neste momento, são procuradas fontes confiáveis e mais completas possíveis, e será necessário triangular informações entre diferentes bases, o que requer que existam variáveis em comum para consolidarmos adequadamente as diferentes bases de dados. Uma vez em posse dos dados, está formada a arquitetura base para toda a sequência do trabalho. Neste trabalho, todos os dados são referentes ao ano de 2010.
O trabalho prossegue pela análise das variáveis de interesse, isto é, IDH, PIB Per Capta e porcentagem da população atendida com esgotamento sanitário. Em um primeiro momento, são analisadas as distribuições de cada variável e seu comportamento ao longo do espaço geográfico. Para isso, será necessário realizar a composição dos arquivos vetoriais com a informação
espacial com os arquivos dos bancos de dados que contêm as informações dos indicadores. Durante a análise, é estudado se as variáveis necessitam de transformações particulares para que possam compor um modelo adequado.
Tendo as variáveis adequadas e devidamente validadas, é iniciado o trabalho de composição de modelos. Primeiramente, as variáveis são analisadas por meio da abordagem da regressão linear clássica, e dependendo da distribuição dos resíduos é avaliada a necessidade de uma abordagem espacial.
A partir de validada a necessidade de uma abordagem espacial, as variáveis são regredidas a partir de metodologias diferentes, e desta vez as relações de autocorrelação espacial são levadas em consideração no modelo. Assim, esperase que os resíduos gerados pelos novos modelos estejam menos autocorrelacionados, isto é, tenham uma menor relação espacial por terem sido ajustados de alguma forma à sua distribuição geográfica. Com isso, as novas estatísticas apontariam que os modelos espaciais estariam capturando melhor a variação da variável dependente com base na variação das variáveis independentes.
Os modelos finais são então analisados, assim como sua dispersão e seus resíduos, e é também analisado o mapa que indica a força de representação do modelo em cada região, se o modelo final for espacial. Por fim, se faz necessária a discussão conceitual do modelo e seus parâmetros, etapa onde se consolida o conhecimento gerado no estudo das estatísticas, trazendo os números para uma realidade reflexiva.
PREPARAÇÃO DOS DADOS E ANÁLISE EXPLORATÓRIA
Histograma IDH
Analisando a dispersão do IDH, podemos observar um comportamento
de amostragem que segue uma normal.
Índice de Moran Local – Autocorrelação Espacial
Através do Índice de Moran podemos perceber que há autocorrelação
espacial positiva.
Cluster Map – IDH
Através do Cluster Map, podemos identificar as regiões dos Clusters,
isto é, as regiões em vermelho representam o cluster HighHigh, onde concentramse valores altos de IDH. Por meio do mapa é possível observar que a região sudeste concentra o Cluster de alto IDH, enquanto o conjunto LowLow, representando baixo IDH, concentrase mais ao nordeste do Brasil, o que reflete uma característica socieconômica histórica do país onde o sudeste concentraria qualidade de vida ao se inserir como região de centralização econômica do pais, enquanto muitas regiões do nordeste ainda são relativamente esquecidas pela política pública.
Histograma Log PIB Per Capta
Na distribuição do PIB Per Capta, a variável foi normalizada através do PIB, isto é, como havia uma cauda longa devido à variável não ter um limite superior, a distribuição apresentavase como uma lognormal. Para realizar a normalização, foi utilizada a conversão via logarítmo em base 10, diminuindo assim a amplitude e a distribuição das variáveis. Como podemos observar, a distribuição foi corretamente transformada em uma normal. Índice de Moran Local – Autocorrelação Espacial
Podemos novamente encontrar um Índice de Moran indicando uma autocorrelação espacial positiva. Cluster Map – Log PIB Per Capta
No mapa de Clusters, podemos aplicar o mesmo raciocínio presente na estrutura espacial do IDH, de modo que a região HighHigh concentrase no sudeste e a região LowLow estaria concentrada mais na região nordeste. Além de diversos problemas climáticos que desfavoreceram o desenvolvimento econômico da região, há um grave processo histórico que tornou crônica a situação do nordeste, o que naturalmente torna a região extremamente sensível à políticas públicas.
Histograma: Porcentagem da população atendida com esgotamento sanitário
Diferentemente das outras variáveis estudadas, aqui não foi possível
observar claramente uma distribuição normal. Assim, foi constatada que a realidade brasileira tem uma situação sanitária curiosa, de modo que a distribuição aponta para concentrações mais ao extremo, ou seja, existem mais municípios com atendimento de esgotamento sanitário muito baixo ou muito alto do que entre o meio da distribuição. Índice de Moran Local – Autocorrelação Espacial
Mais uma vez foi possível observar um Índice de Moran que representa
uma autocorrelação espacial positiva.
Cluster Map: Porcentagem da população atendida com esgotamento sanitário
No Cluster Map, a região do Cluster HighHigh seguiu em linha com os
raciocínios anteriores, concentrando a maior parte do Cluster na região Sudeste. Em contrapartida, o Cluster LowLow parece revelar que as regiões de baixo atendimento de infraestrutura sanitária são regiões que estão mais às margens do país, isto é, regiões que se distanciam dos grandes centros econômicos, o que faz sentido e conversa com o processo histórico de desenvolvimento de infraestrutura do país.
ANÁLISE DE REGRESSÃO CLÁSSICA
Primeiro Modelo – Infraestrutura Sanitária (Somente)
Segundo Modelo – Log PIB Per Capta (Somente)
Terceiro Modelo Composição entre Infraestrutura Sanitária e PIB Per Capta
É possível observar que o modelo composto com as duas variáveis independentes, PIB Per Capta e (%) da população atendida com esgotamento sanitário, foi melhor do que os modelos com cada uma das variáveis isoladas, de modo que foi possível observar o aumento do R² e do R² ajustado.
Testes de PseudoSignificância das Variáveis
IDH
Log PIB Per Capta
Porcentagem da população atendida com Infraestrutura Sanitária
Como foi possível observar, os testes de pseudosignificância indicam um pvalor suficiente para rejeitarmos a hipótese nula de que não há autocorrelação espacial, e no teste do modelo linear é possível observar um teste de moran indicando autocorrelação espacial.
Histograma dos Resíduos
Como podemos observar, os resíduos estão normalmente distribuídos.
Dispersão entre valores previstos e resíduos
De acordo com os testes de BreuschPagan, KoenkerBassett e White, não há heterocedasticidade, ou seja, a variância dos resíduos é constante. Esta distribuição constante também pode ser observada com base no gráfico acima, onde a dispersão é contínua e não faz um formato em forma de funil, isto é, não apresenta um comportamento diferente em alguma escala da distribuição.
Índice de Moran Local dos Resíduos – Modelo Clássico
Analisando o Índice de Moran dos resíduos, é possível observar que há autocorrelação espacial, isto é, há uma relação espacial presente nos resíduos e, assim, é um indicativo de que uma regressão espacial pode apresentar um modelo mais coerente.
Dispersão Residual no Espaço – Cluster Map
O Cluster Map dos resíduos do modelo linear apontam para uma região HighHigh que estaria amplamente espaçada entre a região sul e sudeste, enquanto o Cluster LowLow acompanha a região nordeste, assim como nos outros indicadores.
ANÁLISE DE REGRESSÃO ESPACIAL Modelos de Regressão Espacial Variável dependente: IDH Variáveis independentes: Log de PIB Per Capta & Infraestrutura Sanitária
Spatial Error:
Spatial Lag:
Modelo mais aderente: Spatial Error
Foi possível observar que dentre os modelos com efeitos espaciais globais, o que mais adaptouse foi o Spatial Error, indicando que a explicação para efeitos espaciais como ruídos e como frutos de outras variáveis seriam maiores do que fatores de vizinhança.
Índice de Moran Local dos Resíduos do modelo Spatial Error:
Podemos observar que o Índice de Moran dos resíduos caiu consideravelmente, eliminando a autocorrelação espacial presente nesta distribuição e, assim, representando um modelo muito mais sólido e adaptado à realidade espacial das variáveis.
Mapa de Autocorrelação dos Resíduos – Cluster Map
É possível observar uma diminuição das áreas dos Clusters.
Dispersão de Valores Previstos x Resíduos:
Novamente, de acordo com a dispersão dos resíduos, não há heterocedasticidade no modelo.
Histograma dos Resíduos:
É possível observar a distribuição normal dos resíduos, indicando também a adaptabilidade do modelo.
Apesar de os modelos anteriores capturarem a relação espacial entre as variáveis, estas seriam modelagens com variações espaciais modeladas de maneira discreta. Há a possibilidade de analisarmos o comportamento de variações espaciais modeladas de maneira contínua, com parâmetros variando no espaço, o que poderia gerar um modelo mais bem adaptado às diferentes regiões e diferentes relações espaciais dos dados. Dessa forma, prosseguiuse o estudo de um modelo Geographically Wheighted Regression (GWR – Regressão Geograficamente Ponderada).
Modelo GWR:
Mapa de representatividade do Modelo GWR:
Os resultados indicaram um modelo ainda mais bem adaptado às nuances geográficas dos dados, isto é, a modelagem contínua permitiu que os parâmetros variassem no espaço, permitindo uma combinação maior e mais precisa entre as variáveis e, assim, indica que o GWR foi o melhor modelo
entre os analisados. Além disso, através do mapa do R² é possível observar que as relações entre as variáveis estudadas encontramse mais fortes na região sudeste especificamente, e também que são mais fortes nas regiões mais próximas ao litoral do que no interior, o que poderia ser um reflexo dos problemas endêmicos relacionados à deficiência histórica do planejamento de infraestrutura destas regiões.
CONCLUSÃO
Podemos observar que há uma relação entre qualidade de vida, desenvolvimento econômico e infraestrutura sanitária, e esta relações pôde ser dimensionada através dos indicadores IDH, PIB Per Capta e população atendida com esgotamento sanitário. Por meio das análises das variáveis, regressões lineares e espaciais, foi possível observar que as relações entre estas variáveis são melhores descritas a partir de sua disposição espacial.
Analisando os mapas das distribuições, podemos concluir que há uma grande segregação entre clusters, especialmente entre as regiões sudeste e nordeste, de modo que a intensidade das relações se mostrou mais forte no sudeste.
Os modelos espaciais ajustaramse mais corretamente à natureza dos dados, mostrandose muito mais eficientes. Como reflexo das diferenças geográficas, sociais e econômicas, foi possível constatar regiões muito mais sensíveis às relações estudadas, indicando que a qualidade de vida pode depender mais de outros fatores nas outras regiões.
REFERÊNCIAS BIBLIOGRÁFICAS
Secretaria Nacional de Saneamento Ambiental, Ministério das Cidades.
<http://www.snis.gov.br/>
Censo 2010, IBGE. <http://censo2010.ibge.gov.br/>
Notas de Aula. Prof. Dra. Flávia F. Feitosa. Métodos e Técnicas de Análise da
Informação para o Planejamento.
“Análise Espacial de Áreas”. Gilberto Câmara, Marilia Sá Carvalho, Oswaldo Gonçalves
Cruz, Virgínia Correa.
GeoDa Center for geospatial analysis and computation. <https://geodacenter.asu.edu/>