4
1 MODELAGEM VIA REGRESSÃO DINÂMICA DO ÍNDICE DE RADIAÇÃO ULTRAVIOLETA DA CIDADE DE SALVADOR- BAHIA. Alexandre Boleira Lopo; Maria Helena Constantino Spyrides; Paulo Sérgio Lucio. Programa de Pós-Graduação em Ciências Climáticas - PPGCC-DFTE-UFRN Caixa Postal 1641, Campus Universitário Lagoa Nova, CEP 59072-970, Natal/RN E-mail: [email protected], [email protected], [email protected] RESUMO: Esta pesquisa aborda o ajuste de Modelos de Regressão Dinâmica ao Índice de Radiação Ultravioleta máximo (IUVmáx) com o objetivo de realizar predição e previsão desta variável a partir de seu comportamento temporal e por meio de variáveis explicativas: Coluna Total de Ozônio, Fluxo de Radiação Solar Descendente, Cobertura Total de Nuvens, Umidade Relativa e Temperatura média do ar. Os dados diários utilizados para análise referem-se à cidade de Salvador-BA e ao período de 2009 à 2010. Os resultados das simulações futuras (previsões) para o ano de 2011, através do modelo ajustado, apresentaram uma forte correlação (R 2 = 0,98) com os valores observados do IUVmáx para aquele ano. 1-INTRODUÇÃO A Radiação Ultravioleta (RUV) é uma pequena parte do espectro solar, na ordem de 8% a 9% da radiação solar total incidente no topo da atmosfera terrestre para comprimentos de onda λ<400mnm e 1,4% para comprimentos de onda λ< 300nm. Entretanto, a RUV é de grande importância na estruturação da atmosfera terrestre e também tem grande ação na biosfera [4]. O Índice de Radiação Ultravioleta (IUV) é um valor inteiro e adimensional e descreve o nível ou intensidade de RUV solar na superfície do planeta em relação ao seu efeito fotobiológico, sendo classificado como baixo (≤ 2), moderado ou médio (3 ≤ ≤ 5), alto (6 ≤ ≤ 7), muito alto (8 ≤ ≤ 10) e extremo (≥ 11). As precauções a serem tomadas pelo indivíduo, de acordo com esta classificação, se referem ao uso de chapéus, roupas, óculos de sol, guarda-chuvas ou até mesmo a permanência dentro de casa [7]. O IUV é um importante veículo para sensibilizar o público para os riscos de exposição excessiva às RUV e para alertar as pessoas sobre a necessidade de adotar medidas de proteção, incentivando-as a reduzir sua exposição ao sol, com a finalidade de evitar queimaduras ou doenças como o câncer de pele [7]. Para a modelagem do IUVmáx escolheu-se o Modelo de Regressão Dinâmica por ser capaz de explicar o fenômeno observado a partir de suas variáveis explicativas ou preditoras e dos valores passados (característica autoregressiva) da variável resposta, ou seja, combinam a dinâmica de séries temporais e o efeito de variáveis explicativas [5] proporcionando a realizações de simulações/previsões. O objetivo desse artigo é ajustar Modelos de Regressão Dinâmica à série temporal da variabilidade do IUVmáx da cidade de Salvador-BA em função das variáveis explicativas e dos valores passados, com a finalidade de realizar predições e previsão (simulação). 2-MATERIAIS E MÉTODOS O método consistiu de três etapas: (1) Imputação dos dados diários de IUV via técnica Preditive Mean Matching (PMM); (2) Ajuste do Modelo Dinâmico Linear polinomial e sazonal; e (3) previsões ou simulações futuras via modelo ajustado. 2.1 DADOS Os dados diários e máximos de IUV em Salvador (5°48’S e 35°12’W) para o período de 2009 à 2011 sendo obtidos no SISAM-CPTEC. Os dados diários de 2011 foram usados para avaliar o modelo ajustado com dados de 2009 à 2010.. 2.2 IMPUTAÇÃO DE DADOS Em função da presença de dados faltantes aplicou-se técnica de imputação múltipla via método da média preditiva ou Preditive Mean Matching [1, 2] presente no aplicativo mice 302 ISSN 2317-3297

MODELAGEM VIA REGRESSÃO DINÂMICA DO ÍNDICE DE … · pelo indivíduo, de acordo com esta classificação, se referem ao uso de chapéus, roupas, óculos de sol, guarda- ... (em

  • Upload
    lethuan

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

1

MODELAGEM VIA REGRESSÃO DINÂMICA DO ÍNDICE DE

RADIAÇÃO ULTRAVIOLETA DA CIDADE DE SALVADOR-

BAHIA.

Alexandre Boleira Lopo; Maria Helena Constantino Spyrides; Paulo Sérgio Lucio.

Programa de Pós-Graduação em Ciências Climáticas - PPGCC-DFTE-UFRN

Caixa Postal 1641, Campus Universitário Lagoa Nova, CEP 59072-970, Natal/RN E-mail: [email protected], [email protected], [email protected]

RESUMO: Esta pesquisa aborda o ajuste de Modelos de Regressão Dinâmica ao Índice de

Radiação Ultravioleta máximo (IUVmáx) com o objetivo de realizar predição e previsão desta

variável a partir de seu comportamento temporal e por meio de variáveis explicativas: Coluna

Total de Ozônio, Fluxo de Radiação Solar Descendente, Cobertura Total de Nuvens, Umidade

Relativa e Temperatura média do ar. Os dados diários utilizados para análise referem-se à

cidade de Salvador-BA e ao período de 2009 à 2010. Os resultados das simulações futuras

(previsões) para o ano de 2011, através do modelo ajustado, apresentaram uma forte correlação

(R2 = 0,98) com os valores observados do IUVmáx para aquele ano.

1-INTRODUÇÃO

A Radiação Ultravioleta (RUV) é uma pequena parte do espectro solar, na ordem de 8% a

9% da radiação solar total incidente no topo da atmosfera terrestre para comprimentos de onda

λ<400mnm e 1,4% para comprimentos de onda λ< 300nm. Entretanto, a RUV é de grande

importância na estruturação da atmosfera terrestre e também tem grande ação na biosfera [4].

O Índice de Radiação Ultravioleta (IUV) é um valor inteiro e adimensional e descreve o

nível ou intensidade de RUV solar na superfície do planeta em relação ao seu efeito

fotobiológico, sendo classificado como baixo (≤ 2), moderado ou médio (3 ≤ 𝐼𝑈𝑉 ≤ 5), alto

(6 ≤ 𝐼𝑈𝑉 ≤ 7), muito alto (8 ≤ 𝐼𝑈𝑉 ≤ 10) e extremo (≥ 11). As precauções a serem tomadas

pelo indivíduo, de acordo com esta classificação, se referem ao uso de chapéus, roupas, óculos

de sol, guarda-chuvas ou até mesmo a permanência dentro de casa [7].

O IUV é um importante veículo para sensibilizar o público para os riscos de exposição

excessiva às RUV e para alertar as pessoas sobre a necessidade de adotar medidas de proteção,

incentivando-as a reduzir sua exposição ao sol, com a finalidade de evitar queimaduras ou

doenças como o câncer de pele [7].

Para a modelagem do IUVmáx escolheu-se o Modelo de Regressão Dinâmica por ser capaz

de explicar o fenômeno observado a partir de suas variáveis explicativas ou preditoras e dos

valores passados (característica autoregressiva) da variável resposta, ou seja, combinam a

dinâmica de séries temporais e o efeito de variáveis explicativas [5] proporcionando a

realizações de simulações/previsões.

O objetivo desse artigo é ajustar Modelos de Regressão Dinâmica à série temporal da

variabilidade do IUVmáx da cidade de Salvador-BA em função das variáveis explicativas e

dos valores passados, com a finalidade de realizar predições e previsão (simulação).

2-MATERIAIS E MÉTODOS

O método consistiu de três etapas: (1) Imputação dos dados diários de IUV via técnica

Preditive Mean Matching (PMM); (2) Ajuste do Modelo Dinâmico Linear polinomial e

sazonal; e (3) previsões ou simulações futuras via modelo ajustado.

2.1 DADOS

Os dados diários e máximos de IUV em Salvador (5°48’S e 35°12’W) para o período de

2009 à 2011 sendo obtidos no SISAM-CPTEC. Os dados diários de 2011 foram usados para

avaliar o modelo ajustado com dados de 2009 à 2010..

2.2 IMPUTAÇÃO DE DADOS

Em função da presença de dados faltantes aplicou-se técnica de imputação múltipla via

método da média preditiva ou Preditive Mean Matching [1, 2] presente no aplicativo mice

302

ISSN 2317-3297

2

(Multivariate Imputation by Chained Equatoins) do software R (disponível em http://www.r-

project.org/).

O PMM parte do princípio que as imputações múltiplas são feitas a partir de uma regressão

linear (Y = α + βX); Y~N(Xβ; Iσ2), em que a variável-resposta Y será a variável a ser imputada.

No PMM os parâmetros são estimados a partir de uma distribuição a posteriori própria [6]. São

calculados os valores preditos para a variável-resposta observada (yob) e variável-resposta

faltante (yf). Para cada yf predito, procura-se a unidade observada com valor predito mais

próximo, e utiliza-se o valor observado como valor a ser imputado. A variabilidade entre

imputações é gerada por meio dos passos que servem para estimar β e σ e que são repetidos m

vezes [2].

2.1-DADOS E ETAPA 1-IMPUTAÇÃO DE DADOS À SÉRIE TEMPORAL DE IUVmáx

Os dados diários de IUVmáx em Salavdor para o período de 2009 a 2010 apresentavam 109

dados ausentes (14,9%). Em função da presença de dados faltantes, aplicou-se técnica de

imputação múltipla via método da média preditiva ou Preditive Mean Matching [2] presente no

aplicativo mice (Multivariate Imputation by Chained Equations) do software R (disponível em

http://www.r-project.org/).

Para o ajuste dos modelos às variáveis explicativas, obteve-se um conjunto de dados mensais

da National Centers for Environmental Prediction/ National Oceanic and Atmospheric

Administration (NCEP/NOAA), disponível em www.esrl.noaa.gov, extraindo-se as variáveis:

Coluna Total de Ozônio (UD), Cobertura Total de Nuvens (%), Umidade Relativa (%), Fluxo de

Radiação Solar Descendente (W/m2) e Temperatura média do ar (ºC) para o período de 2009 à

2010.

2.2-MODELO DE REGRESSÃO DINÂMICA

Os Modelos de Regressão Dinâmica combinam a dinâmica de séries temporais e o efeito de

variáveis explicativas, assim trata-se de um modelo matemático de regressão envolvendo séries

de tempo, que inclui não somente valores atuais da variável em estudo como seus valores

históricos ou passados [5]. Além disso, é possível incluir as variáveis explicativas ou preditoras

da variável resposta ao modelo com ou sem defasagens (em inglês lag) e criar intervalos de

confiança.

Considerando os valores defasados da variável ( 1tY ) e de suas preditoras (Xn, t) ou preditoras

defasadas (Xn,t-k) utiliza-se a seguinte equação para representar um Modelo de Regressão

Dinâmica:

0 1 1 1 1, 1, 1, 1 1, 1 1, 1, 2, 2, 2, 1 2, 1... ...t t t k t t t t t k t k t t t t tY Y Y X X X X X ,

sendo os índices t-i as variáveis e parâmetros com i defasagens. À equação acrescenta-se um

termo estocástico (εt) que representa as variáveis não incluídas no modelo (resíduos), assim

como algumas flutuações normalmente distribuídas e insignificantes para o modelo [5].

A estimação dos parâmetros da equação foi feita utilizando-se o Método dos Mínimos

Quadrados Ordinários [8], supondo que o termo estocástico (εt) tenha as propriedades

adequadas como média zero (E(εt) = 0), homoscedasticidade (Var(εt) = σ²) e erros não

correlacionados (E(εi,εj) = 0, se i > j).

O aplicativo dynlm (Dynamic Linear Models and Time Series Regression) do software R e

de autoria de Zeileis (2011) foi usado para realizar os cálculos e ajustar do modelo.

3-RESULTADOS

3.1-ETAPA 2-AJUSTE DOS MODELOS DE REGRESSÃO DINÂMICA

Ajustaram-se dois modelos diferenciados: Modelo 1 formado apenas pelas variáveis

explicativas escolhidas, sem defasagens; e o modelo 2 incluindo-se o vetor autoregressivo às

variáveis explicativas e defasagens (t-1, t-2, ...) para otimização do ajuste. Os primeiros testes

indicaram a falta de significância da variável Umidade Relativa em ambos os modelos e da

Cobertura Total de Nuvens e Temperatura média do ar no modelo 2, sendo assim essas foram

retiradas das equações apresentadas na tabela 3.1.

303

ISSN 2317-3297

3

A tabela 3.1 apresenta-se a abreviação da variável em língua inglesa como obtido na

NCEP/NOAA e sua defasagem (lag) através do índice subscrito, em que X1 representa o Fluxo

de Radiação Solar Descendente (dswrf)t; X2 a Cobertura Total de Nuvens (tcdc)t; X3 a Coluna

Total de Ozônio (tco3)t; e X4 a Temperatura média do ar (air) t.

Tabela 3.1 Estimação dos coeficientes, erro padrão e p-valor dos modelos.

Variável Resposta

(IUVmáx)

X1

(dswrf) t

X2

(tcdc) t

X3

(tco3)t,

X4

(air) t

interceptot

IUV t-1

Modelo 1 0,008 0,021 0,076 0,692 -30,42 -

p-valor 0,001 0,001 0,001 0,001 0,001 -

Erro Padrão 0,001 0,003 0,004 0,025 1,374 -

Modelo 2 0,001 - 0,003 - -0,697 0,967

p-valor 0,01 - 0,01 - 0,05 0,001

Erro Padrão 0,000 - 0,001 - 0,319 0,008

Fonte: Elaborada pelos autores. Obs: Traço indica ausência

A Figura 3.1 apresenta a variabilidade mensal das observações de IUVmáx e os valores

preditos pelos modelos.

Figura 3.1 – Observações de IUV máximo e os valores preditos pelos dois modelos.

3.2 - ETAPA 3 - COMPARAÇÃO DOS MODELOS E ANÁLISE DOS RESÍDUOS.

Na análise de correlação entre os valores modelados (preditos) e observados, o modelo 1

obteve o coeficiente de determinação R2 = 0,73 e o modelo 2, R

2 = 0,97.

Na análise de resíduos do modelo 2, aquele com o melhor resultado de R2, estes se

mostraram-se hetereocedásticos na análise gráfica e no teste de Breusch-Pagan. A hipótese nula

de homocedásticidade seria aceita se o p-valor do teste fosse maior ou igual a 5 %, no caso foi

de 2,2x10-16

. Os resíduos não se apresentaram normalizados conforme o teste Shapiro-Wilk e a

interpretação gráfica do QQ-Plot.

Figura 3.2 – Análise de resíduos do modelo 2 em relação a variância e normalidade.

Nesse caso em que não houve homocedásticidade existe a possibilidade de modelar a

variância dos resíduos e incluir no modelo, através do modelo ARCH (autoregressive

conditional heteroscedaticity).

Na existência de heterocedásticidade dos resíduos não se pode garantir que a estimação do

modelo é BLUE (Best Linear Unbiased Estimator), entretanto optou-se em realizar previsões

(simulações) com o modelo 2, devido ao resultado encontrado para o R2.

IUV obs e Modelos

Time

IUVm

áx

2002 2004 2006 2008 2010

810

1214

Observações

Modelo 1

Modelo 2

304

ISSN 2317-3297

4

3.3 - ETAPA 4 - PREVISÕES OU SIMULAÇÕES FUTURAS

O modelo 2 foi ajustado com dados diários de 2009 à 2010, assim realizou-se simulações

futuras do IUVmáx para o ano de 2011. Com os dados observados de IUVmáx para o mesmo

período, obtidos no SISAM-CPTEC, foi possível verificar a qualidade da previsão através do

coeficiente de determinação, constatando-se uma forte correlação entre os valores modelados e

observados (R=0,98 e R2= 0,96).

A Figura 3.3 retrata: (a) o comportamento da IUVmáx com o modelo ajustado para 2011

com intervalo de confiança de 95%; (b) a comparação entre os valores observados em 2011 e

simulados pelo modelo 2.

Figura 3.3 – (a) Simulação para 2011 do IUVmáx com intervalo de confiança (95%);

(b) Comparação entre os valores observados em 2011 e simulados pelo modelo 2.

3 - CONSIDERAÇÕES FINAIS

O modelo (nº 2) ajustado ao IUVmáx apresentou os melhores resultados com R2= 0,97 para

os valores modelados (preditos) e observados do período de 2009 à 2010, sendo sua equação

definida por: IUVmáx =0,001X1 + 0,003X3 + 0,967IUVt-1 - 0,697 + et , em que et é o resíduo,

entretanto houve o fato limitante na modelagem devido a heterocedáscidade e não normalidade

dos resíduos. Apesar desta limitação, o modelo ao simular a variabilidade futura de IUVmáx

para o ano de 2011 apresentou uma forte correlação (R2 = 0,98) com as observações de IUVmáx

daquele ano.

5-AGRADECIMENTOS

Alexandre B. Lopo agradece ao apoio do IFBA e da Universidade do Estado da Bahia. P. S.

Lucio agradece ao apoio do CNPq (Proc: 309165/2010-5).

6-REFERÊNCIAS BIBLIOGRÁFICAS

[1] BROWN, R.L., J. DURBIN, AND J.M. EVANS (1975) “Techniques for Testing the

Constancy of Regression Relationships Over Time,” Journal of the Royal Statistical Society,

Series B, 37, 149–192.

[2] BUUREN .V, S., OUDSHOORN , K.G. mice: Multivariate Imputation by Chained

Equations in R. Journal of Statistical Software, 45(3), 1-67, 2011.

[3] HARRELL Jr. FE. Regression modeling strategies: with applications to linear models,

logistic regression and survival analysis. New York: Springer-Verlag; 2001

[4] MADRONICH, S. UV radiation in the natural and perturbed atmosphere. Tevini, M.

ed., in UV-B Radiation and Ozone Depletion Lewis Publisher, 1993.

[5] PANKRATZ, A. Forecasting with dynamic regression models. John Wiley and Sons, New

York, 1991.

[6] RUBIN, D.B. Multiple imputation for Nonresponse in Surveys. New York: Wiley, 1987.

[7] WHO (2002) Global Solar UV Index: A Practical Guide. World Health Organisation,

World Meteorological Organisation (WMO), United Nations Environment Program (UNEP),

and International Commission on Non-Ionising Radiation Protection (ICNRP), Geneva, 18 p,

2002.

[8] ZEILEIS, A. dynlm: Dynamic Linear Regression.R package version 0.3-

1(2011).Disponível em:<http://CRAN.R-project.org/package=dynlm>Acesso em: 10 maio

2012.

305

ISSN 2317-3297