Transcript
Page 1: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

Modelo Econométrico para Previsão da Incidência de Dengue no Município do Rio de Janeiro

Marcelo Rubens dos Santos do AmaralDepartamento de Estatística – IME-UERJ

Rua São Francisco Xavier, 524 – Pavilhão Reitor João Lyra Filho – 6º andar – [email protected]

Aline Pereira VaughonGraduanda em Estatística – IME-UERJ

[email protected]

Karine Silva DuarteGraduanda em Estatística – IME-UERJ

[email protected]

RESUMO

Tendo como objetivo apresentar um modelo estatístico que auxilie na previsão de epidemias graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este artigo apresenta um modelo econométrico estimado a partir de séries de dados mensais da incidência de dengue e de variáveis climáticas como índice pluviométrico e temperatura média. A série de incidência de dengue foi modelada através de sua transformação logarítmica, em uma formulação log-linear com sazonalidade modelada através de variáveis dummy. O modelo final contemplou resíduos com estrutura ARMA e variância heterocedástica através de um modelo GARCH. A variável temperatura não apresentou significância estatística e o modelo revelou um coeficiente com sinal negativo para o índice pluviométrico. Conjectura-se que os anos com regimes de chuvas menos intensos criaram condições favoráveis para um ciclo de vida mais prolífero do vetor da doença, o Aedes Aegypti.

PALAVRAS CHAVE. Epidemiologia. Dengue. Econometria de Séries Temporais. Área de classificação principal: AS – Aplicações à Saúde

ABSTRACT

In order to present a statistical model that aids in forecasting serious dengue fever epidemics such as that ones which fell on the Rio de Janeiro city in the years of 2002 and 2008, this article presents an econometrical model which was estimated with basis in time series of monthly dengue incidence data and of climatic variables as pluviometrical index and medium temperature. The series of dengue incidence was modeled upon its logarithmic transformation, through a log-linear formulation with seasonal component modeled by dummy variables. The final model has contemplated residual with ARMA structure and heteroskedastic variance by a GARCH model. The variable temperature hasn't presented statistical significance and the model has revealed a coefficient with negative sign for the pluviometrical index. It is conjectured that the years with less intense regimes of rains has created favorable conditions to a cycle of life more proliferous for the vector of the disease, the Aedes Aegypti mosquito.

KEYWORDS. Epidemiology. Dengue Fever. Time Series Econometrics. Main area: Applications to Health.

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1435

Page 2: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

1. Introdução

No final do século XX, o mundo se viu diante do ressurgimento de muitas doenças infecciosas, sendo a dengue uma das mais importantes em termos de morbidez e mortalidade, constituindo-se em sério problema de saúde pública. O Ministério da Saúde (MS) realiza anualmente ações de combate à Dengue em parceria com as Secretarias Estaduais e Municipais de Saúde e a população com o intuito de evitar epidemias da doença e, ao mesmo tempo, garantir uma assistência adequada aos pacientes na rede do Sistema Único de Saúde (SUS).

O Brasil apresenta condições climáticas extremamente favoráveis ao desenvolvimento do vetor (temperatura e umidade) e de acordo com o MS a dengue está relacionada ao saneamento doméstico. Cerca de 90% dos focos do mosquito encontram-se nas residências, com isso o Aedes Aegypti se tornou o principal personagem das maiores campanhas de saúde pública realizadas no país, possuindo uma crescente proliferação devido a uma urbanização desenfreada que acarreta em diversas mudanças sociais e ambientais além de falhas na vigilância epidemiológica.

A capacidade de resistência dos ovos à dessecação é um sério obstáculo para sua erradicação. Esta condição permite que os ovos sejam transportados a grandes distâncias durante até um ano, em recipientes secos, tornando-se assim o principal meio de dispersão do inseto (dispersão passiva). Outro problema é a existência de quatro tipos de vírus, que dificulta a criação de uma vacina eficaz que contenha todos os tipos em proporções adequadas.

Os problemas de saúde pública e o impacto da doença nas regiões tropicais e subtropicais é muito grande. A dengue é reconhecida em vários países e 2,5 bilhões de pessoas vivem em áreas de risco. A Organização Mundial da Saúde (OMS) estima que ocorram, anualmente, 50 – 100 milhões de casos de Dengue Clássica e centenas de milhares de Dengue Hemorrágica, em todos os continentes, exceto a Europa. Cerca de 550 mil doentes necessitam de hospitalização e 20 mil morrem em conseqüência da dengue.

Este estudo apresenta uma inovação metodológica ao modelo desenvolvido em Vaughon e Duarte (2009), pois não modela a componente cíclica na expectativa de que a mesma seja captada de forma mais dinâmica através da estrutura ARMA dos resíduos. Ademais, no lugar do método de Mínimos Quadrados Generalizado da referida obra, o método de estimação usado aqui foi o de Mínimos Quadrados Não-Linear, o qual será explicado mais detalhadamente na segunda seção. Pretende-se com estas modificações simplificar o processo de estimação, assim como melhorar a identificação da componente cíclica, a qual foi modelada em Op. cit. (2009) através de uma formulação harmônica rígida que não conseguiu alcançar os picos de incidência nos anos epidêmicos. Este fato se refletiu na aderência insatisfatória aos dados de incidência de dengue pelo modelo apresentado na referida obra.

Em estudo realizado na cidade litorânea de São Sebastião-SP, Ribeiro et al., (2006) observam que:

“A associação entre o número de casos de dengue e fatores abióticos identificou o intervalo de tempo em que a chuva e a temperatura contribuíram na geração de novos casos. Tais aspectos, associados à vulnerabilidade turística da região litorânea, propiciaram condições para ocorrência da doença.”.

Sendo a cidade do Rio de Janeiro também um pólo turístico litorâneo, por essas semelhanças com a cidade de São Sebastião, o objetivo desde trabalho é verificar se a associação entre os índices pluviométricos e as temperaturas do ar no aumento dos casos de dengue no município do Rio de Janeiro e estabelecer um modelo preditivo que possibilite prever o risco de epidemias.

Nesta introdução apresentamos a motivação e os objetivos deste artigo. Na segunda seção apresenta-se o aparato metodológico que foi usado no desenvolvimento do modelo pretendido. Na terceira seção discutimos os resultados, analisando-os. Na quarta seção apresentamos as conclusões pertinentes, seguidas das referências bibliográficas na última seção.

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1436

Page 3: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

2. Metodologia

Nesta seção abordaremos aspectos e técnicas metodológicas que nortearam o nosso desenvolvimento de um modelo de previsão para a incidência de dengue. A ordem expositiva não tem necessariamente um compromisso histórico, mas principalmente funcional e didático desenvolvendo alguns tópicos de uma área científica constituída por um amálgama multidisciplinar que se convenciona chamar de Econometria de Séries Temporais.

2.1. Séries TemporaisA seqüência expositiva e os conteúdos desta subseção seguem muito proximamente aquela

contida em Vaughon e Duarte (2009). Uma série temporal é qualquer conjunto de observações ordenadas no tempo. Dentre os

vários exemplos que podem ser citados, ilustramos aqui as próprias séries temporais que foram usadas no desenvolvimento do nosso modelo: incidência mensal de dengue, valores mensais de temperatura média e dos índices pluviométricos, todos na cidade do Rio de Janeiro.

Como principal objetivo da análise de séries temporais, podemos citar a investigação do mecanismo gerador, em geral uma função do tempo e/ou de observações antigas da série temporal, com o alvo de fazer previsões de valores futuros da série. A percepção que serve de base à elaboração dos modelos é que as observações antigas da série histórica possuem informações que podem ser utilizadas para estimar o comportamento futuro, dessa forma, o objetivo da modelagem passa a ser quais informações queremos extrair do passado e como podemos medi-las para utilizá-las na previsão futura.

Modelos probabilísticos ou estocásticos podem ser criados no domínio do tempo. Em geral, estes modelos devem ser simples e parcimoniosos no sentido que o número de parâmetros deve ser o menor possível. Sob este julgamento, uma série temporal deve ser entendida como uma particular realização de um processo estocástico, definido como um processo que evolui no tempo de forma aleatória e com leis de probabilidade conhecidas.

2.1.1. Modelos de Decomposição em Componentes Não ObserváveisEsses modelos fazem uso da decomposição de uma série temporal em suas componentes não

observáveis de tendência, sazonalidade, ciclo e irregular (ou aleatória). A decomposição clássica de uma série temporal nessas componentes foi basicamente a única alternativa disponível para a análise de séries temporais até o início dos anos 60 e utilizava meios aritméticos para extrair estimadores sucessivos desses componentes (Souza (1985), p.9). A formulação aditiva para estes modelos assume a seguinte forma:

ttttty ε+χ+γ+µ=Onde,yt – representa a série temporal qua se deseja modelar avaliada no instante t de tempo;µt – representa a componente de tendência no instante t de tempo;γt – representa a componente sazonal no instante t de tempo;χt – representa a componente cíclica no instante t de tempo;εt – também conhecida como componente irregular, representa o ruído ou erro da observação

no instante t de tempo, geralmente suposto como uma seqüência independente com distribuição gaussiana (normal) de média nula e variância constante.

2.1.1.1. TendênciaA componente de tendência é a componente não observável sobre a qual supõe-se mudar

pouco ao longo do tempo, ou seja, fornece uma indicação mais clara sobre os movimentos de longo prazo da série. Tradicionalmente são utilizadas funções (do tempo), exponenciais, logísticas, de Gompertz e ajuste de polinômios através da regressão via Mínimos Quadrados Ordinários (MQO) para modelar a parte determinística da tendência.

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1437

Page 4: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

2.1.1.2. SazonalidadeA componente sazonal é a componente não observável que está associada a um instante

específico do tempo repetindo-se em intervalos eqüidistantes e regulares de ano para ano. Os intervalos mais comuns de repetição são o semanal (cada ano tem em torno de 52 semanas), o mensal (cada ano tem 12 meses) e o trimestral (cada ano tem 4 trimestres). Fatores como variações climáticas, safra e entre-safra, além de fatores de ordem cultural ou social costumam determinar o padrão sazonal de séries históricas. As variáveis climáticas utilizadas neste estudo têm comportamentos obviamente sazonais. As temperaturas médias, por exemplo, são mais elevadas nos meses de verão, mais baixas nos meses de inverno e apresentam valores intermediários nos meses de primavera e outono. A incidência de dengue também apresenta um padrão sazonal, o qual suspeitamos estar associado ao padrão climático representado pelas variáveis que selecionamos, suspeita essa já confirmada em alguns estudos tal como o de Ribeiro et al., (2006). Para modelar essa componente via equação de regressão linear supondo-se uma série de tempo mensal definem-se as variáveis artificiais denominadas Dummies:

== contrário caso 0,

1,2,...,12j j, mês ao ecorrespond t tempode índice o se 1,D t,j

Neste caso a formulação matemática linear determinística para a componente sazonal seria:

∑=

β=µ12

1jt,jjt D , onde βj, é o coeficiente sazonal do mês j (2.1)

Deve-se tomar um cuidado especial ao ajustar as componentes sazonais em um modelo de regressão linear quando em presença de um intercepto β0. Já que haveria problema de colinearidade perfeita na matriz de dados que iria tornar-se não inversível e, portanto inviabilizaria a estimação pelo método de mínimos quadrados ordinários. Neste caso, o problema seria resolvido se retirássemos uma variável dummy do modelo, por exemplo, D12,t.

Existem procedimentos trabalhosos para contornar um problema analítico que surge quando se exclui arbitrariamente uma variável dummy sazonal do modelo, tal como aquele descrito em Wonnacott & Wonnacott (1990), porém o método mais elegante e simples é o descrito em Morettin & Toloi (1987) que consiste em redefinir as variáveis dummies sazonais através da seguinte fórmula:

==

= contrário caso 0,

12j mês ao ecorrespond t tempode índice o se 1,-1,2,...,11j j, mês ao ecorrespond t tempode índice o se 1,

D*t,j , para j=1, 2, ..., 11 (2.2)

Uma restrição comum – chamada de restrição de normalização – para a componente sazonal é que a soma dos desvios sazonais βj dentro de um período sazonal completo totalize zero. Essa restrição permite uma interpretação dessa componente como desvios significantes em relação a média (ou nível da série), já que a soma dos desvios em relação à média é sempre nula. Uma das vantagens da engenhosa solução de Morettin & Toloi (1987) é que usando-se os 11 *

t,jD no contexto da estimação dos parâmetros βj por MQO, tem-se que:

*22

ˆˆ β=β ; *33

ˆˆ β=β ; ... ; *1111

ˆˆ β=β e *11

*2

*112

ˆ....ˆˆˆ β−−β−β−=βonde,

*mêsβ̂ , mês = jan (1),...,nov (11) são os estimadores dos parâmetros da componente sazonal

análoga à (2.1) sem a 12a. parcela e trocando-se os t,jD pelos *t,jD ; e

mêsβ̂ , mês = jan (1),...,dez (12) são os estimadores respectivamente de β1, β2, ..., β12 da

equação (2.1), que atendem a restrição de normalização 0ˆdez

janii =β∑

=.

Apesar de não estarmos usando um processo de estimação baseado em MQO, mantivemos a definição das dummies sazonais de (2.2) no processo de estimação por Mínimos Quadrados Não-Lineares.

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1438

Page 5: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

2.1.1.3. Componente CíclicaEssa componente não observável representa um movimento transitório e estacionário na série

histórica. Tal movimento é do tipo ondulatório, com amplitude e freqüência podendo variar no tempo.

A presença dessa componente é muito comum em séries macroeconômicas. Os ciclos econômicos são caracterizados por quatro fases recorrentes: prosperidade, recessão, depressão e recuperação.

Uma forma para a inclusão dessa componente é incluí-la na expressão da componente de tendência.

A formulação dessa componente, tal como na formulação de sazonalidade por harmônicas, também utiliza funções trigonométricas da seguinte forma:

)]t.(sen.)t.cos(.[ cct γ+λβ+γ+λα=ψ (2.3)onde,λc é a freqüência em radianos;α e β são os coeficientes associados a essa harmônica.Esta componente está aparentemente presente na evolução dos dados de incidência de dengue

e será ilustrada graficamente na seção de desenvolvimento, isto apesar do nosso descontentamento com a sua estimação através da formulação (2.3), o que nos motivou a trocar a abordagem metodológica contida em Vaughon e Duarte (2009) pela a atual.

Figura 1: Exemplo de série temporal com algumas componentes não observáveis

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1439

Page 6: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

2.1.2. Modelos ARMA de Box & JenkinsEsta subseção segue muito proximamente a seção equivalente do capítulo 4 de

Amaral (1996).A publicação do livro de Box & Jenkins (1970) é considerada um marco na área de

modelagem e previsão de séries temporais. O principal objetivo desta técnica é a identificação e estimação do sistema que está implícito na formação dos dados das séries históricas. Por suas características, esse sistema pode ser identificado, nas séries estacionárias, com o auxílio das funções de autocorrelação e correlação cruzada dos dados (correlograma), utilizando-se o princípio da parcimônia - com o menor número de parâmetros possíveis -, e através de um ciclo iterativo envolvendo a identificação, a estimação e os testes de diagnóstico para que o modelo possa ser utilizado para previsão.

A escolha do modelo é feita a partir de uma ampla classe de modelos, e a identificação requer uma análise detalhada dos dados, em um processo onde “torturam-se os dados até eles confessarem”. Na execução dessa “tortura” exploram-se resultados e conceitos da Teoria Geral de Sistemas Lineares da Engenharia de Controle, como também de Processos Estocásticos da Estatística. A teoria básica de Box & Jenkins trabalha com uma classe de processos estocásticos (processos que evoluem no tempo ou espaço de acordo com leis probabilísticas) denominados estacionários. Os processos estocásticos estacionários caracterizam-se por uma estrutura probabilística que não se altera com o tempo ou espaço, como conseqüência esses processos apresentam média e variâncias constantes.

A teoria de Box & Jenkins restringe-se também aos processos que são obtidos pela passagem de um processo ruído branco (com média nula, variância constante e observações mutuamente independentes) por um filtro linear conforme a seguinte expressão:

y t k t kk

= −=

∑ ψ ε0

= ψ(b)ε t = (1+ψ 1b+ψ 2b 2+ψ 3b 3+... )ε t (2.4)

onde,b é o operador de atraso simples: b ky t=y t - k;Yt é a observação no instante t do processo estocástico estacionário;εt é a observação da seqüência infinita de ruído branco no instante t;ψt é o coeficiente ou peso do ruído no instante t.

A expressão (2.4) é conhecida como decomposição de Wold, e apresenta como característica uma estrutura de dependência no tempo. Na prática, todas as metodologias de séries temporais procuram identificar algum tipo de estrutura de dependência temporal para modelagem e previsão.

Figura 2: Fluxo teórico de modelagem de Box & Jenkins

Sistema Linear com memória

infinita

FILTRO ε t yt

Ruído Branco Série Estacionária

Na modelagem proposta por Box & Jenkins o conjunto infinito (ψ) de pesos ψt que definem o filtro linear pode ser aproximado pela seguinte razão entre polinômios funcionais:

ψ(b)=θ(b)/φ(b) (2.5)onde,φ(b)=(1-φ 1b-φ 2b 2-. . . -φ pb p) ;θ(b)=(1-θ 1b-θ 2b 2-. . . -θ qb q) .

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1440

Page 7: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

Desta forma, através das expressões (2.4) e (2.5) podemos chegar à expressão dos conhecidos modelos ARMA(p,q):

φ(b)y t=θ(b)ε t

Para identificar os parâmetros φ‘s e θ‘s é necessário impor restrições sobre eles de forma que o filtro linear apresente estabilidade, isto é, a série de saída (yt) seja realmente estacionária, já que o processo de entrada (εt) é estacionário. Esse processo é também auxiliado pela utilização das funções de autocorrelação e correlação cruzada dos dados (através do correlograma).

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1441

Page 8: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

2.2. Econometria de Séries TemporaisEsta subseção está fortemente inspirada em seções contidas em Castro et al. (2007).Econometria consiste na aplicação de métodos estatísticos e matemáticos na análise de dados

econômicos com o propósito de dar conteúdo empírico a teorias econômicas e confirmá-las ou refutá–las (Maddala (2003)).

Essa ciência possui os seguintes objetivos:● A formulação de modelos econométricos, isto é, a formulação de modelos econômicos em

uma forma empiricamente testável. Em geral, há várias maneiras de formular o modelo econométrico a partir de um modelo econômico, uma vez que temos que escolher a forma funcional, a especificação da estrutura estocástica das variáveis e assim por diante. Esta parte constitui a especificação do trabalho econométrico.

● A estimação e o teste desses modelos com dados observados (inferência do trabalho econométrico).

● O uso desses modelos para previsões e propósitos de política econômica.Como evidência do sucesso de um teste de uma teoria econômica, um dos objetivos citados

acima, é costume relatar que os sinais dos coeficientes estimados no modelo econométrico estão corretos. Esta abordagem pode ser denominada de abordagem de confirmação da teoria econômica. O problema desta abordagem, de acordo com Mark Blaug, é que (Apud Maddala (2003)):

“Em muitas áreas da economia, diferentes estudos econométricos chegam a conclusões conflitantes e, com base nos dados disponíveis, frequentemente não há método eficiente para decidir qual conclusão é correta. Em conseqüência, às vezes, pressupostos contraditórios continuam a coexistir por décadas ou mais.”

Na aplicação elaborada para se alcançar o modelo deste artigo, poderíamos aproveitar o arcabouço conceitual desta subseção trocando-se os termos associados à ciência econômica por termos equivalentes de epidemiologia, através de um tipo epidemiometria, afinal estamos interessados em modelar uma variável de interesse da epidemiologia como o é a incidência de dengue, não sendo, portanto, um objeto típico de interesse da ciência econômica. Contudo mantivemos o termo econometria pela sua tradição na literatura.

Um modo mais válido de testar uma teoria econômica é verificar se ela é capaz de formular previsões melhores do que as teorias alternativas sugeriam anteriormente. Assim, torna-se necessário comparar um dado modelo com os anteriores. Esta abordagem de avaliação de teorias alternativas tem recebido maior atenção nos últimos anos, dando ensejo à incorporação de métodos e técnicas de séries temporais como a teoria de Box&Jenkins entre muitas outras ao escopo da econometria, o que explica o título desta subseção.

A modelagem econométrica tradicional pode ser considerada uma abordagem apropriada para análise de dados sócio-econômicos ou macroeconômicos aplicados a dados de corte ou comumente conhecidos como cross-section, pois a mesma se aplica às informações quantitativas observadas e coletadas num mesmo intervalo de tempo. Porém, quando o objetivo é a análise de características mensuradas, coletadas e registradas periodicamente ao longo do tempo, a introdução da dimensão de evolução temporal produz vários complicadores na modelagem matemática e estatística da abordagem tradicional. Neste contexto, a modelagem econométrica correta é a que ficou conhecida ao longo das últimas três décadas como econometria de séries temporais.

Dentre as complicações que a dimensão temporal pode produzir à análise de um modelo de regressão clássico da econometria, encontram-se: a) a possibilidade de resíduos com estrutura ARMA; b) a possibilidade de variância com heterocedasticidade condicional auto-regressiva, tal como a de um modelo GARCH de Bollerslev (1986); e, c) a possibilidade de regressões espúrias (Granger & Newbold (1974)) na regressão entre duas ou mais séries temporais não-estacionárias. Dentre estas complicações, as que se mostraram presentes no desenvolvimento do modelo atual foram as duas primeiras, isto porque as séries temporais que usamos são todas estacionárias, seja por razões teóricas, assim como analíticas através de uma avaliação gráfica, o que nos isenta da formalidade de realização de testes específicos.

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1442

Page 9: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

O tratamento inadequado das duas primeiras complicações poderia nos levar a um modelo tendencioso e ineficiente. A abordagem corretiva que escolhemos foi norteada pela a análise de instrumentos apropriados para diagnósticos da presença de estrutura ARMA, seja dos resíduos como também deles elevados ao quadrado para a identificação de variância condicionalmente heterocedástica. Dentre os instrumentos encontram-se testes de hipóteses como o de Durbin-Watson (Durbin e Watson (1951)) e a análise dos correlogramas dos resíduos e dos mesmos ao quadrado.

2.2.1. Modelos GARCHTrata-se de uma opção de modelagem desenvolvida por Bollesrlev (1986) que se propõe a

corrigir a estrutura heterocedástica (ou seja, de variancia oscilante) condicional e auto-regressiva no domínio do tempo. Dentre as razões que se pode querer modelar e volatilidade (ou variância) citamos duas: a) intervalos de confiança da previsão podem variar com o tempo, de forma que intervalos mais precisos podem ser obtidos modelando a variância dos erros; b) podem ser obtidos estimadores mais eficientes se a heterocedasticidade nos resíduos é controlada corretamente.

A equação que rege a variância dos resíduos εt ao longo do tempo, dada por um modelo do tipo GARCH(1,1) é:

21t

21t

2t −− β σ+α ε+ω=σ

Os parâmetros deste modelo são estimados pelo método da máxima verossimilhança sob a suposição de que os resíduos têm distribuição de probabilidade condicionalmente gaussiana.

2.3. Equação geral do modelo desenvolvidoA expressão geral do modelo que desenvolvemos tem a seguinte forma log-linear:

tt13t12

11

1j

*t,jj0t uTCD)yln( +β+β+β+β= ∑

=(2.6)

onde, Ct – representa as médias móveis de tam. 12 do índice pluviométrico no instante de tempo t;Tt – representa a temperatura média no instante de tempo t;ut tem uma estrutura ARMA φ(b)u t=θ(b)ε t ;

),0(Normal~ 2tt σε ; e )1,1(GARCH~2

tσ ; Os parâmetros βj , j=1,…,13 foram estimados por Mínimos Quadrados Não-Lineares, para o

qual uma discussão adicional pode ser obtida em Pindyck e Rubinfeld (1991, pp. 231-245) ou Davidson e MacKinnon (1993)

3. Resultados

3.1. Análise Exploratória dos DadosDo total de 332.312 casos de dengue ocorridos no Município do Rio de Janeiro (MRJ), no

período compreendido entre janeiro de 2000 e junho de 2008, 261.031 (78,55%) dos casos foram notificados nos anos epidêmicos 2002 e 2008, conforme é observado na figura 3. Nota-se também que a série histórica é estacionária.

Figura 3: Gráfico da evolução da incidência de dengue no MRJ

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1443

Page 10: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

-

10 000

20 000

30 000

40 000

50 000

60 000

jan/00

jul/00jan/0

1jul/0

1jan/0

2jul/0

2jan/0

3jul/0

3jan/0

4jul/0

4jan/0

5jul/0

5jan/0

6jul/0

6jan/0

7jul/0

7jan/0

8jul/0

8

Fonte: Informação Epidemiológica: S / SUBASS / SVS / GERÊNCIA DE VIGILÂNCIA EPIDEMIOLÓGICA - SMS/RJ

Figura 4: Gráfico da evolução do logaritmo da incidência de dengue no MRJ

-0,501,001,502,002,503,003,504,004,505,00

jan/00

jul/00jan/0

1jul/0

1jan/0

2jul/0

2jan/0

3jul/0

3jan/0

4jul/0

4jan/0

5jul/0

5jan/0

6jul/0

6jan/0

7jul/0

7jan/0

8jul/0

8

log10 dengue harmônica+média

Fonte: Informação Epidemiológica: S/ SUBASS/ SVS / GERÊNCIA DE VIGILÂNCIA EPIDEMIOLÓGICA - SMS/RJ

Na figura 4, após a transformação logarítmica, é possível notar com maior nitidez o comportamento sazonal dos casos de dengue. A curva em forma senoidal corresponde à harmônica (2.3) estimada em Vaughon e Duarte (2009) para modelar a componente cíclica.

Figura 5: Gráfico da evolução dos índices pluviométricos e das temperaturas médias no MRJ

-

50,00

100,00

150,00

200,00

250,00

300,00

350,00

jan/00

jul/00

jan/01

jul/01

jan/02

jul/02

jan/03

jul/03

jan/04

jul/04

jan/05

jul/05

jan/06

jul/06

jan/07

jul/07

jan/08

Índi

ce p

luvi

omét

rico

-

5,00

10,00

15,00

20,00

25,00

30,00

35,00

Tem

pera

tura

Méd

ia

C huv aT em pe ra t u ra12 po r. M éd. M ó v . (C huv a)

As médias dos Índices Pluviométricos (precipitação) por estação de coleta são dados do Alerta Rio – Prefeitura do Rio de Janeiro. Foi realizada uma associação dos bairros com as

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1444

Page 11: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

estações pluviométricas. Os índices foram ponderados pela densidade populacional bruta dos bairros. Os dados da temperatura média do ar não estavam disponíveis em apenas uma fonte para todo o período do presente trabalho, por isso foi necessário pesquisá-los em dois lugares: no Armazém de Dados – Prefeitura do Rio do período compreendido entre janeiro de 2000 a dezembro de 2003 e no INMET de janeiro de 2004 a junho de 2008. Observando que os dados do Armazém teve como fonte o INMET.

A figura 5 deixa claro o comportamento estacionário e sazonal das variáveis climáticas usadas como explicativas para o nosso modelo.

O quadro resumo contendo as estimativas dos parâmetros do modelo, obtidas através do software E-views foi:

Parâmetro Coeficiente estimado Erro padrão Estatística t P-valorβ 0 9,4400 2,7373 3,4486 0,0006β 1 0,8208 0,3187 2,5758 0,0100β 2 1,3475 0,3698 3,6441 0,0003β 3 1,6706 0,4021 4,1550 0,0000β 4 1,3434 0,3429 3,9173 0,0001β 5 0,7322 0,2312 3,1670 0,0015β 7 -0,7764 0,4182 -1,8566 0,0634β 8 -1,1850 0,5340 -2,2189 0,0265β 9 -1,6914 0,4706 -3,5941 0,0003

β 10 -1,3393 0,4057 -3,3011 0,0010β 11 -0,6863 0,3729 -1,8405 0,0657β 12 -0,0230 0,0067 -3,4101 0,0006φ 1 0,7256 0,0810 8,9563 0,0000φ 8 0,2035 0,0682 2,9832 0,0029θ 1 0,6799 0,1077 6,3105 0,0000θ 2 0,2967 0,0888 3,3403 0,0008ω 0,5680 0,1503 3,7780 0,0002α -0,1811 0,0665 -2,7210 0,0065β -0,6610 0,2663 -2,4821 0,0131

R-squared 0,9347 Mean dependent var 5,7730Adjusted R-squared 0,9164 S.D. dependent var 2,2059S.E. of regression 0,6378 Akaike info criterion 1,9867Sum squared resid 26,0368 Schwarz criterion 2,5404Log likelihood -63,4467 F-statistic 50,9337Durbin-Watson stat 2,0325 Prob(F-statistic) 0,0000

Os parâmetros de (2.6) ausentes no quadro acima indicam a ausência de significância estatística ao nível de 10% de probabilidade. Os resíduos deste modelo passaram nos principais testes de especificação aleatória e de normalidade (distribuição gaussiana).

4. Conclusões

A relevância do modelo estimado pode ser depreendida da gravidade das epidemias de dengue no Brasil relatada no quadro reproduzido abaixo contido em Câmara et al. (2007):

“No período da última grande epidemia de 2001-2003, foram notificados 1.564.112 casos de dengue no país, sendo 4.123 na forma hemorrágica, com 217 óbitos (SVS (2006)). Se considerarmos que estas notificações representam apenas cerca de 15% do total notificado (Lima et al. (1999)) é possível que o numero de casos tenha sido da ordem de 10 milhões. Além disso, se considerarmos ainda que grande parte das infecções pelo vírus da dengue é assintomática (Teixeira et al, .(2002)), o número real de casos pode ter sido superior a 40 milhões, cerca de 20% da população do país. É, pois, de considerável relevância combater esta doença em nosso meio.”

Este modelo obteve uma aderência aos dados muito boa, especialmente se comparado com o modelo anteriormente obtido em Vaughon e Duarte (2009), afinal o mesmo obteve um R2=93,47% no lugar de R2=65% na referida publicação.

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1445

Page 12: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

Na nossa avaliação este resultado se deve, principalmente, pelas escolhas metodológicas de substituir o método de estimação por Mínimos Quadrados Generalizados baseado em estimações por MQO pelo Método de Mínimos Quadrados Não-Linear, o que permite captar estruturas ARMA no lugar de estruturas meramente auto-regressivas (AR). Com o novo aparato metodológico a variável chuva passou a ser significativa para a previsão dos casos de dengue.

Por outro lado abandonamos a estimativa da componente cíclica, a qual percebe-se através da figura 4 que não consegue captar os picos epidêmicos da dengue. A contar pela melhora no grau de aderência do modelo, esta componente foi captada pela variável chuva, sabidamente cíclica, e também pela estrutura ARMA dos resíduos.

O fato de a variável temperatura não ser estatisticamente significativa não foi surpresa, na medida em que o ano todo as temperaturas na cidade do Rio de Janeiro estão dentro das faixas ideais para a eclosão dos ovos do mosquito transmissor. O resultado que mais nos surpreendeu foi a relação com sinal negativo para a variável chuva, o que contrariou nossa expectativa inicial na medida em que esperávamos que com o aumento das chuvas houvesse aumento nos casos de dengue, o que se traduziria em um coeficiente com sinal positivo.

O que podemos conjecturar quanto a este fato é que no verão o regime de chuvas já é naturalmente superior por razões sazonais óbvias, porém a variável chuva entrou no modelo sazonalmente ajustada através das médias móveis, portanto, o que realmente importou para o modelo não foi o seu comportamento sazonal, mas sim o da sua tendência. Olhando atentamente para o comportamento das médias móveis do índice pluviométrico na figura 5, percebe-se que nos anos epidêmicos este nível de chuvas foi relativamente menos intenso, conferindo credibilidade analítica para o sinal negativo do referido coeficiente. A título de exemplo, o ano de 2001 foi um ano no qual, a nível nacional, o regime de chuvas foi reconhecidamente abaixo da média, o que, inclusive, precipitou a crise energética naquele ano, ao passo que no verão seguinte o país experimentou a maior epidemia de dengue de acordo com os registros que se tem.

A avaliação que temos a partir dos resultados do modelo aqui desenvolvido é que os regimes de chuvas mais intensos para os meses de verão na cidade do Rio de Janeiro devem implicar em condições adversas para os ovos e as larvas do mosquito transmissor que devem se perder nas redes dos sistemas de escoamentos pluviais e fluviais, os quais desembocam no mar. Portanto, as avaliações aqui contidas apontam para a conclusão de que as entidades públicas interessadas do combate e controle das epidemias de dengue na cidade devem ficar mais atentas é nos anos de regimes de chuvas com intensidade relativamente inferior, conforme indicado em avaliações e prognósticos meteorológicos.

5. Referências Bibliográficas.

Amaral, M. R. S. Modelos em Espaço de Estado: Formulação Multivariada Aplicada à Previsão de Carga Elétrica. Dissertação de Mestrado, DEE, PUC-RJ. 1996.

Amaral, M. R. S.; Lima, J. W. M.. O Racionamento e a Racionalização do Consumo de Energia Elétrica Residencial após a Crise de 2001 no Brasil: Uma Aplicação da Abordagem de Cointegração, Simpósio Brasileiro de Pesquisa Operacional, CD-ROM do XXXVIII-SBPO, v. 38, p. 563-574, 2006

Bollerslev, T. (1986), Generalised Autorregressive Conditional Heteroskedasticy, Journal of Econometrics, 31, 307-327.

Box, G. E. P., Jenkins, G. M. (1970), Time Series Analysis, Forecasting and Control, San Francisco: Holden-Day, Inc. [and (1976) revised edition].

Câmara, F. P., Theophilo, R. L. G., dos Santos, G. T., Pereira, S. R. F. G., Câmara, D. C. P., de Matos, R. R. C., (2007), Estudo Retrospectivo (Histórico) da Dengue no Brasil:

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1446

Page 13: Preenchimento do Formulário de Submissão de Trabalho Completo · graves de dengue tais como aquelas que se abateram sobre a cidade do Rio de Janeiro nos anos de 2002 e 2008, este

Características Regionais e Dinâmicas, Revista da Sociedade Brasileira de Medicina Tropical, 40(2):192-196

Castro, D.A., Duarte, P.B., e Oliveira, P.S., Modelagem Econométrica Aplicada à Previsão de Séries Temporais de Indicadores de Inadimplência, 2007. Orientador: Amaral, M. R. S., Rio de Janeiro: UERJ/IME, 2009. 71 p. Monografia. (Graduação em Estatística)

Davidson, R. e MacKinnon, J. G., Estimation and Inference in Econometric, Oxford University Press, 1993

Durbin, J. e Watson, G. S., Testing for Serial Correlation in Least-Squares Regression, Biometrika, vol. 38, 1951, p. 159-171.

Granger, C. Q. J., Newbold, P. (1974), Spurius Regressions in Econometrics, Journal of Econometrics, v. 2, p. 111-120.

Lima, V. L. C., Figueiredo, L.T.M., Correa, F. H. R., Leite, O.F., Rangel, O., Vido, A. A., Oliveira, S. S., Owa, M. A., Carlucci, R. H., Dengue: Inquérito Sorológico Pós Epidemiológico em Zona Urbana do Estado de São Paulo, Brasil., Revista Saúde Pública, 33: 566-574, 1999.

Morettin, P. A.; Toloi, C. M. C., Séries temporais. 2. ed., Atual: São Paulo, SP, 1987.

Pindyck, R. S., e Rubinfeld, D. L., Econometric Model and Economic Forecasts, 3rd

edition, MacGraw-Hill, 1991.

Ribeiro, A.F., Marques, G.R.A.M., Voltolini, J.C., Condino, M.L.F., Associação entre incidência de dengue em variáveis climáticas, Revista de Saúde Pública, Volume 40 Nº4, São Paulo, ISSN 0034 – 8910, Agosto 2006.

Secretaria de Vigilância em Saúde-SVS. Dengue (cartaz). Ministério da Saúde http://dtr2001.saude.gov.br/svs/epi/dengue/dengue_cartaz.htm, acessado em 15.04.2006, 2006.

Souza, R. C. (1985), “Modelos Estruturais para Previsão de Séries Temporais: Abordagens Clássica e Bayesiana”, Instituto de Matemática Pura e Aplicada/CNPq.

Teixeira, M.G., Barreto, M.L., Costa, M.C.N., Ferreira, L.D.A., Vasconcelos, P.F.C., Cairncross, S., Dynamics of Dengue Virus Circulation: a Silent Epidemic in a Complex Urban Area. Tropical Medicine and International Health 7: 757-762, 2002.

Vaughon, A. P., Duarte, K. S., Desenvolvimento de um Modelo Econométrico para a Previsão da Incidência de Dengue no Município do Rio de Janeiro, Orientador: Amaral, M. R. S., Rio de Janeiro: UERJ/IME, 2009. 52 p. Monografia. (Graduação em Estatística)

Wonnacott, T. H. e Wonnacott, R. J., Introductory Statistics for Business and Economics, John Wiley & Sons, 4th. Ed., 1990.

XLI SBPO 2009 - Pesquisa Operacional na Gestão do Conhecimento Pág. 1447