2
* Bolsista de Doutorado CNPq Melhoria do Modelo Híbrido Inteligente Proposto por Khashei e Bijari para Previsão de Séries Temporais Neuma T. Santos * Brígida R. P. Rocha Valquíria G. Macedo Universidade Federal do Pará, Programa de Pós-Graduação em Engenharia Elétrica, 66075-110, Belém, PA E-mail: [email protected] , [email protected], [email protected] RESUMO Uma série temporal pode ser definida como um conjunto de observações feitas seqüencialmente no tempo [3]. A previsão de séries temporais é aplicada em diversas áreas (metereologia, economia, marketing, energia, epidemiologia, entre outras), por isso há interesse no desenvolvimento e aperfeiçoamento dos modelos. Os métodos mais utilizados para previsão de séries temporais são os modelos estatísticos de Box-Jenkins que partem da ideia de que cada valor da série pode ser explicado por valores prévios, a partir do uso da estrutura de correlação temporal que geralmente há entre os valores da série [4] e as Redes Neurais Artificiais (RNA) inspiradas no funcionamento dos neurônios biológicos que entre suas vantagens está à capacidade de mapeamento flexível da função não- linear e generalização. Os modelos de Box-Jenkins têm a desvantagem de só resolver problemas lineares, enquanto que a RNA tem a desvantagem de que só é possível saber se a rede funciona corretamente pela análise do erro médio quadrático apresentado ao se introduzir os dados para validação, ou seja, não há como gerar uma prova formal para os resultados obtidos [2]. Tanto as redes neurais (não-lineares) como os modelos auto-regressivos (lineares) alcançaram êxito em sua área de domínio, no entanto, nenhum deles pode ser considerado como um método universal que possa ser usado em todas as circunstâncias, por isso, a proposta de Khashei e Bijari é usar modelos híbridos ou combinar vários modelos, a fim de superar as limitações de cada modelo e melhorar a precisão da previsão, ou seja, usar uma metodologia híbrida com a capacidade de modelar problemas lineares e não-lineares [1]. Para formulação do modelo uma série temporal foi considerada como função de uma componente linear e uma não-linear. Assim: ( , ) t t t y fLN , onde L t denota a componente linear e N t a componente não-linear. Essas componentes são estimadas a partir dos dados. Na primeira fase o objetivo principal é a modelagem linear através do Modelo Auto-Regressivo e de Média Móveis (ARMA(p,q)). Os resíduos dessa fase conterão a seguinte relação: Onde L t é o valor da previsão para o tempo t; e e t é o resíduo no tempo t a partir do modelo linear. Os resíduos são importantes para medir o grau de suficiência de modelos lineares. Na segunda fase é feita a análise não-linear e, portanto, um perceptron de múltiplas camadas é usado para modelar os relacionamentos não-lineares e os lineares ainda existentes nos resíduos da modelagem linear dos dados originais. Assim, Onde f 1 , f 2 e f são funções não-lineares determinadas pela rede neural; n e m são inteiros e referem-se ao grau do modelo. Desse modo a previsão combinada terá a seguinte forma: Onde n 1 n e m 1 m são inteiros determinados no processo final do modelo neural. Para testar a eficiência do modelo, Khashei e Bijari usaram a base de dados de manchas solares que é o registro da atividade anual de manchas visíveis na face do sol e do número de grupos semelhantes. Os dados contêm um total de 288 observações (1700-1987). A série é não- 868 ISSN 1984-8218

Melhoria do Modelo Híbrido Inteligente Proposto por ... · * Bolsista de Doutorado CNPq Melhoria do Modelo Híbrido Inteligente Proposto por Khashei e Bijari para Previsão de Séries

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

* Bolsista de Doutorado CNPq

Melhoria do Modelo Híbrido Inteligente Proposto por Khashei e Bijari

para Previsão de Séries Temporais

Neuma T. Santos* Brígida R. P. Rocha Valquíria G. Macedo

Universidade Federal do Pará, Programa de Pós-Graduação em Engenharia Elétrica,

66075-110, Belém, PA

E-mail: [email protected] , [email protected], [email protected]

RESUMO

Uma série temporal pode ser definida como um conjunto de observações feitas

seqüencialmente no tempo [3]. A previsão de séries temporais é aplicada em diversas áreas

(metereologia, economia, marketing, energia, epidemiologia, entre outras), por isso há interesse

no desenvolvimento e aperfeiçoamento dos modelos.

Os métodos mais utilizados para previsão de séries temporais são os modelos estatísticos de

Box-Jenkins que partem da ideia de que cada valor da série pode ser explicado por valores

prévios, a partir do uso da estrutura de correlação temporal que geralmente há entre os valores

da série [4] e as Redes Neurais Artificiais (RNA) inspiradas no funcionamento dos neurônios

biológicos que entre suas vantagens está à capacidade de mapeamento flexível da função não-

linear e generalização. Os modelos de Box-Jenkins têm a desvantagem de só resolver

problemas lineares, enquanto que a RNA tem a desvantagem de que só é possível saber se a

rede funciona corretamente pela análise do erro médio quadrático apresentado ao se introduzir

os dados para validação, ou seja, não há como gerar uma prova formal para os resultados

obtidos [2].

Tanto as redes neurais (não-lineares) como os modelos auto-regressivos (lineares)

alcançaram êxito em sua área de domínio, no entanto, nenhum deles pode ser considerado como

um método universal que possa ser usado em todas as circunstâncias, por isso, a proposta de

Khashei e Bijari é usar modelos híbridos ou combinar vários modelos, a fim de superar as

limitações de cada modelo e melhorar a precisão da previsão, ou seja, usar

uma metodologia híbrida com a capacidade de modelar problemas lineares e não-lineares [1].

Para formulação do modelo uma série temporal foi considerada como função de uma

componente linear e uma não-linear. Assim: ( , )t t ty f L N , onde Lt denota a componente linear

e Nt a componente não-linear. Essas componentes são estimadas a partir dos dados. Na primeira

fase o objetivo principal é a modelagem linear através do Modelo Auto-Regressivo e de Média

Móveis (ARMA(p,q)). Os resíduos dessa fase conterão a seguinte relação:

Onde Lt é o valor da previsão para o tempo t; e et é o resíduo no tempo t a partir do modelo

linear. Os resíduos são importantes para medir o grau de suficiência de modelos lineares.

Na segunda fase é feita a análise não-linear e, portanto, um perceptron de múltiplas camadas

é usado para modelar os relacionamentos não-lineares e os lineares ainda existentes nos resíduos

da modelagem linear dos dados originais. Assim,

Onde f

1, f

2 e f são funções não-lineares determinadas pela rede neural; n e m são inteiros e

referem-se ao grau do modelo. Desse modo a previsão combinada terá a seguinte forma:

Onde n1 n e m1 m são inteiros determinados no processo final do modelo neural.

Para testar a eficiência do modelo, Khashei e Bijari usaram a base de dados de manchas

solares que é o registro da atividade anual de manchas visíveis na face do sol e do número de

grupos semelhantes. Os dados contêm um total de 288 observações (1700-1987). A série é não-

868

ISSN 1984-8218

linear, não-gaussiana e freqüentemente usada para avaliar eficácia de modelos não-lineares. O

conjunto de dados foi dividido em dois para treinamento e testes. O treinamento foi realizado

com 221 observações (1700-1920) e o teste com 67 observações (1921-1987) para avaliar o

desempenho do modelo estabelecido.

O processo consiste de duas fases: na primeira fase eles usaram o Modelo Auto-Regressivo

de ordem 9 (AR(9)), por entenderem que é o melhor modelo, uma vez que tem sido usado por

vários pesquisadores, e na segunda fase foi implementada uma rede neural backpropagation no

Matlab com uma arquitetura de 7 entradas, 3 neurônios escondidos e 1 saída.

Na figura 1 são apresentados os resultados da previsão com rede neural backpropagation e

modelo auto-regressivo de ordem 9, assim como os resultados da proposta de melhoria para

resolução desse problema com um uma rede neural com Função de Base Radial (RBF) e um

modelo auto-regressivo de média móvel ARMA(6,2).

Figura 1. Resultados do processamento da rede neural backpropagation e RBF

A contribuição deste trabalho está no fato de que testes realizados com o mesmo banco de

dados e a mesma metodologia proposta, mas com um modelo auto-regressivo de média móvel

ARMA(6,2) e uma rede neural com Função de Base Radial (RBF) mostraram resultados com

um desempenho muito melhor do que com os modelos escolhidos por Khashei e Bijari como

pode ser observado na tabela 1. MLP e AR(9) RBF e ARMA(6,2)

Treinamento Validação Treinamento Validação

Erro Médio Quadrático (MSE) 0.0038 0.0083 4.8249 x 10-021

3.5164 x 10-021

Erro Médio Absoluto (MAE) 0.0455 0.0658 5.1284 x 10-011

4.8489 x 10-011

Soma do Quadrado dos Erros

(SSE)

0.8464 0.5576 1.0663 x 10-018

2.3560 x 10-019

Tabela 1. Medidas Estatísticas de Desempenho

Palavras-chave: Modelos Auto-regressivos, Previsão de Séries Temporais, Redes Neurais

Artificiais

Referências [1] M. Khashei; M. Bijari. A novel hybridization of artificial neural networks and ARIMA

models for time series forecasting. Applied Soft Computing, 2664–2675. 2011.

[2] O. Ludwig Jr., E. Montgomery. Redes Neurais: Fundamentos e Aplicações com Programas

em C, Ed. Ciência Moderna. 2007.

[3] P. A. Morettin; C. M. C, Toloi. Análise de Séries Temporais. Ed. Edgard Blucher. São

Paulo. 2006.

[4] L. Werner; J. L. D. Ribeiro. Previsão de demanda: uma aplicação dos modelos Box-Jenkins

na área de assistência técnica de computadores pessoais, Gest. Prod., Vol. 10, no 1, p.47-67,

Abr 2003.

869

ISSN 1984-8218