Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Universidade Federal do Rio Grande do Norte
Centro de Ciências Sociais Aplicadas
Departamento de Ciências Administrativas
Programa de Pós-Graduação em Administração
PREVISÃO DO ÍNDICE BOVESPA POR MEIO DE REDES NEURAIS
ARTIFICIAIS: Uma análise comparada aos métodos tradicionais de séries de tempo
RENATA LAÍSE REIS DE SOUZA
Natal
2011
Renata Laíse Reis de Souza
PREVISÃO DO ÍNDICE BOVESPA POR MEIO DE REDES NEURAIS
ARTIFICIAIS: Uma análise comparada aos métodos tradicionais de séries de tempo
Dissertação apresentada ao Programa de Pós
Graduação em Graduação em Administração
(PPGA) da Universidade Federal do Rio
Grande do Norte (UFRN), para a obtenção do
título de Mestre em Administração.
Orientador: Prof. Dr. Anderson Luiz Rezende
Mól.
Natal
2011
RENATA LAÍSE REIS DE SOUZA
PREVISÃO DO ÍNDICE BOVESPA POR MEIO DE REDES NEURAIS
ARTIFICIAIS: Uma análise comparada aos métodos tradicionais de séries de tempo
Dissertação apresentada em defesa da obtenção do título de Mestre em Administração
no Departamento de Administração, na Universidade Federal do Rio Grande do Norte.
COMISSÃO EXAMINADORA:
Prof. Dr. Anderson Luiz Rezende Mól - Orientador
Prof. Dr. Vinicio de Souza e Almeida - Examinador
Prof. Dr. Rodrigo José Guerra Leone - Examinador
Aprovada em:____/____/_____.
Aos meus pais, fonte de tudo que sou e que
tenho.
R.L.R.S
AGRADECIMENTOS
Diante da realização de mais um objetivo de vida, tornar-me Mestre em
Administração, desejo agradecer esta realização:
À Deus, pai eterno, por todos os desafios, oportunidades e pessoas que colocou em
minha vida e por todas as bênçãos que derramou sobre mim não apenas no decorrer deste
curso mas durante toda a minha vida.
À minha família, em especial meus pais e irmãos, pelo incentivo e por sempre terem
se esforçado para que eu tivesse as melhores condições para meu desenvolvimento e
crescimento – não apenas como estudante, mas também como pessoa – e se preocupado
comigo, zelando para que eu conseguisse cumprir com mais este objetivo em minha vida. À
minha prima Virgínia pela preocupação e auxílio na busca por contatos que me auxiliassem
no desenvolvimento do meu trabalho. E ao meu sobrinho Pedro Henrique por ter enchido
meus dias de luz e alegria, mesmo nos momentos mais estressantes destes últimos anos.
Ao meu querido Victor, por ter estado ao meu lado me fornecendo apoio,
compreensão, carinho, amor e amizade imprescindíveis para que eu continuasse seguindo em
frente e me esforçando para conseguir realizar um bom trabalho.
Aos meus preciosos amigos, que contribuíram para que eu mantivesse minhas
responsabilidades e me esforçasse para atingir minhas metas, e que também não me
permitiram esquecer que preciso saber aproveitar a vida e os frutos de meus esforços.
Principalmente as minhas amigas de longa data Almog, Amanda, Fabienne e Carmem, que
mesmo com minha ausência de contato permanecem torcendo pelo meu sucesso, e meus
amigos do Yujô Fest, que, além da companhia e afeto, me ajudaram a enfrentar esse último
ano com um objetivo a mais a complementar meu tempo, me auxiliando para que não ficasse
desesperada em momentos em que a dissertação andava a passos mais lentos. Aos amigos
Fábio, Lucas Matheus e Matheus pelo auxílio durante a última etapa de meu trabalho.
Ao Professor Dr. Miguel Moreno, pelo carinho e todas as oportunidades que vem
colocando em minha vida acadêmica e as várias oportunidades em que vem me ajudando, tal
como a participação em sua Base de Pesquisa (BEPEGE) e aos meus companheiros do
GEPMSIM (Grupo de Estudos e Pesquisas em Modelagem e Simulação Empresarial) – em
especial Fernando, Josué e Max – por tornarem esta experiência tão rica e me mostrarem a
importância da pesquisa e da produção científica para meu desenvolvimento como estudante e
para a realização de meus objetivos.
Ao Professor Dr. Anderson Mól, por ter me apresentado ao tema desta dissertação, por
ter aceitado ser meu orientador durante o curso, e por sua paciência, compreensão e auxílio ao
desenvolver este trabalho tão importante.
Ao professor André Luiz, do Departamento de Estatística da UFRN, por ter me
auxiliado na exploração inicial dos modelos aplicados às séries temporais e na compreensão
de alguns testes de análise destes modelos. E ao professor Adrião, do Departamento de
Engenharia da Computação e Automação da UFRN, e, em especial, ao Carlos Padilha e
colegas do laboratório de Sistemas Inteligentes da UFRN, sem os quais não teria conseguido
realizar a bendita modelagem com as Redes Neurais Artificiais.
Aos professores Dr. Luciano Sampaio, Dr. Vinicio de Souza e Almeida e Dr. Rodrigo
Leone por suas preciosas contribuições ao trabalho feito, realizadas por meio de sua
participação em minhas bancas examinadoras de Qualificação e de Defesa desta dissertação.
E, por fim, a CAPES, por financiar minha bolsa de Mestrado, que me permitiu ter uma
preocupação a menos em minha vida no decorrer do curso. E a todos os professores do curso
de Mestrado em Administração e membros do Programa de Pós Graduação da UFRN,
especialmente Elizabeth e Thiago, por seu trabalho bem feito e por sua contribuição para que
tudo ocorresse da melhor forma possível, colaborando substancialmente para que eu
conseguisse chegar à conclusão de mais esta etapa em minha vida acadêmica.
“Penso noventa e nove vezes e nada
descubro; deixo de pensar, mergulho em
profundo silêncio - e eis que a verdade
se me revela.”
Albert Einstein
Resumo
Nas organizações, a previsão constitui a base para a tomada de decisões estratégicas, táticas e
operacionais. Na economia financeira, diversas técnicas têm sido usadas a fim de prever o
comportamento de ativos no decorrer das últimas décadas. Assim, existem diversos métodos
para auxiliar na tarefa de previsão de séries temporais, entretanto, técnicas de modelagem
convencionais como modelos estatísticos e aqueles baseados em modelos matemáticos
teóricos têm produzido previsões insatisfatórias, aumentando o número de estudos em
métodos mais avançados de previsão. Dentre estes, as Redes Neurais Artificiais (RNA) são
um método relativamente recente e promissor para a previsão em negócios que se revela uma
das técnicas que tem causado muito interesse no ambiente financeiro e tem sido utilizado com
sucesso em uma ampla variedade de aplicações de sistemas de modelagem financeiro,
provado em muitos casos sua superioridade sobre os modelos estatísticos ARIMA-GARCH
(OLIVEIRA,2007). Nesse contexto, o presente trabalho teve por objetivo analisar se as RNAs
são um método mais adequado para a previsão do comportamento de Índices em Mercados de
Capital do que métodos tradicionais de análise de séries temporais. Para tanto, foi
desenvolvido um estudo quantitativo que, a partir de índices econômico financeiros, elaborou
dois modelos de RNA do tipo feedfoward de aprendizado supervisionado, cujas estruturas
consistiram em 20 dados na camada de entrada, 90 neurônios em uma camada oculta e um
dado como camada de saída (índice Ibovespa). Estes modelos utilizaram BackPropagation,
função de ativação de entrada baseada na tangente Sigmoid e uma função de saída linear.
Visto o intuito de analisar a aderência do Método de Redes Neurais Artificiais à realização de
previsões do Ibovespa, optou-se por realizar tal análise por meio da comparação de resultados
entre este e o Método de previsão em séries temporais GARCH, desenvolvendo-se um
modelo GARCH (1,1). Uma vez aplicadas ambas as metodologias (RNA e GARCH) e
desenvolvidos os modelos, realizou-se a análise dos resultados obtidos comparando-se os
resultados das previsões com os dados históricos e estudando-se os erros de previsão por meio
do MSE, RMSE, MAE, Desvio Padrão, U de Theil e teste abrangente da previsões. Verificou-
se que os modelos desenvolvidos por meio de RNAs apresentaram menores MSE, RMSE e
MAE que o modelo de controle e o teste U de Theil indicou que os três modelos estudados
apresentam erros menores que os de uma previsão ingênua. Embora a RNA baseada em
retornos tenha apresentado valores dos indicadores de precisão inferiores aos da RNA baseada
em preços, o teste abrangente de regressões rejeitou a hipótese de que este modelo seja
superior que aquele, indicando que os modelos de RNA apresentam um nível semelhante de
precisão. Concluiu-se que, para a série de dados estudada neste trabalho, as Redes Neurais
artificiais se mostram um modelo mais adequado de previsão do que os modelos tradicionais
de séries temporais, representado neste pelo método GARCH.
Palavras-chave: Ibovespa. Séries de Tempo. Modelos de Previsão.
Abstract
Forecast is the basis for making strategic, tactical and operational business decisions. In
financial economics, several techniques have been used to predict the behavior of assets over
the past decades.Thus, there are several methods to assist in the task of time series
forecasting, however, conventional modeling techniques such as statistical models and those
based on theoretical mathematical models have produced unsatisfactory predictions,
increasing the number of studies in more advanced methods of prediction. Among these, the
Artificial Neural Networks (ANN) are a relatively new and promising method for predicting
business that shows a technique that has caused much interest in the financial environment
and has been used successfully in a wide variety of financial modeling systems applications,
in many cases proving its superiority over the statistical models ARIMA-GARCH. In this
context, this study aimed to examine whether the ANNs are a more appropriate method for
predicting the behavior of Indices in Capital Markets than the traditional methods of time
series analysis. For this purpose we developed an quantitative study, from financial economic
indices, and developed two models of RNA-type feedfoward supervised learning, whose
structures consisted of 20 data in the input layer, 90 neurons in one hidden layer and one
given as the output layer (Ibovespa). These models used backpropagation, an input activation
function based on the tangent sigmoid and a linear output function. Since the aim of analyzing
the adherence of the Method of Artificial Neural Networks to carry out predictions of the
Ibovespa, we chose to perform this analysis by comparing results between this and Time
Series Predictive Model GARCH, developing a GARCH model (1.1).Once applied both
methods (ANN and GARCH) we conducted the results' analysis by comparing the results of
the forecast with the historical data and by studying the forecast errors by the MSE, RMSE,
MAE, Standard Deviation, the Theil's U and forecasting encompassing tests. It was found that
the models developed by means of ANNs had lower MSE, RMSE and MAE than the GARCH
(1,1) model and Theil U test indicated that the three models have smaller errors than those of
a naïve forecast. Although the ANN based on returns have lower precision indicator values
than those of ANN based on prices, the forecast encompassing test rejected the hypothesis
that this model is better than that, indicating that the ANN models have a similar level of
accuracy . It was concluded that for the data series studied the ANN models show a more
appropriate Ibovespa forecasting than the traditional models of time series, represented by the
GARCH model.
Palavras-chave: Ibovespa. Time Series. Forecasting Models.
LISTA DE FIGURAS
Figura 1: Modelo não linear de neurônio artificial. ................................................................. 27 Figura 2: Rede feedforward de uma única camada de neurônios. .......................................... 28 Figura 3: Rede feedforward de múltiplas camadas ................................................................. 28
Figura 4: Funcionamento de uma RNA feedfoward. .............................................................. 29 Figura 5: Rede feedforward de múltiplas camadas e redes recorrentes. ................................. 30 Figura 6: aprendizado supervisionado. ................................................................................... 31 Figura 7: Estrutura Inicial da RNA ......................................................................................... 38 Figura 8: Estrutura Final da RNA ........................................................................................... 38
Figura 9: Arquitetura da Rede Neural Artificial ..................................................................... 39 Figura 10: comportamento da série de preços (IBOV) e de retornos do Ibovespa (RIBOV). 41
Figura 11: Gráfico de distribuição e estatísticas descritivas da série RIBOV. ........................ 42
Figura 12: Comportamento da RNA (preços) em comparação com os dados históricos – etapa
de treinamento. ......................................................................................................................... 46 Figura 13: Comportamento da RNA em comparação com os dados históricos – etapa de
utilização. .................................................................................................................................. 47
Figura 14: Comportamento do erro e seu desvio padrão (RNA – preços). ............................. 47 Figura 15: Comportamento do erro e seu desvio padrão (RNA – preços, após conversão de
seus resultados para retornos). .................................................................................................. 48 Figura 16: Comportamento da RNA (retornos) em comparação com os dados históricos –
etapa de treinamento. ................................................................................................................ 48
Figura 17: Comportamento da RNA (retornos) em comparação com os dados históricos –
etapa utilização. ........................................................................................................................ 49
Figura 18: Comportamento do erro e seu desvio padrão (RNA – retornos). .......................... 49 Figura 19: Representação gráfica dos resultados obtidos pelo modelo GARCH (1,1) ........... 51
Figura 20: Comparação gráfica dos erros quadráticos dos modelos de previsão estudados. .. 52
LISTA DE QUADROS
Quadro 1: Comparação entre RNAs e Modelos Lineares Gerais. .......................................... 25
LISTA DE TABELAS
Tabela 1: Teste de estacionariedade. ....................................................................................... 41 Tabela 2: Autocorrelação e autocorrelação parcial da série RIBOV. ...................................... 42 Tabela 3: Resultados do Modelo ARMA (1,1) para geração de resíduos para estudo. ........... 43
Tabela 4: Testes de efeitos ARCH. ......................................................................................... 43 Tabela 5: Resultados do Modelo GARCH para previsão do RIBOV. .................................... 50 Tabela 6: Teste de Efeitos ARCH, após a modelagem do GARCH (1,1). .............................. 50 Tabela 7: RMSE, MAE e Desvios Padrão dos erros de previsão dos modelos. ...................... 52 Tabela 8: Teste Abrangente de regressões .............................................................................. 53
LISTA DE SIGLAS E ABREVIATURAS
ADF – Dickey-Fuller Aumentado (Teste de)
AR – Autoregressive Model (Modelo Auto Regressivo)
ARCH – Autoregressive Conditional Heterocedasticity Model (Modelo
Autoregressivo de Heterocedasticidade Condicional)
ARIMA – Autoregressive Integrated Moving-Average Model (Modelo Auto-
regressivo Integrado de Médias Móveis)
ARMA – Autoregressive-Moving-Average Model (Modelo Auto-regressivo de
Médias Móveis )
BM&F Bovespa – Bolsa de Valores, Mercadorias e Futuros de São Paulo
GARCH – Generalized Autoregressive Conditional Heterocedasticity Model
(Modelo de Heterocedasticidade Condicional Auto-Regressiva
Generalizada)
IBOVESPA – Índice Bovespa
IBRA – Índice Brasil Amplo BM&F BOVESPA
IBrX – Índice Brasil BM&F BOVESPA
IBrX-50 – Índice Brasil 50 BM&F BOVESPA
ICO2 – Índice Carbono Eficiente BM&F BOVESPA
ICON – Índice BM&F BOVESPA de Consumo
IDIV – Índice de Dividendos BM&F BOVESPA
IEE – Índice de Energia Elétrica BM&F BOVESPA
IFNC – Índice BM&F BOVESPA Financeiro
IGC – Índice de Ações com Governança Corporativa Diferenciada BM&F
BOVESPA
IGCT – Índice BM&F BOVESPA de Governança Corporativa Trade
IMAT – Índice de Materiais Básicos BM&F BOVESPA
IMOB – Índice BM&F BOVESPA Imobiliário
INDX – Índice do Setor Industrial BM&F BOVESPA
ISE – Índice de Sustentabilidade Empresarial BM&F BOVESPA
ITAG – Índice de Ações Tag Along Diferenciado BM&F BOVESPA
ITEL – Índice Setorial de Telecomunicações BM&F BOVESPA
IVBX-2 – Índice Valor Bovespa
MA – Moving-Average Model (Modelo de Médias Móveis)
MAE – Mean Absolute Error (Erro Médio Absoluto)
MLCX – Índice BM&F BOVESPA Mid-Large Cap
MSE – Mean Squared Error (Erro Quadrado Médio)
RIBOV – Série de Retornos diários do Ibovespa
RMSE – Root Mean Squared Error (Raiz do Erro Quadrado Médio)
RNA – Rede Neural Artificial
SMLL – Índice BM&F BOVESPA Small Cap
UTIL – Índice Utilidade Pública BM&F BOVESPA
SUMÁRIO
1 INTRODUÇÃO ................................................................................................................... 15 1.1 CONTEXTUALIZAÇÃO E PROBLEMA .................................................................... 15 1.2 JUSTIFICATIVA ............................................................................................................. 18
1.3 OBJETIVOS ..................................................................................................................... 20 1.3.1 OBJETIVO GERAL: ....................................................................................................... 20 1.3.2 OBJETIVOS ESPECÍFICOS .......................................................................................... 20
2. REDES NEURAIS ARTIFICIAIS (RNAs) ...................................................................... 21
2.1 CONSIDERAÇÕES INICIAIS ....................................................................................... 21 2.2 AS REDES NEURAIS ARTIFICIAIS ............................................................................ 23
2.2.1 O NEURÔNIO ARTIFICIAL ......................................................................................... 26
2.2.2 ARQUITETURA DE RNA ............................................................................................. 27 2.2.3 APRENDIZAGEM .......................................................................................................... 30 2.2.4 IMPLEMENTANDO UMA RNA .................................................................................. 32 2.2.4.1 DEFINIÇÃO DA REDE E ESCOLHA DO SOFTWARE .......................................... 32
2.2.4.2 OBTENÇÃO DE DADOS ........................................................................................... 32 2.2.4.3 TREINAMENTO ......................................................................................................... 32
2.2.4.4 ETAPA DE TESTES (UTILIZAÇÃO DA RNA) ........................................................ 33 2.2.4.5 MANUTENÇÃO .......................................................................................................... 33
3 METODOLOGIA ................................................................................................................ 34 3.1 TIPO DA PESQUISA ....................................................................................................... 34
3.2 AMOSTRAGEM .............................................................................................................. 34 3.3 COLETA DE DADOS ...................................................................................................... 35
3.4 TRATAMENTO DOS DADOS ....................................................................................... 36 3.4.1 TRATAMENTO DOS DADOS PARA A RNA ............................................................. 36 3.4.2 TRATAMENTO DOS DADOS PARA O MODELO DE CONTROLE........................ 39
3.5 PROCEDIMENTO DA ANÁLISE DOS RESULTADOS ............................................ 43
4 RESULTADOS E ANÁLISE .............................................................................................. 46 4.1 REDES NEURAIS ARTIFICIAIS .................................................................................. 46 4.1.1 RNA BASEADA EM PREÇOS ...................................................................................... 46 4.1.2 RNA BASEADA EM RETORNOS ................................................................................ 48
4.2 MODELO DE CONTROLE - GARCH (1,1) ................................................................. 49 4.3 ANÁLISE DOS RESULTADOS ..................................................................................... 52
5 CONSIDERAÇÕES FINAIS .............................................................................................. 54
APÊNDICE - Tabelas de Previsões, Erros de Previsão e Erro Quadrático dos Modelos
15
1 INTRODUÇÃO
Este capítulo discorre sobre o contexto no qual se insere este trabalho, apresentando o
problema e justificativa de pesquisa, bem como os objetivos gerais e específicos que
nortearam o desenvolvimento da mesma.
1.1 CONTEXTUALIZAÇÃO E PROBLEMA
Tendo em vista a complexidade crescente do ambiente em que as organizações estão
inseridas, torna-se necessária a busca de informações além de suas fronteiras de maneira
prospectiva, à procura de obtenção de vantagem competitiva (ALMEIDA; DUMONTIER,
1996).
Nas organizações, a previsão constitui a base para a tomada de decisões estratégicas,
táticas e operacionais, tendo um papel importante para realizar em economia e finanças, uma
vez que essas são ciências de decisão preocupadas com os efeitos das decisões (PANDA;
NARASIMHAN; 2006).
De acordo com Morettin e Toloi (2006, p7), etimologicamente a palavra previsão, que
tem origem das palavras prae e vidare, “sugere que se quer ver uma coisa antes que ela
exista”. Essencialmente, a previsão supõe que “as condições presentes e passadas determinam
em algum grau o futuro de tal forma que pode haver muitas interações e complexas relações
entre as variáveis envolvidas” (OLIVEIRA, 2004, p.1).
Complementando, Ribeiro (2009) destaca que para que seja possível prever os valores
futuros com base em valores passados, faz-se necessária a disponibilidade de uma memória
histórica de dados ocorridos anteriormente. Entretanto, o conjunto de dados, por si só, não
permite a previsão dos valores futuros, de forma que, para isso, faz-se necessária a utilização
de algoritmos, técnicas ou métodos de previsão de séries temporais, que podem envolver
cálculos simples ou procedimentos complexos (RIBEIRO, 2009).
A previsão de séries temporais tem sido uma das áreas-chave em Ciências Sociais
Aplicadas (OLIVEIRA, 2004). Como são um conjunto de observações geradas
sequencialmente no tempo, os modelos utilizados para sua descrição são processos
estocásticos, isto é, controlados por leis probabilísticas. Os modelos de previsão destas séries
analisam as propriedades estocásticas das mesmas, com base nos valores passados das
próprias variáveis e do termo estocástico (termo de erro). Onde
16
ao contrário das séries determinísticas, nas quais os valores futuros de uma série
temporal são determinados exatamente por alguma função matemática, nas séries
temporais estocásticas (não-determinísticas), os valores futuros podem ser descritos
apenas em termos de uma distribuição de probabilidade à série temporal
(OLIVEIRA, 2007).
Existem diversos métodos para auxiliar na tarefa de previsão de séries de tempo, como
por exemplo: modelos de Suavização Exponencial, modelos auto-regressivos (AR), de
Médias Móveis (MA), Modelos ARIMA, ARCH e GARCH.
Os métodos lineares são fáceis de serem desenvolvidos e implementados, além de
serem, relativamente, simples de entender e interpretar. Porém, mesmo tendo dominado os
processos de previsão por várias décadas, apresentam sérias limitações no fato de não serem
capazes de capturar todas as relações não-lineares nos dados (ZHANG, 2004). Segundo
Oliveira (2007), as técnicas de modelagem convencionais têm produzido previsões
insatisfatórias, onde suas principais desvantagens seriam, em suma, seu alto grau de
subjetividade com respeito à estrutura do modelo e sua base de informação limitada
(ZHANG, 2004; OLIVEIRA, 2004; OLIVEIRA, 2007).
Por outro lado, o recente avanço da capacidade de processamento dos computadores
deu grande impulso ao uso de métodos quantitativos em Administração (ALMEIDA;
PASSARI, 2006) e permitiu que tecnologias de Inteligência Computacional, como Redes
Neurais, Lógica Nebulosa e Algoritmos Genéticos, proporcionassem a criação de
metodologias avançadas de previsão (PALIT; POPOVIC, 2005). Desta forma, modelos
financeiros que exigem forte desempenho computacional agora podem ser explorados de
maneira mais fácil.
Este é o caso das Redes Neurais Artificiais (RNAs), que se mostram um método
relativamente recente e promissor para a previsão em negócios (ZHANG, 2004) e tem
recebido muita atenção nos campos de economia e finanças (CARVALHAL; RIBEIRO,
2007; THAWORNWONG; ENKE, 2004).
Embora desenvolvidas originalmente com o propósito de entender o funcionamento do
cérebro humano, a constante interação dos pesquisadores através de disciplinas que tentavam
aplicar as atividades neurológicas do cérebro a funções de classificação tornaram-nas uma
tendência multidisciplinar (WALLACE, 2008).
Atualmente, as Redes Neurais Artificiais constituem uma ferramenta flexível e
amplamente utilizada para a análise de séries temporais, fornecendo grande variedade de
modelos matemáticos não lineares, úteis para resolver diferentes problemas em que são
empregadas convencionalmente técnicas estatísticas. Suas aplicações têm sido realizadas nas
17
mais variadas situações que envolvem problemas reais de diversas áreas, incluindo Finanças e
Economia (OLIVEIRA; MONTINI; BERGMAN, 2008).
Existem aplicações de RNAs encontradas nas áreas de Finanças, Gestão de Pessoas,
Marketing, Médica, Engenharia e muitas outras. Esta tecnologia de informação baseada no
funcionamento do cérebro humano propõe o uso de um enorme volume de dados disponíveis,
que muitas vezes são pouco ou mal utilizados, transformando-os em informação útil à tomada
de decisões (BOSAIPO, 2001).
Na área da Administração Financeira, as RNAs têm sido usadas para prever falência,
taxa de câmbio, taxa de juros, preço de futuros, retorno acionário, volume de negociação,
índice do Mercado de Capitais, preço da oferta pública inicial, valor da propriedade e outros
(ZHANG, 2004). Além disso, estudos que utilizam este modelo têm obtido sucesso em uma
ampla variedade de aplicações de sistemas e modelagem financeiros (OLIVEIRA, 2007),
provando em muitos casos “sua superioridade sobre os modelos estatísticos ARIMA-GARCH
(MEDEIROS et al, 2006; MEDEIROS, 2007).
A previsão em Mercado de Ações torna-se difícil porque este é influenciado por
fatores diversos como eventos políticos, condições econômicas gerais e as expectativas dos
investidores (OH; KIM, 2002).
Os preços das ações podem variar por fatores relacionados à empresa ou por fatores
externos, como o crescimento do país, do nível de emprego e da taxa de juros (BM&F
BOVESPA, 2011). Tendo isto em vista, a Bolsa de Valores, Mercadorias e Futuros de São
Paulo (BM&F BOVESPA) – principal instituição brasileira de intermediação para operações
financeiras, com o intuito de orientar as decisões de investimento, criou alguns índices que
buscam retratar a situação dos investimentos realizados durante os pregões. Esses índices são
indicadores de desempenho de um conjunto de ações, ou seja, mostram a valorização de um
determinado grupo de papéis ao longo do tempo.
Atualmente existem 21 Índices da BM&F BOVESPA, onde cada um mostra o
comportamento de um grupo diferente de ações. Destes, o Índice de maior destaque é o
Ibovespa (Índice Bovespa), que tem por finalidade básica “servir como indicador médio do
comportamento do mercado. Para tanto, sua composição procura aproximar-se o mais
possível da real configuração das negociações à vista (lote-padrão) na BM&F BOVESPA”
(BM&F BOVESPA, 2011, s/n).
Assim, até certo ponto, o Ibovespa pode ser utilizado para estudos do comportamento
do Mercado de Capitais, visto que reflete o comportamento das principais ações negociadas
na bolsa – as ações integrantes da carteira teórica do Índice Bovespa respondem por mais de
18
80% do número de negócios e do volume financeiro verificados no Mercado à Vista (lote-
padrão) da BM&F BOVESPA.
Dentre os estudos que utilizam Redes Neurais para previsão no Mercado Financeiro,
costuma-se focalizar os preços dos ativos, como os trabalhos de Kalyvas (2001) e Oliveira
(2007), entretanto, ao se trabalhar com previsão de Índices, como o trabalho de Carvalhal e
Ribeiro (2007), passa-se a trabalhar com o comportamento não de um ativo em especial, mas
sim do comportamento de um segmento do mercado.
Nesta conjuntura, este trabalho enfoca a seguinte questão- problema:
Seriam as Redes Neurais Artificiais um método aderente para a previsão do
comportamento do Índice Bovespa?
1.2 JUSTIFICATIVA
Novas tecnologias de informática frequentemente tornam mais competitivas as
empresas que delas souberam tirar proveito antes da concorrência, uma vez que o uso desses
sistemas lhes permitem tanto reduzir custos quanto oferecer um serviço diferenciado aos
clientes. (ALMEIDA, 1995, p.47).
A capacidade de prever o futuro apuradamente é fundamental para muitos processos
de decisão em planejamento, programação, aquisição, formulação da estratégia, definição de
políticas e operações da cadeia de suprimentos (ZHANG, 2004). No campo da Administração
Financeira, a maioria das empresas administra seus recursos com alocação de parte dos ativos
em investimentos de diversos tipos, procurando garantir melhores receitas e lucros para seus
acionistas e, para isto, boas técnicas de previsão e de auxílio à tomada de decisões são
imprescindíveis.
Ao longo das últimas décadas, muitas tendências importantes mudaram o ambiente
dos Mercados Financeiros e diversas técnicas têm sido usadas a fim de prever o
comportamento de ativos.
No Brasil, estudos quanto à previsão em Mercado de Capitais que utilizam as Redes
Neurais Artificiais geralmente se baseiam nos valores das ações. Tendo em vista que o
presente estudo visa trabalhar com Índices da BM&F BOVESPA, optou-se por se trabalhar
com a previsão do Índice Bovespa visto que ele, como mencionado anteriormente, reflete o
comportamento das principais ações negociadas na Bolsa, permitindo um estudo com foco no
19
comportamento geral do mercado por meio de um único indicador. Desta forma o presente
estudo tem sua relevância teórica justificada, uma vez que trabalha métodos de previsão em
Mercado de Capitais, com base em Índices de Mercado, contribuindo para o desenvolvimento
dos estudos em Finanças no Brasil.
As Redes Neurais estão propondo soluções interessantes a problemas de várias áreas
de Administração, Como Finanças, Marketing, Vendas e Compras, ou mesmo Gestão de
Pessoas. É uma tecnologia relativamente recente, e diversas áreas de aplicação estão por ser
exploradas. (CARVALHAL; RIBEIRO, 2007; ALMEIDA, 1995).
Segundo Oliveira et al (2008, p.132):
Do ponto de vista teórico, o processamento de sinais não-lineares (LAPEDES;
FABER 1987), a incorporação do tempo na rede neural (ELMAN, 1988) e o
modelamento não-linear para previsão de séries temporais caóticas (CASDAGLI,
1989) têm sido aplicados como ferramenta na tomada de decisão em finanças
(HAWLEY et al., 1990; REFENES,1993), análise de mercado (FISHMAN et al.,
1991), modelamento não-linear e previsão (CASDAGLI; EUBANK.,1992; AZZOF,
1993; CLEMENTS; HENDRY, 1999). Mais recentemente tem havido a
preocupação de comparar e relacionar a tecnologia de redes neurais com a
abordagem estatística tradicional (CHENG; TITTERINGTON, 1994; RIPLEY,
1993, 1994, 1996; MEDEIROS et al., 2006), sob a perspectiva econométrica
(KUAN; WHITE, 1994), de engenharia financeira (ABU-MOSTAFA et al., 2001) e
macroeconômica (TERASVIRTA et al., 2005).
Diversas pesquisas na área da Administração Financeira vêm sendo realizadas
abrangendo variados tópicos, como: vendas no varejo (ALMEIDA; PASSARI, 2006),
previsões de avaliação de crédito (STEINER et al, 1999; LEMOS et al, 2005; KUMAR;
BUTTACHARYA, 2006), estudos no Mercado Financeiro (DUTTA et al, 2006), Mercado de
Ações (LAM;LAM, 2000; OH; KIM, 2002; KIM; LEE, 2004; PANDA, NARASIMHAN,
2006) e Índices de ações (CARVALHAL, RIBEIRO, 2007).
Desta forma, verifica-se a relevância deste método, a qual é reforçada uma vez que as
Redes Neurais Artificiais virem sendo aplicadas a inúmeras situações, como diagnósticos
médicos, inspeções de produtos, exploração de petróleo, controle aéreo (GATELY, 1996),
bem como em áreas financeiras, onde têm encontrado aplicações em predição de ações, fraude
em cartões de crédito, predição de falência, preço de arbitragem e etc.
A justificativa metodológica dá-se pela possibilidade de resposta ao problema de
pesquisa, através de técnicas estatísticas e pela viabilidade do estudo, a qual pode ser
comprovada através da disponibilidade de material bibliográfico hábil para se realizar um
estudo a este respeito, da existência de poucas barreiras para o levantamento dos dados
necessários e da alta confiabilidade nos mesmos, uma vez que o acesso aos dados necessários
para o estudo será realizado através do site da Bolsa de Valores, Mercadorias e Futuros de São
20
Paulo. Quanto à relevância metodológica, esta se deve ao uso de modelos estatísticos ainda
pouco utilizados em trabalhos específicos da área de Administração no Brasil – as RNAs,
aspirando-se contribuir para a evolução dos estudos em Administração Financeira por meio da
utilização de modelos que viabilizem estudos com resultados mais precisos.
Do ponto de vista prático, a realização desta pesquisa justifica-se na medida em que
seus resultados possam servir de parâmetro de decisão para investimentos de empresas ou
acionistas. Desta forma, contribui com informações para uma gestão de capital mais eficiente.
Ademais, no âmbito dos estudos em Mercado de Capitais, a presente pesquisa oferece a
avaliação de um método ainda pouco utilizado no mercado e pode vir a validar uma forte
ferramenta para predição do comportamento de ativos, função cada vez mais importante visto
a crescente complexidade das inter-relações em Mercados Financeiros.
Por fim, a realização deste estudo justifica-se também por ser de interesse pessoal da
pesquisadora, a qual é, atualmente, Especialista em Administração Financeira e, tendo esta
área como parte integrante de sua vida, considera que esta pesquisa terá grande importância
para seu desenvolvimento, agregando conhecimento para uso próprio no decorrer de sua vida
acadêmica e profissional.
1.3 OBJETIVOS
1.3.1 OBJETIVO GERAL:
Investigar se o método de Redes Neurais Artificiais resulta em melhor ajuste na
previsão do comportamento do Índice Bovespa, comparativamente aos métodos
tradicionais de Séries de Tempo.
1.3.2 OBJETIVOS ESPECÍFICOS
- Desenvolver modelos utilizando RNAs voltados à predição do comportamento do
Índice Bovespa;
- Aplicar um modelo de previsão de séries temporais ARCH-GARCH como modelo
de controle para a avaliação da adequação do modelo de Rede Neural Artificial;
- Analisar os resultados por meio de indicadores de para fim de estudar a precisão da
previsão dos modelos desenvolvidos perante série temporal estudada.
21
2. REDES NEURAIS ARTIFICIAIS (RNAs)
Este capítulo trata do referencial bibliográfico utilizado como base para este trabalho.
Desta forma, apresentam-se algumas considerações acerca de séries temporais e previsões
financeiras para, então, explanarem-se os princípios sobre as Redes Neurais Artificiais e como
elas podem ser utilizadas e implementadas.
2.1 CONSIDERAÇÕES INICIAIS
De acordo com Lima et al (2010, p.189), uma série temporal pode ser conceituada
como “qualquer conjunto de variáveis estocásticas equiespaçadas e ordenadas no tempo
{Xt}n t-1 = {X1, X2, ..., Xn}”. Onde, qualquer
sinal que depende do tempo e é medido em instantes particulares no tempo pode ser
representado por uma série temporal (ENDERS,2003). Conforme Morettin (2002), o
que se chama de série temporal é uma parte de uma trajetória, dentre muitas que
poderiam ter sido observadas, de um processo estocástico. (LIMA et al, 2010,
p.189)
Segundo o autor, o objetivo principal da análise de séries temporais é a realização de
previsões. E, para isto, utiliza-se uma metodologia que estabelece mecanismos onde “valores
futuros de uma série possam ser previstos com base apenas em seus valores presentes e
passados. As técnicas desse processo de previsão fundamentam-se na exploração da
correlação temporal que pode existir entre os valores exibidos pela série” (LIMA et al, 2010,
p.189).
Uma vez que os modelos utilizados para descrever séries temporais são processos
estocásticos, ou seja, controlados por leis probabilísticas, os modelos de previsão analisam as
propriedades estocásticas destas séries com base nos valores passados das próprias variáveis e
do termo estocástico (termo de erro). Onde
ao contrário das séries determinísticas, nas quais os valores futuros de uma série
temporal são determinados exatamente por alguma função matemática, nas séries
temporais estocásticas (não-determinísticas), os valores futuros podem ser descritos
apenas em termos de uma distribuição de probabilidade à série temporal
(OLIVEIRA, 2007).
Basicamente, existem duas abordagens para a análise de séries temporais: Análise no
domínio temporal e análise no domínio de frequência, onde ambas apresentam o objetivo de
construir modelos para as séries com propósitos determinados. Na primeira, os modelos
22
propostos são modelos paramétricos (com número definido de parâmetros) e na segunda os
modelos propostos são modelos não-paramétricos (MORETTIN; TOLOI, 2006)
Independente da classificação para os modelos de séries temporais, pode-se considerar
um número muito grande de modelos diferentes para descrever o comportamento de uma série
em particular. A construção destes modelos depende de vários fatores, tais como o
comportamento do fenômeno ou o conhecimento a priori que temos de sua natureza e do
objetivo da análise (MORETTIN; TOLOI, 2006). Na prática, depende, também, da existência
de métodos apropriados de estimação e da disponibilidade de programas (softwares)
adequados.
Normalmente as séries temporais podem conter cinco características: Tendência,
sazonalidade, algum ponto de influência discrepante, uma variância que se altera no tempo –
heterocedasticidade condicional e, não linearidade (OLIVEIRA, 2007). Tipicamente, uma
série temporal econômica apresenta pelo menos duas ou três dessas características.
Muitos modelos financeiros dependem de entendimento de séries temporais para
predizer a funcionalidade dos Mercados Financeiros e utilizam inferências estatísticas para
fins de prospecção. As séries temporais são uma forma especial de dados onde os valores
passados podem influenciar os valores futuros. E a relação entre variáveis influenciadas pelo
tempo, em finanças, pode ser caracterizada por tendências, ciclos, e o comportamento não-
estacionário entre pontos de dados que servem a um propósito de previsão ou informação para
o modelo (WALLACE, 2008)
O nível de sucesso destes métodos de previsão varia de estudo para estudo e depende
dos conjuntos de dados subjacentes e a forma que estes métodos são aplicados a cada vez. No
entanto, nenhum deles foi provado ser a ferramenta de previsão consistente que o investidor
gostaria de ter (KALYVAS, 2001).
Na literatura, diferentes métodos têm sido aplicados de forma a prever retornos de
ações no mercado. Estes métodos podem ser agrupados em quatro categorias principais: 1)
métodos de análise técnica, 2) métodos de análise fundamentais, 3) previsões tradicionais de
séries temporais e 4) métodos de aprendizado de máquina.
Os modelos de previsão em séries temporais podem ser estacionários, como os
modelos ARMA, ou não estacionários, como os modelos ARCH e GARCH. Entretanto,
embora modelos lineares venham sendo utilizados no passado para extrair essas relações, existem
relações não-lineares entre diversas variáveis financeiras. Desta forma, métodos como as Redes
Neurais Artificiais tem um lugar específico na literatura financeira visto que podem ser treinadas para
23
mapear valores futuros de séries temporais, de modo a extrair estruturas ocultas e das relações que
podem governar os dados (WALLACE, 2008).
2.2 AS REDES NEURAIS ARTIFICIAIS
As origens das Redes Neurais Artificiais
remontam a cerca de 50 anos em estudos matemático-estatísticos, mas só obtiveram
grande interesse a partir da década de 1980 com a evolução dos computadores, que
possibilitaram não só processamento de número muito maior de simulações, como
também a aceitação do modelo de computação paralela em computadores mais
rápidos, permitindo, então, a construção dos algoritmos. (BIALOSKORSKI NETO
et al, 2006, p.61)
De acordo com Gately (1996) mesmo perante a existência de computadores com poder
para se começar pesquisas práticas em Redes Neurais artificiais disponíveis desde o final da
década de 1970, apenas a partir de 1986, com o desenvolvimento da retro-propagação, tornou-
se possível que Redes Neurais Artificiais resolvessem problemas científicos, de negócios e
industriais do dia-a-dia.
Além do fator tecnológico, Wallace (2008) aponta que o relativamente recente
aumento no interesse e uso de modelos neurais tem origem em seus modelos não-lineares, que
podem ser treinados para mapear valores passados e futuros das relações entre entradas e
saídas, adicionando valor analítico através da possibilidade de extração de relações entre os
dados que não seriam tão óbvias utilizando outras ferramentas de análise (WALLACE, 2008).
De uma forma mais geral, uma Rede Neural Artificial pode ser considerada “uma
máquina projetada para modelar a maneira como o cérebro realiza uma tarefa particular ou
função de interesse; sendo normalmente implementada utilizando-se componentes eletrônicos
ou simulada por uma programação em um computador digital” (HAYKIN, 2001, p.28). Ou,
em outras palavras, “um software que imita a habilidade do cérebro humano de classificar
padrões ou de fazer previsões e decisões baseado em experiências passadas” (GATELY,
1996, p.3).
Uma RNA consiste em um sistema de processamento de informações que apresenta
certas características em comum com as Redes Neurais Biológicas que formam o sistema
nervoso dos seres vivos e tem por intuito construir representações internas de modelos ou
padrões detectados nos dados, geralmente não visíveis ao usuário (LEMOS et al, 2005).
24
De acordo com Wallace (2008), ela é basicamente, uma técnica de processamento de
dados que liga cursos de entradas com a saída, seu uso pode ser caracterizado por quatro tipos
de aplicações:
1. Classificação por linha de entrada (Input stream)
2. Associação com a saída dados os agrupamentos de setores de entrada
3. Codificação de entrada por saída produzida dentro de um subespaço dimensional
reduzido;
4. Simulação de saída a partir dos relacionamentos e interconexões das entradas
(inputs)
O sucesso das aplicações das Redes Neurais Artificiais pode ser atribuído às suas
características únicas e poderosa capacidade de reconhecimento de padrões. Diferente da
maioria das técnicas tradicionais de previsão, os modelos de RNAs auto-organizados possuem
a vantagem de não exigirem do usuário a aplicação de nenhuma teoria acerca da organização
destes dados, e podem fornecer subsídios para a atualização ou mesmo formulação de novas
teorias acerca do assunto em questão. Em outras palavras, a novidade das Redes Neurais
reside na sua capacidade para modelar processos não-lineares, sem suposições a priori sobre a
natureza do processo de geração, permitindo seu emprego como alternativa aos modelos
tradicionais (THAWORNWONG; ENKE, 2004; ZHANG, 2004; WALLACE, 2008;
BRIESCH; RAJAGOPAL, 2010; LIMA et al, 2010).
Estas características:
são particularmente interessantes para situações concretas de previsão em que os
dados são abundantes e facilmente disponíveis, mas o modelo teórico ou a relação
subjacente não é conhecido. Além disso, uma RNA tem uma capacidade de
aproximação funcional universal e são capazes de captar qualquer tipo de relação
complexa. Como o número de possíveis relações não-lineares em dados de negócio
geralmente é grande, RNAs têm a vantagem de aproximá-los bem. (ZHANG, 2004,
p.vi)
Como todo modelo, as RNAs possuem pontos fortes e fracos em comparação com
outros métodos. Sendo um de seus pontos fortes, a habilidade de facilmente acomodar
relações lineares e não-lineares, visto que o pesquisador não precisa especificar formas
funcionais com antecedência.
No quadro 1 – comparação entre RNAs e Modelos Lineares Gerais, abaixo, resumem-
se algumas vantagens e desvantagens chave das Redes Neurais em relação aos modelos
lineares tradicionais, destacando-se as perspectivas destes perante certas características
daquelas. Nele, pode-se observar, além de tópicos já mencionados sobre vantagens da
25
aplicação de RNAs em previsões de séries de tempo – como a possibilidade de utilização de
diversas variáveis e capacidade de aprender sozinha sobre as relações entre as variáveis,
alguns pontos fracos.
Destaca-se que parte dos pontos fracos apontados no quadro 1 referem-se a uma nova
perspectiva, ou mesmo consequência, de diferenças entre os modelos já mencionadas. Este é o
caso, por exemplo, da ausência da necessidade de uma noção prévia das relações entre as
variáveis e seu embasamento teórico, previamente destacada como um ponto positivo das
RNAs, que passa a ser apontada como desvantagem através da analogia das mesmas com
“caixas pretas”, uma vez que seus resultados podem ser obtidos sem a necessidade de se
basearem na teoria.
Quadro 1: Comparação entre RNAs e Modelos Lineares Gerais.
Fonte: Adaptado de Briesch e Rajagopal, 2010, p.382.
De acordo com Oliveira, Montini e Bergman (2008), as RNAs constituem uma
ferramenta flexível amplamente utilizada para a análise de séries temporais e sua aplicação
tem sido feita em diversas áreas, como Finanças e Economia. Segundo os autores, “estas redes
fornecem uma grande variedade de modelos matemáticos não-lineares, úteis para resolver
diferentes problemas em que são empregadas convencionalmente técnicas estatísticas”
(OLIVEIRA; MONTINI; BERGMAN, 2008, p.132).
As Redes Neurais Artificiais são também referidas na literatura como
Neurocomputadores, Redes Conexionistas, Redes Neuronais Artificiais, dentre outros. Neste
26
trabalho, optou-se pela utilização do termo Rede Neural Artificial (RNA) ou, ocasionalmente,
apenas Redes Neurais.
2.2.1 O NEURÔNIO ARTIFICIAL
Basicamente, as características das RNAs são formuladas através do estudo da célula
fundamental do cérebro, o neurônio, e reproduzidas através de algoritmos que procuram
simular o funcionamento de um conjunto de neurônios (HAYKIN, 2001).
Trabalhando analogicamente com o cérebro humano, as Redes Neurais empregam
uma interligação maciça de células computacionais simples denominadas “neurônios” ou
“unidades de processamento” (HAYKIN, 2001). E, segundo Haykin (2001), assemelham-se
ao cérebro em dois aspectos:
1. O conhecimento é adquirido pela rede a partir de seu ambiente através de um
processo de aprendizagem; e
2. Forças de conexão entre neurônios, conhecidas como pesos sinápticos, são
utilizadas para armazenar o conhecimento adquirido.
Através dos neurônios e suas ligações, de forma computacional, as informações
interligam-se por uma rede na qual cada unidade recebe e combina uma série de entradas
numa única saída, que dá entrada a uma nova unidade até a saída final da rede, ou a resposta
ao problema (BIALOSKORSKI NETO et al, 2006).
A estrutura de um neurônio, como ilustrada na figura 1, permite um conjunto de
valores como entradas (x1, x2, ..., xm) para a produção de uma saída única (yk). Tais entradas
são ponderadas por respectivos pesos sinápticos (wk1, wk2, ...wkm) e somadas ao valor de um
bias bk aplicado externamente. O bias bk tem o efeito de aumentar ou diminuir a entrada
líquida da função de ativação, dependendo se ele é positivo ou negativo. Em seguida uma
função de ativação φ(.) é utilizada para restringir a amplitude do sinal de saída.
27
Figura 1: Modelo não linear de neurônio artificial.
Fonte: Haykin, 2001, p.38.
A função de ativação ϕ(.)define a saída de um neurônio, a regra para o mapeamento
das entradas somadas do neurônio até sua saída, introduzindo a capacidade de processar a
não-linearidade na rede (OLIVEIRA et al, 2008). Segundo Oliveira et al (2008) e Haykin
(2001), a função de ativação mais comum utilizada na construção de RNAs é a sigmoide,
definida por uma função “de estreitamento crescente que exibe um balanceamento adequado
entre comportamento linear e não linear” (HAYKIN, 2001, p.40). A função sigmoide pode ser
expressa por:
Onde g é o ganho, ou parâmetro de inclinação da função sigmoide.
O processamento realizado pelos neurônios, além de estar disposto em uma arquitetura
paralela, também lança mão de uma propagação sequencial na qual os neurônios de camadas
posteriores recebem como sinal de entrada o resultado do processamento ocorrido nas
camadas anteriores (ZHANG et al, 2004; PANDA; NARASIMHAN, 2006). Estas operações
consistem na multiplicação do valor de cada entrada pelo respectivo peso associado e na
posterior soma para resultar em um valor (BOSAIPO, 2001). Nos modelos de Redes Neurais
Artificiais, estas características são simuladas através da adoção de estado, função e limiar de
ativação (BRAGA; CARVALHO; LUDERMIR, 2007).
2.2.2 ARQUITETURA DE RNA
28
A estrutura da Rede Neural, composta de interconexões de neurônios, pode variar
quanto ao número de camadas, neurônios em cada camada, função de ativação dos neurônios
em uma camada e a forma como as camadas são conectadas (totalmente ou parcialmente).
Existem basicamente três tipos de arquitetura de RNA: redes feedforward (alimentada
adiante) de camada única, redes feedforward de múltiplas camadas e redes recorrentes.
As redes feedfoward, também conhecidas por redes alimentadas adiante ou acíclicas,
podem ser de camada única (Figura 2) ou de múltiplas camadas (Figura 3). Onde a designação
“camada única” se refere à camada de saída dos neurônios, não sendo contabilizada a camada
de entrada dos neurônios uma vez que nela não é realizada qualquer computação.
Figura 2: Rede feedforward de uma única camada de neurônios.
Fonte: Haykin, 2001, p.47.
Figura 3: Rede feedforward de múltiplas camadas
Fonte: Haykin, 2001, p.48.
29
As RNAs acíclicas de múltiplas camadas se distinguem pela presença de uma ou mais
camadas ocultas, cujos nós computacionais são chamados correspondentemente de neurônios
ocultos ou unidades ocultas (HAYKIN, 2001). A função desses neurônios é intervir entre a
entrada externa e a saída da rede de uma maneira útil.
Convindo ressaltar que uma Rede Neural do tipo feedforward é especialmente
adequada para realizar previsão de séries que apresentam volatilidade, devido ao tratamento
da não-linearidade realizada pela utilização de funções sigmoides na camada de entradas
(OLIVEIRA et al, 2008).
O funcionamento de um RNA do tipo feedfoward pode ser retratado pela figura 4,
abaixo:
Figura 4: Funcionamento de uma RNA feedfoward.
Fonte: Adaptado de Wallace, 2008, p.71.
O terceiro tipo de arquitetura é o das redes recorrentes (Figura 5), também conhecidas
por cíclicas. Esta se diferencia das redes feedforward por ter ao menos um laço de
retroalimentação.
30
Figura 5: Rede feedforward de múltiplas camadas e redes recorrentes.
Fonte: Braga, Carvalho e Ludemir, 2007, p.11.
A escolha da estrutura da Rede Neural determina diretamente a qualidade do modelo
obtido e diversas atividades são necessárias para a definição da arquitetura de uma RNA para
a qual um problema específico deverá ser resolvido de forma ótima (RIBEIRO et al, 2009).
Na maior parte das aplicações de previsão, somente uma camada oculta é usada,
embora algumas situações excepcionais justifiquem um número maior. Já o número de
neurônios nas camadas de entrada e de saída depende da dimensionalidade dos dados,
enquanto que o número de neurônios nas camadas intermediárias depende da complexidade
do problema, de forma que quanto maior o número de neurônios nas camadas intermediárias,
mais complexas são as funções mapeadas com a RNA. (RIBEIRO et al, 2009).
2.2.3 APRENDIZAGEM
De forma similar ao ser humano, as Redes Neurais Artificiais são capazes de aprender
comportamentos através de exposição de exemplos dos mesmos (LEMOS et al, 2005). Nesta
fase, as entradas são apresentadas e as redes aprendem a extrair informações relevantes a
partir desses padrões, com isso, a rede pode gerar resultados e conduzir a conclusões lógicas
ou não previstas através do modelo (WALLACE, 2008)
No contexto de Redes Neurais, aprendizagem pode ser definida como:
Um processo pelo qual os parâmetros livres de uma rede neural são adaptados
através de um processo de estimulação pelo ambiente no qual a rede está. O tipo de
aprendizagem é determinado pela maneira pela qual a modificação dos parâmetros
ocorre (HAYKIN, 2001, p.75).
31
Esta definição, segundo Haykin (2001, p. 75), implica a seguinte sequência de
eventos:
1. A rede neural é estimulada por um ambiente
2. A rede neural sofre modificações nos seus parâmetros livres como resultado
desta estimulação
3. A rede neural responde de uma maneira nova ao ambiente, devido às
modificações ocorridas na sua estrutura interna.
Os algoritmos de aprendizado podem ser classificados em três paradigmas distintos:
aprendizado supervisionado, aprendizado não-supervisionado e aprendizado por reforço.
A aprendizagem supervisionada, também conhecida como aprendizagem com um
professor, caracteriza-se pela existência de um professor ou supervisor, externo a rede que
tem a função de monitorar a resposta da mesma para cada vetor de entrada. Como aponta
Medeiros 2007, neste aprendizado, são sucessivamente apresentadas à rede conjuntos de padrões
de entrada e seus correspondentes padrões de saída. De forma que, durante este processo, a rede
realiza um ajustamento dos pesos das conexões entre os elementos de processamento, segundo
uma determinada lei de aprendizagem, até que o erro entre os padrões de saída gerados pela rede
alcance um valor mínimo desejado.
Figura 6: aprendizado supervisionado.
Fonte: Dutta et al, 2006, p.286.
No aprendizado não-supervisionado a rede é autônoma, ela não necessita de um
“professor”, sendo o processo direcionado por correlações existentes nos dados de entrada.
Nele, a rede “analisa” os conjuntos de dados apresentados a ela, determina algumas propriedades
dos conjuntos de dados e “aprende” a refletir estas propriedades na sua saída (MEDEIROS, 2007).
O aprendizado por reforço pode ser considerado um paradigma intermediário entre o
aprendizado supervisionado e o não-supervisionado. O conjunto de treinamento é formado
32
apenas pelos vetores de entrada, mas existe um crítico externo em substituição ao supervisor
do aprendizado supervisionado.
2.2.4 IMPLEMENTANDO UMA RNA
Existem algumas etapas gerais a serem seguidas para a implementação de uma Rede
Neural Artificial. Para que se possa compreender tal processo, abaixo expõe-se uma breve
explanação sobre as mesmas.
2.2.4.1 DEFINIÇÃO DA REDE E ESCOLHA DO SOFTWARE
Processo pelo qual a RNA é desenvolvida teoricamente. Nessa etapa, são definidas
questões primordiais, como os problemas que a rede deve solucionar, bem como as variáveis
de relevância para a obtenção da resposta ao problema proposto.
Para o desenvolvimento de sistemas a base de Redes Neurais existe um certo número
de pacotes para micro computadores voltados especificamente para este fim (Brainmaker,
Neuroshell, Explorer, Matlab, Nestor e etc), entretanto também podem ser utilizados
softwares estatísticos como Microsoft Office, Statistica ou SPSS.
2.2.4.2 OBTENÇÃO DE DADOS
O segundo elemento indispensável é a obtenção de dados, os quais poderão ser
quantitativos ou qualitativos.
A fim de realizar o processo de experimentação através de Redes Neurais, três
subconjuntos de dados devem ser selecionados: o de treinamento, o de validação e o de teste.
O subconjunto de treinamento serve para treinar a rede, ou seja, é através desses dados que a
rede neural é criada. O subconjunto de validação é utilizado para acompanhar o desempenho
da rede a partir de uma mostra independente. Para testar a rede com um subconjunto de dados
independente da criação do modelo, um terceiro subconjunto de teste deve ser selecionado
(ZANETI JR; ALMEIDA, 1998).
Ressalta-se que em alguns modelos, o pesquisador pode optar por estudar os
subconjuntos de validação e o de teste durante o mesmo processo.
2.2.4.3 TREINAMENTO
33
Esta etapa é de fundamental importância para a validação da rede, pois é nela que a
rede recebe os dados para treinamento, classificados como supervisionados ou não-
supervisionados. No modo supervisionado, a rede recebe os valores de entradas e quais devem
ser os resultados de saída, analisados previamente, e estabelece os pesos das correlações; já no
modo não-supervisionado a rede analisa as diversas informações e determina semelhanças,
aprendendo a utilizar essas informações em suas saídas (BIALOSKORSKI NETO et al,
2006).
Como mencionado anteriormente, existem dois tipos de paradigmas de aprendizado:
supervisionado, o qual supõe a existência de um direcionador externo que orienta a rede para
as saídas desejadas, e não supervisionado, no qual inexiste este direcionador, fazendo com
que os resultados produzidos pela rede sejam considerados como sendo o melhor
processamento possível obtido a partir dos dados disponíveis. A escolha do paradigma de
aprendizado depende do tipo de aplicação a que a rede neural será utilizada e às limitações
relativas à topologia da rede. (HAYKIN, 2001).
A otimização do processo de criação das redes através de algoritmos genéticos ou a
difusão dos dados para melhor representação permitem aumentar a precisão dos modelos
(ZANETI JR; ALMEIDA, 1998).
2.2.4.4 ETAPA DE TESTES (UTILIZAÇÃO DA RNA)
Após o treinamento, o método passa a fornecer dados confiáveis. Utilizando
estimativas, pode-se entrar com novos dados para verificar como certa alteração teria efeito
sobre determinada função, ou qualquer outro resultado para o qual a rede tenha sido treinada
(BIALOSKORSKI NETO et al, 2006).
2.2.4.5 MANUTENÇÃO
A partir de grandes mudanças de ambiente, ou mesmo de variáveis de alta relevância,
a rede deve receber certa manutenção para que os pesos das conexões, correlações, sejam
sempre atualizados (BIALOSKORSKI NETO et al, 2006).
34
3 METODOLOGIA
Este capítulo expõe os elementos da metodologia científica utilizados no presente
trabalho. Nele serão descritos o tipo de pesquisa, bem como os procedimentos de coleta de
dados, tratamento de dados e análise dos resultados.
3.1 TIPO DA PESQUISA
Este trabalho está baseado em teorias quantitativas de análise, sendo assim os modelos
matemáticos e estatísticos são utilizados a fim de atender o objetivo da pesquisa. Segundo
Markoni e Lakatos (1990), os estudos quantitativos são aqueles em que os pesquisadores
estabelecem hipóteses e as testa por meio da mensuração de variáveis operacionais definidas,
quantificando o resultado com o uso de variados métodos matemáticos e estatísticos. Sendo
um tipo de pesquisa tradicionalmente aceito como tendo confiabilidade, fidedignidade e
validade, desde que realizado seguindo uma metodologia rigorosa (MARKONI; LAKATOS,
1990).
Convém ressaltar que, visto este estudo ter por objetivo a análise da adequação do
Método de Redes Neurais Artificiais à realização de previsões do Ibovespa, optou-se por
realizar tal questão por meio da comparação de resultados entre este e o Método de previsão
em séries temporais GARCH.
3.2 AMOSTRAGEM
Segundo a Bolsa de Valores oficial do Brasil, BM&F Bovespa (2011), os preços das
ações podem variar por diversos motivos, logo, com o intuito de orientar as decisões de
investimento, criaram-se alguns Índices que buscam retratar a situação dos investimentos
realizados durante os pregões, retratando a valorização de um determinado grupo de papéis ao
longo do tempo.
Geralmente, pode-se perceber a qual segmento do mercado cada Índice pretende
observar através de seu nome. Atualmente, existem os seguintes Índices: Índice Bovespa
(Ibovespa), Índice Brasil 50 (IBrX-50), Índice Brasil (IBrX), Índice Brasil Amplo (IBRA),
Índice de Sustentabilidade Empresarial (ISE ), Índice Carbono Eficiente (ICO2), Índice
Setorial de Telecomunicações (ITEL), Índice de Energia Elétrica (IEE), Índice do Setor
Industrial (INDX), Índice de Consumo (ICON), Índice Imobiliário (IMOB), Índice de
35
Materiais Básicos (IMAT), Índice Utilidade Pública (UTIL), Índice de Ações com
Governança Corporativa Diferenciada (IGC), Índice de Governança Corporativa Trade
(IGCT), Índice de Ações Tag Along Diferenciado (ITAG), Índice Mid-Large Cap (MLCX),
Índice Small Cap (SMLL), Índice Valor Bovespa (IVBX-2), Índice Financeiro (IFNC) e
Índice de Dividendos (IDIV).
Optou-se por se realizar previsões acerca do Índice Bovespa, adotando-o como
indicador que melhor refletiria o comportamento geral do mercado objeto de estudo. Visto sua
composição e que o mesmo é o mais relevante indicador do desempenho médio das cotações
do Mercado de Ações Brasileiro, já que retrata o comportamento dos principais papéis
negociados na BM&F Bovespa e também por sua tradição (BM&F BOVESPA, 2011, s/n).
3.3 COLETA DE DADOS
Os dados econômicos e financeiros necessários para o estudo consistiram basicamente
de séries históricas e o acesso aos mesmos ocorreu através de consulta ao site da BM&F
Bovespa – Bolsa de Valores, Mercadorias e Futuros de São Paulo.
Dentre os dados coletados, estão os valores diários dos 21 Índices da BM&F Bovespa
listados no tópico acima, quando disponíveis, durante um horizonte de tempo que abrangeu
desde o primeiro dia útil do ano de 2006 (dois de janeiro) até o último dia útil do mês de
janeiro do ano de 2011, a saber, dia 31.
A coleta de outros Índices além do Ibovespa se justifica pelo fato de que tais dados
foram inseridos como inputs nos modelos de previsão baseados em redes neurais. Isso ocorreu
pois os modelos baseados em Redes Neurais Artificiais podem extrair relações interessantes
ao seu modelo de previsão a partir do comportamento de outras variáveis e identificação de
inter-relações no sistema e, portanto, considerou-se válida a inserção de dados referentes ao
comportamento dos diferentes setores do mercado abordados pelos Índices por retratarem
segmentos e portfólios distintos do mercado e por terem potencial para adicionar
contribuições significativas às redes neurais modeladas visto que o Ibovespa pode ser
considerado um reflexo do comportamento geral do mercado.
Optou-se por este período de tempo visto que o mesmo seria capaz de prover um
número razoável de entradas para estudo da série temporal (aproximadamente 1250 dados
para cada Índice), ao mesmo tempo em que permite a inclusão de quase todos os índices
atualmente trabalhados pela BM&F Bovespa devido à existência de dados referentes aos
mesmos durante todos os períodos deste horizonte de tempo.
36
3.4 TRATAMENTO DOS DADOS
Uma vez coletados os dados, os mesmos foram tratados por meio de métodos
estatísticos e financeiros de acordo com as necessidades dos modelos a serem utilizados
(Redes Neurais e GARCH).
Criou-se, por exemplo, uma base de dados convertida na qual transformou-se os dados
de valores diários (preços) em retornos diários. Onde, denotando observações sucessivas de
uma variável tomada nos instantes t e t+1 a transformação da série de valores em uma série
de retornos foi dada por:
Y t = Log(t+1) - Log(t)
Após esta etapa de adequação dos dados, desenvolveram-se modelos de previsão para
o Ibovespa através dos métodos das Redes Neurais Artificiais e GARCH (modelo de
controle).
Durante esta etapa foram utilizados os softwares MS Excel – para organização e
tratamento inicial dos dados, Eviews – para modelagem do método GARCH e MATLAB
(versão estudante) – para modelagem do método de RNA.
3.4.1 TRATAMENTO DOS DADOS PARA A RNA
Observou-se na base de dados utilizada que dois dos 21 Índices – ICON e ICO2 - não
apresentavam dados referentes aos seus valores durante um longo período de tempo da série,
optando-se por excluí-los dos parâmetros estudados para fins de tornar a inter-relação
modelada pela RNA mais coesa, restando assim 19 parâmetros (Índices) para estudo. E, como
mencionado anteriormente, a Rede Neural Artificial foi desenvolvida para realizar a previsão
do período (dia) seguinte do Índice Bovespa.
Ressalta-se que visto a possibilidade da RNA de extrair informações dos
comportamentos e relações dos demais Índices, este modelo se utiliza não apenas dos dados
históricos do Ibovespa como também dos demais Índices disponíveis acerca do mercado a fim
de que a rede tenha a possibilidade de criar um modelo mais acurado de previsão.
Para fins de comparação de resultados, foram desenvolvidos dois modelos de RNA.
Um utilizando os dados em sua forma original (preços diários) e apenas após a previsão
37
convertidos para retornos diários, para fins de padronização de resultados. E o outro tendo
seus dados de entrada convertidos para retornos diários antes da modelagem da rede, gerando
suas previsões já em forma de retornos. Entretanto, embora os dados de entrada e saídas sejam
diferentes (preços – retornos), ambas utilizaram a mesma metodologia e estrutura.
Para a modelagem das Redes Neurais a base de dados foi dividida em dois grupos.
Para o modelo baseado em preços, o grupo de treinamento consistiu nos dados referentes aos
valores do período 1 ao período 1200, ou seja, de dois de janeiro de 2006 a 11 de novembro
de 2010. Já o grupo de teste e validação foi composto pelos 50 períodos seguintes do banco de
dados, abarcando o período de 12 de novembro de 2010 a 26 de janeiro de 2011. Já para o
modelo baseado em retornos, o grupo de treinamento abarcou do período 2 (visto a perda da
primeira observação AR se realizar a transformação da série de preços para retornos) ao 1196,
enquanto que o grupo de teste e validação gerou previsões para os 50 períodos seguintes.
Depois de selecionados os dados, iniciou-se o estudo da melhor estrutura a ser
utilizada na rede. Após uma analise inicial optou-se, para um melhor tratamento dos dados,
por utilizar não apenas um período (n) para realizar a previsão do próximo (n+1), mas sim a
carga histórica do período atual mais os quatro anteriores, como pode ser ilustrado através da
figura7. Convém ressaltar que para cada período de tempo utilizado como entrada nas RNAs
foram fornecidos os valores de cada um dos 19 parâmetros (Índices), esta ação está
representada na figura abaixo pelos grupos de 19 entradas referentes a cada um dos períodos
de tempo “n”, “n-1”, “n-2”, “n-3” e “n-4” e que somam um total de 95 dados utilizados como
entrada na rede.
38
Onde :
I = valor diário do Índice no período
n = dia
X = entrada fornecida ao sistema para cada parâmetro
MLP = MultiLayer Perceptron (Perceptron de Múltipla Camada)
Figura 7: Estrutura Inicial da RNA
Fonte: Dados da Pesquisa, 2011.
Entretanto, após tentativas de modelagem através desta estrutura e do nível de erro
obtido, resolveu-se pela utilização da Análise dos Componentes Principais (PCA) para fins de
reduzir o número de entradas e, assim, aumentar a relevância dos dados levados em
consideração pela rede (MLP) em si. Desta forma conseguiu-se reduzir o número de entradas
a serem fornecidas à rede de 95 para 20, como pode ser visualizado através da seguinte figura:
Figura 8: Estrutura Final da RNA
Fonte: Dados de Pesquisa, 2011.
Por meio desta estrutura, pôde-se chegar a uma Rede Neural Artificial do tipo
feedforward e de aprendizado supervisionado, cuja arquitetura, ilustrada pela figura 9,
consistiu em 20 dados na camada de entrada, 90 neurônios em uma camada oculta e um dado
na camada de saída (previsão do Ibovespa).
Nesta rede empregou-se o BackPropagation, através da ferramenta disponível na
Toolbox (caixa de ferramentas) do software utilizado (MATLAB). Para fins deste estudo
39
optou-se também por se utilizar a função de ativação de entrada como sendo a tangente
Sigmoid e uma função de saída linear.
Figura 9: Arquitetura da Rede Neural Artificial
Fonte: Dados de Pesquisa, 2011.
3.4.2 TRATAMENTO DOS DADOS PARA O MODELO DE CONTROLE
Para fins de estudo dos resultados obtidos pelos modelos de RNA gerados, realizou-se
a modelagem de um modelo de controle baseado nos modelos tradicionais de análise de séries
temporais. Visto as características dos dados estudados e do objetivo do modelo, optou-se
pela utilização do método ARCH/GARCH para a modelagem deste modelo de controle.
O modelo
Enquanto séries temporais e modelos econométricos convencionais operam com a
suposição de variância constante, o modelo ARCH (Autoregressive Conditional
Heterocedasticity) desenvolvido por Engle (1982) considera ser a variância heterocedástica,
ou seja, não é constante ao longo do tempo (BOLLERSLEV, 1986).
Uma importante extensão deste modelo é a sua versão generalizada proposta por
Bollerslev (1986), denominada GARCH (Generalized Autoregressive Conditional
Heterocedasticity). A modelagem GARCH leva em consideração não somente a estrutura
autoregressiva, mas também a estrutura de médias móveis descrito pela última parcela do
modelo ARCH, podendo também afetar a variância condicional quando esta for estimada.
40
O modelo GARCH pode ser usado para descrever a volatilidade com menos
parâmetros que um modelo ARCH. Neste modelo, a função linear da variância condicional
inclui também variâncias passadas.
Assim sendo, a volatilidade dos retornos depende dos quadrados dos erros anteriores e
também de sua própria variância em momentos anteriores. Segundo Bollerslev (1996, p.309),
um modelo GARCH (p,q) é dada seguinte forma:
onde
Ressaltando-se que q representa a ordem do componente ARCH e p a ordem do
componente GARCH.
O modelo GARCH utilizado neste trabalho foi um GARCH (1,1), versão mais simples
e mais utilizada em séries financeiras, que pode ser representada por:
Tratamento de dados
Para a realização da modelagem GARCH, fizeram-se necessárias as observações de
alguns testes e análises padrão, discutidos a seguir.
Primeiramente, com o intuito de se transformar a série de dados a ser trabalhada em
uma série estacionária, realizou-se a conversão da mesma de valores diários (preços) do
Ibovespa (IBOV) em uma série de retornos diários deste Índice por meio da equação
especificada anteriormente.
A Figura 10 ilustra o comportamento da série original do Ibovespa (IBOV) e da série
de retornos do Ibovespa (RIBOV) no período sob análise. Por meio dela, percebe-se
visualmente que a série RIBOV, ao contrário da IBOV, apresenta estacionariedade.
41
-.15
-.10
-.05
.00
.05
.10
.15
20000
30000
40000
50000
60000
70000
80000
250 500 750 1000 1250
IBOV RIBOV
____ IBOV ____ RIBOV
Figura 10: comportamento da série de preços (IBOV) e de retornos do Ibovespa (RIBOV).
Fonte: Dados de Pesquisa, 2011.
Além da observação gráfica, optou-se por também realizar o teste de Dickey-Fuller
Aumentado (teste de ADF) em ambas as séries, para verificação da existência ou não de raiz
unitária – onde quanto mais negativo o número retornado da estatística de ADF, mais
indicativo o teste se torna a rejeitar a hipótese nula de que existe raiz unitária. Por meio deste
teste conclui-se que, diferentemente da série IBOV, a série de retornos não apresenta raiz
unitária.
Tabela 1: Teste de estacionariedade.
Teste para Raiz Unitária Dickey-Fuller
Série Ibovespa
Série de retornos do Ibovespa
-2,112709
-36,04160
Fonte: Dados de Pesquisa, 2011.
Nota:
O valor crítico a 1% de significância* é de -3.965416;
* Valor crítico de MacKinnon para rejeição da hipótese de raiz unitária.
Através da observação gráfica e do teste ADF, pode-se observar a evidência de que a
série de retornos do Ibovespa é estacionária e não contém raiz unitária, sendo assim, em
primeira instância, passível de modelagem GARCH. Ademais, observando-se o
comportamento da série RIBOV, percebe-se também o padrão diferenciado da variância por
meio de concentração de volatilidade durante o período da Crise Econômico-Financeira
mundial de 2008-2009 (observações 595 a 968, aproximadamente), sugerindo a necessidade
de que um modelo de heteroscedasticidade seja aplicado durante o tratamento da série.
42
Por meio do estudo das estatísticas descritivas da série RIBOV (Figura11), analisou-se
o nível de assimetria e curtose da mesma, bem como o indicador do teste de Jarque-Bera,
verificando-se a rejeição da hipótese de normalidade, visto o valor retornado pelo teste de
Jarque-Bera ser superior a 6, e observando-se que a série apresenta leptocurtose, demonstrada
pelo excesso de curtose e assimetria negativa.
0
50
100
150
200
250
300
350
-0.10 -0.05 -0.00 0.05 0.10
Series: RIBOV
Sample 1 1250
Observations 1249
Mean 0.000575
Median 0.001478
Maximum 0.136782
Minimum -0.120961
Std. Dev. 0.020799
Skewness -0.005650
Kurtosis 8.771046
Jarque-Bera 1733.253
Probability 0.000000
Figura 11: Gráfico de distribuição e estatísticas descritivas da série RIBOV.
Fonte: Dados de pesquisa, 2011.
Observando-se as funções de autocorrelação (AC) e de autocorrelação parcial (FAC),
vide tabela 2, verificou-se a presença de poucos dados fora do Intervalo Assintótico da série,
indicando a existência de ruído branco e a não necessidade de se modelar a média da série,
evitando-se assim, o aumento do erro embutido no modelo. Logo, o momento condicional da
série necessitaria ser modelado segundo uma estrutura autoregressiva da família ARCH.
Tabela 2: Autocorrelação e autocorrelação parcial da série RIBOV.
Retornos RIBOV
a1 (p1)*
a2 (p2)
a3 (p3)
a4 (p4)
a5 (p5)
2/ **
-0,020(0,020)
-0,043(0,043)
-0,071(0,073)
-0,003(0,009)
-0,019(0,026)
0,056569
*ai e pi denotam os coeficientes de autocorrelação e autocorrelação parcial da i-ésima ordem,
respectivamente.
** Limite assintótico da função de autocorrelação
Fonte: Dados de Pesquisa, 2011.
Série: RIBOV
Amostra: 1 1250
Observações 1249
Média 0,000575
Mediana 0,001478
Máximo 0,136782
Mínimo - 0,120961
Desv.Pad. 0,020799
Assimetria -0,005650
Curtose 8,771946
Jarque-Bera 1733,253
Probabilidade 0,000000
43
Embora tenha sido verificada a não necessidade da aplicação de um modelo ARMA,
devido a sua característica heteroscedástica optou-se por realizar um modelo ARMA (1,1)
com o intuito de se gerar a possibilidade da observação dos resíduos deste modelo, se
viabilizando o estudo das variâncias (efeitos ARCH) da série estudada. Para este modelo,
utilizou-se um filtro de correção de Newey-West tornando-o robusto à heteroscedasticidade e
autocorrelação no processo do resíduo, obtendo-se os resultados ilustrados por meio da tabela
3, abaixo.
Tabela 3: Resultados do Modelo ARMA (1,1) para geração de resíduos para estudo.
Equação de Variância
Coeficiente Erro Padrão Estatística-z P Valor
AR (1)
MA (1)
0,737926
-0,790481
0,189690
0,173818
3,890165
-4,547755
0,0001
0,0000
Critério de Informação de Akaike - 4,911962
Critério de Informação de Schwarz - 4,903742
Máxima Verossimilhança 3067,064
Fonte: Dados de Pesquisa, 2011.
Uma vez de posse dos resíduos gerados por meio do Modelo ARMA (1,1), pôde-se
aplicar o teste de ARCH de Engle (1982) para estudo dos mesmos (tabela 4).
Tabela 4: Testes de efeitos ARCH.
TESTE ARCH 1 lag 5 lags 10 lags 20 lags
F-statistic 51,55367 88,21203 64,54719 39,39459
p-valor 0,000000 0,000000 0,000000 0,000000
Fonte: Dados de pesquisa, 2011.
Conforme os p-valores, os testes para efeitos ARCH fornecem fortes evidências contra
a hipótese nula de não haver heteroscedasticidade condicional na volatilidade dos modelos
para a série estudada (RIBOV).
3.5 PROCEDIMENTO DA ANÁLISE DOS RESULTADOS
Os resultados obtidos por meio da implementação das RNAs e do modelo de controle
(GARCH (1,1)) foram analisados estudando-se as previsões e erros obtidos em cada modelo
de forma a se visualizar qual seria aquele mais aderente à base de dados utilizada.
Para uma padronização dos resultados, foram estudadas e comparadas as previsões
geradas pelos modelos para do período número 1202 (16 de novembro de 2010) ao 1246 (19
44
de janeiro de 2011) do Índice Bovespa , analisando-se assim, uma amostra de 45 observações
do grupo de previsão gerado por cada modelo.
Para estudo da precisão das previsões realizadas foram calculados os indicadores MSE
(Erro Quadrado Médio), RMSE (Raiz do Erro Quadrado Médio) e o MAE (Erro Médio
Absoluto) de acordo com as fórmulas a seguir:
Onde pi representa o valor predito e oi o valor observado. De acordo com estes
indicadores, o modelo com menores MSE, RMSE e MAE apresentaria evidência de ser
superior.
Outro indicador calculado foi o coeficiente de U de Theil, o qual avalia o desempenho
das previsões contra os valores da previsão ingênua, também conhecida por previsão naïve, a
qual considera que a estimativa do período futuro é igual a estimativa do valor atual.
O U de Theil é calculado de acordo com a seguinte fórmula:
Onde At é o valor atual e Ft é p valor predito. E de forma que se U > 1, significa que o
erro do modelo é maior do que da previsão ingênua e, consequentemente, se U < 1, significa
que o erro do modelo é menor que da previsão ingênua.
Quanto mais próximo de zero for a estatística de U de Theil, melhor será o resultado
da previsão do modelo.
Por fim, complementou-se a análise da precisão das previsões dos modelos por meio
dos testes abrangente de regressões (forecast encompassing tests), nos quais, para cada par de
modelos, realizam-se duas regressões dos erros de previsão de um para com a previsão do
outro :
45
(pai – oi) = γ pbi + εi
(pbi – oi) = Φ pai + υi
Onde: pai e pbi são os valores previstos nos modelos a e b, respectivamente, oi é o
valor atual (pai – oi) e (pbi – oi) são os erros de previsão dos dois modelos, a e b, e εi e υi
são os erros aleatórios.
De acordo com estes testes, se γ é significativamente diferente de zero mas Φ não é,
rejeita-se a hipótese nula de que nenhum modelo é superior ao outro, a favor da hipótese
alternativa de que o modelo b é superior ao modelo a. Por outro lado, se γ é
significativamente diferente de zero, mas Φ não é, pode-se concluir que o modelo a é superior
ao b. E se ambos γ e Φ não forem significantes, ou se ambos forem, pode-se concluir que
nenhum dos modelos é superior ao outro (CARVALHAL; RIBEIRO, 2007).
Para este estudo, trabalhou-se considerando um nível de significância de 5%.
46
4 RESULTADOS E ANÁLISE
Para fins do estudo foram realizadas duas modelagens por meio de Redes Neurais
Artificiais e uma utilizando o modelo GARCH, todas com o objetivo de realizarem previsões
para a série temporal do Ibovespa. Neste capítulo são explorados os resultados obtidos por
meio destas modelagens, bem como sua análise.
4.1 REDES NEURAIS ARTIFICIAIS
Para fins de comparação foram realizados dois modelos de RNA por meio da
metodologia previamente especificada. Abaixo, os resultados destes modelos.
4.1.1 RNA BASEADA EM PREÇOS
Como destacado na metodologia, para o modelo de RNA os dados foram separados
em dois grupos, o de treinamento e o de teste e validação. Na etapa de treinamento a rede
recebe os valores de entradas, quais devem ser os resultados de saída e estabelece os pesos das
correlações. A Figura 12 ilustra o comportamento das previsões realizadas pela RNA na etapa
de treinamento, em comparação com os dados reais obtidos para o mesmo período de tempo.
____ Dados históricos ____ RNA
Figura 12: Comportamento da RNA (preços) em comparação com os dados históricos – etapa de
treinamento.
Fonte: Dados de pesquisa, 2011.
valor
período
47
Após esta etapa foi-se realizada a etapa de teste e validação, que consistiu em prever o
valor diário do Ibovespa para os últimos 50 períodos da série estudada. O comportamento dos
resultados obtidos por esta fase são ilustrados abaixo.
____ Dados históricos ____ RNA
Figura 13: Comportamento da RNA em comparação com os dados históricos – etapa de utilização.
Fonte: Dados de pesquisa, 2011.
Uma vez de posse dos valores históricos e dos valores previstos pela RNA pôde-se
calcular o erro obtido pelas previsões da rede. Estes dados são listados pela tabela encontrada
no Apêndice A-1.
Abaixo, a figura 14 demonstra o comportamento do erro e seu desvio padrão, para fins
de ilustração.
Figura 14: Comportamento do erro e seu desvio padrão (RNA – preços). Fonte: Dados de pesquisa, 2011.
período
valor
48
Por fim, para fins de comparação do resultado obtido pela RNA e pelo modelo de
controle, adaptou-se os dados previstos pela RNA, convertendo-os de preço para retorno nos
períodos de previsão, calculando-se assim um novo erro e, então, um erro quadrático
(Apêndice A-2)
Figura 15: Comportamento do erro e seu desvio padrão (RNA – preços, após conversão de seus
resultados para retornos).
Fonte: Dados de pesquisa, 2011.
4.1.2 RNA BASEADA EM RETORNOS
Para o segundo modelo de RNA, converteu-se a base de dados de valores diários para
retornos diários e os quais foram então submetidos a uma modelagem RNA de mesma
estrutura daquela do modelo anterior. Por meio desta, foram obtidos os seguintes
comportamentos da série de treinamento da série de previsão na fase de treinamento
(figura16) e na fase de teste e validação (figura 17).
____ Dados históricos ____ RNA
Figura 16: Comportamento da RNA (retornos) em comparação com os dados históricos – etapa de
treinamento.
Fonte: Dados de pesquisa, 2011.
49
____ Dados históricos ____ RNA
Figura 17: Comportamento da RNA (retornos) em comparação com os dados históricos – etapa
utilização.
Fonte: Dados de pesquisa, 2011.
Observa-se graficamente que o modelo de previsão gerado parece se adequar bem aos
dados estudados e, além disso, de forma superior aos modelos previamente desenvolvidos.
Entretanto, para comprovação, realizou-se um cálculo do erro quadrático da mesma, onde
foram obtidos os valores apresentados na tabela do Apêndice B, bem como se observou o
comportamento dos erros frente ao seu desvio padrão (figura 18).
Figura 18: Comportamento do erro e seu desvio padrão (RNA – retornos).
Fonte: Dados de pesquisa, 2011.
Embora ambos os modelos tenham sido desenvolvidos satisfatoriamente, percebe-se
que o modelo baseado diretamente nos retornos dos Índices ao invés dos preços diários
apresentou menores erros e, logo, desvio padrão indicando uma melhor adequação à base de
dados utilizada visto suas previsões estarem mais próximas do real que o primeiro modelo.
Isto indica que o fato de se trabalhar com uma base de dados de menor volatilidade
(retornos, frente a preços) parece ter influenciado no resultado final obtido pela RNA.
4.2 MODELO DE CONTROLE - GARCH (1,1)
50
Após verificar-se a presença dos fatos estilizados (assimetria, linearidade,
normalidade, estacionariedade, volatilidade e curtose) como elemento primário para
determinar se o modelo GARCH seria um modelo estatístico adequado à série temporal sob
análise. Realizou-se uma modelagem ARMA (1,1) para possibilizar a aplicação do o teste
ARCH de Engle (1982).
Uma vez que os p-valores encontrados neste teste forneceram fortes evidências contra
a hipótese nula de não haver heteroscedasticidade condicional na volatilidade dos modelos
para a série estudada (RIBOV). Modelou-se a série transformada levando-se em consideração
o padrão heteroscedástico da volatilidade para a média condicional dos resíduos, através do
método GARCH (1,1).
Visto que o modelo ARMA foi realizado apenas para fins de estudo de seus resíduos,
ao se desenvolver a modelagem GARCH optou-se por ignora-lo, utilizando-se apenas os
dados da série RIBOV. Com objetivo de se reduzir o erro embutido no modelo, como
mencionado anteriormente e baseando-se no fato de que testes anteriores já haviam
comprovado a não necessidade de tal modelagem para a implementação do GARCH (1,1).
Desta forma, obteve-se um modelo GARCH(1,1) cujos resultados estão representados
na tabela 5, e cuja representação algébrica encontra-se na expressão:
GARCH = C(1) + C(2)*RESID(-1)^2 + C(3)*GARCH(-1)
Tabela 5: Resultados do Modelo GARCH para previsão do RIBOV.
Equação de Variância
Coeficiente Erro Padrão Estatística-z P Valor
C
7,07E-06
0,084944
0,895420
1,95E-06
0,013013
0,015103
3,619919
6,527458
59,28715
0,0003
0,0000
0,0000
Critério de Informação de Akaike -5,243055
Critério de Informação de Schwarz -5,230733
Máxima Verosemelhança 3277,288
Fonte: Dados de Pesquisa, 2011.
Realizando-se então um novo teste de Efeitos ARCH de Engle, comprova-se a
resolução dos problemas de ARCH, como pode ser observado na tabela 6.
Tabela 6: Teste de Efeitos ARCH, após a modelagem do GARCH (1,1).
TESTE ARCH 1 lag 5 lags 10 lags 20 lags
F-statistic 1,403809 0,542138 0,658516 0,577361
Probabilidade 0,236313 0,744435 0,763599 0,929842
Fonte: Dados de Pesquisa, 2011.
51
A partir deste modelo obteve-se o seguinte resultado da variância, que mostra o
comportamento da volatilidade da previsão, ilustrado graficamente abaixo.
-.04
-.03
-.02
-.01
.00
.01
.02
.03
.04
1200 1210 1220 1230 1240 1250
RIBOVF
Forecast: RIBOVF
Actual: RIBOV
Forecast sample: 1200 1250
Included observations: 51
Root Mean Squared Error 0.010762
Mean Absolute Error 0.008905
Mean Abs. Percent Error 100.0000
Theil Inequality Coefficient 1.000000
Bias Proportion 0.005785
Variance Proportion 0.994215
Covariance Proportion 0.000000
.00012
.00014
.00016
.00018
.00020
.00022
.00024
.00026
1200 1210 1220 1230 1240 1250
Forecast of Variance
____ RIBOV
-.04
-.03
-.02
-.01
.00
.01
.02
.03
.04
1200 1210 1220 1230 1240 1250
RIBOVF
Forecast: RIBOVF
Actual: RIBOV
Forecast sample: 1200 1250
Included observations: 51
Root Mean Squared Error 0.010762
Mean Absolute Error 0.008905
Mean Abs. Percent Error 100.0000
Theil Inequality Coefficient 1.000000
Bias Proportion 0.005785
Variance Proportion 0.994215
Covariance Proportion 0.000000
.00012
.00014
.00016
.00018
.00020
.00022
.00024
.00026
1200 1210 1220 1230 1240 1250
Forecast of Variance
____ Previsão da Variância
Figura 19: Representação gráfica dos resultados obtidos pelo modelo GARCH (1,1)
Fonte: Dados de pesquisa, 2011.
A partir do modelo GARCH(1,1) calculou-se o erro e o erro quadrático baseados no
retorno da série Ibovespa (ver Apêndice C).
Percebe-se que o Modelo de Controle apresenta-se mais limitado que os modelos RNA
uma vez que se utiliza apenas dos dados históricos do próprio Ibovespa para realizar a
modelagem de um modelo de previsão do mesmo. Desta forma, os erros relativamente
superiores encontrados por este modelo em relação aquele pode ser reflexo desta limitação.
52
4.3 ANÁLISE DOS RESULTADOS
Uma vez realizadas as modelagens das Redes Neurais e do modelo GARCH, calculou-
se o desvio padrão dos erros de previsão de cada modelo (tabela 7) e, em seguida, realizou-se
a comparação dos erros quadráticos, e suas médias, do período 1202 ao 1246, de forma a se
ter o mesmo número de observações para cada modelo. Tal comparação pode ser observada
através da tabela 8.
Convém lembrar que os erros do modelo de Redes Neurais Artificiais com base em
preços considerados nesta etapa são aqueles após a conversão de suas previsões de preços
para retornos, de forma a se trabalhar com uma padronização dos resultados.
Tabela 7: RMSE, MAE e Desvios Padrão dos erros de previsão dos modelos.
Modelo MSE RMSE MAE U de Theil
Desvio
Padrão do
Erro de
Previsão
GARCH (1,1)
RNA preços
RNA retornos
0,000309
0,000060
0,000000
0,017570
0,007714
0,000072
0,014796
0,006085
0,000045
0,045541
0,019994
0,000186
0,011296
0,007799
0,000063
Fonte: Dados de Pesquisa, 2011.
De forma semelhante, a figura 20 na qual pode-se visualizar graficamente a diferença
do comportamento dos erros quadráticos de cada um dos três modelos.
Figura 20: Comparação gráfica dos erros quadráticos dos modelos de previsão estudados.
Fonte: Dados de Pesquisa, 2011.
Por meio destas informações, percebe-se que dentre os três modelos desenvolvidos,
aquele com maior aderência à série de dados estudada seria o modelo de RNA com base em
retornos, seguido pelo modelo de RNA baseado em preços, o qual além de a menor média dos
erros quadráticos também apresenta menor erro padrão.
53
Além disso, observa-se também que de, de acordo com a estatística do U de Theil, os
resultados dos três modelos podem ser considerados superiores a um modelo de previsão
ingênua, sendo que aquele que apresentaria melhores previsões seria o modelo de RNA
baseado em retornos, visto ser o mais próximo a 0.
Ressalta-se que, embora tenha sido obtido um resultado com base em retorno para
ambos os modelos de Redes Neurais, aquele que utilizou os dados baseados em retorno como
dados de entrada obteve resultados superiores que aquele que utilizou a base baseada em
preços como dados de entrada, segundo os indicadores da tabela 7. O que indica que, assim
como em diversos modelos financeiros, a estrutura de RNA utilizada se adapta melhor a séries
de retornos que as de preços, visto a maior volatilidade desta em comparação com aquelas,
e/ou ainda que a exclusão de um filtro extra no modelo de RNA foi capaz de reduzir o nível
de erro obtido pelo modelo.
Em adição aos indicadores destacados acima, realizou-se também um teste abrangente
de regressões, comparando os erros e previsões do modelo de forma a se observar se as
diferenças de previsão entre eles são significantes para classificar um ou outro como modelo
superior. Os resultados deste teste encontram-se na tabela 8, abaixo.
Tabela 8: Teste Abrangente de regressões
Fonte: Dados de Pesquisa, 2011.
Com base nesta tabela, observa-se que ambos os modelos de RNA podem ser
classificados como superiores ao modelo de controle. Entretanto, a superioridade da RNA
baseada em retornos não é confirmada, visto que ambos os coeficientes das regressões das
RNAs não são significativamente diferentes de zero, concluindo-se que uma rede não supera a
outra. Ou seja, mesmo que os indicadores MSE, MRSE, MAE e U de Theil evidenciem o
contrario, este teste demonstra que as diferenças nos erros de previsão dos modelos baseados
em RNA não são significantes.
Variável Dependente:
Erro de Previsão do
Variável Independente: previsão do
GARCH (1,1) RNA preços RNA retornos
GARCH (1,1) 0,941757 - 0,000080
RNA preços 0,856382 0,727804 -
RNA retornos 0,220935 0,844127 0,267209
54
5 CONSIDERAÇÕES FINAIS
Os modelos tradicionais de análise e previsão em séries de tempo têm sido utilizados
pelos estudiosos por várias décadas e apresentam diversas metodologias a fim de
possibilitarem estudos em séries, estacionárias ou não, entretanto, as relações não-lineares,
difíceis de serem previstas por meio deles fazem com que novos métodos sejam buscados
para fins de uma melhor adequação e robustez dos modelos utilizados.
Nas séries financeiras, predominam as relações não-lineares, onde os modelos
tradicionais de análise tem se mostrado insuficientes. Frente a isso, as Redes Neurais
Artificiais são uma metodologia que tem sido explorada pelos estudiosos da área financeira e
tem se mostrado mais adequadas ao estudo das mesmas, visto terem por intuito construir
representações internas de modelos ou padrões detectados nos dados, as quais geralmente não
são visíveis ao usuário.
Assim, objetivando analisar se as RNAs são um método adequado para a previsão do
comportamento do Índice Bovespa do que métodos tradicionais de análise de séries
temporais, foram desenvolvidos três modelos de previsão do mesmo utilizando como base de
dados os valores diários dos 21 Índices disponíveis através da BM&F BOVESPA.
Estes modelos consistiram em dois baseados em Redes Neurais, utilizando
aprendizado supervisionado, e um baseado na metodologia GARCH (1,1). Onde seus
resultados foram apresentados individualmente e depois padronizados para fins de análise
comparativa de sua adequação à base de dados estudada.
Através da comparação dos resultados obtidos por tais modelos, observou-se uma
melhor adequação dos modelos baseados em RNA frente ao modelo GARCH (1,1),
mostrando que no presente caso de estudo, a metodologia das Redes Neurais Artificiais se
mostrou superior à metodologia tradicional de previsão de séries temporais.
Tal conclusão pode ser justificada através da análise dos erros resultantes de cada
modelo, bem como seus desvios padrões e observação gráfica. E, indica que nesta série de
dados, onde predominam relações não lineares, o método de RNA apresentou resultados mais
próximos dos dados reais.
Percebeu-se ainda que, na primeira etapa de testes (tabela 7), dentre os dois modelos
de RNA desenvolvidos, aquele cujos dados de entrada consistiam em retornos dos Índices
mostrou evidencias de ser superior aquele cujos dados de entrada se basearam em valores
diários (preços) e que apenas após implementado teve sua série de previsões convertida em
retornos. Isto nos leva a crer que a melhor adequação do primeiro modelo pode se encerrar no
55
fato amplamente conhecido de que a literatura recomenda que em estudos de séries
financeiras sejam utilizados dados de retornos ao invés de preços (visto sua menor
instabilidade no decorrer do tempo) ou ainda no fato de que quanto mais filtros
implementados no modelo implicam em um maior erro embutido no mesmo, ou ambos.
Ademais, pode indicar ainda que o fato de o segundo modelo lidar com dados de maior
variância torna necessário um tratamento diferenciado dentro da estrutura de RNA,
necessitando talvez a inclusão de uma arquitetura diferente da utilizada no modelo baseado
em retornos ou até mesmo a inclusão de um novo filtro.
Complementando a análise dos resultados, a segunda etapa de testes (tabela 8),
comprovou a superioridade dar previsões dos modelos de RNA perante o modelo de controle,
de acordo com os critérios adotados. E, indicou que mesmo perante as diferenças entre os
modelos de RNA, observadas na primeira etapa de testes, não se pode afirmar que a RNA
baseada em retornos apresenta previsões superiores às da RNA baseada em preços.
Desta, forma concluiu-se que, para a base de dados adotada, as Redes Neurais
Artificiais são um método aderente para a previsão do Ibovespa, obtendo resultados
superiores ao modelo de controle utilizado como método representante dos modelos
tradicionais de análise de séries de tempo.
Para estudos futuros, sugere-se que sejam desenvolvidos modelos para previsão de
outros Índices além do Ibovespa, para fins de averiguação de possível réplica de resultados,
preferencialmente aqueles que possam ser utilizados como reflexo do comportamento geral do
mercado, como o Índice Brasil (IBrx), por exemplo.
Sugere-se, ainda, a realização de novos estudos para fins de uma melhor observação
da adequação dos modelos preditivos de RNA em séries financeiras, utilizando-se abordagens
diferenciadas e possivelmente mais abrangentes que possam possibilitar uma maior robustez e
precisão das previsões geradas tanto pelos modelos de Redes Neurais Artificiais quanto pelos
modelos aos quais estes sejam eventualmente comparados.
56
REFERÊNCIAS
ALMEIDA, Fernando Carvalho de; PASSARI, Antônio Fabrizio Lima. Previsão de vendas no
varejo por meio de redes neurais. R.Adm., São Paulo, v.41, n.3, p.257-272, jul./ago./set. 2006
ALMEIDA, Fernando Carvalho de; DUMONTIER, Pascal. O uso de redes neurais em
avaliação de riscos de inadimplência. RAUSP (Revista de Administração FEA/USP),
vol.31, n.1, p.52-63, jan./mar. 1996.
ALMEIDA, Fernando C. de. Desvendando o uso de redes neurais em problemas de
administração de empresas. R.Adm. São Paulo, v.35, n.1, p.46 -55, jan./fev. 1995.
BIALOSKORSKI NETO, Sigismundo; NAGANO, Marcelo Seido; MORAES, Marcelo
Botelho da Costa. Utilização de redes neurais artificiais para avaliação socioeconômica: uma
aplicação em cooperativas. R.Adm., São Paulo, v.41, n.1, p.59-68, jan./fev./mar. 2006.
BM&F BOVESPA – Bolsa de Valores, Mercadorias e Futuros de São Paulo. Disponível
em: < http://www.bmfbovespa.com.br>. Acesso em 07/maio/2011.
BOLLERSLEV, T. Generalized autoregressive conditional heteroskedasticity. Journal of
Econometrics, North-Holland, v31, p.307-327, 1986.
BOSAIPO, Cláudia Rödel. Aplicação das redes neurais na previsão do comportamento de
mercados financeiros. Revista de Informação e Tecnologia. (online) Maio, 2001.
BRAGA, Antônio de Pádua; CARVALHO, André Carlos Ponce de Leon Ferreira de;
LUDEMIR, Teresa Bernarda. Redes neurais artificiais: teoria e aplicações. 2.ed. Rio de
Janeiro: LTC, 2007.
BRIESCH, Richard; RAJAGOPAL, Priyali. Neural networks applications in consumer
behavior. Journal of consumer psychology. V.20, p.381-389, 2010.
DUTTA, Goutam et al. Artificial neural network models for forecasting stock price index in
the bombay stock exchange. Journal of Emerging Market Finance, v.5, n.3, p.283-295,
2006.
ELTON, Edwin J.; GRUBER, Martin J., Modern Portfolio Theory and Investment
Analysis. 5 ed. New York: John Wiley & Sons, 1995.
GATELY, E.. Neural Networks for financial forecasting. New York: John Wiley & Sons,
1996.
HAYKIN, Simon S.. Redes neurais artificiais: princípios e práticas. Porto Alegre:
Bookman, 2001.
KALYVAS, Efstathios. Using neural networks and genetic algorithms to predict stock
market returns. 2001. 166 p. Tese (Master of Science in Advanced Computer Science) –
University of Manchester, Manchester, 2001. Disponível em:
<http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.22.1625&rep=rep1&type=pdf>.
Acesso em 08/08/2010.
57
KIM, Kyoung-jae; LEE, Won Boo. Stock market prediction using artificial neural networks
with optimal feature transformation. Neural Comput. & Applic. v.13, p.255-260,
junho/2004.
KUMAR, Kuldeep; BHATTACHARYA, Sukanto. Artificial neural network vs linear
discriminant analysis in credit ratings forecast – A comparative study of prediction
performances. Review of Accounting and Finance. v. 5, n. 3, p. 216-227, 2006.
LAKATOS, Eva Maria; MARCONI, Marina de Andrade. Técnicas de pesquisa. 2. ed. São
Paulo: Atlas, 1990.
LAM; Kim; LAM, King Chung. Forecasting for the generation of trading signals in financial
markets. Journal of Forecasting. v.19, p.39-52, 2000.
LEMOS, Eliane Prezepiorski; STEINER,Maria Teresinha Arns; NIEVOLA, Julio César.
Análise de crédito bancário por meio de redes neurais e árvores de decisão: uma aplicação
simples de data mining. R.Adm., São Paulo, v.40, n.3, p.225-234, jul./ago./set. 2005.
LIMA, Fabiano Guesti et al. Previsão de preços de commodities com modelos ARIMA-
GARCH e redes neurais com ondaletas: velhas tecnologias – novos resultados. R.Adm. v.45,
n.2, p.188-202, abr./mai./jun., 2010.
MEDEIROS, M .; TERASVIRTA, T.; RECH, G. Building neural network models for
time series: a statistical approach. Journal of Forecasting, v.25, p. 49-75. 2006
MORETTIN, Pedro A.; TOLOI, Célia M.C.. Análise de séries temporais. 2.ed. São Paulo:
Edgard Blücher, 2006. 538 p.
OH, Kyong Joo; KIM, Kyoung-jae . Piecewise nonlinear model for financial time series
forecasting with artificial neural networks. Intelligent Data Analysis. v.6, p. 175–185,
2002.
OLIVEIRA, Mauri Aparecido de. Aplicação de redes neurais artificiais na análise de
séries temporais econômico-financeiras. 2007. 317p. Tese (Doutorado em Administração) –
Universidade de São Paulo (USP), São Paulo, 2007.
________. Previsão de sucessões cronológicas econômico-financeiras por meio de redes
neurais artificiais recorrentes de tempo real e de processos ARMA-GARCH: um estudo
comparativo quanto à eficiência de previsão. 2004. 193 p. Dissertação (Mestrado em
Administração) – Universidade de São Paulo (USP), São Paulo, 2004.
OLIVEIRA, Mauri Aparecido de; MONTINI, Alessandra de Ávila. BERGMANN, Daniel
Reed. Construção de intervalos de predição para redes neurais via regressão multivariada e
sua aplicação em séries heterocedásticas. FACEF PESQUISA , v. 10, n. 3, p.271-283 , 2007
OLIVEIRA, Mauri Aparecido de; MONTINI, Alessandra de Ávila. BERGMANN, Daniel
Reed. . Previsão de retornos de ações dos setores financeiro, de alimentos, industrial e de
serviços, por meio de rna e modelos arima-garch. RAM – Revista De Administração
Mackenzie , v. 9, n. 1, p. 130-156, 2008.
58
PANDA, Chakradara. NARASIMHAN, V..Predicting stocks returns: an experiment of the
artificial neural network in Indian stock market. South Asia Economic Journal, v7, n.2,
p.205-218, 2006.
PALIT, A. K., POPOVIC, D. Computational intelligence in time series forecasting.
Londres: Springer-Verlag, 2005. 372p.
REZENDE, S. O.. Sistemas inteligentes: fundamentos e aplicações. 1. ed. São Paulo:
Manole, 2003. 525p.
RIBEIRO, Claudio Vasconcelos; GOLDSCHMIDT, Ronaldo Ribeiro; CHOREN, Ricardo.
Métodos para previsão de séries temporais e suas tendências de desenvolvimento.
Monografias em Sistemas e Computação. Rio de Janeiro, n.3, p.1-26. Setembro, 2009.
STEINER, Maria Tereseinha Ams et al. Sistemas especialistas probabilísticos e redes neurais
na análise do crédito bancário. R.Adm. São Paulo, v.34, n.3, p.56-67, julho/setembro 2009.
THAWORNWONG, Suraphan; ENKE, David. Forecasting stock returns with artificial neural
networks. In: ZHANG, Peter G.. Neural business in business forecasting. Hershey: Idea
Group Publishing, 2004.
WALLACE, Martin P.. Neural networks and their application to finance. Business
Intelligence Journal. p. 67-76.Julho, 2008.
ZANETI JR, Luiz Antonio; ALMEIDA, Fernando C. de. Exploração do uso de redes neurais
na previsão do comportamento de ativos financeiros. Terceiro SEMEAD - 21 a 23 de
Outubro de 1998 – Faculdade de Economia Administração e Contabilidade – USP.
ZHANG, Guoqiang; PATUWO, B. Eddy; HU, Michael Y. Forecasting with artificial neural
networks: the state of the art.International Journal of Forecasting, Amsterdam, v.14, p.35-
62,1998
ZHANG, Peter G.. Business forecasting with artificial neural networks: an overview. In: - .
Neural business in business forecasting. Hershey: Idea Group Publishing, 2004. p.1-22.
APÊNDICE
Tabelas de Previsões, Erros de Previsão e Erro Quadrático dos Modelos
A -1 – Previsões e erros de previsão da RNA (preços).
Período Preço previsto Preço real Erro de previsão
1201 71252,51 70367,15 885,36
1202 71119,97 69192,41 1927,56
1203 69445,00 69708,63 -263,63
1204 70652,79 70781,40 -128,61
1205 70966,96 70897,90 69,06
1206 67966,09 69632,50 -1666,41
1207 68170,11 67952,55 217,56
1208 69812,71 69629,36 183,35
1209 71770,85 69361,63 2409,22
1210 67887,87 68226,10 -338,23
1211 67329,67 67908,18 -578,51
1212 67262,04 67705,40 -443,36
1213 68772,68 69345,85 -573,17
1214 70629,14 69527,07 1102,07
1215 72603,18 69766,09 2837,09
1216 71502,43 69551,81 1950,62
1217 69807,44 69337,64 469,80
1218 68282,06 68174,92 107,14
1219 68250,76 67879,46 371,30
1220 71463,29 68341,83 3121,46
1221 70966,38 69126,32 1840,06
1222 68945,48 68742,97 202,51
1223 68923,39 67870,14 1053,25
1224 67463,02 67306,39 156,63
1225 68883,36 67981,22 902,14
1226 66522,72 67263,60 -740,88
1227 67592,58 68214,86 -622,28
1228 66606,38 68470,76 -1864,38
1229 68624,32 68485,96 138,36
1230 68532,55 67803,16 729,39
1231 66711,84 68040,94 -1329,10
1232 66956,69 68952,42 -1995,73
1233 66945,41 69304,81 -2359,40
1234 68090,87 69962,32 -1871,45
1235 68120,43 70317,79 -2197,36
1236 70339,28 71091,03 -751,75
1237 70457,71 70578,83 -121,12
1238 70108,58 70057,20 51,38
1239 70015,61 70127,04 -111,43
1240 70252,80 70423,44 -170,64
1241 71065,85 71632,90 -567,05
1242 71075,62 70721,44 354,18
1243 71828,27 70940,22 888,05
1244 70953,28 70609,07 344,21
1245 72011,46 70919,75 1091,71
1246 69669,60 70058,08 -388,48
1247 70203,01 69561,53 641,48
1248 68155,96 69133,09 -977,13
1249 69386,66 69426,57 -39,91
1250 68709,22 68709,22 -442,327
Fonte: Dados de pesquisa, 2011.
A-2 – Erros de previsão do modelo RNA (preços) após ter seus resultados convertidos em
retornos.
Período Erro de previsão Erro quadrático
1202 0,006503 0,000042
1203 -0,013579 0,000184
1204 0,000856 0,000001
1205 0,001213 0,000001
1206 -0,010943 0,000120
1207 0,011908 0,000142
1208 -0,000246 0,000000
1209 0,013687 0,000187
1210 -0,016987 0,000289
1211 -0,001557 0,000002
1212 0,000862 0,000001
1213 -0,000751 0,000001
1214 0,010435 0,000109
1215 0,010481 0,000110
1216 -0,005299 0,000028
1217 -0,009080 0,000082
1218 -0,002251 0,000005
1219 0,001687 0,000003
1220 0,017027 0,000290
1221 -0,007987 0,000064
1222 -0,010132 0,000103
1223 0,005410 0,000029
1224 -0,005678 0,000032
1225 0,004716 0,000022
1226 -0,010535 0,000111
1227 0,000830 0,000001
1228 -0,008009 0,000064
1229 0,012866 0,000166
1230 0,003770 0,000014
1231 -0,013214 0,000175
1232 -0,004188 0,000018
1233 -0,002287 0,000005
1234 0,003267 0,000011
1235 -0,002013 0,000004
1236 0,009171 0,000084
1237 0,003871 0,000015
1238 0,001064 0,000001
1239 -0,001009 0,000001
1240 -0,000363 0,000000
1241 -0,002398 0,000006
1242 0,005621 0,000032
1243 0,003233 0,000010
1244 -0,003291 0,000011
1245 0,004522 0,000020
1246 -0,009049 0,000082
1247 0,00640 0,00004
1248 -0,01017 0,00010
1249 0,00593 0,00004
1250 0,00025 0,00000
Fonte: Dados de pesquisa, 2011.
B- Erros do Modelo RNA (Retornos).
Período Erro de previsão Erro quadrático
1197 0,000010 1,059E-10
1198 0,000017 3,028E-10
1199 0,000055 3,050E-09
1200 0,000044 1,939E-09
1201 0,000052 2,734E-09
1202 0,000056 3,190E-09
1203 0,000039 1,530E-09
1204 0,000018 3,371E-10
1205 0,000000 5,069E-14
1206 0,000078 6,089E-09
1207 0,000076 5,809E-09
1208 0,000110 1,208E-08
1209 0,000222 4,947E-08
1210 0,000068 4,622E-09
1211 0,000023 5,119E-10
1212 0,000024 5,825E-10
1213 0,000006 4,203E-11
1214 -0,000005 2,103E-11
1215 -0,000050 2,454E-09
1216 0,000128 1,634E-08
1217 -0,000044 1,973E-09
1218 0,000027 7,472E-10
1219 0,000033 1,065E-09
1220 0,000062 3,896E-09
1221 0,000009 7,520E-11
1222 -0,000046 2,101E-09
1223 0,000047 2,184E-09
1224 0,000008 6,387E-11
1225 0,000318 1,009E-07
1226 0,000011 1,295E-10
1227 0,000029 8,371E-10
1228 0,000025 6,097E-10
1229 0,000042 1,744E-09
1230 0,000021 4,237E-10
1231 0,000011 1,127E-10
1232 0,000019 3,664E-10
1233 0,000021 4,295E-10
1234 0,000026 6,570E-10
1235 0,000026 6,514E-10
1236 -0,000008 6,187E-11
1237 0,000042 1,746E-09
1238 0,000006 3,598E-11
1239 -0,000008 7,000E-11
1240 -0,000038 1,449E-09
1241 0,000022 4,706E-10
1242 0,000034 1,163E-09
1243 0,000066 4,364E-09
1244 0,000034 1,130E-09
1245 0,000008 6,448E-11
1246 0,000020 4,056E-10
Fonte: Dados de Pesquisa, 2011.
C- Erro e Erro Quadrático das Previsões Geradas pelo modelo de controle GARCH (1,1).
Período Erro de previsão Erro quadrático
1200 -0,018467 0,000341
1201 -0,023789 0,000566
1202 -0,029133 0,000849
1203 -0,005560 0,000031
1204 0,002457 0,000006
1205 -0,011621 0,000135
1206 -0,030893 0,000954
1207 -0,038045 0,001447
1208 0,009304 0,000087
1209 -0,020104 0,000404
1210 -0,032194 0,001036
1211 -0,020566 0,000423
1212 -0,018367 0,000337
1213 0,009083 0,000082
1214 -0,013406 0,000180
1215 -0,012013 0,000144
1216 -0,018006 0,000324
1217 -0,017529 0,000307
1218 -0,030908 0,000955
1219 -0,018798 0,000353
1220 -0,007247 0,000053
1221 -0,002322 0,000005
1222 -0,019298 0,000372
1223 -0,026191 0,000686
1224 -0,021897 0,000479
1225 -0,003399 0,000012
1226 -0,023925 0,000572
1227 0,000744 0,000001
1228 -0,009823 0,000096
1229 -0,012978 0,000168
1230 -0,022834 0,000521
1231 -0,009310 0,000087
1232 0,000808 0,000001
1233 -0,007701 0,000059
1234 -0,003093 0,000010
1235 -0,007454 0,000056
1236 -0,001346 0,000002
1237 -0,019636 0,000386
1238 -0,019690 0,000388
1239 -0,011165 0,000125
1240 -0,007643 0,000058
1241 0,005380 0,000029
1242 -0,025276 0,000639
1243 -0,009639 0,000093
1244 -0,017091 0,000292
1245 -0,007778 0,000060
1246 -0,024159 0,000584
1247 -0,019320 0,000373
1248 -0,018265 0,000334
1249 -0,007695 0,000059
1250 -0,022100 0,000488
Fonte: Dados de Pesquisa, 2011.