Monografia Redes Neurais

PONTIFICIA UNIVERSIDADE CATOLICA DE MINAS GERAISBacharelado em Sistemas de Informacao

Vitor Hugo Ananias Moreira

REDES NEURAISAplicacao de uma ferramenta para o Mercado Financeiro

Belo Horizonte2012



Monografia apresentada ao programa de Bachareladoem Sistemas de Informacao da Pontifıcia Universi-dade Catolica de Minas Gerais, como requisito par-cial para obtencao do tıtulo de Bacharel em Sistemasde Informacao.

Orientador: Sylvio Silveira Santos

Belo Horizonte2012



Monografia apresentada ao programa de Bachareladoem Sistemas de Informacao da Pontifıcia Universi-dade Catolica de Minas Gerais, como requisito par-cial para obtencao do tıtulo de Bacharel em Sistemasde Informacao.

Sylvio Silveira Santos

Wladmir

Saulo Augusto de Paula Pinto

Belo Horizonte, 05 de Dezembro de 2012

AGRADECIMENTOS

Agradeco aos professores, em especial ao Sylvio, pelo fundamental apoio neste trabalho. AAna que sempre esteve do meu lado.

RESUMO

Sabe-se que no seculo XX houve importantes aplicacoes do campo cientıfico computacio-

nal e matematico no mundo dos negocios, especificamente, aplicacoes estatısticas focadas nas

organizacoes, industrias e nas instituicoes militares. O uso de ferramentas de apoio a analise

tecnica esta em constante aperfeicoamento, complementando os modelos analıticos tradicionais.

A Inteligencia Artificial e uma area que se mostra eficaz para se resolver problemas complexos

como as predicoes e analises do mercado financeiro de acoes, que envolve muitas variaveis e

seus relacionamentos e influencias em resultados e rumos do mercado de capitais. As variaveis

do mercado financeiro de acoes sao altamente volateis, devido a sua variabilidade ao longo do

tempo tornando-se difıcil de prever um padrao de comportamento de seus valores, tambem seu

elevado numero dificulta a analise das relacoes e implicacoes que cada variavel tem umas com

as outras. Pretende-se tratar o problema de analise e mapeamento das variaveis do mercado

financeiro em torno do ındice Dow Jones atraves da analise e demonstracao de um software

que implementa redes neurais artificiais e realiza a previsao da direcao do ındice Dow Jones

e o impacto de cada variavel no resultado. Para tanto obtem uma base de dados do mercado

financeiro norte americano, da Palisade Corporation e que possui como resultado a direcao do

ındice Dow Jones. este trabalho realiza o treinamento da rede neural probabilıstica sobre a

base de dados e teste da mesma rede sobre uma porcentagem de dados separados para este fim.

Apos a execucao destas etapas extrai-se dos relatorios os resultados que indicam a porcentagem

de acerto das previsoes bem como o impacto de cada variavel no resultado. Conclui que esta

ferramenta realiza com eficiencia e facilidade a aprendizagem de series historicas de dados do

mercado financeiro.

Palavras-chave: Redes Neurais Artificiais. Previsao Mercado de Acoes. Sistemas Estocasticos.NeuralTools.

ABSTRACT

It is known that in the twentieth century there were important applications of the scientific and

mathematical fields in business, specifically, statistical and probabilistic applications focused on

organizations, industries and military institutions. The use of tools to support technical analysis

is constantly improving, complementing traditional analytical models. Artificial Intelligence is

an area that has proven efficient for solving complex problems such predictions and analysis of

the stock financial market, involving many variables and their relationships and influences on

results and directions of capital markets. The financial market variables are highly volatile due

to its variability over time making it difficult to predict a pattern of behavior of their values,

their number also complicates the analysis of relationships and implications that each variable

has with each other. It is intended to address the problem of mapping and analysis of financial

market variables around the Dow Jones through analysis and demonstration of software that

implements and carries out artificial neural networks to forecast the direction of the Dow Jones

and the impact of each variable in result. For this it obtain a database of North American

financial market from Palisade Corporation and has resulted in the direction of the Dow Jones

index. This work performs probabilistic neural network training based on the test data and the

same network on a percentage of data separately for this purpose. After performing these steps

It is extracted from reports the results that indicate the percentage of correct predictions and the

impact of each variable on the outcome. We conclude that this tool performs efficiently and

easily the learning of historical series of financial market data.

Keywords: Artificial Neural Network. Stock Market Forecasting. Stochastic Systems. Neural-Tools.

LISTA DE FIGURAS

FIGURA 1 – Neuronio de McCulloch-Pitts . . . . . . . . . . . . . . . . . . . . . . . . 13

FIGURA 2 – Arquitetura de rede Multilayer FeedFoward . . . . . . . . . . . . . . . . 16

FIGURA 3 – Tela sobre NeuralTools . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

FIGURA 4 – Barra de Ferramentas NeuralTools . . . . . . . . . . . . . . . . . . . . . 25

FIGURA 5 – Planilha com base de dados . . . . . . . . . . . . . . . . . . . . . . . . . 26

FIGURA 6 – Tela NeuralTools Gerenciador de dados . . . . . . . . . . . . . . . . . . . 27

FIGURA 7 – Tela NeuralTools Utilidades de dados ausentes . . . . . . . . . . . . . . . 28

FIGURA 8 – Tela NeuralTools configuracoes de treinamento . . . . . . . . . . . . . . 29

FIGURA 9 – Tela NeuralTools configuracoes da rede . . . . . . . . . . . . . . . . . . . 30

FIGURA 10 –Tela NeuralTools andamento da execucao . . . . . . . . . . . . . . . . . 30

FIGURA 11 –Tela NeuralTools visao geral do teste . . . . . . . . . . . . . . . . . . . . 31

FIGURA 12 –Tela de Previsao da rede neural . . . . . . . . . . . . . . . . . . . . . . . 32

FIGURA 13 –Tela NeuralTools escolha da rede neural para previsao . . . . . . . . . . . 32

FIGURA 14 –Relatorio de treinamento . . . . . . . . . . . . . . . . . . . . . . . . . . 33

FIGURA 15 –Relatorio analise de impacto de variaveis de treinamento . . . . . . . . . 34

FIGURA 16 –Histograma de probabilidades de categorias incorretas . . . . . . . . . . . 35

FIGURA 17 –Impacto de variaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

FIGURA 18 –Relatorio resumido de teste da rede neural . . . . . . . . . . . . . . . . . 36

SUMARIO

1 INTRODUCAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.1 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2 Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.4 Objetivos Especıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 REVISAO DA LITERATURA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.1 Rede Neural Artificial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.1.1 Historico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.1.2 Caracterısticas e Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.1.3 Arquiteturas de Redes Neurais . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.1.4 Vantagens de Uso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.2 Previsao no Mercado Financeiro . . . . . . . . . . . . . . . . . . . . . . . . . . 182.2.1 Analise Fundamentalista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.2.2 Analise Tecnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.2.3 Indices Financeiros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.3 Mercado de Acoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.4 Mercado de Capitais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3 METODOLOGIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

4 DESENVOLVIMENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234.1 A ferramenta Neural Tools . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234.2 Dados do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254.3 Execucao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

5 CONCLUSAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

REFERENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

9

1 INTRODUÇÃO

Sabe-se que no século XX houve importantes aplicações do campo científico

computacional e matemático no mundo dos negócios, especificamente, aplicações

estatísticas focadas nas organizações, indústrias e nas instituições militares. Tais

aplicações vão desde a pesquisa operacional com modelos de otimização, métodos

estatísticos quantitativos aplicados nas indústrias, no mercado financeiro de ações e

em diversos outros segmentos.

O mundo está cada vez mais dinâmico e exigente, em um cenário de

mudanças constantes onde a incerteza está presente no contexto do sistema

capitalista, onde tudo tem um valor monetário e está sob influência de diversas

variáveis, o que o torna um sistema complexo para ser analisado.

É por isso que o uso de ferramentas de apoio à análise técnica no mercado

financeiro está em constante aperfeiçoamento, complementando os modelos

analíticos tradicionais. “Os sofisticados modelos matemáticos atuais não são inúteis,

apenas devem ser aperfeiçoados ainda mais, incorporando estudos sobre a

irracionalidade do investidor” (Famá et al, 2008).

1.1 Motivação

A Inteligência Artificial é uma área que se mostra eficaz para se resolver

problemas complexos como as predições e análises do mercado financeiro de

ações, que envolve muitas variáveis e seus relacionamentos e influências em

resultados e rumos do mercado de capitais.

A partir desta ciência, surgiram várias ferramentas de ampla aplicabilidade e

avançados mecanismos baseados na neurofisiologia e na matemática aplicados na

área da ciência da computação. Podemos citar Data Mining (Mineração de dados)

para reconhecimento de padrões e inferências em bases de conhecimento,

algoritmos genéticos para problemas de otimização, árvores de decisão para tomada

de decisões inteligentes e as redes neurais artificiais usadas para fazer previsões,

10

também usadas em conjunto com Data Mining para resolver problemas de

classificação (BARBIERI, 2011).

1.2 Problema

As variáveis do mercado financeiro de ações são altamente voláteis, o que diz

respeito a sua variabilidade ao longo do tempo, pois se torna difícil prever um padrão

de comportamento constante em seus valores se analisadas isoladamente, também

seu elevado número dificulta a análise das relações e implicações que cada variável

tem umas com as outras e com o resultado de índices de mercado que são

influenciados por estas variáveis, como Dow Jones, S&P 500, Bovespa, dentre

outros. Além disso, são processos estocásticos que necessitam de modelos

adequados para tratá-los.

[..]estocástico significa aleatório e processo, neste contexto, significa função, então um processo estocástico é uma função cujos valores são variáveis aleatórias indexadas por um conjunto finito que é definido sobre um espaço de probabilidade também finito (Edward Nelson, 1987,p.10, tradução nossa).

Portanto, os processos estocásticos compõem-se basicamente de variáveis

aleatórias em função do tempo. Os modelos lineares são insuficientes para resolver

problemas não lineares como os índices, médias e valores do mercado financeiro e

seus relacionamentos.

1.3 Objetivo Geral

Pretende-se efetuar a análise e demonstração de um software que

implementa redes neurais artificiais para tratar o problema de análise e mapeamento

das variáveis do mercado financeiro em torno do índice Dow Jones e as influências

destas variáveis no resultado da direção deste índice. Portanto, o estudo descritivo a

11

ser realizado tem o objetivo de coletar dados da execução do tipo de rede neural

mais eficaz dentre os disponíveis para tratar este problema.

1.4 Objetivos Específicos

Os objetivos específicos são:

Realizar a análise do software NeuralTools, que implementa redes neurais, da

suíte de ferramentas da Palisade através de dados históricos do mercado

financeiro norte-americano;

Analisar a eficiência da melhor rede neural dentre aquelas implementadas pelo

software e o grau de influência de cada variável nos resultados da rede;

Extrair dos resultados, indicadores de desempenho tanto para treinamento

quanto para teste da rede, executados pelo software para serem analisados.

12

2 REVISÃO DA LITERATURA

2.1 Rede Neural Artificial

Uma rede neural artificial é um modelo matemático-computacional que se

baseia no funcionamento do cérebro humano, através de abstrações do neurônio e

suas conexões sinápticas. Basicamente, tem a capacidade de propagar as

informações de entrada através dos neurônios artificiais que estão interligados

produzindo uma saída. Segundo HAYKIN, a definição para uma rede neural de forma

geral é:

[...] uma máquina que é projetada para modelar a maneira como o cérebro realiza uma tarefa particular ou função de interesse; a rede é normalmente implementada utilizando-se componentes eletrônicos ou é simulada por programação em um computador digital. (HAYKIN, 2001, p.28)

Já Leonardo Augusto. A. Terra, (2012) cita a seguinte definição:

As redes neurais artificiais (RNA) são um ramo da inteligência artificial. Esses sistemas computacionais são inspirados nos neurônios biológicos e têm como objetivo a solução de problemas complexos, a partir de um conjunto de variáveis independentes, como o reconhecimento de padrões e aproximações de funções (PRINCIPE; EULIANO; LEFEBVRE apud TERRA, 2012).

Segundo Jingtao Yao (1999), uma Rede Neural é uma coleção de elementos de

processamento simples interconectados onde a cada conexão da Rede Neural tem-

se um peso atrelado.

Citando uma definição matemática, pode-se definir o seguinte: “uma rede

neural relaciona um conjunto de variáveis de entrada {xi}, i = 1,...,k, a um conjunto de

uma ou mais variáveis de saída, {yj}, j = 1,...,k” (MCNELIS, 2005).

O Neurônio é a unidade básica fundamental de uma rede neural. Comparando

a rede neural com uma estrutura de grafo orientado, poderíamos dizer que os

neurônios são os nodos deste grafo e estão interligados pelas arestas do grafo. O

13

neurônio individualmente realiza o processamento das informações que chegam e

produz uma saída que irá alimentar outros neurônios.

Conforme citado no histórico das redes neurais, o primeiro neurônio artificial

definido por McCulloch e Pitts tem o seguinte esquema:

Figura 1 – Modelo não-linear do neurônio de McCulloch e Pitts.

Fonte: HAYKIN, 2001

Segundo Simon Haykin (2001), o neurônio apresenta três elementos básicos a

saber:

Um conjunto de sinapses ou elos de conexão, cada qual caracterizado por um

peso ou força própria. O sinal de entrada X1, X2, Xp é multiplicado pelos pesos

sinápticos Wk1, Wk2, Wkp

Um somador ∑ para somar os sinais de entrada, ponderado pelas respectivas

sinapses do neurônio.

Uma função de ativação φ(.) para restringir a amplitude de saída do neurônio.

Esta função limita o intervalo de saída para [0,1] ou [-1,1].

A equação que representa o modelo de neurônio é dada por :

(1)

14

As operações do somador constituem um combinador linear dado por uk, portanto a

saída yk do neurônio constitui-se da função de ativação φ e o resultado de uk.

yk = φ (uk) (2)

A função de ativação φ(u), define a saída do neurônio. Existe diversas funções de

ativação, mas os tipos básicos são Função de Limiar e Função Sigmóide.

Para a função de Limiar,

Se u ≥ 0 então φ(u) = 1;

Se u < 0 então φ(u) = 0. (3)

Esta definição descreve a propriedade tudo-ou-nada do modelo de McCulloch-Pitts.

(HAYKIN, 2001).

A função sigmoide é uma das mais utilizadas em aplicações de redes neurais,

conforme se pode observar nos artigos e livros-texto pesquisados. “Esta função é

estritamente crescente e exibe um balanceamento adequado entre comportamento

linear e não-linear” (HAYKIN, 2001). Um exemplo deste tipo de função é a função

logística dada por:

(4)

onde 𝑎 é o parâmetro de inclinação da função sigmoide, esta função assume um

intervalo contínuo de valores entre 0 e 1 e seu gráfico é em forma de S.

Podemos dizer que o que concede à rede neural o caráter de inteligência é a

capacidade de aprender. Como é definido, “o conhecimento é adquirido pela rede a

partir de seu ambiente através de um processo de aprendizagem” (HAYKIN, 2001).

As redes neurais são empregadas em processos estocásticos, já que o

caráter aleatório do conjunto de variáveis e sua mudança no tempo podem ser

aprendidos pela rede. O que garante este armazenamento do conhecimento

adquirido são os pesos sinápticos, definidos por Simon Haykin (2001) como forças

de conexão entre neurônios. O algoritmo de aprendizagem tem a função de modificar

os pesos sinápticos da rede de forma a alcançar o objetivo.

15

2.1.1 Histórico

A origem das Redes Neurais Artificiais como parte da Inteligência Artificial teve

sua origem a partir de estudos de dois precursores da Inteligência Artificial, o

matemático Walter H. Pitts e o neuroanatomista Warren S. McCulloch, a partir de

1943 quando foi escrito o artigo intitulado “A Logical Calculus of the Ideas Immanent

in Nervous Activity” publicado originalmente na revista Bulletin of Mathematical

Biophysics, vol. 5, ano de 1943. Segundo HAYKIN (2001), neste artigo McCulloch e

Pitts descrevem um cálculo lógico das redes neurais que unificou a neurofisiologia e

a lógica matemática.

Outro importante pesquisador foi Minsky que em 1961 publicou um artigo

sobre Inteligência Artificial e 7 anos depois publicou livro Computation: Finite and

Infinite Machines que estendeu os estudos de McCulloch e Pitts para a teoria dos

autômatos e da computação (HAYKIN, 2001).

Em 1958, F. Rosenblatt publicou em Psychological Review, vol 65 nº 6, o artigo

intitulado The Perceptron: A Probabilistic Model for Information Storage and

Organization in the Brain, o qual criou um método inovador de aprendizagem

supervisionada (HAYKIN, 2001).

Na década de 1980, os trabalhos mais importantes foram de autoria de

Hopfield e o livro de Rumelhart e McClelland, responsáveis pela retomada do

interesse em redes neurais, cujo assunto ficou adormecido na década de 70,

conforme Haykin cita em seu livro, as redes neurais desde McCulloch e Pitts até os

dias atuais se estabeleceram e evoluíram permanentemente como um tema

interdisciplinar desde neurociência, passando pela matemática à engenharia.

2.1.2 Características e propriedades

Um neurônio artificial pode ser do tipo linear ou não-linear. Segundo Simon

Haykin (2001), a não-linearidade é uma propriedade muito importante, pois tem

facilidade para lidar com sinais de entrada gerados por mecanismos não-lineares, o

16

que torna esta propriedade importante no contexto do problema analisado, pois os

dados do mercado financeiro, são de natureza não-linear.

Uma rede é capaz de fazer um mapeamento entrada-saída, o que é chamado

de aprendizagem supervisionada que envolve a modificação dos pesos sinápticos,

assim a rede aprende dos exemplos (HAYKIN, 2001).

O mapeamento entrada-saída caracteriza a aprendizagem supervisionada,

pois se torna o conhecimento do ambiente e professor da rede neural que durante o

treinamento faz os devidos ajustes aos pesos sinápticos de acordo com um sinal de

erro, tal procedimento é conhecido como aprendizagem por correção de erro

(HAYKIN, 2001) e está intrinsecamente ligado a aprendizagem supervisionada.

2.1.3 Arquiteturas de Redes Neurais

O Multilayer Perceptron ou Perceptron de Múltiplas Camadas é uma das

topologias de redes neurais mais implementadas.

Duas características importantes do Perceptron de Múltipla camada são o

processamento não-linear de elementos, os quais tem uma não linearidade que

deve ser suave. A outra característica é sua massiva interconectividade, qualquer

elemento de uma camada alimenta todos os elementos da próxima camada.

(PRINCIPE EULIANO et al apud GURESEN, 2011).

O que distingue este tipo de rede neural são os neurônios ocultos, que são

dispostos paralelamente em camadas intermediárias entre a camada de entrada e a

camada de saída. “Adicionando-se uma ou mais camadas ocultas, tornamos a rede

capaz de extrair estatísticas de ordem elevada” (HAYKIN, 2001).

As funções de ativação mais largamente utilizadas segundo EULIANO são a

função logística e a função tangente hiperbólica.

Um dos motivos que explicam a capacidade elevada e dinamismo deste tipo de rede

é que em um MultiLayer Perceptron ou Rede alimentada adiante (FeedFoward) com

vários neurônios na camada oculta, é sempre possível especificar funções de

ativação alternativas para os diferentes neurônios (MCNELIS, 2005).

17

Figura 2 – Rede de alimentação direta de múltiplas camadas

Fonte: adaptado de YAO, 1999

2.1.4 Vantagens de Uso

A vantagem de se usar Redes Neurais é devido aos seus modelos não-lineares que podem ser treinados para mapear valores passados e futuros da relação entrada-saída. Também devido a sua capacidade de reconhecer padrões e a rapidez de suas técnicas para resolver problemas complexos

com precisão e em diversas aplicações. (WALLACE, 2008, p.69-70,

tradução nossa).

Refenes et al. citado por YAO (1999), indica que técnicas estatísticas

convencionais para previsões tem alcançado suas limitações em aplicações com

conjunto de dados não-lineares. Podemos observar que devido às restrições dos

modelos convencionais para resolver certos tipos de problemas não lineares, como é

o caso das previsões no mercado de ações, abre-se espaço para aplicação de redes

neurais nas organizações.

Segundo a Palisade Corporation, fabricante do software de Redes Neurais,

NeuralTools, objeto de análise deste trabalho, as redes neurais fornecem uma

alternativa aos métodos estatísticos convencionais. Funcionam semelhante às

regressões lineares, são usadas para aproximação de funções. Também são usadas

para classificação como em análises discriminantes e regressões logísticas.

Camada

Oculta

Camada

Camada de

Saída

Entrada

y

x1 x2 x3 x4 xn

....

....

....

18

2.2 Previsão no mercado Financeiro

Segundo McNelis (2005), previsão diz respeito a entender quais variáveis

levam ou ajudam a prever outras variáveis, quando muitas variáveis interagem em

mercados voláteis. Isto significa olhar no passado para ver quais variáveis são as

principais indicadoras do comportamento de outras variáveis. Isto também significa

um melhor entendimento do tempo de relações “conduzir–atrasar” entre muitas

variáveis, entendendo o significado estatístico destes relacionamentos “conduzir–

atrasar”, e aprendendo quais variáveis são as mais importantes para vermos como

sinais para novos desenvolvimentos em outros retornos (MCNELIS, 2005, tradução

nossa).

Considerando esta característica, pode-se saber qual o peso que cada

variável tem na função da rede neural. Através da ferramenta NeuralTools é possível

saber isto devido as porcentagens atribuídas a cada variável de entrada e ao gráfico

gerado, permitindo eliminar variáveis que têm pouca influência no resultado de saída

da rede.

2.2.1 Análise Fundamentalista

Analisa em profundidade as condições financeiras e os resultados

operacionais de uma empresa específica e o comportamento subjacente de suas

ações ordinárias. O valor de uma ação é estabelecido através da análise da

informação fundamental associado à empresa, como a concorrência, contabilidade e

gestão (YAO, 1999).

“É baseado também nas características financeiras da empresa, em sua perspectiva

de crescimento, no perfil de risco e outros indicadores. A característica desta análise

é de operações de médio e longo prazo” (COSTA et al, 2010).

19

A análise fundamentalista é uma metodologia de análise para determinar o preço

justo de uma ação que se fundamenta na expectativa de resultados futuros da

empresa (CAVALCANTE et al apud COSTA et al, 2010).

2.2.2 Análise Técnica

Análise técnica, por outro lado, assume que a bolsa se move em tendências

e estas tendências podem ser capturados e usados para a previsão. A

análise técnica pertence à terceira escola de pensamento. Ele tenta usar

preço das ações passadas e informações de volume para prever os

movimentos futuros de preços. O analista técnico acredita que existem

padrões recorrentes de comportamento de mercado que são previsíveis.

(YAO et al, 1999, tradução nossa).

O mesmo autor afirma que análise fundamental e técnica pode ser simulado

em redes neurais. Para os métodos fundamentais, vendas no varejo, preços de ouro,

índices de produção industrial e taxas de câmbio, poderiam ser usados como

insumos. Para os métodos técnicos, os dados de séries de tempo retardados podem

ser utilizados como entradas.

Segundo Piazza, (2008) citado por COSTA et al (2005), a Análise Técnica

tem o foco principal na análise gráfica do histórico de preços da ação e no seu

desempenho ao longo dos tempos.

2.2.3 Índices Financeiros

O índice DJIA - Dow Jones Industrial Average – é um índice que representa o

cálculo da média da atividade industrial baseado nos principais players do mercado

norte americano. É uma das principais medidas relevantes e representativas do

mercado financeiro estadunidense segundo análise do grupo que administra e provê

este serviço de índices financeiros, a CME – sigla de Chicago Mercantile Exchange

Inc. Segundo o artigo da companhia, este índice denominado simplesmente “The

20

Dow”, marca registrada, foi instituído em 1896 e era composto originalmente por 12

componentes, posteriormente aumentou-se para 30 componentes, os quais são

representados pelas principais corporações Norte-americanas que juntas

representam uma grande parcela do mercado. Dentre as 30 companhias, a categoria

produtos Industrializados tem maior destaque de representatividade (3M, Boeing,

General Eletric, dentre outras), seguida pela categoria Tecnologia (IBM, Intel,

Microsoft, Cisco Systems e Hewlett-Packard) e logo após Serviços ao consumidor,

tais como, McDonald’s, Wal Mart Stores, Walt Disney e outras.

Este índice é resultante de métodos matemático-financeiros para estabelecer

uma média que represente os capitais financeiros e desempenho destas

corporações, no mercado de ações, a fim de nortear os investidores e o rumo da

economia. Apesar de ser um índice do mercado Norte-americano, reflete nas bolsas

de valores de outros países, inclusive o Brasil (BOVESPA), conforme estudos de

WOLFF et al (2011) que conclui que o índice Dow Jones tem uma relação de

equilíbrio em longo prazo com as companhias Vale SA e Petrobras SA, identificando-

se relação causal entre os preços das ações destas empresas com o DJIA. Dada

esta relevância para o índice utilizado e conforme nosso país passa a atrair cada vez

mais investimentos estrangeiros e praticar uma política de abertura, deixando nossa

economia mais suscetível aos reflexos da economia internacional, prosseguiremos

com o objetivo de avaliar a previsão da direção do índice Dow Jones naquele

mercado. Em suma, o DJIA é um Benchmark confiável e aceito mundialmente, que

serve como termômetro dos dividendos de capitalização do Mercado dos Estados

Unidos, cobrindo até o ano de 2011 um nível de 24% do total de capitalizações

(quase ¼ do total do Mercado).

2.4 Mercado de Ações

Para descrever de forma bem simples o que é uma ação, podemos defini-la

como uma quota, uma parcela de uma empresa. O conceito de sociedade anônima

foi criado para permitir que uma empresa (ou a iniciativa de criar uma empresa)

pudesse captar dinheiro no mercado para financiar suas atividades.

21

Se a empresa lucrar com sua atividade econômica, terá que repartir uma

parcela desse lucro com os acionistas. A lei das sociedades anônimas estabelece

que a empresa seja obrigada a pagar pelo menos 25% de seu lucro líquido, na forma

de dividendos, aos seus acionistas.

Ao adquirir ações você não sabe exatamente quanto vai ganhar com elas,

apenas tem uma perspectiva de ganho, por isso esse tipo de investimento é

chamado renda variável.

2.5 Mercado de Capitais

O mercado de capitais é o ambiente operacional no qual se pode negociar o

capital das empresas constituídas como sociedades anônimas. Nesse mercado

podem ser negociados tanto as ações como seus derivativos. Derivativos são títulos

derivados das ações, daí sua denominação.

22

3 METODOLOGIA

Nos procedimentos empregados, foi feito levantamento do estado atual dos

modelos de redes neurais aplicados em problemas de categorização. Para atender

os objetivos deste trabalho foram executadas as seguintes etapas detalhadas no

capítulo seguinte:

Primeira etapa descrita no item 4.2 consiste em obter uma base de dados de

séries temporais fornecida pela companhia Palisade, sobre os indicadores que

atuam no mercado financeiro da bolsa de valores de Nova Iorque que inclua o valor

do índice Dow Jones no fim de cada mês e a indicação da direção deste índice no

fechamento mensal.

A segunda etapa, descrita no item 4.3, basicamente foi utilizar a base de

dados obtida para executar através do Software NeuralTools o treinamento de uma

rede neural na referida base de dados.

A terceira etapa, descrita no item 4.3 se baseia em realizar através da rede

neural treinada a ação de prever automaticamente a direção do índice Dow Jones no

próximo mês para cada caso do modelo.

Por último na quarta etapa, descrita no item 4.4 resume-se em analisar a

eficiência da rede neural implementada pelo software NeuralTools dentre aquelas

disponíveis pelo software e tida como a melhor rede segundo a busca automática, e

o impacto de cada variável no resultado, através dos relatórios gerados.

23

4 DESENVOLVIMENTO

Para executar a análise da ferramenta, foi feito o treinamento da Rede Neural

implementada como suplemento para o Excel através da ferramenta NeuralTools da

Palisade Corporation. Para tanto, considerou um conjunto de dados fornecidos pela

Palisade, cuja periodicidade é mensal contemplando o período de Janeiro de 1959 a

Dezembro de 1997. O motivo da escolha deste modelo deveu-se as variáveis

independentes da economia tais como taxa de juros básica, inflação anterior, que

são de grande importância como fatores que aceleram a inflação e

consequentemente influenciam o rumo da economia conforme indica o trabalho de

Luiz Carlos Bresser Pereira e Yoshiaki Nakano (1984). Além disso, segundo

fundamentos econométricos estes dados estão organizados em um modelo de séries

temporais. Conforme atesta Erkam Guresen, os modelos de séries temporais

financeiros expressados por teorias financeiras tem sido a base para previsão de

uma série de dados no século XX. (GURESEN,2011, p.10390, tradução nossa). A

variável dependente do modelo é a direção do índice Dow Jones classificando em

duas categorias, sendo Subiu para Alta do Índice e Caiu para Baixa da direção do

índice.

4.1 A ferramenta Neural Tools

O Neural Tools 5.7 Edição Industrial, é um software proprietário da Palisade

Corporation sediada em Nova Iorque e traduzido para português devido à venda

deste software no Brasil e o seu uso por organizações e instituições brasileiras de

grande porte como Petrobras, UFRJ, dentre outras companhias.

O Neural Tools trabalha integrado ao ambiente do Excel, o que torna muito

simples a manipulação dos dados. No modelo a ser analisado, uma rede neural

aprende a prever a direção do mercado no próximo mês, com base em dados de

indicadores econômicos mensais específicos. No modelo em questão, além dos

24

valores dos indicadores do mês anterior, estão inseridas variáveis defasadas e

variáveis que medem as mudanças no decorrer de 6 meses.

A rede utilizada pelo NeuralTools é do tipo Multilayer FeedFoward conhecida

como alimentação direta com múltiplas camadas e probabilística, segundo a

Palisade Corporation, o NeuralTools permite usar diferentes configurações de redes

neurais, a fim de propiciar as melhores previsões possíveis. A ferramenta distingue

as redes neurais para a previsão de classificação/categoria (em que a variável

dependente é um tipo de categoria) em dois tipos de redes disponíveis: Redes

Neurais Probabilísticas (PNN) e redes Multi-Layer Feedforward (MLF). A

previsão numérica pode ser realizada usando-se redes MLF assim como Redes

Neurais de Regressão Generalizada (GRN), que são estreitamente relacionadas

às redes Probabilísticas.

Figura 3 – Tela de informações sobre o software NeuralTools.

25

As opções da ferramenta resume-se em gerenciar dados, treinar uma rede

neural, testar a rede neural treinada e fazer previsões em cima de novos dados.

Abaixo a nova aba:

Figura 4 – Aba do Excel com menu de ferramentas do NeuraTools.

4.2 Dados do Modelo

Segundo Paul McNelis (2005), o problema em usar um índice baseado em

uma média ou média ponderada é que o mercado não pode ser agrupado em torno

daquela média. Em contrapartida, segundo o mesmo autor um modelo que pode

explicar tudo, ou aproximadamente tudo, na realidade nada explica. Neste trabalho,

realiza-se análise apenas do ponto de vista do índice Dow Jones, apesar de

existirem outros índices, como o NASDAQ, S&P 500, mas por questões de

simplificação, pois pretende-se mostrar a facilidade de uso da ferramenta

NeuralTools no cumprimento do objetivo, portanto, utilizaremos além do DJIA,

variáveis da economia como taxa de inflação, índice de produção industrial, vendas

a varejo, dentre outros, com as seguintes nomenclaturas:

JUR: Taxa Básica de juros (baseada em Notas do Tesouro com vencimento

constante, 5 anos);

INF: Taxa de inflação como um dos principais componentes;

PROD: Índice de produção industrial;

VAR: Vendas a varejo;

DJIA: Índice da Média Industrial Dow Jones;

RESULTADO: direção do índice Dow Jones (DJIA).

26

Além destas variáveis, foram utilizados variáveis defasadas e variáveis que medem

as mudanças decorridos 6 meses, pois com isto é possível que a rede neural

assimile melhor as imperfeições do mercado e aumente sua capacidade de

generalização.

As opções da ferramenta resume-se em gerenciar dados, treinar uma rede

neural, testar a rede neural treinada e fazer previsões em cima de novos dados.

Abaixo a nova aba:

Figura 5 – Base de dados históricos para treinamento da rede.

4.3 Execução

1º Passo

Definir os conjuntos de dados para treinamento, teste e previsão através do

gerenciador de conjunto de dados. Neste caso para melhor visualização, utilizou

conjuntos de dados separadas para cada fim. O NeuralTools permite treinar e testar

a rede com base em um único conjunto de dados, selecionando aleatoriamente uma

porcentagem de dados para cada fim.

27

Figura 6 – Gerenciador do conjunto de dados

Uma característica muito importante do NeuralTools é que ele detecta

automaticamente o tipo de variável de cada intervalo de células. As variáveis podem

ser numéricas (na maioria das vezes valores contínuos) ou categóricas (geralmente

variáveis qualitativas em que se classificam-nas em uma ou mais categorias).

Também podem ser variáveis dependentes, no modelo analisado é a variável de

saída, pois depende das outras variáveis de entrada e seus respectivos valores para

determiná-la, ou variáveis independentes, que são todas as variáveis de entrada

neste caso analisado.

O Gerenciador de conjunto de dados detectou 17 variáveis distribuídas nas

colunas e 468 células de dados por variável para o conjunto de dados de

treinamento da rede neural. Também foi definido um conjunto de testes e por fim os

dados para previsão.

28

2º Passo

Após configurar os dados, antes de iniciar o treinamento da rede, é preciso

verificar os dados de treinamento, pois podem existir erros, dados ausentes, dentre

outras anomalias. O NeuralTools faz esta varredura automaticamente.

O NeuralTools trabalha com casos e variáveis. Neste modelo as variáveis são

17 no total, compreendendo faixas de dados contíguas das colunas e cada uma das

492 linhas é um caso. Portanto ao NeuralTools caberá prever os casos em que a

variável dependente estiver vazia.

No utilitário da ferramenta, é possível preencher os espaços em branco

automaticamente com valores a escolha do usuário, como média, aproximações

vizinhança, etc, como pode-se observar abaixo:

Figura 7 – Tela Utilidades de Dados Ausentes

29

3º Passo

O conjunto de dados já está pronto para ser utilizado para treinar a rede

neural. Portanto a ação Treinar é executada chamando a janela de treinamento.

Neste momento, é determinado se o treinamento e teste será automático ou

manual. Pois o NeuralTools é altamente eficiente e simples para operar, permitindo

que o treino e o teste seja feito de maneira automática selecionando intervalos

aleatórios do conjunto de dados.

Figura 8 – Tela de treinamento

O NeuralTools disponibiliza a opção de busca da melhor arquitetura de rede

neural para cada tipo de problema. No entanto, esta opção é a mais demorada, pois

as redes de múltiplas camadas alimentadas adiante são executadas diversas vezes

com variadas quantidades de neurônios nas camadas ocultas. Após executar as

diversas opções a mais rápida foi a rede probabilística/regressão generalizada.

30

Figura 9 – Aba configurações da rede

Abaixo, a tela de andamento do treinamento da rede neural durante a

execução do processo.

Figura 10 – Tela andamento do treinamento

31

4º Passo

Após o treinamento da rede neural e o seu salvamento em um local pré-

determinado é gerado um relatório detalhado e resumido sobre o treinamento.

Executa-se o teste da nova rede neural treinada com um conjunto de dados

selecionados para teste.

Figura 11 – Visão geral de teste

5º Passo

A rede neural está pronta para realizar previsões. Pode-se observar durante a

análise a existência de duas situações, a previsão automática ao detectar valores

ausentes para variáveis dependentes, no caso a variável categórica da direção DJIA

que se classifica em Subiu ou Caiu. Ou também a realização da previsão desta

variável para cada mês de cada caso, permitindo a comparação com os dados

históricos, permitindo também correlacionar a porcentagem de acerto na previsão.

32

Figura 12 – Tela de previsão da rede neural

Figura 13 – Escolha da rede neural treinada e testada

33

4.4 Resultados

Ao executar a ação de prever, a rede neural probabilística mostrou-se a mais

eficiente, pois através desta rede o tempo de execução de treinamento foi de apenas

4 segundos enquanto que para redes de múltiplas camadas com 5 nós nas camadas

ocultas o tempo de execução foi de 2 horas, que é o tempo máximo.

A rede probabilística para o problema de categorização do resultado do índice

Dow Jones em queda e alta, obteve para os 468 casos uma porcentagem de

previsões adequadas de 62,6%, o que pode ser constatado pela porcentagem de

previsões inadequadas de 37,39% nos dados do relatório de treinamento.

Figura 14 – Relatório dos resultados de treinamento

34

Para este relatório, também percebe-se dentre as variáveis numéricas

independentes que são as entradas da rede, uma variação de impacto no resultado,

obtendo-se 27,66% de influência no resultado para a variável taxa de juros decorrido

o acúmulo desta taxa em 6 meses. E um impacto muito baixo para as variáveis de

taxa de inflação defasada (0,086%) e índice de produção industrial decorrido 6

meses (0,02 %).

Figura 15 – Relatório de treinamento – análise de impacto de variáveis

Segundo a matriz de classificação, que faz a correlação entre a quantidade de

previsões realizadas e aquelas efetivas disponíveis dos dados históricos, houve um

alto índice de acerto (84,68%) para a categoria Subiu enquanto que para a categoria

Caiu do índice Dow Jones houve apenas 31,44% de acerto.

Abaixo o histograma de probabilidade de categorias incorretas e o gráfico em

barras da análise de impacto das variáveis:

35

Figura 16 – Histograma de probabilidades de categorias incorretas

Figura 17 – Impacto de variáveis

36

Para os resultados do teste, as porcentagens foram bem próximas daquelas

do treinamento. Dada a porcentagem de previsões inadequadas (38,09%) o nível de

acerto foi de 61,91% de previsões adequadas. Abaixo relatório de teste da rede:

Figura 18 - Relatório resumido de teste da rede neural treinada

Segundo a matriz de classificação de teste, houve melhora no índice de

acerto (91,67%) para a categoria Subiu comparado com os valores de treinamento

enquanto que para a categoria Caiu do índice Dow Jones houve uma porcentagem

menor ainda se comparada com o valor de treinamento (22,23%) de acerto.

37

5 CONCLUSÃO E TRABALHOS FUTUROS

Conclui-se que a ferramenta analisada implementa a nível de software

eficazmente redes neurais artificiais conforme a mecânica de aprendizagem de

máquinas das redes neurais de múltiplas camadas, probabilísticas e de regressão

generalizada. Sendo uma alternativa eficaz e substitutiva de técnicas puramente

estatísticas e probabilísticas aplicadas no mercado financeiro, de fácil manipulação e

rápida execução, possibilita o uso aplicado de redes neurais sem a necessidade de

ser especialista, que seria o caso de pessoas que utilizam os modelos de redes

neurais como ferramenta de apoio a tomada de decisão para o mercado financeiro.

Portanto, as redes neurais tem um grande poder de processamento e amplo

campo de aplicação, sendo adequadas para problemas do mercado financeiro de

categorização, previsão e análise de sensibilidade em modelos de dados.

Para trabalhos futuros, é sugerido um maior detalhamento analítico e

comparação de diferentes implementações de modelos de redes neurais para

problemas de previsão de valores numéricos utilizando arquiteturas de redes mais

avançadas como redes neuro-dinâmicas de retro-alimentação.

38

REFERENCIAS BIBLIOGRÁFICAS

BARBIERI, Carlos. BI2 – Modelagem e Qualidade. Axcel Books, 2011.

COSTA, Israel J. VARGAS, Jaderson. Análise Fundamentalista e Análise Técnica: agregando Valor a uma carteira de Ações. Faculdade Estácio de Sá. Espírito Santo.

GURESEN, Erkam; KAYAKUTLU, Gulgun; TUGRUL U. Daim, Using artificial neural network models in stock market index prediction, Expert Systems with Applications, V. 38, n. 8, Ago-2011, p. 10389-10397.

HAYKIN, Simon. Redes Neurais: princípios e prática. 2.ed. Porto Alegre : Bookman, 2001.

Índice DowJones. Acesso em http://www.djindexes.com/literature/?go=analyticsandresearch

MCNELIS, Paul. Neural Networks in Finance: Gaining predictive edge in the Market. Elselvier, 2005.

NELSON, Edward . Radically Elementary Probability Theory. Princeton University Press. 1987. Acesso em https://web.math.princeton.edu/~nelson/books/rept.pdf

WOLFF, Laion. et al. Influência do mercado acionário norte americano sobre o preço das principais ações brasileiras. Revista Organizações em Contexto, ROC. São Bernardo do Campo, SP. Ano 7. n. 14. Jul-Dez 2011.p 191-210.

WALLACE, M. P. Neural Networks and their application to Finance. Business Intelligence Journal, London, 2008.

YAO, J. T. et al. Neural Networks for Technical Analysis: A Study on KLCI. Journal of Theoretical and Applied Finance Vol. 2, No. 2 (1999) 221-241.

http://www.djindexes.com/literature/?go=analyticsandresearch

https://web.math.princeton.edu/~nelson/books/rept.pdf

Documents

Monografia Redes Neurais