17
APLICAÇÃO DE REDE NEURAL NARX PARA A PREVISÃO DO PREÇO DA SOJA Leticia Biagi Vilela (UFMS ) [email protected] Tiago Henrique de Abreu Mateus (UFMS ) [email protected] Este trabalho faz o estudo da previsão de séries temporais utilizando uma rede neural artificial do tipo NARX para prever a cotação da soja para a cidade de São Gabriel do Oeste/MS. A principal vantagem de se utilizar RNAs reside em sua altta capacidade de aprendizagem sobre um sistema por meio de uma base de exemplo fornecida a rede e, além disso, na sua alta capacidade de generalização diante de informações incompletas, não lineares ou com ruído. Para realizar a previsão foram feitos diversos testes para um conjunto de dados que reflete a cotação da soja no período de 2007 a 2015 no software MATLAB® R2008a testando configurações de rede para uma camada intermediária. Para treinar a rede neural utilizou-se o algoritmo de Levenberg- Marquardt. Os resultados obtidos confirmam o poder da capacidade de captura de tendência da rede, podendo ser aplicada ainda em várias áreas do conhecimento, como em sistemas inteligentes de reconhecimento de voz e auxílio ao diagnóstico médico. Palavras-chave: Palavras-chave: Séries Temporais; Redes Neurais Artificiais; NARX; Soja. XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil João Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016.

APLICAÇÃO DE REDE NEURAL NARX PARA A … · XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE ... realidade cotidiana com aplicações em várias ciências como ... Genéticos e Redes Neurais

  • Upload
    doque

  • View
    216

  • Download
    2

Embed Size (px)

Citation preview

APLICAÇÃO DE REDE NEURAL NARX

PARA A PREVISÃO DO PREÇO DA

SOJA

Leticia Biagi Vilela (UFMS )

[email protected]

Tiago Henrique de Abreu Mateus (UFMS )

[email protected]

Este trabalho faz o estudo da previsão de séries temporais utilizando

uma rede neural artificial do tipo NARX para prever a cotação da soja

para a cidade de São Gabriel do Oeste/MS. A principal vantagem de se

utilizar RNAs reside em sua altta capacidade de aprendizagem sobre

um sistema por meio de uma base de exemplo fornecida a rede e, além

disso, na sua alta capacidade de generalização diante de informações

incompletas, não lineares ou com ruído. Para realizar a previsão

foram feitos diversos testes para um conjunto de dados que reflete a

cotação da soja no período de 2007 a 2015 no software MATLAB®

R2008a testando configurações de rede para uma camada

intermediária. Para treinar a rede neural utilizou-se o algoritmo de

Levenberg- Marquardt. Os resultados obtidos confirmam o poder da

capacidade de captura de tendência da rede, podendo ser aplicada

ainda em várias áreas do conhecimento, como em sistemas inteligentes

de reconhecimento de voz e auxílio ao diagnóstico médico.

Palavras-chave: Palavras-chave: Séries Temporais; Redes Neurais

Artificiais; NARX; Soja.

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016.

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

2

1. Introdução

No Brasil a soja se configura como a cultura mais cultivada do agronegócio. O retorno das

exportações da commoditie em relação à safra de 2015/2016 de acordo com a CONAB

(Companhia Nacional de Abastecimento) em seu sexto levantamento realizado em março de

2016 aponta um montante de US$ 147,6 milhões de dólares americanos para as negociações

de exportação. Segundo a Confederação da Agricultura e Pecuária do Brasil (CNA), a

participação do agronegócio em 2015 no PIB brasileiro correspondia a 23%, fazendo do

agronegócio uma componente de extrema importância para as contas da União, sendo que

com relação ao saldo da Balança Comercial do Brasil, o agronegócio tem destaque

fundamental na manutenção dos superávits alcançados pelo país.

De acordo com a secretaria de Portos do Brasil, no ano de 2015, só no Porto de Santos a soja

em grão atingiu uma marca de 24% do volume exportado de mercadorias, no Porto do Rio

Grande as exportações da commoditie atingiram 21% do volume exportado, no Porto de

Paranaguá 13% do total exportado, e no Porto de São Luís 9% do volume total. Isso sem

mencionar o grande volume de exportações do farelo de soja para esses portos.

O preço da soja é influenciado principalmente por três variáveis, sendo o preço praticado no

mercado internacional com base na bolsa de Chicago (CBOT), a taxa de câmbio Real/Dólar e

o prêmio de exportação da soja (base Porto de Paranaguá). Margarido e Souza (1998) em seu

trabalho mostraram que a oferta no Brasil é influenciada diretamente pela variação entre os

preços na CBOT e os preços praticados no mercado interno.

Visto que o preço da soja tem grande influência no comportamento do mercado, saber qual

será a tendência de precificação da oleaginosa facilita a tomada de decisão aos produtores e

lhes permite maximizar seus lucros. Sabendo da importância da commoditie para a Balança

Comercial do País, este trabalho faz a previsão dos preços da soja utilizando um tipo

específico de Redes Neurais Artificiais (RNAs), a rede NARX (Rede Não Linear

Autorregressiva com Entradas Exógenas), rede recorrente com alto desempenho, e treinada

neste trabalho com algoritmo de Levenberg-Marquardt.

A importância de estudo do tema para a Engenharia de Produção está no desenvolvimento da

pesquisa e do conhecimento para a área de Pesquisa Operacional, mais especificamente para a

subárea de Modelagem, Simulação e Otimização, bem como para servir de suporte a decisões

operacionais no mercado da soja.

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

3

2. Referencial Teórico

Previsões acerca do comportamento de um sistema seja ele físico, econômico, ou social nunca

foi tarefa das mais fáceis. Além de contar com os fatores incerteza e imprevisibilidade, é

essencial que a técnica de previsão esteja adequada ao fenômeno, e que o tomador de decisão

tenha domínio da técnica para obter resultados satisfatórios. O processo de tomada de decisão

nas organizações é sempre importante porque define rumos para a empresa tanto no curto,

quanto no médio ou longo prazo (RIBEIRO, 2003). Para auxiliar o processo de tomada de

decisão este trabalho faz uso da previsão de séries temporais utilizando redes neurais

artificiais (RNA) para prever a cotação da soja na cidade de São Gabriel do Oeste (MS). De

início é feita uma apresentação sobre séries temporais e posteriormente sobre RNAs, que é a

ferramenta empregada neste trabalho.

2.1. Mercado da soja no Brasil

No Brasil a Região Centro-Oeste é a principal produtora da oleaginosa. De acordo com o

sexto levantamento da safra brasileira de grãos para a safra 2015/2016 realizado pela CONAB

(Companhia Nacional de Abastecimento), a cultura da soja é responsável por 56,8% da área

cultivada do país, e permanece como a principal responsável pelo aumento de área cultivada

na agricultura do país. A estimativa ainda para o ano de 2016 é de crescimento de 3,6% (1,2

milhão de hectares) na área cultivada, e safra estimada em 101,2 milhões de toneladas para a

soja no país. A figura 1 ilustra a produção total de grãos na safra 2015/2016 e a porcentagens

correspondentes a cada cultura, sendo que a soja representa 48,13% da produção agrícola do

país.

De acordo com a FIESP em seu informativo de março de 2016, o consumo mundial de soja

para a safra 2015/2016 assume a marca de 315,7 milhões de toneladas, impulsionado pelo alto

consumo no mercado da China.

Figura 1 - Produção de Grãos no País safra 2015/2016. Levantamento 03/2016

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

4

Fonte: CONAB (2016)

A atividade agrícola se diferencia da produção industrial na medida em que o produtor não

pode controlar as condições meteorológicas e consequentemente a quantidade exata que será

produzida e a qualidade das safras. A tarefa de conciliar uma demanda relativamente estável

com uma oferta agrícola que flutua sazonal e aleatoriamente é o principal desafio da

comercialização da soja e das commodities agrícolas. Assim, conhecer a tendência de preço

dos produtos facilitam decisões estratégicas dos produtores, tais como estocar a produção e

vender nos períodos de alta da cotação.

Por definição, normalmente, as commodities são cíclicas, ou seja, a produção pode ser

estimulada ou desestimulada de acordo com o preço da commoditie. Se o preço do produto

estiver alto, por exemplo, os produtores serão “estimulados” a produzi-lo. Por outro lado, se a

produção for grande demais, os estoques irão aumentar e o preço irá cair, logo o interesse dos

produtores também será menor, fazendo com que a safra diminua. Consequentemente, os

estoques diminuem e o preço volta a subir, configurando um assim ciclo (NEHMI, 2012).

Os fatores que mais assolam a competitividade das exportações brasileiras são:

elevado custo de tarifas portuárias; ausência de investimentos na ampliação de instalações

portuárias, ocasionando assim as conhecidas filas de caminhões e navios no período da safra;

e a limitação de profundidade dos portos (muitos deles não fazem a dragagem com a

frequência necessária), impedindo a atracação de navios de maior porte (IMEA, 2015).

O preço da soja dita tendências importantes no mercado de negociação da commoditie.

Para fazer a previsão dessa componente, utilizam-se dados históricos da cotação da soja

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

5

aliado a alguma técnica de previsão. Nos trabalhos de Ceretta et al. (2010), Yonenaga e

Figueiredo (1999), e Lima et al. (2009) as cotações da commoditie foram empregadas como

entradas da técnica de previsão.

2.2. Séries Temporais

Uma série temporal (ST) é um conjunto de observações ordenadas no tempo (MORETTIN;

TOLOI, 1987). Os estudos de séries temporais envolvem modelagens, análises, e técnicas

específicas aplicadas. São exemplos de séries temporais:

i) Média mensal de chuva que atinge uma determinada região;

ii) Taxa de desemprego no país;

iii) Registros de casos anuais de dengue em um estado;

iv) Preços diários de ações;

v) Níveis de eletrocardiograma;

vi) Registros anuais de terremotos na Ásia;

vii) Níveis de um determinado hormônio feminino a cada hora.

Segundo Costa (2009), são inúmeros os exemplos de séries temporais que permeiam a nossa

realidade cotidiana com aplicações em várias ciências como economia, medicina,

meteorologia, epidemiologia, astronomia, física, engenharias entre outras.

Para Ehlers (2009), uma série temporal é um conjunto de observações { ( ), }Y t t T , Y , onde a

variável de interesse, T : conjunto de índices, sendo que a série pode ser discreta, contínua ou

multivariada. Sendo então uma série temporal um processo estocástico, o conjunto de valores

{ ( ), }Y t t T é chamado de espaço de estados e os valores ( )Y t são chamados de estados.

Se discreta, a série pode ser escrita como: 1 2,{ , ..., }nT t t t ;

Se contínua, a série tem a seguinte forma: 1 2{ : }T t t t t ;

Se considerada multivariada, as observações são correspondentes a: 1{ ( ),..., ( ), }kY t Y t t T ,

onde neste caso, cada t tem se um vetor de observações, ou seja, as séries são

correlacionadas. Deve-se ressaltar que observações correlacionadas são mais difíceis de

analisar e exigem técnicas especiais.

A análise de uma série temporal possui dois objetivos principais, como:

i) Compreender o mecanismo gerador da série;

ii) Predizer o comportamento futuro da série, que é o foco deste trabalho;

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

6

iii) Controlar as observações da série, muito utilizado em controle estatístico de processos

(CEP) para medir a qualidade de um processo de manufatura (EHLERS, 2009).

De acordo com Latorre e Cardoso (2001), quando se compreende o mecanismo gerador pode-

se, por exemplo, descrever o comportamento da série e controlar sua trajetória. Já predizer seu

comportamento, possibilita ao analista fazer planos a longo, médio e curto prazo. Todo tipo de

previsão conta com o fator incerteza, o que significa que elas não são perfeitas e o objetivo é

reduzir ao máximo os erros de previsão.

2.3 Redes Neurais Artificiais (RNA)

A inteligência artificial (IA) é uma área da ciência que tem como objetivo reproduzir por

meios computacionais capacidades inteligentes que os seres humanos detêm, tais como

pensar, resolver problemas, comunicar-se a partir de uma linguagem, armazenar informações

e conhecimento, e aprender. Ela vem se desenvolvendo desde 1943 com o início das

pesquisas voltadas ao neurônio artificial de McCulloch & Pitts nessa mesma época, entretanto

o termo inteligência artificial foi cunhado por John MacCarthy em 1956 (RUSSEL; NORVIG,

2009). Destacam-se na IA algumas ferramentas como Lógica Nebulosa, Algoritmos

Genéticos e Redes Neurais Artificiais (FILIPATTI, et al., 2000).

Nesse contexto se desenvolveu a pesquisa de McCulloch e Pitts em 1943. McCulloch

(Instituto Tecnológico de Massachusetts) foi um psiquiatra e neuroanatomista por

treinamento, e por cerca de 20 anos passou refletindo sobre a representação de um evento no

sistema nervoso. Pitts (Universidade de Illinois) por sua vez, foi um matemático talentoso que

associou-se a McCulloch em 1942. Ambos descreveram um cálculo lógico das redes neurais

que unificava as pesquisas da neurofisiologia e da lógica matemática (HAYKIN, 2001).

Redes Neurais Artificiais é uma ferramenta não paramétrica utilizada, por exemplo, no

reconhecimento de padrões e interpolação, filtragem de sinais, previsões de séries temporais,

entre várias outras aplicações. RNAs são aptas a suportar dados com erros e encontrar

associações não lineares entre os parâmetros do modelo, entretanto, para que isso aconteça é

essencial incorporar as variáveis apropriadas ao modelo para que a previsão possua uma

acurácia aceitável (KRISTJANPOLLER; MINUTOLO, 2015).

RNAs são baseadas no funcionamento do cérebro humano, como ele funciona e estabelece

suas conexões através dos neurônios, constituintes estruturais do cérebro. Estima-se que haja

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

7

10 bilhões de neurônios no córtex humano e 60 trilhões de sinapses (conexões) (SHEPHERD;

KOCH, 1990).

Em termos matemáticos, um neurônio k pode ser descrito com o seguinte par de equações:

1

m

k kj j

j

u w x

(1)

e,

( )k k ky u b (2)

Onde,

1 2, ,..., mx x x correspondem aos respectivos sinais de entrada; 1 2, ,...,k k kmw w w são os pesos

sinápticos do neurônio k ; ku corresponde a saída do combinador linear; kb é por sua vez o

bias; . é a função de ativação e ky corresponde ao sinal de saída do neurônio (HAYKIN,

2001). A figura 2 ilustra essa representação do neurônio artificial concebido originalmente por

McCulloch e Pitts.

Figura 2 - Modelo não-linear de um neurônio

Fonte: Adaptado de HAYKIN (2001)

Devido a sua estrutura, RNAs são bastante efetivas no aprendizado de padrões a partir de

dados não lineares, incompletos e com ruídos. Diferentes topologias e configurações de

treinamento foram construídas ao longo do tempo com o objetivo de se adaptar ao problema a

ser resolvido nas mais variadas áreas da ciência. Aplicações substanciais de RNA segundo

Silva et. al (2010) podem ser verificadas abaixo:

i) Sistemas de previsão;

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

8

ii) Otimização de sistemas;

iii) Controle de processos;

iv) Memórias associativas;

v) Agrupamento de dados (clusterização);

vi) Reconhecimento e classificação de padrões;

vii) Aproximador universal de funções.

RNAs possuem a propriedade de serem aproximadores universais. Pode-se dizer, que para

uma RNA, com um número adequado de neurônios em sua camada oculta e uma função de

ativação do tipo logística, é capaz de aproximar, com o grau de precisão esperado, qualquer

mapa de um espaço dimensional finito em um outro espaço dimensional finito qualquer. Já os

métodos de aprendizagem empregados para obter os pesos se dão por processos de estimação

usual em estatística. RNAs possuem muitos pontos de contato com os modelos estatísticos e

econométricos tradicionais, mas com diferença em suas terminologias (FERNANDES; et al,

1995). O quadro 1 mostra a correspondência para a terminologia básica de RNAs quando

comparado com a estatística.

Quadro 1: Correspondência da Terminologia Básica entre RNAs e Estatística.

Fonte: Próprio autor.

REDES NEURAIS ESTATÍSTICA

Entradas Variáveis Exógenas

Saídas Variáveis Endógenas

Pesos Parâmetros

Conjunto de Treinamento Amostra

Retropropagação Aproximação Estocástica

Treinamento Estimação

Sendo uma RNA um modelo computacional inspirado no cérebro biológico a rede passa a

possuir características tal qual o cérebro nos seres humanos, como por exemplo, a capacidade

de aquisição, manutenção e generalização do conhecimento. Segundo Silva et al. (2010) as

principais características no emprego de RNAs são:

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

9

i) Aprender com exemplos: A rede aprende a partir do relacionamento com o ambiente

por meio de um algoritmo de treinamento capaz de absorver a interação entre as variáveis

do modelo;

ii) Capacidade de generalização: Depois de treinada a rede alcança a generalização do

conhecimento absorvido;

iii) Capacidade de adaptação: Após o treinamento a rede ajusta seus pesos sinápticos

internos a fim de fornecer a melhor resposta;

iv) Classifica padrões: Agrupa e organizar dados criando grupamentos com características

semelhantes;

v) Tolerância a falhas: Em razão do grande número de conexões a rede tem a capacidade

de continuar funcionando mesmo se parte de sua estrutura interna for corrompida, tal

como acontece no cérebro biológico.

Em uma RNA os neurônios estão estruturados em camadas. A forma na qual os neurônios

estão organizados está estreitamente ligada ao algoritmo de aprendizagem utilizado para

realizar o treinamento da rede. Em geral, é possível discernir três classes de arquiteturas de

rede fundamentalmente distintas (HAYKIN, 2001):

i) Redes alimentadas adiante com camada única (Perceptron);

ii) Redes alimentadas diretamente com múltiplas camadas (Perceptron de Múltiplas

Camadas);

iii) Redes recorrentes.

Redes alimentadas adiante com camada única apresentam-se estruturadas em uma única

camada de entrada que se projeta sobre uma saída de neurônios, porém não vice-versa, ou

seja, esta rede é alimentada adiante (acíclica). É importante ressaltar que na camada de

entrada não há nenhum esforço computacional (HAYKIN, 2001).

Redes alimentadas diretamente com múltiplas (MLP - Multi-Layer Perceptron) camadas

adiante se diferenciam de redes alimentadas adiante com camada única por possuírem uma ou

mais camadas ocultas. A arquitetura Multi-Layer Perceptron (MLP) é conhecida como uma

das mais populares arquiteturas de RNA. A rede MLP é do tipo feedforward, isto é, os sinais

se propagam em um único sentido, da camada de entrada para a camada de saída (SOUZA,

2012).

Redes recorrentes por sua vez, se diferenciam das redes alimentadas adiante por possuir em

sua configuração ao menos um laço de realimentação. A influência de laços de realimentação

é profunda na capacidade de aprendizagem da RNA e no seu desempenho. A realimentação

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

10

utiliza-se de elementos de atraso unitário ( 1z ) que representa um comportamento dinâmico

não linear (HAYKIN, 2001).

2.4. Rede NARX

A rede neural artificial NARX (Nonlinear Autoregressive with Exogenous Inputs) é uma rede

comumente utilizada para sistemas dinâmicos não lineares. Apesar do seu alto desempenho, a

rede NARX ainda não foi explorada massivamente como uma ferramenta não linear para

séries cronológicas (XIE, et al., 2009). Campos potenciais para aplicação da NARX têm sido

desenvolvidos nas áreas de caracterização de tráfego de redes de comunicação e em previsão

de séries temporais caóticas. A figura 3 ilustra uma topologia para a rede NARX com duas

camadas escondidas.

Figura 3 - Topologia de uma rede NARX com atrasos na entrada ud e na saída yd .

Fonte: Adaptado de HAYKIN (1999)

3. Metodologia

Para a elaboração desse trabalho foram coletados dados da série histórica da cotação da soja

no período de 2007 a 2015, sendo que os dados correspondentes ao ano de 2015 foram

separados do restante do conjunto para realizar o teste adicional, a fim de que os dados

utilizados no treinamento não fossem os mesmos utilizados no teste.

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

11

O conjunto de dados foi utilizado então para alimentar as entradas de uma RNA do tipo

NARX por meio do software MATLAB® R2008a. A rede NARX foi estudada como

ferramenta deste trabalho por ser uma rede dinâmica e recorrente com alto desempenho.

Na prática, a rede NARX possui várias vantagens. Segundo Siegelmann (1977), a rede neural

NARX é considerada mais poderosa do que as redes recorrentes convencionais. Sua

aprendizagem pelo gradiente descendente tende a tornar-se mais eficaz devido à sua memória

integrada que fornece um caminho menor para a propagação do gradiente de informação

quando a rede é aberta ao invés de retropropagar o sinal de erro. Além disso, treiná-la com o

algoritmo de Levenberg-Marquardt adiciona privilégios à rede, pois ele combina vantagens

do gradiente descendente simples com o algoritmo do método de Newton, fornecendo a rede

rápida convergência, sem falar de seu desempenho robusto.

Para obter a rede com maior desempenho, foram feitos vários testes com parâmetros

diferentes para testar a performance da rede NARX. Os parâmetros utilizados nos testes

foram:

i) Comparação das funções de ativação linear e tangente hiperbólica para a camada

intermediária;

ii) Função linear na camada de saída;

iii) Pesos sinápticos introduzidos aleatoriamente;

iv) Reentradas com quantidade diversificadas de atrasos;

v) Uma camada intermediária (escondida);

vi) Quantidade diversificada de neurônios nas camadas escondidas.

Os critérios de parada adotados foram:

i) 50 épocas;

ii) Erro quadrático médio: inferior a 210 ;

iii) Taxa de aprendizagem entre 310 1 ;

iv) Gradiente.

4. Resultados e Discussão

A tabela 1 apresenta os três melhores resultados do desempenho da rede utilizando a função

de ativação linear, enquanto que a tabela 2 apresenta os três melhores resultados para a função

de ativação tangente hiperbólica. A simbologia (x, y) refere-se respectivamente ao número de

neurônios na camada intermediária e ao número de atrasos na entrada e na saída.

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

12

A figura 4 ilustra o teste para a função de ativação linear na camada intermediária.

Figura 4 - Representação esquemática da rede na fase de treino utilizando na camada intermediária a função de

ativação linear.

Fonte: Simulação obtida por meio do software MATLAB® R2008a

Tabela 1 - Desempenho do teste para função de ativação linear.

RESULTADO DO TESTE PARA FUNÇÃO DE ATIVAÇÃO

LINEAR

Mse do Teste Mse do Treinamento Configuração

1,6902 0,0041 7,2

1,6904 0,0041 5,2

1,6923 0,0041 3,2

A figura 5 ilustra o teste para a função de ativação tangente hiperbólica na camada

intermediária.

Figura 5 - Representação esquemática da rede na fase de treino utilizando na camada intermediária a função de

ativação tangente hiperbólica.

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

13

Fonte: Simulação obtida por meio do software MATLAB® R2008a

Tabela 2 - Desempenho do teste para função de ativação tangente hiperbólica.

RESULTADO DO TESTE PARA FUNÇÃO DE ATIVAÇÃO

TANGENTE HIPERBÓLICA

Mse do Teste Mse do Treinamento Configuração

1,6649 0,0040 1,2

1,6704 0,0032 3,3

1,7372 0,0032 2,4

A figura 6 e 7 apresentam respectivamente o primeiro e o segundo melhor desempenho para a

rede com função de ativação linear.

Figura 6 - Primeiro melhor desempenho para a função de ativação linear na camada escondida. 0 200 400 600 800 1000 1200 1400 1600 1800

-0.5

0

0.5

1

TEMPO (DIAS)

MS

E

MSE DO TREINAMENTO

0 50 100 150 200 25045

50

55

60

65

70

75

80

TEMPO (DIAS)

CO

TA

ÇÃ

O (

R$)

0 50 100 150 200 250-5

0

5MSE DO TESTE = 1.6902

TEMPO (DIAS)

ER

RO

VALOR ESTIMADO

VALOR REAL

0 200 400 600 800 1000 1200 1400 1600 1800-0.5

0

0.5

1

TEMPO (DIAS)

ER

RO

MSE DO TREINO

0 50 100 150 200 25040

60

80

TEMPO (DIAS)

CO

TA

ÇÃ

O (

R$)

0 50 100 150 200 250-5

0

5MSE DO TESTE = 1.6902

TEMPO (DIAS)

ER

RO

VALOR ESTIMADO

VALOR REAL

Figura 7 - Segundo melhor desempenho para a função de ativação linear na camada escondida.

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

14

0 200 400 600 800 1000 1200 1400 1600 1800-0.5

0

0.5

1

TEMPO (DIAS)

MS

E

MSE DO TREINAMENTO

0 50 100 150 200 25045

50

55

60

65

70

75

80

TEMPO (DIAS)

CO

TA

ÇÃ

O (

R$)

0 50 100 150 200 250-5

0

5MSE DO TESTE = 1.6902

TEMPO (DIAS)

ER

RO

VALOR ESTIMADO

VALOR REAL

0 200 400 600 800 1000 1200 1400 1600 1800-0.5

0

0.5

1

TEMPO (DIAS)

ER

RO

MSE DO TREINO

0 50 100 150 200 25040

60

80

TEMPO (DIAS)

CO

TA

ÇÃ

O (

R$)

0 50 100 150 200 250-5

0

5MSE DO TESTE = 1.6902

TEMPO (DIAS)

ER

RO

VALOR ESTIMADO

VALOR REAL

A figura 8 e 9 apresentam respectivamente o primeiro e o segundo melhor desempenho para a

rede com função de ativação tangente hiperbólica.

Figura 8 - Primeiro melhor desempenho para a função de ativação tangente hiperbólica na camada escondida. 0 200 400 600 800 1000 1200 1400 1600 1800

-0.5

0

0.5

1MSE DO TREINO

TEMPO (DIAS)

ER

RO

0 50 100 150 200 25045

50

55

60

65

70

75

80

TEMPO (DIAS)

CO

TA

ÇÃ

O (

R$)

0 50 100 150 200 250-5

0

5MSE DO TESTE = 1.66493

TEMPO (DIAS)

ER

RO

VALOR ESTIMADO

VALOR REAL

0 200 400 600 800 1000 1200 1400 1600 1800-0.5

0

0.5

1MSE DO TREINO

TEMPO (DIAS)

ER

RO

0 50 100 150 200 25040

50

60

70

80

TEMPO (DIAS)

CO

TA

ÇÃ

O (

R$)

0 50 100 150 200 250-5

0

5MSE DO TESTE = 1.66493

TEMPO (DIAS)

ER

RO

VALOR ESTIMADO

VALOR REAL

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

15

Figura 9 - Segundo melhor desempenho para a função de ativação tangente hiperbólica na camada escondida. 0 200 400 600 800 1000 1200 1400 1600 1800

-0.5

0

0.5

1

0 50 100 150 200 25045

50

55

60

65

70

75

80

TEMPO (DIAS)

CO

TA

ÇÃ

O (

R$)

0 50 100 150 200 250-5

0

5MSE DO TESTE = 1.67043

TEMPO (DIAS)

ER

RO

VALOR ESTIMADO

VALOR REAL

0 200 400 600 800 1000 1200 1400 1600 1800-0.5

0

0.5

1

TEMPO (DIAS)

ER

RO

MSE DO TREINO

0 50 100 150 200 25040

50

60

70

80

TEMPO (DIAS)

CO

TA

ÇÃ

O (

R$)

0 50 100 150 200 250-5

0

5MSE DO TESTE = 1.67043

TEMPO (DIAS)

ER

RO

VALOR ESTIMADO

VALOR REAL

Embora o resultado dos testes com a função de ativação tangente hiperbólica tenha sido

melhor para o primeiro e o segundo melhor desempenho da rede em termos de valor absoluto,

como pode ser visto na tabela 3, para esse tipo de problema a função de ativação linear

converge muito mais fácil e rápido do que a função de ativação tangente hiperbólica na

camada escondida.

Tabela 3 - Comparação de resultados para função de ativação linear versus tangente hiperbólica.

5. Conclusões e trabalhos futuros

Neste trabalho foi estudada a previsão de séries temporais aplicado ao mercado da soja na

cidade de São Gabriel do Oeste por meio da técnica de inteligência artificial, redes neurais

Critério Função de Ativação

Linear

Função de Ativação

Tangente

Hiperbólica

1º Melhor Desempenho 1,6902 1,6649

2º Melhor Desempenho 1,6904 1,6704

3º Melhor Desempenho 1,6923 1,7372

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

16

artificiais, empregando uma rede recorrente não linear, treinada com o algoritmo de

Levenberg- Marquardt.

Os resultados indicaram que a rede neural aqui utilizada apresenta um bom desempenho para

previsão de séries temporais e apresenta uma ótima capacidade de captura de tendência para

séries temporais. O algoritmo de treinamento empregado, Levenberg- Marquardt melhorou os

tempos computacionais de processamento quando comparado ao treinamento Bayesiano.

Sugere-se também o estudo da eficiência de outras topologias de redes neurais recorrentes,

bem como outros tipos de função de ativação para fazer comparação com o desempenho da

rede NARX para aperfeiçoar o estudo de previsão de séries temporais com redes neurais

artificiais.

A utilização de RNAs ainda esbarra em um problema antigo, a determinação de sua

arquitetura ótima, visto que a técnica predominantemente utilizada na literatura é de tentativa

e erro. A sugestão para trabalhos futuros é o emprego e estudo da estatística para auxiliar na

escolha da arquitetura ótima para a rede.

De maneira geral, os objetivos foram atingidos, sendo possível observar a capacidade

computacional das RNAs, neste trabalho empregada na previsão de séries temporais, mas que

pode ser empregada nas mais variadas áreas do conhecimento, justificando os estudos de

redes neurais artificiais e sua empregabilidade para estudo de sistemas inteligentes da

atualidade.

REFERÊNCIAS

CERETTA, P. S.; RIGHI, M. B.; SCHLENDER, S. G. PREVISÃO DO PREÇO DA SOJA: uma comparação

entre os modelos ARIMA e redes neurais artificiais. Informações Econômicas, SP, v.40, n.9, set. 2010.

CONAB. Companhia Nacional de Abastecimento. OBSERVATÓRIO AGRÍCOLA. Acompanhamento da safra

brasileira de grãos, v. 6- Safra 2015/16 - Sexto levantamento, Brasília, p. 1-140, março 2016.

COSTA, K. C. de O. Análise de DFA e de agrupamento do perfil de densidade de poços de petróleo. Rio Grande

do Norte, 2009.

EHLERS, R. ANÁLISE DE SÉRIES TEMPORAIS. Quinta edição 2009.

FERNANDES, L. G. L; PORTUGAL, M. S; NAVAUX, P. O. A. Previsão de Séries de Tempo: Redes Neurais

Artificiais e Modelos Estruturais. Porto Alegre, 1995.

FIESP. Federação das Indústrias do Estado de São Paulo. Safra Mundial de Soja 2015/16 - 11º Levantamento do

USDA. Informativo DEAGRO/FIESP. São Paulo. Março de 2016.

FILIPATTI F.; FRANCHESCHINI G.; TASSONI C.; VAS P. (2000). Recent developments of induction motor

drives fault diagnosis using AI techniques. IEEE Transactions on Industrial Eletronics, v. 47, nº. 5, p994-1004.

XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil

João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .

17

HAYKIN, S. Neural networks: a comprehensive fundation. (2ª ed.) Upper Saddle Rever, New Jersey: Prentice

Hall. 1999.

HAYKIN, S. Redes neurais: princípios e prática. 2ª. ed. Porto Alegre: Bookman, 2001.

IMEA. Instituto Matogrossense de Economia Agropecuária. Entendendo o mercado da soja. Workshop

Jornalismo Agropecuário. 2015.

KRISTJANPOLLER, W; MINUTOLO, M. C. Gold price volatility: A forecasting approach using the Artificial

Neural Network–GARCH model. Expert Systems with Applications: An International Journal, p.3, 2015.

LATORRE, M. R. D. O; CARDOSO, M. R. A. Análise de séries temporais em epidemiologia: uma introdução

sobre os aspectos metodológicos. Rev. Bras. Epidemiol. Vol. 4, Nº 3, 2001.

LIMA, F. G.; KIMURA, H.; ASSAF NETO, A; PERERA, L. C. J. Previsão de preços de commodities com

modelos ARIMA-GARCH e redes neurais com ondaletas: velhas tecnologias – novos resultados. R.Adm., São

Paulo, v.45, n.2, p.188-202, abr./maio/jun. 2010.

MORETTIN, P. A.; TOLOI, C. M. C. Previsões de Séries Temporais, 2ª ed. Atual, São Paulo, 1987.

NEHMI, V. Por que commodities são cíclicas? Disponível em: https://verios.com.br/blog/porque-commodities-

sao-ciclicas/. Acesso em: 05 abr. 2016.

RIBEIRO, A. L. Teorias da Administração. São Paulo: Saraiva, 2003.

RUSSEL, S; NORVIG, P. Artificial Intelligence: A Modern Approach. Prentice Hall, 3rd Edition, 932p, 2009.

SECRETARIA DE PORTOS. Presidência da República. Disponível em: http://www.portosdobrasil.gov.br/.

Acesso em 06 abr. 2016.

SHEPHERD, G. M; KOCH, C. Introduction to synaptic circuits. The Synaptic Organization of the Brain. New

York: Oxford University Press, 1990.

SILVA, I. N.; SPATTI, D. H.; FLAUZINO, R. A. Redes Neurais Artificiais para engenharia e ciências

aplicadas: Curso prático. São Paulo: Artliber, 2010.

SOUZA, I.M.M. Um estudo comparativo para previsão da cotação de ações da bm&fbovespa utilizando redes

neurais artificiais. Trabalho de Conclusão de Curso, p.22. Recife, 2012.

XIE, H.; TANG, H.; LIAO, Y. Time series prediction based on narx neural networks: an advanced approach.

Proceedings of the Eighth International Conference on Machine Learning and Cybernetics. China, 2009.

YONENAGA, W. H., & FIGUEIREDO, R. S. (1999). Previsão do preço da soja utilizando redes neurais. Anais

do Encontro Nacional de Engenharia de Produção, Rio de Janeiro, RJ, Brasil, 19.