Universidade de São Paulo - bertolo.pro.brbertolo.pro.br/LuizAntonioBertoloMonografia.pdf · Figura 18 – Suavização exponencial simples.....44 Figura 19 – Otimizando parâmetros

Universidade de São Paulo

Escola Superior de Agricultura "Luiz de Queiroz”

Programa de Educação Continuada em Economia e Gestão de Empresas

Modelo para o Apreçamento Futuro da Caixa-Peso do Limão in natura e Planejamento Estratégico

Luiz Antonio Bertolo

Trabalho de Conclusão de Curso apresentado ao Programa de Educação Continuada em Economia e Gestão de Empresas para obtenção do título de

Especialista em Agronegócio.

Piracicaba 2013

Dedico este estudo a minha esposa Cátia que

me apoiou durante esta valiosa etapa de minha

vida.

AGRADECIMENTOS

Aos nossos colegas de curso, pelo excelente convívio, pelas ajudas muitas vezes recebidas e

por nos proporcionarem trocas de aprendizado.

Ao Sr. Waldyr Promicia, Presidente da Associação Brasileira dos Produtores e Exportadores

de Limão - ABPEL pelas entrevistas concedidas e apoio na execução e elaboração deste

estudo.

Aos pesquisadores do Centro de Estudos Avançados em Economia Aplicada (CEPEA) por

facilitarem, através da divulgação dos preços da lima ácida Tahiti a realização deste trabalho e

de outras tantas contribuições ao agronegócio do país.

Aos professores Dr. Pedro Valentim Marques e Ricardo de Assis Perina, pela orientação

quanto ao tema proposto, incentivo a continuidade e conhecimentos básicos para formulação

deste estudo. Com um entusiasmo e humildade contagiantes, sempre prontos a ajudar.

SUMÁRIO

RESUMO....................................................................................................................................5

ABSTRACT ...............................................................................................................................6

LISTA DE FIGURAS.................................................................................................................7

LISTA DE TABELAS................................................................................................................9

1 INTRODUÇÃO....................................................................................................................10

2 REVISÃO DE LITERATURA............................................................................................12

3 MATERIAL E MÉTODOS.................................................................................................42

4 RESULTADOS E DISCUSSÕES.......................................................................................76

5 CONCLUSÃO.....................................................................................................................78

5 REFERÊNCIAS BIBLIOGRÁFICAS................................................................................79

RESUMO

O presente trabalho tem por finalidade apresentar aos produtores de lima ácida Tahiti um

modelo para previsão de preços futuros da caixa-peso (27 kg) contribuindo para o

planejamento estratégico da produção. Foram testados vários modelos de previsão,

particularmente, os de análise de séries temporais, que são capazes de projetar no futuro,

padrões e tendências observadas no passado dos preços. O modelo eleito, isto é, aquele que

apresentou o melhor ajuste foi o SARIMA(2,1,2)(1,0,1). A pesquisa consistiu em encontrar

como decompor o valor da caixa de limão nos fatores de risco do mercado e com isso orientar

os usuários destas estimativas nas suas projeções econômicas. Estas informações do cenário

macroeconômico de longo prazo, por meio de gráficos e análises, ajudam no gerenciamento

de riscos, antecipando fatores que movimentam o mercado e acabam contribuindo para a

adoção de medidas em relação à comercialização.

Palavras-Chave: Limão Tahiti, Métodos de Previsão, Modelo de Box-Jenkins, Simulações

de Monte Carlo.

ABSTRACT

The present work aims at presenting the producers of acid lime Tahiti a model for prediction

of future prices of box-weight (27 kg) contributing to the strategic planning of production.

Were tested several models of forecasting, particularly, the analysis of time series, which are

capable of projecting into the future, patterns and trends observed in prices passed. The model

elected, that is, those who make best adjustment was the SARIMA(2,1,2)(1,0,1). The research

is to find how to decompose the value box of lemon on the risk factors of the market and thus

these estimates to guide users in their economic projections. This information of long-term

macroeconomic scenario, through charts and analysis, assist in managing risks, anticipating

factors that drive the market and end up contributing to the adoption of measures in relation to

marketing.

Keywords: Lemon Tahiti, Forecasting Methods, Model of Box-Jenkins, Monte Carlo

Simulations

LISTA DE FIGURAS

Figura 1 – Metodologias mais comuns para a Previsão ..........................................................13

Figura 2 – Dados sazonais e dados com tendência .................................................................14

Figura 3 – Os oito métodos mais comuns de série temporal ..................................................15

Figura 4 – Dados sazonais e dados com tendência..................................................................16

Figura 5 – Gráfico típico de dados de média móvel simples, mostrando o ajuste e a linha de

previsão..................................................................................................................17

Figura 6 – Gráfico típico de dados de suavização exponencial simples, mostrando o ajuste e a

linha de previsão....................................................................................................18

Figura 7 – Gráfico típico de dados de média móvel dupla, mostrando o ajuste e a linha de

previsão..................................................................................................................20

Figura 8 – Gráfico típico de dados de suavização exponencial dupla de Holt, mostrando o

ajuste e a linha de previsão.....................................................................................21

Figura 9 – Gráfico típico de dados de sazonalidade multiplicativa e sem tendência, mostrando

o ajuste e a linha de previsão..................................................................................25

Figura 10 – Gráfico típico de dados de sazonalidade aditiva e sem tendência, mostrando o

ajuste e a linha de previsão.....................................................................................26

Figura 11 – Gráfico típico de dados de sazonalidade multiplicativa de Holt-Winters,

mostrando o ajuste e a linha de previsão................................................................28

Figura 12 – Gráfico típico de dados de sazonalidade aditiva de Holt-Winters com tendência,

mostrando o ajuste e a linha de previsão................................................................30

Figura 13 – Média móvel simples (3 meses)............................................................................42

Figura 14 – Calculando a média móvel simples.......................................................................43

Figura 15 – Fazendo previsão com média móvel simples........................................................43

Figura 16 – Estimativa do erro..................................................................................................43

Figura 17 – Valores Reais versus Valores Estimados pelo modelo MMS...............................44

Figura 18 – Suavização exponencial simples...........................................................................44

Figura 19 – Otimizando parâmetros numa suavização exponencial simples...........................46

Figura 20 – Valores Reais e Valores Estimados pelo Modelo de suavização exponencial

simples...................................................................................................................47

Figura 21 – Média Móvel Dupla (3 meses)..............................................................................48

Figura 22 – Valores Reais e Valores Estimados pelo modelo de Média Móvel Dupla...........49

Figura 23 – Suavização Exponencial Dupla (SED) de Holt.....................................................50

Figura 24 – Valores reais e estimados numa suavização exponencial dupla de Holt...............51

Figura 25 – Sazonalidade Aditiva para um período de sazonalidade s = 4 meses....................52

Figura 26 – Modelo de sazonalidade aditiva com período sazonal de 12 meses......................53

Figura 27 – Modelo de uma sazonalidade multiplicativa.........................................................54

Figura 28 – Modelo de uma sazonalidade aditiva de Holt-Winter...........................................56

Figura 29 – Modelo de uma sazonalidade multiplicativa de Holt-Winter................................56

Figura 30 – Faixa de Opções do Excel com o Suplemento ARMA instalado..........................58

Figura 31 – Janela inicial do ARMA........................................................................................58

Figura 32 – Resultados obtidos com o modelo ARMA, instalado como Suplemento.............59

Figura 33 – Janela para entrada de dados e seleção do modelo...............................................60

Figura 34 – Resultados obtidos com o software Risk Simulator.............................................62

Figura 35 – Ranking dos métodos testados pelo Risk Simulator.............................................63

Figura 36 – Janela para entrada de dados do Risk Simulator...................................................64

Figura 37 – Resultados obtidos com a ferramenta ARIMA do Risk Simulator.......................66

Figura 38 – Resultados obtidos com o Risk Simulator............................................................69

Figura 39 – Resultados obtidos com a ferramenta CB-Predictor do Crystal Ball...................70

Figura 40 – Resultados obtidos com a ferramenta CB-Predictor do Crystal Ball e Simulações

de Monte Carlo.....................................................................................................71

Figura 41 – Ranking dos métodos pelo CB-Predictor do Crystal Ball...................................72

Figura 42 – Ranking dos métodos pelo CB-Predictor Novo para os preços Nominais do

Limão...................................................................................................................72

Figura 43 – Preços projetados pelo CB-Predictor para 12 meses à frente..............................73

Figura 44 – Relatórios e Tabela comparando os vários métodos pelo CB-Predictor.............76

Figura 45 – Resultados obtidos com o CB-Predictor do Crystal Ball para o modelo de

previsão SARIMA(2,1,2)(1,0,1).........................................................................77

LISTA DE TABELAS

Tabela 1 - Comparações dos Resultados obtidos com o CB-Predictor do Crystal Ball para o

modelo de previsão SARIMA(2,1,2)(1,0,1) e os valores reais divulgados pelo CEPEA........77

1. INTRODUÇÃO

A citricultura brasileira, tem sido um dos setores mais competitivos do agronegócio.

O Brasil produz a metade do suco de laranja do planeta, exporta 98% da sua produção e

consegue 85% de participação no mercado mundial, trazendo ao país de US$ 1,5 bilhão a US$

2,5 bilhões por ano (NEVES, 2009). O segmento de produção de Suco de Laranja

Concentrado Congelado – SLCC brasileiro possui, portanto, desempenho singular dentro da

economia brasileira, não existindo outro produto com a mesma fatia de produção e

participação nas vendas do mercado mundial.

Além da laranja, outra fruta que vem se destacando na citricultura brasileira é a

lima-ácida Tahiti, também denominada de limão Tahiti, geralmente comercializada in natura,

tanto no mercado interno, como no mercado externo.

Os principais estados brasileiros produtores do limão Tahiti são: São Paulo, Bahia,

Minas Gerais e Rio de Janeiro, sendo o Estado de São Paulo, o maior produtor. Nele os

maiores municípios produtores dessa fruta localizam-se na região dos Escritórios de

Desenvolvimento Rural (EDRs) de Catanduva e Jaboticabal: Itajobi, Itápolis e Taquaritinga.

De acordo com SILVA (2008), as unidades de produção agropecuária (UPA), que

plantam limão no estado de São Paulo, apresentam uma área entre 5 a 50 ha, enquanto o

Estado de São Paulo, em si, apresenta média de 72,2 hectares nas suas UPAs, caracterizando-

se, portanto, como uma cultura de pequenas propriedades e, com isso, a função dos

distribuidores (packing house) se destaca. Estes fazem o intermédio entre os pequenos

produtores e grandes distribuidores que exportam, bem como para empresas que produzem

suco industrializado. Além disso, tais packing houses – responsáveis por comprar, limpar,

desinfetar, secar e fazer aplicação de cera e escovação dos frutos – também fazem as vendas

diretamente para o mercado varejista quando o preço é mais atrativo.

O IAC 5 é o principal clone tahiti nucelar plantado em São Paulo, e o porta-enxerto

de limão cravo é largamente utilizado. Com a utilização desses materiais, o Estado tornou-se

o principal produtor nacional de lima ácida tahiti com qualidade para exportação.

A safra principal no Estado de São Paulo ocorre de Dezembro a Maio, com pico em

Março e os meses de oferta mais restrita vão de Setembro a Novembro, com pico de escassez

em Outubro e Novembro.

11

No mercado externo, os principais países de destino são: União Europeia (U.E.), os

Estados Unidos da América (USA), Países Baixos, Reino Unido, Itália, Cingapura, Argentina,

França, Alemanha, Canadá, Portugal e Suíça. O principal destino é o mercado europeu.

O produtor como um investidor que aplica seu capital na atividade agrícola em

busca de um rendimento e o comerciante que procura se proteger contra a alta volatilidade dos

preços no mercado num mercado competitivo, ter a informação sobre o preço futuro da caixa-

peso (27 kg) do limão in natura é um indicador valioso para a gestão financeira daqueles que

trabalham com esta fruta, auxiliando-os na tomada de decisão em sua comercialização, na

administração de custos para a produção, na realização de contratos com instituições

financeiras e contratos de colheita num determinado período junto ao packing house.

As informações de mercado são tantas, que nunca um país, consultoria ou pessoa

isolada, vai deter a sua totalidade. Entretanto, todas estas informações já estão refletidas no

preço.

O preço futuro do limão já não é mais nenhuma obra de ficção ou miragem

econômica. Por isso, o objetivo dessa monografia é ajustar um modelo de previsão de preços

futuros, baseado na análise da série temporal dos preços passados. Com este modelo será

estimado mensalmente (ou diariamente) o valor da caixa-peso (27 kg) do limão, e o relatório

produzido pela estimativa poderá ser divulgado no site da Associação Brasileira dos

Produtores e Exportadores do Limão - ABPEL, por exemplo.

Os dados históricos serão obtidos no CEPEA, a partir de 1996, e as previsões

oferecidas pelo modelo escolhido servirão como sementes ou as variáveis de entrada,

obedecendo às distribuições de probabilidades sugeridas pelo modelo, para análise estatística

de cenários futuros, usando a ferramenta de Monte Carlo.

O produtor deve se habituar a elaborar as informações e deve se proteger no

mercado, assim como fazem os grandes investidores e empresas. Se o produtor ficar só no

campo produzindo e não for ao banco administrar o seu negócio, não tem jeito. O que afinal é

o mercado futuro, por que adivinhar um preço que vai ocorrer no futuro? Porque nós sabemos

o valor do que compramos, mas nunca sabemos por quanto vamos vender.

A maior riqueza é a informação. O agricultor que não se preocupar com o que ocorre

da porteira para fora, não resistirá na atividade.

A mídia informa a cotação dos principais produtos. Mas, geralmente o limão não

está presente.

12

2. REVISÃO DE LITERATURA

2.1 O que é previsão?

"Prediction is very difficult, especially if it’s

about the future."1

Niels Bohr, laureado com Nobel em Física

Segundo o Dicionário do Aurélio (FERREIRA, 1975) a palavra previsão é um

substantivo feminino que significa ato ou efeito de prever; antevisão; estudo ou exame feito

com antecedência.

Uma previsão adequada deve dar suporte a uma decisão minimizadora de risco por

parte dos tomadores de decisão (HARRISON e STEVENS, 1976). E é essencial para o

planejamento e a administração de recursos.

Existem muitas abordagens científicas para a previsão. Geralmente, elas podem ser

divididas em métodos qualitativos e quantitativos. A previsão qualitativa é utilizada quando

há poucos ou nenhum dado histórico confiável, contemporâneo, ou comparável. Há vários

métodos qualitativos, como a abordagem Delphi ou de opinião de especialista, pressupostos

gerenciais, bem como as pesquisas de mercado, dados externos ou sondagens e pesquisas

(MUN, 2010).

Na parte quantitativa, as abordagens de previsão geralmente caem numa dessas

categorias:

a) Séries Temporais – Realiza a análise de séries temporais sobre a forma padrão

passada dos dados para, a partir daí projetar os resultados futuros. Isto funciona bem para

situações estáveis em que as condições são esperadas permanecerem as mesmas. Como

exemplo, podemos citar as receitas em diferentes anos, os índices de inflação, as taxas de

juros, a participação no mercado, as taxas de falhas, os preços nominais mensais da caixa-

peso do Limão in natura divulgados pelo CEPEA, e assim por diante.

b) Regressão – Prevê os resultados futuros usando relações passadas entre uma

variável de interesse (variável dependente) e várias outras variáveis que podem influenciá-la

(variáveis independentes). Isso funciona bem para situações em que se precisam identificar os

diferentes efeitos das diferentes variáveis. Nesta categoria se inclui a regressão linear

múltipla.

1 Previsão é muito difícil, especialmente se ela for acerca do futuro.

13

c) Simulação – Aleatoriamente gera muitos cenários para um modelo de previsão

dos resultados possíveis. Este método funciona bem onde não se tem dados históricos, mas se

pode construir o modelo da situação para analisar o seu comportamento. Atualmente a

simulação de Monte Carlo é usada largamente nestas situações e os suplementos do MS-

Excel, Crystal Ball e Risk Simulator são popularmente conhecidos para automatizar esta

tarefa.

2.2 Diferentes Tipos de Técnicas de Previsão

Figura 1 – Metodologias mais comuns para a Previsão.

Fonte: MUN, 2010, p.261

Como mostrado na Figura 1, existem vários métodos para se realizar a previsão. Os

mais comuns são:

1. ARIMA (modelo de média móvel integrada autorregressiva) de Box-Jenkins

2. AutoARIMA

3. Econometria básica

4. Autoeconometria

5. Lógica difusa combinatória

6. Distribuições personalizadas

7. GARCH (modelo autoregressivo à heteroscedasticidade condicional

generalizado)

14

8. Curvas J

9. Cadeias de Markov

10. Máxima verossimilhança

11. Rede Neural

12. Regressão multivariada

13. Extrapolação não linear

14. Curvas S

15. Spline cúbico

16. Previsão estocástica

17. Análise da série temporal

18. Linhas de tendência

2.2.1 A Metodologia Clássica de Previsão por análise de séries temporais (time-series

forecasting).

"O tempo diz o que a razão não pode dizer."

René Descartes

A análise de séries temporais se aplica nos casos em que há um padrão persistente

ou sistemático no comportamento da variável, que é possível de captar através de uma

representação paramétrica (PINDYCK e RUBENFIELD, 1991). Alguns métodos clássicos

são projetados para funcionarem melhor para certos tipos de dados:

a) Dados sazonais (aumentando ou diminuindo num padrão recursivo regular no

decorrer do tempo)

b) Dados com tendência (aumentando ou diminuindo consistentemente no decorrer

do tempo)

Figura 2 – Dados sazonais e dados com tendência.

Fonte: CB Predictor – User Manual – Selecionando métodos de previsão de séries temporais. p. 3-8

Segundo (MORETTIN & TOLOI, 2004), pode-se entender a tendência (T) como o

movimento persistente nos dados em uma dada direção e a sazonalidade (S) como o

15

comportamento regular assumido pela série em algum subperíodo. O erro aleatório () leva

em consideração movimentos esporádicos e irregulares presentes na série.

A previsão de séries temporais assume que os dados históricos sejam uma

combinação de um formato padrão e de algum erro aleatório. Sua meta é isolar o formato do

erro entendo o nível, a tendência e a sazonalidade do formato. Pode-se medir o erro usando

uma medida estatística para descrever quão bem um formato reproduz os dados históricos e

estimar quão acuradamente ele projeta os dados no futuro.

A Figura 3 lista os oito modelos clássicos de série temporal, separados por

sazonalidade e tendência. Por exemplo, se a variável de dados não possuir tendência ou

sazonalidade, um modelo de média móvel simples ou de suavização exponencial simples seria

suficiente. No entanto, se existir sazonalidade, mas nenhuma tendência discernível estiver

presente, um modelo sazonal aditivo ou sazonal multiplicativo seria melhor, e assim por

diante.

Não Sazonalidade Com Sazonalidade

Nen

hu

ma

Ten

dên

cia

Média Móvel

Simples Sazonal Aditivo

Suavização

Exponencial Simples Sazonal Multiplicativo

Com

Ten

dên

cia

Média Móvel Dupla Aditivo de Holt-Winter

Suavização

Exponencial Dupla

Multiplicativo de Holt-

Winter

Figura 3 – Os oito métodos clássicos de série temporal.

Fonte: MUN, 2010. p. 264.

O que se pretende sempre é testar cada um destes métodos clássicos e classificá-los

de acordo com o erro. O método com o erro mais baixo é o melhor método.

Existem dois tipos de métodos sazonais: aditivo e multiplicativo. A sazonalidade

aditiva tem um padrão estacionário de amplitude, e a sazonalidade multiplicativa tem um

padrão de amplitude crescendo ou decrescendo no decorrer do tempo.

A Figura 4 mostra as diferentes curvas de sazonalidades

16

Figura 4 – Dados sazonais e dados com tendência.


Existem duas técnicas principais de previsão de séries temporais:

1. Suavização de Não Sazonalidade que estima uma tendência ou não

removendo dados extremos e reduzindo a aleatoriedade dos dados

2. Suavização de Sazonalidade que combina a suavização dos dados com um

ajustamento para o comportamento sazonal

2.2.1.1 Métodos de Previsão através de Modelos com Nenhuma Tendência ou

Sazonalidade

A previsão é que os valores futuros serão constantes. Isto porque o modelo não

possui tendência e assume-se que a oscilação de curto prazo é apenas ruído. Aqui a série

temporal possui aleatoriedade, mas não possui sazonalidade.

2.2.1.1.1 Média Móvel Simples (MMS)

O método da média móvel simples é indicado para previsões de curto prazo onde as

componentes de tendência e sazonalidade são inexistentes ou possam ser desprezadas

(MAKRIDAKIS et al, 1998).

17

Figura 5 – Gráfico típico de dados de média móvel simples, mostrando o ajuste e a linha de previsão

Fonte: CB Predictor. User Manual – Selecionando métodos de previsão de séries temporais. p. 3-10

Esse modelo nada mais é do que uma técnica simples de previsão exponencial onde

são considerados os k últimos dados históricos e, com estes, é realizada uma média aritmética

(ou ponderada) para prever o valor do próximo dado. O número de observações p em cada

cálculo da média, ou período, permanece constante e estipulado de maneira a tentar eliminar

da melhor forma possível as componentes de tendência e sazonalidade. (MAKRIDAKIS et.

al., 1998).

Este método usa os p últimos valores da série temporal xt, como previsão para o

tempo t + 1. Portanto:

∑

(1)

As desvantagens desse modelo estão relacionadas à falta de acurácia ao lidar com

séries históricas que apresentam tendência ou sazonalidade já que, nesse método, a previsão

para o próximo período envolve sempre a adição de novos dados e a desconsideração dos

anteriores. Uma alternativa para amenizar esse erro é a utilização da média ponderada para

tentar construir um padrão mais próximo à realidade. A dificuldade na utilização da média

móvel ponderada é a necessidade de conhecimento para se determinar os pesos a serem

utilizados (DAVIS; AQUILANO; CHASE, 2001).

2.2.1.1.2 Suavização Exponencial Simples

Muito usado nos dias de hoje é o modelo de suavização exponencial simples por ser

extremamente simples e possuir fácil capacidade de ajustes em relação à acurácia obtida com

esse método. Ele pondera todos os dados passados com pesos decrescendo exponencialmente

quando se vai de volta ao passado. Em outras palavras, geralmente os dados mais recentes

18

terão maiores pesos. Dessa forma, os pesos decaem exponencialmente a partir dos dados mais

novos. E supera bastante as limitações dos modelos de médias móveis.

Figura 6 – Gráfico típico de dados de suavização exponencial simples, mostrando o ajuste e a linha de previsão

Fonte: CB Predictor. User Manual – Selecionando métodos de previsão de séries temporais. p. 3-10

Caso a série temporal em estudo mantenha-se constante sobre um nível médio, uma

suavização exponencial simples pode ser usada para a previsão de valores futuros dessa série.

A representação matemática desse modelo é dada por (MAKRIDAKIS et al., 1998)

(2)

onde, é a previsão da demanda para o tempo t+1, feita no período atual t; é a constante

de suavização, assumindo valores entre 0 e 1; é o valor observado (real) na série temporal

para o tempo t; e, é o valor da previsão feita para o tempo t.

Uma forma de medir a acurácia da previsão é calculando o erro gerado pela mesma,

ou seja:

(3)

O valor da constante de suavização é arbitrário2. Pode-se determinar o melhor

valor para esta através de métodos iterativos para minimizar alguma medida de qualidade da

previsão como, por exemplo, a média do quadrado dos erros, EQM ou a sua raiz quadrada,

RMSE. Desta maneira, seleciona-se, inicialmente, um valor aleatório para a constante, a partir

do qual previsões são geradas. Comparam-se os valores previstos com os reais, e calcula-se a

média do quadrado das diferenças entre os mesmos; o parâmetro que minimiza essa média é

utilizado no modelo final3. A magnitude da constante determina a velocidade de resposta do

modelo frente a mudanças valores da série (MONTGOMERY et al., 1990). Valores baixos

2 O CB Predictor e o Risk Simulator calculam automaticamente a constante de suavização ótima.

3 Pode-se lançar mão do Solver do Excel para realizar isto.

19

para a constante faz com que o modelo demore em reagir às mudanças no comportamento

da série. Com valores altos de , o modelo responde rapidamente.

Os modelos de suavização exponencial simples requerem uma estimativa inicial para

. Quando dados históricos estão disponíveis, pode-se usar uma média simples das N

observações mais recentes como ; caso contrário, pode-se utilizar a observação mais

recente, ou fazer uma estimativa subjetiva.

Uma medida de eficiência deste método pode ser obtida sob a consideração que o

processo é completamente estável, assim que X1, X2, ..., são variáveis aleatórias

independentes e identicamente distribuído (IID)4 com variância

2. Portanto, segue que (para

grande t):

[ ]

⁄

(4)

Assim que a variância 2 é estatisticamente equivalente para a média móvel com (2 -

)/ = 19. Assim, em termos de variância, o Método de Suavização Exponencial com este

valor de é equivalente ao Método da Média Móvel que utiliza 19 observações. Entretanto,

se uma mudança no processo ocorre, a Suavização Exponencial irá reagir mais rapidamente

com melhor ajuste de que o Método da Média Móvel.

Uma desvantagem deste Método está na dificuldade em escolher um valor

apropriado para . O Método de Suavização Exponencial pode ser visto como um processo de

filtragem com um filtro estatístico cujas entradas são os dados “puros” a partir de um processo

estocástico e a saída são estimativas suavizadas de uma média que varia com o tempo.

Uma maneira de iniciar o processo recursivo é utilizar e .

2.2.1.2 Métodos de Previsão para Modelos com Tendência e Nenhuma Sazonalidade

A representação matemática para o processo (que gera a série temporal) com valor

constante, tendência e flutuações aleatórias pode ser dada por:

(5)

Com t= 1, 2, ..., e onde:

Xt é uma variável aleatória observada no tempo t;

a é a tendência do modelo;

é o valor constante do modelo;

4 Duas variáveis aleatórias são independentes se P(AB) = P(A|B).P(B) = P(A). P(B).

Duas variáveis aleatórias são identicamente distribuídas se possuem a mesma distribuição de probabilidade.

20

t é o erro aleatório ocorrido no tempo t (geralmente assumido ter valor esperado

igual a zero e variância constante).

2.2.1.2.1 Modelo de Previsão com Média Móvel Dupla

Aqui a técnica de média móvel simples é aplicada duas vezes, uma nos dados

originais e depois nos dados resultantes desta primeira aplicação.

Define-se a média móvel dupla de tamanho p como:

[ ]

[ ]

-

[ ]

-

[ ]

(6)

Onde [ ]

é a média móvel (simples) de tamanho p, calculada usando todas as

observações até o instante T (inclusive).

Figura 7 – Gráfico típico de dados de média móvel dupla, mostrando o ajuste e a linha de previsão


Por que usar médias móveis duplas?

Se os dados exibem uma tendência linear, o uso de médias móveis simples para a

previsão dos valores da série induz a erros sistemáticos, pois a média móvel simples segue a

tendência com certo atraso, e este efeito é amplificado quando tentamos prever valores

futuros. O método de médias móveis duplas procura diminuir este efeito sistemático.

A previsão é realizada por meio de uma reta inclinada, isto é, há uma expectativa de

que o valor da variável será sempre crescente de modo a ser compatível com a tendência nos

dados históricos.

Os dados possuem aleatoriedade e tendência de crescimento, mas veja que não há

sazonalidade. Atribui a todos os valores passados o mesmo peso na previsão. Veja que em

previsões o analista deve se preocupar com a tendência. Por quê?

21

O modelo matemático para a previsão de k períodos com média móvel é

[ ]-

[ ]

- (

[ ]- [ ]

) (7)

onde:

[ ]

é a média móvel(simples) de tamanho k calculada usando as k observações

anteriores ao instante t (inclusive);

[ ]

é a média móvel(dupla) de tamanho k calculada usando as k médias móveis

simples, [ ]

, anteriores ao instante t (inclusive).

p é o período usado no cálculo da média móvel;

k é o número de períodos de previsão variando de 1 até h (horizonte de previsão).

2.2.1.2.2 Modelo de Previsão por Alisamento Exponencial Duplo de Holt5

Quando uma determinada série apresenta aleatoriedade e uma tendência linear de

crescimento (ou decrescimento), o modelo de suavização exponencial dupla de Holt pode ser

usado de maneira satisfatória para a previsão, caso os outros componentes da série possam ser

desprezados. Este modelo emprega duas constantes de suavização, e (com valores entre 0

e 1), sendo representado por três equações (MAKRIDAKIS et al., 1998):

- - - (8)

(9)

(10)

onde:

Lt é a componente de nível;

Tt é a componente de tendência;

h é o horizonte de previsão;

k = 1, 2, ..., h;

é a previsão;

, com valores no intervalo 0<<1, é a constante de suavização da componente de nível

Lt;

, com valores no intervalo 0<<1, é a constante de suavização da componente

tendência Tt;

5 Muito usado em Engenharia de Confiabilidade

22

Na equação 8, pode-se perceber que o valor de nível Lt é a média ponderada do

próprio valor da série xt e de Lt-1 e Tt-1 (nível e tendência previstos no tempo t-1,

respectivamente). Para uma série isenta de erro aleatório, a quantidade (Lt-1 + Tt-1) é

exatamente o valor de Lt, uma vez que a variação de tempo entre t e t-1 é obviamente 1.

Assim, a expressão (8) pode ser entendida como:

- (11)

onde:

Lt = f (Lt-1, Tt-1) (12)

Em (9), a parcela Lt – Lt-1 é a derivada discreta que representa, portanto, a tendência.

Para o restante, o raciocínio é análogo ao realizado para a expressão (8).

Considerando que a primeira amostra da série temporal é para t = 1, os valores L1 e

T1 são funções de L0 e T0. Como não existe amostra da série para t = 0, faz-se necessário

inicializar L1 e T1. Há várias maneiras de se inicializar estas variáveis, dentre as quais:

(13)

(14)

ou

-

- (15)

( - ) ( - ) ( - )

(16)

OBS:- Uma vez que a componente de tendência em uma série é representada apenas

por um coeficiente (coeficiente angular da reta) as formas apresentadas em (14), (15), (16)

para inicializar T1 são possíveis representações para a derivada discreta da série calculada em

t = 1.

Figura 8 – Gráfico típico de dados de suavização exponencial dupla de Holt, mostrando o ajuste e a linha de

previsão.


23

O modelo é muito usado para modelagem de produtos na fase de divulgação quando

começa a ser aceito pelo público consumidor.

As equações (8) e (9) fazem uma estimativa do nível e da inclinação da série

temporal, respectivamente. Já a equação (10), calcula a previsão da série para os próximos k

períodos.

Assim como na suavização exponencial simples, o método de Holt requer valores

iniciais, neste caso, L0 e T0. Uma alternativa para estes cálculos iniciais é igualar L0 ao último

valor observado na série temporal e calcular uma média da declividade nas últimas

observações para T0. Outra forma de cálculo é a regressão linear simples aplicada aos dados

da série temporal, onde se obtém o valor da declividade da série temporal e de L0 em sua

origem.

As constantes de suavização e no modelo de Holt podem ser determinadas de

maneira análoga à obtenção de na suavização exponencial simples, ou seja, através da

utilização de um método iterativo que encontre a combinação de e que minimize o EQM.

2.2.1.3 Métodos de Previsão para Séries Temporais Sujeitas a Fenômenos Sazonais e

Nenhuma Tendência

É bastante comum existir padrões sazonais com valores maiores em dados instantes

de tempo de que em outros em uma série temporal. Por exemplo, este fenômeno ocorre para o

volume de vendas de panetones entre outros produtos típicos de festas natalinas na época do

natal, assim como roupas de lã para o período de inverno, bronzeadores e bonés no período do

verão, etc.

Este fenômeno viola a consideração que o processo que gera a série é por uma

componente de valor constante ou com tendência e outra componente de flutuação aleatória,

cujos métodos anteriores de previsão (média móvel simples, suavização exponencial simples,

média móvel dupla, suavização exponencial dupla de Holt) não podem ser utilizados para

previsão.

Uma maneira de realizar previsões com padrões sazonais é corrigir a série temporal

do efeito da sazonalidade e, depois então, utilizar os métodos de previsão de média móvel

simples ou suavização exponencial simples (para modelos de séries de valor constante6 e

sazonalidade), como veremos nas próximas duas seções, ou ainda o método de previsão com

6 Sem tendência

24

suavização exponencial dupla de Holt (para modelos de séries com tendência e sazonalidade),

como veremos na seção 2.2.1.4.

Considerando que o processo que gera a série temporal não tenha tendência, mas

tenha sazonalidade, o modelo será dado por:

(17)

onde: t = 1, 2, ....



St é a componente sazonal no tempo t;


igual a zero e variância constante7).

Previsão com Correção à Priori da Sazonalidade

O procedimento pode ser resumido como:

1. Corrigir a série temporal do efeito da sazonalidade através da divisão (ou

subtração) dos valores da série temporal pelos seus respectivos fatores sazonais.

2. Realizar a previsão através dos métodos Método de Previsão de Média Móvel

Simples ou Suavização Exponencial Simples.

3. Multiplicar (ou adicionar) a previsão pelos fatores sazonais incorporando a

sazonalidade.

Quando o efeito da sazonalidade é retirado e incorporado à série por meio de divisão

e multiplicação, respectivamente, dos valores da série temporal pelos fatores sazonais o

método é denominado multiplicativo.

Quando o efeito da sazonalidade é retirado e incorporado à série por meio de

subtração e adição, respectivamente, dos valores da série temporal pelos fatores sazonais o

método é denominado aditivo.

2.2.1.3.1 Modelo de Previsão com Sazonalidade Multiplicativa

O uso deste modelo deve ser para dados que possuam sazonalidade crescente ou

decrescente, mas não possuam tendência de crescimento ou decrescimento.

7 Distribuído normalmente.

25

Figura 9 – Gráfico típico de dados de sazonalidade multiplicativa e sem tendência, mostrando o ajuste e a linha

de previsão.

Fonte: CB Predictor – User Manual – Selecionando métodos de previsão de séries temporais. p.3-10

Este método utiliza a seguinte expressão:

(18)

(19)

(20)

onde:

Lt é a componente de nível da série no tempo t;

St é a componente de sazonalidade no tempo t;

s é o período sazonal ou duração da sazonalidade


k = 1, 2, ..., h, isto é, o número de períodos da previsão;

é a previsão;

, com valores no intervalo 0<<1, é a constante de suavização da componente de

nível Lt;


sazonalidade St.

As constantes de suavização e devem ser estimadas a partir dos dados.

2.2.1.3.2 Modelo de Previsão com Sazonalidade Aditiva

Este modelo pode ser usado quando ocorre sazonalidade, mas onde não se verifica a

presença de tendência. Além disso, a amplitude da sazonalidade é aproximadamente constante

ao longo do tempo.

26

O modelo pode ser usado para realizar a previsão de diversas variáveis tais como a

venda de sorvetes, brinquedos, preço de commodities, etc.

Figura 10 – Gráfico típico de dados de sazonalidade aditiva e sem tendência, mostrando o ajuste e a linha de

previsão.



- - ( - ) - (21)

- - - (22)

- (23)

onde:

Lt é a componente de nível da série no tempo t;

St é a componente de sazonalidade no tempo t;

s é o período sazonal ou duração da sazonalidade


k = 1, 2, ..., h, isto é, o número de períodos da previsão;

é a previsão;


nível Lt;


sazonalidade St.

As constantes de suavização e devem ser estimadas a partir dos dados8.

8 O CB Predictor realiza isto automaticamente

27

2.2.1.4 Método de Previsão com Suavização Exponencial de Holt-Winters

Os modelos de Holt-Winters são muito utilizados quando da existência de uma série

temporal que apresente, além da tendência, um componente de sazonalidade. Uma série com

esse componente é caracterizada pela ocorrência de padrões cíclicos de variação, que se

repetem em intervalos relativamente constantes de tempo. São muito observadas em

indústrias do ramo alimentícias, de vestuários, cosméticos, entre outras.

Os modelos de Holt-Winters também são classificados em dois grupos: aditivo e

multiplicativo. No modelo aditivo, a amplitude da variação sazonal é constante ao longo do

tempo; ou seja, a diferença entre o maior e menor valor de demanda dentro das estações

permanece relativamente constante no tempo. No modelo multiplicativo, a amplitude da

variação sazonal aumenta ou diminui como função do tempo.

Considerando que o modelo do processo que gera a série temporal seja dado por:

(24)

Onde: t = 1, 2, ....


a é a tendência do modelo;


St é a componente sazonal no tempo t;


igual a zero e variância constante9).

2.2.1.4.1 Modelo Sazonal Multiplicativo de Holt-Winters

O modelo multiplicativo de Holt-Winters se ajusta, de maneira mais adequada, a

séries com tendência e sazonalidade multiplicativa, ou seja, àquelas em que a amplitude da

variação sazonal aumenta com o acréscimo no nível médio da série temporal (KOEHLER et

al., 2001, p.269). Vide figura abaixo:

9 Distribuído normalmente.

28

Figura 11 – Gráfico típico de dados de sazonalidade multiplicativa de Holt-Winters, mostrando o ajuste e a linha

de previsão.



-

- - - (25)

- - - - (26)

- - (27)

(28)

onde:

Lt é a componente de nível;

Tt é a componente de tendência;

St é a componente de sazonalidade;

s é o período sazonal;


k = 1, 2, ..., h;

mod(n,m) é o resto da divisão de n por m;

é a previsão;


nível Lt;

, com valores no intervalo 0<<1, é a constante de suavização da componente

tendência Tt;


sazonalidade St

29

Na equação (25), pode-se perceber que os valores da série (xt) são divididos pelos

fatores sazonais, da mesma forma anterior em

para corrigir os valores da série dos

efeitos da sazonalidade, as demais parcelas da expressão são análogas as da expressão de

Holt:

- - - (29)

A expressão (26) é igual à expressão (9) no método de Holt:

- - - - (30)

A divisão dos valores da série (xt) pelos valores de nível (Lt) na expressão (21) pode

ser entendida como a medida de fator sazonal “instantânea”.

Em (28) a sazonalidade é incorporada à série através da multiplicação da soma dos

valores previstos para as componentes de Nível (Lt) e Tendência (Tt) pela componente

sazonal St-s+k.

O método multiplicativo de Winters, como os demais modelos descritos

anteriormente, funciona através da aplicação recursiva de suas equações aos dados da série.

Dessa forma, tal aplicação deve iniciar em algum período no passado, onde os valores de Lt,

Tt e St devem ser estimados (MAKRIDAKIS et al., 1998, p.168). Uma maneira simples de se

fazer essa estimativa é através da inicialização do nível e da tendência no mesmo período m:

O nível é determinado através da média de primeira estação:

(31)

Para se inicializar a tendência, é recomendado o uso de duas estações completas, ou

seja, 2s períodos:

( -

-

-

) (32)

Por último, os índices sazonais iniciais podem ser determinados através da razão

entre as primeiras observações com a média do primeiro ano:

,

, ...,

(33)

Nas expressões acima, é a previsão para o período t+k. Já , e são

constantes de suavização, cujos valores encontram-se entre 0 e 1, e xt é a mais recente

observação. Nelas, temos:

Lt representa uma estimativa do nível da série no tempo t,

Tt, uma estimativa da declividade da série no mesmo período t e

St, o componente de sazonalidade também no período t.

30

A sazonalidade, ou seja, o número de subperíodos por ano é representada por s. A

escolha dos valores para as constantes de suavização , e é condicionada a algum critério

que, na maioria das vezes, consiste no mesmo citado anteriormente: a minimização pelo uso

de um algoritmo de otimização não linear, do erro quadrático médio (EQM) atribuído ao

desempenho do modelo usando a ferramenta Solver do MS-Excel.

2.2.1.4.2 Modelo Sazonal Aditivo de Holt-Winters

Para séries que possuem tendência e sazonalidade aditiva, o modelo que apresenta

maior capacidade de explicação é o aditivo de Winters. Ou seja, ele é utilizado nas séries onde

o efeito sazonal não é função do nível médio corrente da série temporal e pode ser adicionado

ou subtraído de uma previsão que dependa apenas de nível e tendência (KOHLER et al.,

2001, p. 269). Veja figura abaixo:

Figura 12 – Gráfico típico de dados de sazonalidade aditiva de Holt-Winters com tendência, mostrando o ajuste e

a linha de previsão.


O algoritmo de previsão do modelo sazonal aditivo de Holt-Winters é baseado nas

seguintes expressões:

- - - - - (34)

- - - - (35)

( - ) - - (36)

- (37)

Estas equações são parecidas com aquelas a que se refere ao modelo multiplicativo

de Holt-Winters (Eqs. 25 a 28). A diferença nos dois modelos é o fato das outras equações,

agora, apresentarem os índices de sazonalidade somados e subtraídos, ao invés de

multiplicados e divididos (MAKRIDAKIS et al., 1998, p.169).

31

As inicializações de Ls e Ts são idênticas às do modelo multiplicativo. Os valores

iniciais para os índices sazonais são determinados através das seguintes expressões:

, ,..., (38)

2.2.2 Critérios para avaliar o desempenho de modelos em relação à série temporal

Para saber se o modelo de séries temporais selecionado para realizar previsões é

significativo estatisticamente devemos quantificar o ajuste do modelo escolhido aos dados

históricos existentes. Para isso, há diversas estatísticas:

2.2.2.1 Medidas de erros no processo de previsão

2.2.2.1.1 MAD (Média dos Desvios Absolutos)

Consiste na média da diferença (em módulo) entre os valores reais e preditos:

∑ | |

(39)

Ela mede o erro absoluto e originalmente tornou-se muito popular (anteriormente às

calculadoras) porque não exige cálculos de quadrados e raiz quadrada. Por enquanto é ainda

muito confiável e amplamente utilizada, é muito acurada para dados distribuídos

normalmente.

2.2.2.1.2 MAPE (Média Aritmética dos Desvios Absolutos em Porcentuais)

Avalia a magnitude do erro com relação à série histórica:

∑ |

|

(40)

É a mais popular das formas apresentadas para medir a acurácia da previsão

(KAHN, 1998). Porém, o uso desta fórmula torna-se impossível quando a série temporal

contém valores iguais à zero.

Por se tratar de erro relativo, ele não depende da escala, e com isso, permite

comparar a acurácia da previsão entre séries de dados temporais de proporções diferentes.

2.2.2.1.3 EQD (Média Aritmética dos Quadrados dos Desvios)

Destaca os grandes erros, comparados aos erros de menor magnitude:

∑

(41)

32

2.2.2.1.4 RMSE (Raiz Quadrada da Média Aritmética dos Quadrados dos Desvios)

É a raiz quadrada dos EQM´s:

√ (42)

Esta medida também tende a exagerar erros grandes, que podem ajudar a eliminar

métodos com grandes erros.

2.2.2.1.5 R2

Existe outro parâmetro, além dessas medidas de erro, de grande importância na

análise do ajuste do modelo à série temporal. Trata-se do R2, uma medida percentual de

explicação do modelo. Ou seja, ele relata a fração da variabilidade da série que o método

utilizado consegue explicar. Um valor R2 próximo de 0 indica um modelo de ajuste pobre,

enquanto um valor próximo a 1 indica um bom ajuste. Essa estatística é determinada da

seguinte maneira:

- ∑ ( - )

∑ ( - )

(43)

2.2.2.2 Medidas estatísticas de qualidade de previsão

2.2.2.2.1 U de Thiel

É uma estatística que permite estimar a probabilidade de que o modelo selecionado é

melhor do que simplesmente uma previsão com base em uma simples média aritmética:

√∑ (

)

∑ (

)

(44)

onde:

N é o tamanho da amostra

x(t) são os valores históricos

representa os valores previstos

Interpretação do U:

U < 1: a previsão pelo método escolhido é melhor do que simples adivinhação

(“chute”);

U = 1: a previsão pelo método escolhido é tão boa ou ruim quanto uma simples

adivinhação;

33

U > 1: a previsão pelo método escolhido é pior que uma adivinhação.

Esta medida também exagera os erros e ajuda eliminar métodos com grandes erros.

2.2.2.2.2 Teste de Durbin-Watson

É uma estatística que permite analisar a possível presença de auto-correlação da

variável para uma defasagem de uma unidade (lag1).

∑

∑

(45)

onde:

n é o tamanho da amostra;

e(t) se refere aos resíduos entre os valores previstos e pelo método selecionado e os

valores reais.

Interpretação de D-W:

DW < 1: os valores da série histórica são positivamente correlacionados;

DW = 2: não há auto-correlação entre os valores da série histórica;

DW > 3: os valores da série são negativamente correlacionados.

Os demais valores devem ser interpretados de forma proporcional.

2.2.2.2.3 Estatística de Ljung-Box

É uma grandeza que permite analisar se um conjunto de auto-correlações com

valores diferentes de zero é significativamente diferente de um conjunto de auto-correlações

com valores iguais a zero

∑

-

- (46)

onde:

n é o número de pares de pontos;

h é o tamanho do conjunto de auto-correlações

k é o tamanho das defasagens e rk são os valores das auto-correlações de ordem k.

2.2.2.2.4 Intervalo de Confiança na previsão

O intervalo de confiança da previsão pode ser interpretado como uma medida de

precisão do modelo de previsão. O erro padrão de previsão é estimado por meio de:

Erro –padrão = √∑

(47)

34

É importante notar que se a série de dados históricos for N, o número máximo de

intervalos a serem previstos será igual a N-1.

2.2.3 Análise avançada de previsão de séries temporais através de modelos auto-

regressivos.

“I have seen the future and it is very much

like the present, only longer”10

Kehlog Albran, The Profit

Dentre os modelos mais complexos de previsão de séries temporais encontram-se os

modelos auto-regressivos e as médias móveis (AR, MA e ARMA), os modelos auto-

regressivos integrados de médias móveis (ARIMA), entre outros (MAKRIDAKIS et al.,

1998).

Uma característica intrínseca das séries temporais é a sua correlação temporal. Por

isso, verificar a função de auto-correlação (FAC) torna-se uma tarefa essencial na análise

destas séries.

A FAC (k) é uma medida da dependência entre observações da mesma série,

separadas por certo intervalo de tempo, chamado de defasagem ou retardo (lag k). A sua

definição vem dada por:

(48)

onde:

k é a covariância entre Xt e Xt+k e

0 é a variância de Xt.

A representação gráfica do coeficiente de auto-correlação em função das diversas

defasagens que podem ser atribuídas aos dados é conhecida como correlograma, e pode ser

utilizado para verificar se uma série apresenta periodicidade (MORETTIN; TOLOI,2004). A

FAC permite a verificação de estacionariedade da série, pois é usada para verificar a

correlação da mesma. Ainda mais, possibilita um melhor entendimento do comportamento da

dependência estatística entre as observações da série e, posteriormente, será útil para a

determinação de um modelo adequado para o ajuste do processo.

Já vimos que uma série temporal é descrita pela componente tendência, sazonalidade

e pela componente aleatória. A tendência é a direção a longa distância da série, podendo

10 Eu tenho visto o futuro e é muito semelhante ao presente, apenas mais distante. Filme The Profit laureado no

Festival de Cannes na França em 2001.

35

apresentar um componente geral linear, ou na maioria das vezes não linear, que se altera em

função do tempo e que não se repete durante a amplitude do estudo (MORETTIN &

TOLOI,2004).

2.2.3.1 Estacionariedade

Uma série temporal que se desenvolve aleatoriamente, no tempo, em torno de uma

média constante, refletindo alguma forma de equilíbrio, sem mudanças sistemáticas

(tendência), sem mudanças na variância (homocedásticas) e sem variações cíclicas é definida

como estacionária (EHLERS,2007).

2.2.3.2 Tranformação

Na maioria dos procedimentos de análise de séries temporais, estas são supostas

estacionárias e, como a maioria das séries que se encontram na prática são não estacionárias, é

necessário transformá-las até que se tornem estacionárias (MORETTIN; TOLOI, 2004).

As três razões para a transformação dos dados são: estabilização da variância, tornar

o efeito sazonal aditivo e fazer com que os dados sigam uma distribuição normal

(CHATFIELD, 1984).

Se a série apresentar um efeito sazonal multiplicativo e a variância mostrar-se

aumentando com a média, a transformação apropriada é a raiz quadrada ou uma logarítmica,

casos especiais de transformação de Box-Cox. Caso a série apresente tendência, uma

transformação é a diferenciação, consistindo em efetuar sucessivas diferenças da série

original, até se obter uma série estacionária (EHLERS, 2007).

A primeira diferença de xt é definida como:

xt = xt – xt-1 (49)

E a segunda:

2xt = (xt) (50)

= ( xt – xt-1)

= xt - xt-1

= xt – 2 xt-1 + xt-2 (51)

A d-ésima diferença:

d xt = (

d-1 xt) (52)

Geralmente, em situações normais, será suficiente tomar uma ou duas diferenças

para que a série se torne estacionária.

36

Aqui analisaremos também os principais métodos probabilísticos para modelagem

de séries temporais, uma vez que estes proporcionam resultados melhores para as previsões de

curto e médio prazo (MORETTIN; TOLOI, 2004). Destacamos os processos de médias

móveis (MA), os autoregressivos (AR), os autoregressivos de médias móveis (ARMA), os

autoregressivos de médias móveis integrados (ARIMA) e os ARIMA sazonais (SARIMA).

Estes métodos se referem à metodologia de Box-Jenkins.

2.2.3.3 Modelo de Médias Móveis MA(q)

É um modelo onde o valor presente da série é formado pela combinação linear do

ruído branco, t, ocorrido no período atual e nos períodos passados.

A estrutura geral de médias móveis de ordem q, ou MA(q), é dada por:

Xt = t + 1 t-1 + ... + q t-q (53)

Ou

∑

Onde:

i são parâmetros da estrutura (i = 1, ...,q) e para 0 = 1.

q é a ordem da estrutura

t é um processo discreto puramente aleatório, com média zero e variância 2 (ruído

branco).

O modelo é conceitualmente uma regressão linear dos valores correntes da série

contra os ruídos brancos ou choques aleatórios de um ou mais valores anteriores da série. Os

choques aleatórios em cada ponto são assumidos provenientes da mesma distribuição,

geralmente uma distribuição normal, com média zero e variância 2, constante. A distinção

deste modelo é que estes choques aleatórios são propagados para os valores futuros da série.

Uma MA(q) é essencialmente a média móvel dos erros de previsão defasados e com a

incorporação desses erros de previsão defasados, o modelo aprende a partir de seus erros de

previsão, e os corrige por meio do cálculo de média móvel.

Ajustar as estimativas MA é mais complicado que as do modelo AR porque os

termos erros não são observáveis. Isto significa que os procedimentos de ajustamentos não

lineares iterativos precisam ser usados no lugar dos mínimos quadráticos lineares. Os modelos

MA também têm uma interpretação menos óbvia que a dos modelos AR.

37

Algumas vezes a FAC e a FACparcial sugerirão que o modelo MA seja uma melhor

escolha de modelo e alguma vezes ambos os termos MA e AR deverão ser usados no mesmo

modelo.

O processo MA(q) pode ser expresso a partir de um operador de defasagem,

denotado por B e definido como (MAKRIDAKIS et al., 1998):

Bj t = t-j, para todo j.

Assim, a equação 53 pode ser reescrita como:

Xt = (1 + 1 B + 2 B2 + ... + q B

q) t = (B) t (54)

onde (B) é um polinômio de ordem q em B.

Construída a FAC, conforme definida na equação 48, para o modelo MA(q),

verifica-se que k = 0, para k > q. Desta maneira, essa característica pode ser útil na

identificação da ordem q de um modelo MA a partir da FAC de uma série temporal.

2.2.3.4 Modelo Autoregressivo AR(p)

Um modelo autoregressivo, ou AR, foi criado com a ideia de que a presente

observação da série Xt pode ser explicada como uma função das p observações passadas, Xt-1,

Xt-2, Xt-3, ..., Xt-p, onde p determina o número de passos entre as observações passadas e a

previsão da próxima observação.

A estrutura auto-regressiva geral é expressa por:

Xt = 0 + 1 Xt-1 + ... + p Xt-p + t (55)

ou

∑ (56)

Onde:

i são parâmetros da estrutura (i = 0, ...,, p)

p é a ordem da estrutura

t é um processo discreto puramente aleatório, com média zero e variância 2 (ruído

branco11

).

Essencialmente o modelo captura a variação dos dados históricos reais com aqueles do

modelo de previsão e depois usa essa variação, ou resíduo, para criar um modelo de previsão

melhor.

Quando p = 1, teremos o modelo AR(1)12

:

11 Um conceito econométrico, muito presente no estudo das séries temporais.

38

Xt = 1 Xt-1 + t (57)

Utilizando o operador de defasagem a equação 56 fica:

Xt = (1 - 1 B - 2 B2 - ... - p B

p) Xt = t (58)

ou

(B) Xt = t

em que (B) = (1 - 1 B - 2 B2 - ... - p B

p).

O último coeficiente p mede o “excesso de correlação” na defasagem p que não é

levada em conta por um modelo AR(p-1). Esse último coeficiente é chamado de coeficiente

de auto-correlação parcial de Xt, e quando plotado em função da defasagem, tem-se a função

de auto-correlação parcial (FACP). Sendo assim, a FACP é importante na determinação da

ordem p de um processo AR, para k > p a FACP é zero, (BOX; JENKINS, 1970).

2.2.3.5 Modelos Mistos ARMA(p,q)

Os processos auto-regressivos e de médias móveis, ARMA, combinam as

características de processos AR(p) e MA(q), sendo uma classe de modelos muito úteis e

parcimoniosos para descrever dados de séries temporais (CHATFIELD, 1984).

A estrutura geral do modelo ARMA(p,q) é dada por:

Xt = 1 Xt-1 + ... + p Xt-p + t + 1 t-1 + ... + q t-q (59)

onde: t é um processo puramente aleatório com média zero e variância t2.

Na equação 59, os i são os parâmetros que ajustam os valores passados de Xt a

partir do imediatamente anterior até o mais distante, representado por p. Os valores de

representam uma sequência de choques aleatórios e independentes uns dos outros, t é uma

porção não controlável do modelo, chamada normalmente de ruído branco. Os parâmetros i

possibilitam escrever a série em função dos choques passados. Em geral cada t é considerado

como tendo distribuição normal, média zero, variância constante e não correlacionados, isto é

com covariância nula para quaisquer dois deles.

Usando o operador de retardo o modelo pode ser reescrito da forma:

(1 - 1 B - 2 B2 - ... - p B

p) Xt = (1 + 1 B + 2 B

2 + ... + q B

q) t (60)

ou

(B) Xt = (B) t.

12 Caso 1 = 1, o modelo é conhecido como passeio aleatório ou random walk, cuja característica é violar a

condição de estacionariedade.

39

É importante salientar que a FAC e a FACP ficam consideravelmente mais

complicadas em processos ARMA. Segundo Box & Jenkins (1970), para um processo

ARMA(p,q) estacionário a FAC tem um decaimento exponencial ou oscilatório após a

defasagem q enquanto a FACP tem o mesmo comportamento após a defasagem p. Este

resultado pode ser útil para a determinação da ordem (p, q) do processo, mas na prática pode

ser muito difícil distinguir entre um decaimento exponencial e oscilatório a partir das

estimativas dessas funções.

2.2.3.6 Modelos ARIMA(p,d,q)

Os modelos descritos até o presente momento são apropriados para séries

estacionárias, mas, na prática, muitas séries temporais não são estacionárias. Como dissemos

na seção 2.2.3.2, para ajustar estes modelos a uma série temporal observada é preciso remover

as fontes de variação não estacionárias. Se uma série observada for não estacionária na média,

pode-se tentar a remoção da tendência tomando-se uma ou mais diferenças, como sugerido na

seção 2.2.3.2.

Um modelo ARMA no qual Xt é substituído pela sua d-ésima diferença dXt é capaz

de descrever alguns tipos de séries não estacionárias, (MUN, 2010). A série diferenciada é

denotada por

Nt = dXt = (1 – B)

d Xt (61)

Os processos de média móvel integrada autorregressiva, chamados de ARIMA

(p,d,q) é dado por:

Nt = 1 Nt-1 + ... + p Nt-p + t + 1 t-1 + ... + q t-q (62)

ou, equivalentemente,

(B)(1 – B)d Xt = (B) t. (63)

ou

(64)

Um processo que se torna estacionário após d diferenças é dito ser não estacionário

homogêneo, ou integrado de ordem d, I(d) (CHATFIELD,1984).

O objetivo da metodologia de Box & Jenkins é determinar os três componentes que

configuram qualquer estrutura que são: p (parâmetro auto-regressivo), d (processo de

diferenciação ou integração) e q (parâmetro de médias móveis).

De uma forma geral, a notação apresentada por Box & Jenkins é do tipo ARIMA(p,

d, q). Por exemplo, a estrutura ARIMA(2,1,0) significa que esta possui dois parâmetros auto-

40

regressivos, uma diferenciação a partir da série original e nenhum parâmetro de médias

móveis.

Daí, temos o seguinte:

ARIMA(0,1,0) = passeio aleatório (random walk)

ARIMA(1,1,0) = modelo autoregressivo integrado de primeira ordem

ARIMA(0,1,1) sem constante = suavização exponencial simples com crescimento

ARIMA(0,1,1) com constante = suavização exponencial simples com crescimento

ARIMA(0,2,0) ou (0,2,2) sem constante = suavização exponencial linear

Os modelos ARIMA(p.d,q) formam, em teoria, a classe mais geral de modelos para

previsão de uma série temporal que pode se tornar estacionária por transformações tais como

diferenciação e logaritmização. De fato, o modo mais fácil para se pensar nos modelos

ARIMA é como sendo versões afinadas dos modelos: passeio aleatório e tendência aleatória.

A afinação consiste em adicionar defasagens nas séries diferenciadas e/ou defasagens de erros

de previsão na equação de previsão.

As defasagens das séries diferenciadas que aparecem na sua equação de previsão são

chamados de termos “auto-regressivos”, as defasagens dos erros de previsão são chamados

termos de “médias móveis” e uma série que precisa ser diferenciada para se tornar

estacionária é dita versão “integrada” de uma série estacionária.

2.2.3.7 Modelos Sazonais

Muitas séries temporais contém uma componente periódica sazonal que se repete

por intervalos iguais de tempo, isto é, a cada s observações.

Neste caso, tomar a primeira diferença Xt – Xt-1 não é suficiente para tornar a série

estacionária. A forma adequada de diferenciar dados que contenham padrões sazonais

determinísticos é tomando diferenças no período sazonal.

A diferença sazonal, geralmente, é denotada por s onde s é o período sazonal. A D-

ésima diferença sazonal é denotada por sD. Ao se combinar os dois tipos de diferenciação

obtém-se o operador ds

D.

Box & Jenkins (1970) generalizaram o modelo ARIMA para lidar com sazonalidade

estocástica, e eles definiram um modelo ARIMA sazonal, chamado SARIMA, representado

por:

(B)(Bs)Nt = (B) (B

s) t (65)

41

em que

(B) = (1 - 1(B) - ... - p(Bp))

(Bs) = 1 - sB

s - ... - PB

Ps

Nt = ds

D Xt

(B) = 1 + 1 B + ... + q Bq

(Bs) = 1 + sB

s + ... + Q B

Qs

Esse modelo é um SARIMA de ordem (p,d,q)x(P,D,Q)s e, embora, pareça

extremamente complicado, na prática os valores de d e D, em geral, não serão maiores que 1

ou 2 e um número pequeno de coeficientes será suficiente, Ehlers (2007). No entanto, ainda é

necessário identificar um modelo que além de considerar a sazonalidade, também considere

algum tipo de intervenção.

42

3. MATERIAIS E MÉTODOS

Com os dados do CEPEA procurou-se fazer o ajuste da série histórica de preços com

as metodologias clássicas de previsão de séries temporais, lançando mão do MS-Excel.

Primeiramente serão feitos os testes sem utilização de softwares e suplementos para

percebermos o comportamento do modelo para a série em foco e termos a liberdade de ajustar

os parâmetros do modelo convenientemente. Posteriormente, os testes serão repetidos usando

os softwares Risk Simulator e Crystal Ball.

3.1 Média Móvel Simples

Este método foi explanado na seção 2.2.1.1.1, onde o valor da média móvel (MA1)

para um intervalo específico (n) é simplesmente o somatório dos dados históricos reais (Y)

arranjados e indexados numa sequência temporal (i).

Figura 13 – Média móvel simples (3 meses)

Aqui vemos que existem 201 meses de dados históricos reais e a média móvel, de

período de 3 meses, foi calculada. Colunas adicionais de cálculos também existem neste teste,

cálculos estes que são exigidos para estimar o erro das medidas ao se usar esta abordagem de

média móvel. Estes erros são importantes quando puderem ser comparados com as múltiplas

médias móveis (i.é., 3-meses, 4-meses, 5-meses, e assim por diante) como também com

outros modelos de séries temporais (p.ex., média móvel simples, modelo sazonal aditivo, e

1

2

3

4

5

6

7

8

9

10

11

204

205

206

207

208

209

210

211

212

213

214

A B C D E F G H I J K

Mês RealAjuste de

Previsão|Erro| Erro ^ 2 Erro

jan/96 1,68 - - - - - - - -

fev/96 1,2 - - - - - - - -

mar/96 1,27 - - - - - - - -

abr/96 1,23 1,38 0,15 0,02 12,47% 0,01 0,00 0,15 -

mai/96 2,09 1,23 0,86 0,73 40,99% 0,49 0,49 -0,86 1,02

jun/96 2,19 1,53 0,66 0,44 30,14% 0,10 0,00 -0,66 0,04

jul/96 4,61 1,84 2,77 7,69 60,16% 1,60 1,22 -2,77 4,47

ago/96 13,66 2,96 10,70 114,42 78,31% 5,38 3,85 -10,70 62,78

set/12 24,08 8,70 15,38 236,65 63,88% 1,55 0,90 -15,38 80,88

out/12 24,99 14,61 10,38 107,81 41,55% 0,19 0,00 -10,38 25,00

nov/12 20,47

dez/12 20,47

jan/13 20,47

fev/13

RMSE 5,04

MSE 94,65 25,39

MAD 6,83

MAPE 108,49%

U de Theil 1,90

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Média Móvel Simples .

i = 1, ...,N

43

assim por diante) para encontrar o melhor ajuste que minimiza estes erros. As Figuras 14 e 15

mostram os cálculos exatos usados no modelo de média móvel.

Figura 14 – Calculando a média móvel simples

Figura 15 – Fazendo previsão com média móvel simples

Figura 16 – Estimativa do erro

Note que o valor previsto ajustado no período 4 de 1,38 é uma média dos 3 meses

anteriores (mês 1 até 3). O valor previsto ajustado para o período 5 seria então a média de 3

meses do mês 2 até 4. Este processo é repetido adiante até o mês out-12 (Figura 15), onde

cada mês após este último, a previsão é fixada em 20,47. Claramente, esta abordagem não é

adequada se houver uma tendência (para cima ou para baixo no decorrer do tempo) ou se

houver sazonalidade. Assim, a estimativa do erro é importante quando escolher o modelo de

previsão de séries temporais. A Figura 15 ilustra umas poucas colunas adicionais de cálculos

218

219

220

221

222

223

224

225

226

227

A B C D E F G H I J

Mês RealAjuste de


1 1,68

2 1,20

3 1,27

4 1,23 1,38 0,15 0,02 12,47% 0,0146 0,00 0,15

Formulário

ABS (1,38 - 1,23) 0,152

202

203

204

205

206

207

208

209

A B C D E F G H I J

jul/12 7,39 4,99 2,40 5,76 32,48% 0,14 0,03 -2,40 0,23

ago/12 12,35 5,96 6,39 40,83 51,74% 0,75 0,45 -6,39 15,92

set/12 24,08 8,70 15,38 236,65 63,88% 1,55 0,90 -15,38 80,88

out/12 24,99 14,61 10,38 107,81 41,55% 0,19 0,00 -10,38 25,00

nov/12 20,47

dez/12 20,47

jan/13 20,47

fev/13

RMSE 5,04

MSE 94,65

MAD 6,83

MAPE 108,49%

U de Theil 1,90

𝑅𝑀𝑆𝐸 √∑ 𝐸𝑟𝑟𝑜

𝑛

𝑛𝑖 𝑀𝑆𝐸 𝑀𝑆𝐸 ∑

(𝐸𝑟𝑟𝑜 )

𝑛 𝑅𝑀𝑆𝐸 𝑛

𝑖

𝑀𝐴𝐷 ∑|𝐸𝑟𝑟𝑜|𝑖

𝑛

𝑛𝑖 𝑀𝐴𝑃𝐸 ∑

𝑌𝑡 𝑌 𝑡𝑌𝑡

𝑛

𝑛𝑖

𝑈𝑇ℎ𝑒𝑖𝑙 ∑

𝑌 𝑡 𝑌𝑡𝑌𝑡

𝑛𝑡

∑ |𝑌𝑡 𝑌𝑡

𝑌𝑡 |

𝑛𝑡

44

exigidas para estimar os erros de previsão. Os valores destas colunas são usados na estimativa

do erro da Figura 16.

Figura 17. Valores Reais e Valores Estimados pelo método da MMS.

3.2 Suavização Exponencial Simples

A segunda abordagem a ser usada quando não houver tendência ou sazonalidades

discerníveis é o método de suavização exponencial simples. Este método, tratado na seção

2.2.1.1.2, pondera os dados passados com pesos decrescendo exponencialmente ao voltar ao

passado; isto é, quanto mais recente o valor do dado, maior seu peso. Esta ponderação supera

largamente as limitações dos modelos de médias móveis ou variações porcentuais. O peso

usado é chamado de medida alfa. O método está ilustrado na Figura 18.

Figura 18 – Suavização exponencial simples

Onde a previsão suavizada exponencialmente ( ) no instante t é uma média

ponderada entre o valor real um período atrás (xt-1) e a última previsão do período ( ),

1

2

3

4

5

6

7

8

204

205

206

207

208

209

210

211

212

213

214


= 0,1

Mês RealAjuste de


jan/96 1,68 - =B4 - - -

fev/96 1,2 1,68 0,48 0,23 40,00% 0,08 0,08 0,48

mar/96 1,27 1,63 0,36 0,13 28,50% 0,09 0,00 0,36 0,01

abr/96 1,23 1,60 0,37 0,13 29,74% 0,08 0,00 0,37 0,00

mai/96 2,09 1,56 0,53 0,28 25,40% 0,19 0,49 -0,53 0,80

set/12 24,08 11,85 12,23 149,63 50,80% 0,98 0,90 -12,23 136,29

out/12 24,99 13,07 11,92 142,07 47,70% 0,25 0,00 -11,92 0,10

nov/12 14,26

dez/12

jan/13

fev/13

RMSE 9,67

MSE 93,54 93,54

MAD 7,33

MAPE 126,40%

U de Theil 2,49

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Suavização Exponencial Simples .

=$C$2*$B5+(1-$C$2)*$C5

= xt-1 + (1 - )

45

ponderada pelo parâmetro (). Note que o primeiro valor ajustado de previsão no mês 2 ( ) é

sempre o valor real do mês anterior (x1). A equação matemática é usada somente no mês 3 ou

iniciando no segundo período de previsão ajustada.

3.2.1 Otimização dos Parâmetros de Previsão

Inicialmente, no método de suavização exponencial simples, o parâmetro foi

arbitrariamente escolhido como 0,10. De fato, o alfa ótimo tem que ser obtido para o modelo

fornecer uma boa previsão. No modelo da Figura 18, o suplemento Solver do Excel é usado

para encontrar o parâmetro alfa ótimo que minimiza os erros de previsão. A Figura 19 ilustra

a caixa de diálogo: suplemento Solver do Excel, onde C210 foi definida como célula objetivo

e nomeada como a RMSE.SES, enquanto o objetivo de minimizá-la foi feito variando

metodicamente o parâmetro alfa que se encontra na célula C2. Deverá ser permitido ao α

variar somente entre 0,00 e 1,00 (pois o α é um peso atribuído aos dados históricos e

previsões de períodos passados, e o peso nunca pode ser menor que zero ou maior que um),

vínculos adicionais são também configurados. O valor ótimo resultante de que minimiza os

erros projetados, calculado pelo Solver é 0,06286299. Portanto, entrar com este valor de no

modelo conduzirá aos melhores valores de previsão, como é mostrado na figura 20.

Figura 19 – Otimizando parâmetros numa suavização exponencial simples

46

Figura 20 – Valores Reais versus Valores Estimados pelo Modelo de suavização exponencial simples.

1

2

3

4

5

6

7

8

204

205

206

207

208

209

210

211

212

213

214


= 0,06286299

Mês RealAjuste de


jan/96 1,68 - =B4 - - -

fev/96 1,2 1,68 0,48 0,23 40,00% 0,08 0,08 0,48

mar/96 1,27 1,65 0,38 0,14 29,91% 0,10 0,00 0,38 0,01

abr/96 1,23 1,63 0,40 0,16 32,19% 0,10 0,00 0,40 0,00

mai/96 2,09 1,60 0,49 0,24 23,39% 0,16 0,49 -0,49 0,78

set/12 24,08 13,14 10,94 119,70 45,44% 0,78 0,90 -10,94 138,84

out/12 24,99 13,83 11,16 124,61 44,67% 0,21 0,00 -11,16 0,05

nov/12 14,53

dez/12

jan/13

fev/13

RMSE 9,66

MSE 93,28 93,28

MAD 7,21

MAPE 118,97%

U de Theil 2,38

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Suavização Exponencial Simples .

=$C$2*$B5+(1-$C$2)*$C5

= xt-1 + (1 - )

0

10

20

30

40

50

60

jan

/96

ag

o/9

6

ma

r/9

7

ou

t/9

7

ma

i/9

8

de

z/9

8

jul/

99

fev

/00

set/

00

ab

r/0

1

no

v/0

1

jun

/02

jan

/03

ag

o/0

3

ma

r/0

4

ou

t/0

4

ma

i/0

5

de

z/0

5

jul/

06

fev

/07

set/

07

ab

r/0

8

no

v/0

8

jun

/09

jan

/10

ag

o/1

0

ma

r/1

1

ou

t/1

1

ma

i/1

2

de

z/1

2

Valores Reais

Valores Estimados

47

3.3 Média Móvel Dupla

O método da média móvel dupla, descrito na seção 2.2.1.2.1, suaviza os dados

passados realizando uma média móvel num subconjunto de dados que representa uma média

móvel de um conjunto original de dados. Isto é, uma segunda média móvel é realizada na

primeira média móvel. A aplicação da segunda média móvel captura o efeito de tendência dos

dados. A figuras 21 ilustra o cálculo envolvido.

O exemplo mostrado é uma média móvel dupla de período p de 3 meses e o valor

previsto obtido no período 203.

Figura 21 – Média Móvel Dupla (3 meses)

A previsão suavizada exponencialmente ( ) no instante t é uma média ponderada

entre o valor real um período atrás ( ) e a última previsão do período ( ), ponderada

pelo parâmetro (). Note que o primeiro valor ajustado de previsão no mês 2 ( ) é sempre o

valor real do mês anterior ( ). A equação matemática é usada somente no mês 3 ou iniciando

no segundo período de previsão ajustada.

3.3.1 Otimizando os Parâmetros de Previsão

Incialmente, no método de média móvel dupla, o parâmetro número de dados a ser

feita a média, isto é, o período p da média, foi arbitrariamente escolhido como 3. De fato, o

período p ótimo tem que ser obtido para que o modelo forneça uma boa previsão. Usando o

modelo da Figura 21, o suplemento Solver do Excel, como antes, é usado para encontrar o

parâmetro período p ótimo que minimiza os erros de previsão. Aqui a célula objetivo C210 foi

1

2

3

4

5

6

7

8

9

10

11

204

205

206

207

208

209

210

211

212

213

214

A B C D E F G H I J K L M N

n= 3

MêsReferência

de CélulaReal

MA1t -

n meses

MA2t -

n meses

Ajuste de


jan/96 1 1,68 xxxxx xxxxx xxxxx - - -

fev/96 2 1,2 xxxxx xxxxx xxxxx 0,00

mar/96 3 1,27 xxxxx xxxxx xxxxx 0,00

abr/96 4 1,23 1,38 xxxxx xxxxx 0,00

mai/96 5 2,09 1,23 xxxxx xxxxx 0,00

jun/96 6 2,19 1,53 1,38 0,00

jul/96 7 4,61 1,84 1,53 1,83 2,78 7,75 60,40% 1,62 1,22 -2,78

ago/96 8 13,66 2,96 2,11 2,44 11,22 125,81 82,11% 5,92 3,85 -11,22 71,10

set/12 201 24,08 8,70 6,55 7,62 16,46 270,79 68,34% 1,78 0,90 -16,46 96,43

out/12 202 24,99 14,61 9,75 12,99 12,00 143,95 48,01% 0,25 0,00 -12,00 19,87

nov/12 24,31

dez/12

jan/13

fev/13

RMSE 14,60

MSE 213,06 213,06

MAD 10,53

MAPE 197,41%

U de Theil 3,76

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Média Móvel Dupla .

48

nomeada como a RMSE. SES enquanto o objetivo é minimizá-la variando metodicamente o

parâmetro período13

p que se encontra na célula D2. O parâmetro deverá ser permitido variar

somente entre 1 e 15, vínculos adicionais deverão também serem configurados. O valor p

ótimo resultante que minimiza os erros projetados, calculado pelo Solver foi 3. Portanto,

entrar com este valor de p no modelo conduzirá aos melhores valores de previsão que

minimiza os erros.

13 Muitas vezes usamos n para caracterizar o período p

1

2

3

4

5

6

7

8

9

10

11

204

205

206

207

208

209

210

211

212

213

214

A B C D E F G H I J K L M

n= 3

MêsReferência

de CélulaReal

MA1t -

n meses

MA2t -

n meses

Ajuste de


jan/96 1 1,68 xxxxx xxxxx xxxxx - - -

fev/96 2 1,2 xxxxx xxxxx xxxxx 0,00

mar/96 3 1,27 xxxxx xxxxx xxxxx 0,00

abr/96 4 1,23 1,38 xxxxx xxxxx 0,00

mai/96 5 2,09 1,23 xxxxx xxxxx 0,00

jun/96 6 2,19 1,53 1,38 0,00

jul/96 7 4,61 1,84 1,53 1,83 2,78 7,75 60,40% 1,62 1,22 -2,78

ago/96 8 13,66 2,96 2,11 2,44 11,22 125,81 82,11% 5,92 3,85 -11,22 71,10

set/12 201 24,08 8,70 6,55 7,62 16,46 270,79 68,34% 1,78 0,90 -16,46 96,43

out/12 202 24,99 14,61 9,75 12,99 12,00 143,95 48,01% 0,25 0,00 -12,00 19,87

nov/12 24,31

dez/12

jan/13

fev/13

RMSE 14,60

MSE 213,06 213,06

MAD 10,53

MAPE 197,41%

U de Theil 3,76

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Média Móvel Dupla .

49

Figura 22 – Valores Reais e Valores Estimados pelo modelo de Média Móvel Dupla.

3.4 Suavização Exponencial Dupla (SED) de Holt

Quando os dados exibirem tendência, mas não sazonalidade, uma segunda abordagem

pode ser usada que é o método da suavização exponencial dupla, muito usado em engenharia

e tratado na seção 2.2.1.2.2. A suavização exponencial dupla aplica duas vezes a suavização

exponencial simples, uma vez para os dados originais e depois para os dados da suavização

exponencial simples resultante. Um parâmetro de ponderação alfa () é usado na primeira ou

suavização exponencial simples (SES) enquanto um parâmetro de suavização beta () é usado

na segunda, ou suavização exponencial dupla (SED). Esta abordagem é útil quando a série de

dados históricos não for estacionária. A Figura 23 ilustra o modelo de suavização exponencial

dupla.

-30

-20

-10

0

10

20

30

40

50

60

70

80

jan

/96

ago

/96

mar

/97

ou

t/97

mai

/98

dez

/98

jul/

99

fev/

00

set/

00

abr/

01

no

v/01

jun

/02

jan

/03

ago

/03

mar

/04

ou

t/04

mai

/05

dez

/05

jul/

06

fev/

07

set/

07

abr/

08

no

v/08

jun

/09

jan

/10

ago

/10

mar

/11

ou

t/11

mai

/12

dez

/12

Valores Reais

Valores Estimados

50

Figura 23 – Suavização Exponencial Dupla (SED) de Holt.


Os parâmetros e foram escolhidos inicialmente de forma arbitrária. De fato, o

e o ótimos tem que ser obtidos para o modelo fornecerem uma boa previsão. Usando o

modelo da Figura 23, o suplemento Solver do Excel é usado para encontrar os parâmetros e

, ótimos, que minimizam os erros de previsão. A célula objetivo C210 é definida como a

RMSE.SED enquanto o objetivo a ser minimizado variando metodicamente os parâmetros e

que se encontram nas células C2 e E2. O e o deverão ser permitidos variarem somente

entre 0,00 e 1,00 (pois são pesos dados aos valores históricos e previsões de períodos

passados, e o peso nunca pode ser menor que zero ou maior que um), vínculos adicionais são

também configurados. O valor e o de , ótimos, resultantes que minimizam os erros

projetados, calculado pelo Solver são 0,00096981 e 1,000000, respectivamente.

Figura 24 – Valores reais e estimados numa suavização exponencial dupla de Holt.

3.5 - Sazonalidade Aditiva

1

2

3

4

5

6

7

8

204

205

206

207

208

209

210

211

212

213

214

A B C D E F G H I J K L

= 0,00096981 = 1,00000000

Mês Real Lt TtAjuste de


jan/96 1,68 1,68 0,00 - - -

fev/96 1,2 1,68 0,00

mar/96 1,27 1,68 0,00 1,68 0,41 0,17 32,21% 0,12 0,00 0,41

abr/96 1,23 1,68 0,00 1,68 0,45 0,20 36,41% 0,12 0,00 0,45 0,00

mai/96 2,09 1,68 0,00 1,68 0,41 0,17 19,80% 0,11 0,49 -0,41 0,74

set/12 24,08 18,39 0,00 18,38 5,70 32,48 23,67% 0,21 0,90 -5,70 137,79

out/12 24,99 18,40 0,01 18,39 6,60 43,57 26,41% 0,08 0,00 -6,60 0,81

nov/12 18,40

dez/12

jan/13

fev/13

RMSE 9,58

MSE 91,85 91,85

MAD 7,40

MAPE 128,61%

U de Theil 2,78

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Suavização Exponencial Dupla de Holt .

0

10

20

30

40

50

60

jan

/96

jun

/96

no

v/9

6

ab

r/9

7

set/

97

fev/

98

jul/

98

de

z/9

8

ma

i/9

9

ou

t/9

9

ma

r/0

0

ag

o/0

0

jan

/01

jun

/01

no

v/0

1

ab

r/0

2

set/

02

fev/

03

jul/

03

de

z/0

3

ma

i/0

4

ou

t/0

4

ma

r/0

5

ag

o/0

5

jan

/06

jun

/06

no

v/0

6

ab

r/0

7

set/

07

fev/

08

jul/

08

de

z/0

8

ma

i/0

9

ou

t/0

9

ma

r/1

0

ag

o/1

0

jan

/11

jun

/11

no

v/1

1

ab

r/1

2

set/

12

fev/

13

Valores Reais

Valores Estimados

51

Se os dados da série temporal não tiverem tendência apreciável mas exibirem

sazonalidade, então se aplicam os métodos da sazonalidade aditiva e da sazonalidade

multiplicativa. O método da sazonalidade aditiva, descrito na seção 2.2.1.3.2, está ilustrado na

Figura 25.

As constantes de suavização e devem ser estimadas a partir dos dados como feito

anteriormente.

Figura 25 – Sazonalidade Aditiva para um período de sazonalidade s = 4 meses.


Os parâmetros e são, escolhidos arbitrariamente no início. De fato, o e o

ótimos tem que ser obtidos por otimização para o modelo fornecerem uma boa previsão.

Usando o modelo da Figura 25 e o suplemento Solver do Excel pode-se encontrar os

parâmetros e ótimos que minimizam os erros de previsão. A célula objetivo C210 é

definida como a RMSE.SA enquanto o objetivo a ser minimizado variando metodicamente os

parâmetros e que se encontram nas células C2 e E2. O e o deverão ser permitidos

variarem, como antes, somente entre 0,00 e 1,00 e vínculos adicionais são também

configurados. O valor de e o de , ótimos, resultantes que minimizam os erros projetados,

calculado pelo Solver são 1,000000 e 0,182338111, respectivamente.

1

2

3

4

5

6

7

8

204

205

206

207

208

209

210

211

212

213

214

A B C D E F G H I J K L

= 1,00000000 = 0,18238111 s= 4

Mês RealNível

Lt

Sazonalidade

St

Ajuste de


jan/96 1,68 0,34 - - -

fev/96 1,2 -0,15

mar/96 1,27 -0,08 1,27 1,61 100,00% 1,12 0,00 -1,27

abr/96 1,23 1,35 -0,12 1,23 1,51 100,00% 0,94 0,00 -1,23 0,00

mai/96 2,09 1,76 0,34 1,68 0,41 0,17 19,62% 0,11 0,49 -0,41 0,67

set/12 24,08 23,75 0,34 12,80 11,28 127,24 46,84% 0,83 0,90 -11,28 39,44

out/12 24,99 25,14 -0,15 23,60 1,39 1,93 5,56% 0,00 0,00 -1,39 97,81

nov/12 24,99

dez/12

jan/13

fev/13

RMSE 6,72

MSE 45,15 45,15

MAD 4,34

MAPE 51,13%

U de Theil 1,01

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Sazonalidade Aditiva .

0

10

20

30

40

50

60

jan

/96

jun

/96

no

v/9

6

abr/

97

set/

97

fev/

98

jul/

98

dez

/98

mai

/99

ou

t/9

9

mar

/00

ago

/00

jan

/01

jun

/01

no

v/0

1

abr/

02

set/

02

fev/

03

jul/

03

dez

/03

mai

/04

ou

t/0

4

mar

/05

ago

/05

jan

/06

jun

/06

no

v/0

6

abr/

07

set/

07

fev/

08

jul/

08

dez

/08

mai

/09

ou

t/0

9

mar

/10

ago

/10

jan

/11

jun

/11

no

v/1

1

abr/

12

set/

12

fev/

13

Valores Reais

Valores Estimados

52

Para um período sazonal de 12 meses, depois de feita a otimização dos parâmetros

pelo Solver, teremos:

Figura 26 – Modelo de sazonalidade aditiva com período sazonal de 12 meses e os valores reais e estimados.

O valor de e o de , ótimos, resultantes que minimizam os erros projetados, são

0,9303 e 1,00000000, respectivamente. Portanto, entrar com este valor de e de no modelo

conduzirá aos melhores valores de previsão que minimiza os erros.

3.6 Sazonalidade Multiplicativa

Similarmente, o modelo de sazonalidade multiplicativa exige os parâmetros: e . A

diferença da sazonalidade aditiva é que o modelo é multiplicativo, por exemplo, o valor

projetado é a multiplicação entre o nível caso base e o fator de sazonalidade. A Figuras 27

ilustra os cálculos exigidos.


1

2

3

4

5

6

7

8

204

205

206

207

208

209

210

211

212

213

214


= 0,93092183 = 1,00000000 s= 12

Mês RealNível

Lt

Sazonalidade

St

Ajuste de


Observação

jan/96 1,68 -4,89 - - - 1

fev/96 1,2 -5,37 2

mar/96 1,27 -5,30 3

abr/96 1,23 -5,34 4

mai/96 2,09 -4,48 5

set/12 24,08 12,54 11,54 16,67 7,41 54,94 30,78% 0,36 0,90 -7,41 111,41 201

out/12 24,99 15,91 9,08 21,37 3,62 13,12 14,50% 0,02 0,00 -3,62 14,36 202

nov/12 17,20 7,79 23,61 203

dez/12 27,84 -2,85 12,27 204

jan/13 31,30 -6,31 9,34 205

fev/13 30,59 -5,60 10,37 206

RMSE 5,1924

MSE 26,9608 26,96

MAD 3,3576

MAPE 38,12%

U de Theil 0,7726

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Sazonalidade Aditiva .

-10

0

10

20

30

40

50

60

35

06

53

51

86

35

30

93

54

31

35

55

13

56

74

35

79

63

59

16

36

03

93

61

61

36

28

13

64

04

36

52

63

66

47

36

77

03

68

92

37

01

23

71

35

37

25

73

73

77

37

50

03

76

22

37

74

23

78

65

37

98

73

81

08

38

23

13

83

53

38

47

33

85

96

38

71

83

88

38

38

96

13

90

83

39

20

33

93

26

39

44

83

95

69

39

69

23

98

14

39

93

44

00

57

40

17

94

02

99

40

42

24

05

44

40

66

44

07

87

40

90

94

10

30

41

15

34

12

75

Valores Reais

Valores Estimados

53

O e o ótimos tem que ser obtidos por optimização para o modelo fornecer uma

boa previsão. Usando o modelo da Figura 26 e o suplemento Solver do Excel encontram-se os

parâmetros e ótimos que minimizam os erros de previsão. A célula objetivo C210 é

definida como a RMSE.SM enquanto o objetivo a ser minimizado variando metodicamente os

parâmetros e que se encontram nas células C2 e E2. O e o deverão ser permitidos

variarem somente entre 0,00 e 1,00. O valor de e o de , ótimos, resultantes que minimizam

os erros projetados, calculado pelo Solver são 0,98345282 e 1,000000, respectivamente.

Figura 27 – Modelo de uma sazonalidade multiplicativa

3.7 Sazonalidade Aditiva de Holt-Winters

Quando existirem a sazonalidade e a tendência, modelos mais avançados são

exigidos para decompor os dados nos seus elementos base: um nível caso base (L) ponderado

pelo parâmetro alfa (); um componente de tendência (b) ponderado pelo parâmetro beta ();

e um componente de sazonalidade (S) ponderado pelo parâmetro gama (). Vários métodos

1

2

3

4

5

6

7

8

9

204

205

206

207

208

209

210

211

212

213

214


= 0,98345282 = 1,00000000

Mês RealNível

Lt

Sazonalidade

St

Ajuste de


jan/96 1,68 1,25 - - -

fev/96 1,2 0,89

mar/96 1,27 0,94

abr/96 1,23 1,35 0,91

mai/96 2,09 1,67 1,25 1,68 0,41 0,17 19,62% 0,11 0,49 -0,41

jun/96 2,19 2,44 0,90 1,49 0,70 0,49 32,05% 0,11 0,00 -0,70 0,09

set/12 24,08 29,75 0,81 12,93 11,15 124,24 46,29% 0,81 0,90 -11,15 20,71

out/12 24,99 27,67 0,90 26,91 1,92 3,67 7,67% 0,01 0,00 1,92 170,62

nov/12 28,57

dez/12

jan/13

fev/13

RMSE 6,37

MSE 40,60 40,60

MAD 4,26

MAPE 51,94%

U de Theil 1,05

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Sazonalidade Multiplicativa .

0

10

20

30

40

50

60

jan

/96

jul/

96

jan

/97

jul/

97

jan

/98

jul/

98

jan

/99

jul/

99

jan

/00

jul/

00

jan

/01

jul/

01

jan

/02

jul/

02

jan

/03

jul/

03

jan

/04

jul/

04

jan

/05

jul/

05

jan

/06

jul/

06

jan

/07

jul/

07

jan

/08

jul/

08

jan

/09

jul/

09

jan

/10

jul/

10

jan

/11

jul/

11

jan

/12

jul/

12

jan

/13

Valores Reais

Valores Estimados

54

existem, mas os dois mais comuns são os métodos de sazonalidade aditiva de Holt-Winters e

sazonalidade multiplicativa Holt-Winters.

A Figura 28 ilustra os cálculos exigidos para se determinar o modelo de previsão

com sazonalidade aditiva de Holt-Winters.


A sazonalidade, ou seja, o número de subperíodos por ano é representada por s. As

escolhas dos valores para as constantes de suavização , e estão condicionadas a algum

critério e aqui foram, inicialmente, escolhidos arbitrariamente. Novamente, usando o modelo

da sazonalidade aditiva de Holt-Winters, o suplemento Solver do Excel encontram-se os

parâmetros alfa, beta e gama ótimos que minimizam os erros de previsão. A célula objetivo

C210 é definida como a RMSE.SAHW enquanto o objetivo a ser minimizado variando

metodicamente os parâmetros alfa, beta e gama que se encontram nas células C2 e F2 e I2. O

alfa, o beta e o gama deverão ser permitidos variarem somente entre 0,00 e 1,00. O valor de

, de e o de , ótimos, resultantes que minimizam os erros projetados, calculado pelo Solver

são 0,00095980, 1,00000000 e 0,000000000, respectivamente. Portanto, entrar com este valor

de alfa, de beta e de gama no modelo conduzirá aos melhores valores de previsão que

minimiza os erros.

1

2

3

4

5

6

7

8

204

205

206

207

208

209

210

211

212

213

214


= 0,00095980 = 1,00000000 = 0,00000000

Mês RealNível

Lt

Tendência

Tt

Sazonalidade

St

Ajuste de


jan/96 1,68 0,34 - - -

fev/96 1,2 -0,15

mar/96 1,27 -0,08 1,27 1,61 100,00% 1,12 0,00 -1,27

abr/96 1,23 1,35 0,00 -0,12 1,23 1,51 100,00% 0,94 0,00 -1,23 0,00

mai/96 2,09 1,35 0,00 0,34 1,68 0,41 0,17 19,62% 0,11 0,49 -0,41 0,67

set/12 24,08 18,10 0,00 0,34 18,43 5,65 31,93 23,47% 0,21 0,90 -5,65 127,45

out/12 24,99 18,11 0,01 -0,15 17,96 7,03 49,48 28,15% 0,09 0,00 -7,03 1,91

nov/12 18,04

dez/12

jan/13

fev/13

RMSE 9,60

MSE 92,20 92,20

MAD 7,44

MAPE 130,03%

U de Theil 2,82

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Sazonalidade Aditiva de Holt-Winters .

55

Figura 28 – Modelo de uma sazonalidade aditiva de Holt-Winter

3.8 Sazonalidade Multiplicativa de Holt-Winters

A Figura 29 ilustra os cálculos exigidos para se determinar o modelo de previsão

com sazonalidade multiplicativa de Holt-Winters.

3.8.1 - Otimizando os Parâmetros de Previsão

A sazonalidade, ou seja, o número de subperíodos por ano, é representado por s. As

escolhas dos valores para as constantes de suavização , e estão condicionadas a algum

critério e aqui foram inicialmente escolhidos arbitrariamente. De fato, o alfa, o beta e o gama

ótimos tem que ser obtidos para o modelo fornecerem uma boa previsão. Usando o modelo da

figura 29, o suplemento Solver do Excel é usado para encontrar os parâmetros alfa e gama

ótimos que minimizam os erros de previsão. A célula objetivo C210 é definida como a

RMSE.SMHW enquanto o objetivo a ser minimizado variando metodicamente os parâmetros

alfa, beta e gama que se encontram nas células C2 e F2 e I2. O valor de , de e o de gama,

ótimos, resultantes que minimizam os erros projetados, calculado pelo Solver são

0,03999998, 1,00000000 e 0,27624950, respectivamente.

0

10

20

30

40

50

60

jan

/96

jul/

96

jan

/97

jul/

97

jan

/98

jul/

98

jan

/99

jul/

99

jan

/00

jul/

00

jan

/01

jul/

01

jan

/02

jul/

02

jan

/03

jul/

03

jan

/04

jul/

04

jan

/05

jul/

05

jan

/06

jul/

06

jan

/07

jul/

07

jan

/08

jul/

08

jan

/09

jul/

09

jan

/10

jul/

10

jan

/11

jul/

11

jan

/12

jul/

12

jan

/13

Valores Reais

Valores Estimados

56

Figura 29 – Modelo de uma sazonalidade multiplicativa de Holt-Winter.

3.9 Modelos de Médias Móveis e Auto-Regressivos

Faremos agora uma análise mais avançada de previsão da série temporal do limão,

usando os modelos de médias móveis MA(q), os modelos auto-regressivos AR e as

combinações: ARMA, ARIMA e SARIMA.

A teoria que vamos tratar aqui foi apresentada na seção 2.2.3

Para tanto desenvolvemos um suplemento Excel, chamado ARMA que se instala na

guia SUPLEMENTOS da Faixa de Opções do Excel:

Figura 30 – Faixa de Opções do Excel com o Suplemento ARMA instalado.

Clicando no menu Modelo ARMA aparece a janela Suplemento ARMA para Excel,

onde se introduz a Série Temporal do Limão:

1

2

3

4

5

6

7

8

204

205

206

207

208

209

210

211

212

213

214


= 0,03999998 = 1,00000000 = 0,27624950

Mês RealNível

Lt

Tendência

Tt

Sazonalidade

St

Ajuste de


jan/96 1,68 1,25 - - -

fev/96 1,2 0,89

mar/96 1,27 0,94 1,27 1,61 100,00% 1,12 0,00 -1,27

abr/96 1,23 1,35 0,00 0,91 1,23 1,51 100,00% 0,94 0,00 -1,23 0,00

mai/96 2,09 1,36 0,01 1,33 1,68 0,41 0,17 19,62% 0,11 0,49 -0,41 0,67

set/12 24,08 0,58 -0,07 19,94 5,97 18,11 327,80 75,19% 2,15 0,90 -18,11 166,05

out/12 24,99 0,58 0,00 20,00 5,65 19,34 374,20 77,41% 0,65 0,00 -19,34 1,53

nov/12 6,37

dez/12

jan/13

fev/13

RMSE 26,60

MSE 707,75 707,75

MAD 16,58

MAPE 313,01%

U de Theil 11,18

Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Sazonalidade Multiplicativa de Holt-Winters .

57

Figura 31 – Janela inicial do ARMA

Ao clicar o botão OK, obtemos:

58

Figura 32 – Resultados obtidos com o modelo ARMA, instalado como Suplemento

3.10 Usando Softwares de Previsão

Neste trabalho usaremos três softwares para previsão e simulação, mais conhecidos

no mercado: Risk Simulator da Real Options Valuation, o @Risk da Palisade e o Crystal Ball

da Oracle.

3.11 Investigando o modelo clássico apropriado com o Risk Simulator

Neste trabalho usaremos três softwares para previsão e simulação, mais conhecidos

no mercado: Risk Simulator.

Foram testados os 8 modelos apresentados anteriormente com o software Risk

Simulator, usando a ferramenta Análise da série temporal, a 15ª do grupo de ferramentas de

Previsão. Aqui foi feita a Seleção automática de modelo, inserindo 12 como o número de

períodos de sazonalidade por ciclo e feita projeção para 5 períodos. Ver Figura 33:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

B C D E F

série temporal: y

Método: Mínimos Quadráticos Não Lineares (Levenberg-Marquardt)

data: 16-02-13 relógio: 16:06

Observações incluídas: 201

p = 1 - q = 1 - constante - seleção manual

CoeficienteErro Padrão Estatística-t Prob.

c 10,6593514 1,720332 6,196101167 3,29E-09

AR(1) 0,65914608 0,063748 10,33994841 1,11E-16

MA(1) 0,41833008 0,07672 5,452670212 1,47E-07

R-quadrado 0,670273 Var dependente média 10,435224

R-quadrado Ajustado 0,666942 S.D. var dependente 10,160706

S.E. da regressão 5,863859 Critério de info de Akaike6,358662

Soma quadrática dos resid.6808,199329 critério Schwarz 6,407965

Log probabilidade -636,045511 estat. Durbin-Watson 1,876304

Raízes AR invertidas 0,66

Raízes MA invertidas -0,42

Este é o modelo ARMA de Box-Jenkins aplicado ao Limão. e-mail:

[email protected]

Estimação ARMA de y

59

Figura 33 – Janela para entrada de dados e seleção do modelo

A Figura 34 ilustra os resultados gerados usando a ferramenta Previsão. O modelo

usado foi aditiva de sazonalidade. Observe que na Figura 34, o gráfico de ajuste de modelo e

previsão indica que a tendência e a sazonalidade são demonstradas pelo modelo Aditiva de

sazonalidade. O relatório de análise da série temporal fornece os parâmetros alfa, beta e gama

otimizados, as medidas de erro, os dados ajustados, os valores previstos e o gráfico de

previsão ajustado. Os parâmetros são somente para referência. Alfa captura os efeitos de

memorização das alterações do nível básico ao longo do tempo, beta é o parâmetro de

tendência que mede o ponto forte da tendência e gama mede o ponto forte da sazonalidade

dos dados históricos. A análise decompõe os dados históricos nesses três elementos e depois

os recompõe para prever o futuro. Os dados ajustados ilustram os dados históricos, bem como

os dados ajustados que usam o modelo recomposto e mostram a proximidade das previsões no

passado (uma técnica chamada backcasting14

). Os valores previstos são as estimativas ou

14 Retroajustamento = inicia definindo um futuro desejável e depois vem de volta trabalhando para identificar

políticas e programas que conectarão o futuro ao passado. A questão fundamental do processo é “se quisermos

60

suposições de ponto único (se a opção de geração de suposição automática for escolhida e um

perfil de simulação existir). O gráfico ilustra os valores históricos, ajustados e previstos. O

gráfico é uma ferramenta visual e de comunicação poderosa para ver a qualidade do modelo

de previsão.

Aditiva de sazonalidade

Resumo estatístico

Alfa Gama REQM Alfa Gama REQM

0,00 0,00 8,362 0,60 0,60 5,650

0,10 0,10 6,127 0,70 0,70 5,500

0,20 0,20 6,028 0,80 0,80 5,339

0,30 0,30 5,945 0,90 0,90 5,207

0,40 0,40 5,865 1,00 1,00 5,495

0,50 0,50 5,771

A análise foi executada com alfa = 0,9303, gama = 1,00 e sazonalidade = 12

Medidas de erro

REQM 5,1924

EQM 26,9609

MAD 3,3579

MAPE 38,14%

U-Theil 0,7729

atingir certa meta, que ações devem ser tomadas para se chegar lá”. O retroajustamento aborda o desafio de

discutir o futuro na direção oposta.

61

Figura 34 – Resultados obtidos com o software Risk Simulator

62

Figura 35 – Ranking dos métodos testados pelo Risk Simulator

3.12 Investigando o modelo de Box-Jenkins apropriado com o Risk Simulator

A seguir foram investigados dois modelos de Box-Jenkins: ARIMA e AUTO

ARIMA que foram descritos na seção 2.2.3.6.

63

3.12.1 Modelo ARIMA do Risk Simulator

No software Risk Simulator, usamos a ferramenta ARIMA, a 1ª do grupo de

ferramentas de Previsão. Nela, os valores de P, D e Q foram escolhidos como 1, 0 e 1, como

mostra a Figura 36:

Figura 36 – Janela para entrada de dados do Risk Simulator

Os resultados estão mostrados na Figura 37:

64

65

Figura 37 – Resultados obtidos com a ferramenta ARIMA do Risk Simulator

Interpretação dos resultados:

Na interpretação dos resultados do modelo ARIMA, a maioria das

especificações é idêntica à análise de regressão multivariada. Há, no entanto, diversos

conjuntos adicionais de resultados específicos à análise ARIMA, como observado na

Figura 38.

A primeira é a adição do critério de informação de Akaike (AIC) e do critério de

Schwarz (SC), que são normalmente usados na seleção e identificação do modelo

ARIMA. Ou seja, o AIC e o SC são usados para determinar se um modelo particular com

um conjunto de parâmetros específicos p, d e q é um bom ajuste estatístico. O SC impõe

uma penalidade maior para os coeficientes adicionais do que o AIC, mas em geral o

modelo com menores valores de AIC e SC devem ser escolhidos. Finalmente, um

66

conjunto de resultados adicional chamado de estatísticas de auto-correlação (AC) e auto-

correlação parcial (PAC) é fornecido no relatório ARIMA.

Por exemplo, se a auto-correlação AC(1) é diferente de zero, as séries são

correlacionadas em série de primeira ordem. Se a AC for extinta mais ou menos

geometricamente com uma defasagem crescente, isso implica que a série segue um

processo auto-regressivo de ordem inferior. Se a AC cair a zero depois de um pequeno

número de defasagens, isso implica que a série segue um processo de média móvel de

ordem inferior. Em contraste, PAC mede a correlação de valores que estão k períodos

distante, depois de remover a correlação das defasagens intermédias. Se for possível

capturar o padrão de auto-correlação por uma auto-regressão de ordem menor do que k,

então a auto-correlação parcial na defasagem k será próxima à zero.

As estatísticas Q de Ljung-Box, e seus valores-p na defasagem k, também são

fornecidos, nas quais a hipótese nula sendo testada é tal que não há auto-correlação até a

ordem k. As linhas pontilhadas na “plotagem” das auto-correlações são os limites

aproximados dos dois erros padrão. Se a auto-correlação estiver dentro desses limites,

não será significativamente diferente de zero no nível de significância de 5%,

aproximadamente.

Encontrar o modelo ARIMA certo requer prática e experiência. AC, PAC, AC e

AIC são ferramentas de diagnóstico, muito úteis para ajudar a identificar a especificação

de modelo correta.

Finalmente, os resultados do parâmetro ARIMA são obtidos usando otimização

sofisticada e algoritmos iterativos, que significa que embora as formas funcionais se

pareçam com aquelas de uma regressão multivariada, elas não são as mesmas. O ARIMA

é uma abordagem econométrica avançada e muito mais intensiva computacionalmente.

3.12.2 Modelo AUTO-ARIMA do Risk Simulator

No software Risk Simulator, usamos a ferramenta AutoARIMA, a 2ª do grupo de

ferramentas de Previsão. Ver Figura 38:

67

68

Figura 38 – Resultados obtidos com o Risk Simulator

3.13 Investigando o modelo de Box-Jenkins apropriado com o Crystal Ball

Usando a ferramenta CB-Predictor do Crystal Ball foram investigados todos os

modelos anteriores e permitindo a sua auto seleção, o melhor modelo que o software

encontrou para a série temporal do limão foi o SARIMA.

Neste software os modelos clássicos apresentaram os seguintes resultados:

69

Figura 39 – Resultados obtidos com a ferramenta CB-Predictor do Crystal Ball

Aqui foram feitas Simulações de Monte Carlo com 1.000 tentativas. Os resultados

simulados quando comparados com os informados pelo CEPEA, apresentam uma grande

diferença. Isto sugere a busca de novos modelos.

70

Figura 40 – Resultados obtidos com a ferramenta CB-Predictor do Crystal Ball e simulações de Monte Carlo

71

Figura 41 – Ranking dos métodos pelo CB-Predictor do Crystal Ball

3.13.1 Modelo SARIMA no Crystal Ball

Com uma versão mais nova do CB-Predictor do Crystal Ball que agora testa os

modelos de Box-Jenkins, encontramos que o modelo que este software oferece como o mais

apropriado é o SARIMA(2,1,2)(1,0,1):

Figura 42 – Ranking dos métodos pelo CB-Predictor Novo para os preços Nominais do Limão

72

Figura 43 – Preços projetados pelo CB-Predictor para 12 meses à frente.

O relatório fornecido pelo software:

73

74

75

Figura 44 – Relatórios e Tabela comparando os vários métodos pelo CB-Predictor.

76

4. RESULTADOS E DISCUSSÕES

Como demonstrado na seção 3.13.1, o modelo SARIMA(2,1,2)(1,0,1) foi o que

apresentou os melhores resultados e, portanto, será o eleito para nossas análises futuras quanto

a previsão de preços da lima ácida Thaiti.

Conforme podemos ver na Figura 45, baseada em 202 valores fornecidos pelo

CEPEA de janeiro de 1996 a outubro de 2012, o mínimo do preço neste período foi de R$

1,02 e o preço máximo no período foi de R$ 51,78, tendo um preço médio de R$ 10,39, com

desvio padrão de R$ 10,15.

A Figura 45 mostra a saída obtida com o CB-Predictor do Crystal Ball, para uma

previsão de 14 períodos:

Figura 45 – Resultados obtidos com o CB-Predictor do Crystal Ball para o modelo de previsão

SARIMA(2,1,2)(1,0,1)

Para comparação montamos uma tabela com os resultados ajustados e previstos a

partir de outubro de 2012 até dezembro de 2013 (14 períodos) e comparamos com os valores

fornecidos pelo CEPEA (disponível até abril de 2013):

77

Tabela 3 – Comparações dos Resultados obtidos com o CB-Predictor do Crystal Ball para o modelo de previsão

SARIMA(2,1,2)(1,0,1) e os valores reais divulgados pelo CEPEA.

Devemos ressaltar que este período retratado na tabela acima corresponde a um ano

atípico. Os produtores ficaram surpresos com a evolução dos preços. Nos meses de novembro

e dezembro de 2012, os preços previstos ficaram abaixo daqueles do mercado. Quanto aos

meses de janeiro a abril de 2013 os preços de mercado caíram muito, e ficando abaixo

daqueles previstos pelo modelo, decorrência de uma produção elevada da fruta neste período,

em virtude do atraso das chuvas no final do ano de 2012. Entretanto, embora não divulgado

ainda pelo CEPEA, os preços de mercado, principalmente no mês de junho de 2013, ficaram

acima daqueles previstos pelo modelo.

78

5. CONCLUSÃO

A análise de rentabilidade de um produto agrícola num determinado período

apresenta como insumos mais importantes as variáveis: preço de venda, produtividade e valor

de compra dos insumos. Fatores como: oferta, demanda, intervenções governamentais de

apoio à comercialização, além dos aspectos macroeconômicos (taxa de juro e taxa de câmbio)

também interferem nos resultados finais de cada safra.

A garantia da sustentabilidade da cultura da lima ácida Thaiti deve ser analisada ao

longo do tempo, pela razão de existirem cenários diferentes ou individuais em cada safra.

Neste trabalho procuramos encontrar um modelo de previsão que apresente um

melhor ajuste à série histórica de preços, levando em conta a sazonalidade. Depois do estudo

dos diversos modelos encontramos que o modelo SARIMA(2,1,2)(1,0,1) foi o que apresentou

o melhor ajuste e será o eleito para as análises de previsão de preços futuros para a lima ácida

Thaiti.

Essa previsão de preços se faz necessária para que o produtor possa planejar toda a

estrutura financeira da empresa, e com relatórios contábeis pro forma traçar uma meta de

crescimento sustentável, escolhendo os indicadores: taxa de crescimento interno e taxa de

crescimento sustentável, adequados e programando as suas necessidades de financiamento

externo, tanto no curto prazo, principalmente no que diz respeito ao capital de giro líquido,

quanto no longo prazo, pensando nos gastos líquidos de capital para ampliar a sua produção.

Acredita-se que à medida que com o surgimento de novos métodos de previsão

poderemos encontrar melhores modelos para precificação da caixa-peso (27 kg) da lima ácida

Thaiti. Porém, no momento, o que apresentamos é a melhor forma de contribuir para o

desenvolvimento de análise econômica da produção desta fruta.

Como dissemos na Introdução deste trabalho iremos estabelecer uma parceria com a

ABIPEL (Associação Brasileira dos Produtores e Exportadores de Limão) e apresentar uma

página no site da associação com as previsões futuras dos preços (mensal ou diária) para que

o produtor possa se posicionar. Isso, sem dúvida agregará valor à gestão da produção e

comercialização da fruta.

79

6. REFERÊNCIAS BIBLIOGRÁFICAS

ARCHER, B. Forecasting Demand: Quantitative and Intuitive Techniques. International

Journal of Tourism Management. USA. v.1, n.1, 1980, p. 5-12.

BOX,G.; JENKINS, G. Time series analysis: Forecasting and control. San Francisco:

Holden-Day, 1970.

CENTRO DE ESTUDOS AVANÇADOS EM ECONOMIA APLICADA – CEPEA .

Indicador mensal de preços de citros CEPEA/ESALQ – São Paulo. Disponível em:

<http://cepea.esalq.usp.br/hfbrasil/edicoes/119/citros.pdf>. Acesso em: 28 de jan. 2013.

CHAMBERS, J. C.; MULLICK, S. K.; SMITH, D. D. How to Choose the Right Forecasting

Technique. Harvard Business Review. USA. v. 49, July-August, p. 45-57, 1971.

CHATFIELD, C. The Analysis of Time Series. 6 ed. Washington: Chapman & Hall/CRC,

2004. 322p.

COMPANHIA DE DESENVOLVIMENTO DOS VALES DO SÃO FRANCISCO E DO

PARNAÍBA-CODEVASF. Oportunidade de investimento em limão nos vales do São

Francisco e do Parnaíba CODEVASF/MI. Disponível em

<http://www.codevasf.gov.br/principal/estudos-e-pesquisas/pins/relatorios/limao.doc/>.

Acesso em 4 de jan. 2013.

DAVIS, M.; AQUILANO, N.; CHASE, R. Fundamentos da Administração da Produção.

3 ed. Porto Alegre: Bookman, 2001.

EHLERS, R.S. Análise de Séries Temporais. Disponível em: <

http://www2.icmc.usp.br/~ehlers/>. Acesso em 22 de dez 2012.

FERREIRA, A.B.H. Novo Dicionário da Língua Portuguesa. Rio de Janeiro: Editora Nova

Fronteira, 1975.

FURTADO, M.R. Aplicação de um modelo de previsão da demanda total nos

credenciados Belgo pronto. Juiz de Fora, 2006. 32 p.

HARRISON, P.J.; STEVENS, C. F. Bayesian Forecasting. Journal of the Royal Statistical

Society. UK. series B, v. 38, nº 3, p.81-135, 1976.

http://cepea.esalq.usp.br/hfbrasil/edicoes/119/citros.pdf

http://www.codevasf.gov.br/principal/estudos-e-pesquisas/pins/relatorios/limao.doc

http://www2.icmc.usp.br/~ehlers/

80

KOEHLER, A. B.; SNYDER, R. D.; ORD, J. K. Forecasting Models and Prediction Intervals

for the Multiplicative Holt-Winters Method. International Journal of Forecasting. USA.

v.17, n.2, p.269-286, apr./jun. 2001.

MAKRIDAKIS, S.; WHEELWRIGHT, S.; HYNDMAN, R. Forecasting: Methods and

Applications. 3. ed., New York: John Wiley & Sons, 1998.

MONTGOMERY, D.; JOHNSON, L.; GARDINER, J. Forecasting and Time Series

Analysis. New York: McGraw-Hill, 1990.

MORETTIN, P.A.; TOLOI, C.M.C. Análise de Séries Temporais. São Paulo: Editora

Edgard Blucher Ltda., 2004.

MUN, J. Modeling Risk: Applying Monte Carlo Simulation, Real Options Analysis,

Stochastic Forecasting and Portfolio Optimization. 2ª ed., New York: John Wiley & Sons,

2010.

NEVES, M.F. et al. O retrato da citricultura brasileira. Ribeirão Preto: Markestrat, 2009.

71p. Disponível em

<http://www.citrusbr.com/download/Retrato_Citricultura_Brasileira_MarcosFava.pdf>

Acesso em 28/12/2012.

ORACLE CRYSTAL BALL – CBPredictor User Manual, Release 11.1.1.1.00, 2008.

PINDYCK, R.; RUBENFELD, D.L. Microeconomia. 5ª ed., São Paulo: Prentice Hall, 2002.

SERVIÇO BRASILEIRO DE RESPOSTAS TÉCNICAS - SBRT. Cultivo de Limão: Dossiê

Técnico de Julho/2007. Disponível em: <http://sbrt.ibict.br/dossie-

tecnico/downloadsDT/MjMx> Acesso 08/01/2013.

SILVA, P. R.; FRANCISCO, V. L. F.; BAPTISTELLA, C. S. L. Caracterização da Cultura

do Limão no Estado de São Paulo. Informações Econômicas. São Paulo, v. 38, n. 7, jul.

2008.

TSAY, R.S. Analysis of Financial Times Series: Financial Econometrics. New York: John

Wiley & Sons, 2002

http://www.citrusbr.com/download/Retrato_Citricultura_Brasileira_MarcosFava.pdf

http://sbrt.ibict.br/dossie-tecnico/downloadsDT/MjMx

http://sbrt.ibict.br/dossie-tecnico/downloadsDT/MjMx

Documents

Universidade de São Paulo - bertolo.pro.brbertolo.pro.br/LuizAntonioBertoloMonografia.pdf · Figura 18 – Suavização exponencial simples.....44 Figura 19 – Otimizando parâmetros