4
Aplicação da Metodologia Box-Jenkins na Previsão da Produção da Cana-de-Açúcar Lêda Valéria Ramos Santana, Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco Rua Dom Manoel de Medeiros s/n, Dois Irmãos, 52171-900, Recife-PE, Brasil. E-mail: [email protected], [email protected], [email protected] Dra. Suzana Leitão Russo, Dr. Manuel Luiz Figueroa, Departamento de Estatística e Ciências Atuariais, Universidade Federal de Sergipe Av. Marechal Rondon s/n, Rosa Elze, 49100-000, São Cristóvão-SE E-mail: [email protected], [email protected] Palavras-chaves: Séries temporais, Metodologia Box-Jenkins, Cana de Açúcar. RESUMO: A cultura da cana de açúcar responsável pela base de sustentação da economia e da colonização do nosso país durante séculos mantém-se até os dias atuais como um importante produto da economia brasileira. Entre as culturas produzidas no Brasil, à cana-de- açúcar ocupa o terceiro lugar em relação à área plantada, sua importância pode relacionar-se à diversidade da sua utilização. Este trabalho visa analisar a produção desta matéria prima, por meio da análise descritiva dos dados, gráficos e tabelas. Verificar a presença de autocorrelação e, aplicar a metodologia Box-Jenkins que determinará através do MAPE o melhor modelo para a série em estudo, com o intuito de efetuar uma previsão para a produção da cana. O modelo ARIMA (2,1,0) apresentou-se mais adequado entre os modelos que foram encontrados para gerar previsões com MAPE (10,73362). O software utilizado nas análises estatísticas foi o STATISTICA 7. 1. Introdução A cana-de-açúcar ocupa o terceiro lugar entre as culturas produzidas no Brasil em relação à área plantada, ficando atrás da soja e do milho, apenas. O Brasil é líder mundial na produção de cana-de-açúcar, tendo processado cerca de 569 milhões de toneladas na safra 2008/2009, cerca de 90% do total na principal região produtora do País, a Centro-Sul, e 10% no Nordeste [5]. A cana contribui para a sustentabilidade do planeta e para a luta contra o aquecimento global, visto que é considerada a matéria-prima mais eficiente para a produção de etanol, obtido do caldo da cana, e bioeletricidade, obtida da biomassa formada pelo bagaço (resíduo fibroso gerado após a extração do caldo) e a palha (pontas e folhas) da cana [5]. Devido a solidificação da cana-de-açúcar na importância da economia do país. Este estudo irá desenvolver um modelo para realizar previsões da produção desta material prima nos próximos anos. 2. Fundamentação Teórica 2.1. Série Temporal Uma série temporal é qualquer conjunto de observações ordenadas no tempo. Como os dados são coletados sequencialmente ao longo do tempo, espera-se que ela apresente correlação seriada no tempo[3]. A análise de séries temporais tem como objetivo: investigar o mecanismo gerador da série temporal; fazer previsões de valores futuros da série; descrever o comportamento da série; procurar periodicidades relevantes nos dados. 309 ISSN 2317-3297

Aplicação da Metodologia Box-Jenkins na Previsão da Produção … · 2013-03-12 · Uma série temporal é qualquer conjunto de ... possui uma metodologia de modelagem flexível

Embed Size (px)

Citation preview

Aplicação da Metodologia Box-Jenkins na Previsão da Produção da

Cana-de-Açúcar

Lêda Valéria Ramos Santana,

Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco

Rua Dom Manoel de Medeiros s/n, Dois Irmãos, 52171-900, Recife-PE, Brasil.

E-mail: [email protected], [email protected], [email protected]

Dra. Suzana Leitão Russo, Dr. Manuel Luiz Figueroa,

Departamento de Estatística e Ciências Atuariais, Universidade Federal de Sergipe

Av. Marechal Rondon s/n, Rosa Elze, 49100-000, São Cristóvão-SE E-mail: [email protected], [email protected]

Palavras-chaves: Séries temporais, Metodologia Box-Jenkins, Cana de Açúcar.

RESUMO: A cultura da cana de açúcar responsável pela base de sustentação da economia e

da colonização do nosso país durante séculos mantém-se até os dias atuais como um

importante produto da economia brasileira. Entre as culturas produzidas no Brasil, à cana-de-

açúcar ocupa o terceiro lugar em relação à área plantada, sua importância pode relacionar-se

à diversidade da sua utilização. Este trabalho visa analisar a produção desta matéria prima,

por meio da análise descritiva dos dados, gráficos e tabelas. Verificar a presença de

autocorrelação e, aplicar a metodologia Box-Jenkins que determinará através do MAPE o

melhor modelo para a série em estudo, com o intuito de efetuar uma previsão para a produção

da cana. O modelo ARIMA (2,1,0) apresentou-se mais adequado entre os modelos que foram

encontrados para gerar previsões com MAPE (10,73362). O software utilizado nas análises

estatísticas foi o STATISTICA 7.

1. Introdução

A cana-de-açúcar ocupa o terceiro lugar entre as culturas produzidas no Brasil em

relação à área plantada, ficando atrás da soja e do milho, apenas. O Brasil é líder mundial na

produção de cana-de-açúcar, tendo processado cerca de 569 milhões de toneladas na safra

2008/2009, cerca de 90% do total na principal região produtora do País, a Centro-Sul, e 10% no

Nordeste [5].

A cana contribui para a sustentabilidade do planeta e para a luta contra o aquecimento

global, visto que é considerada a matéria-prima mais eficiente para a produção de etanol, obtido

do caldo da cana, e bioeletricidade, obtida da biomassa formada pelo bagaço (resíduo fibroso

gerado após a extração do caldo) e a palha (pontas e folhas) da cana [5].

Devido a solidificação da cana-de-açúcar na importância da economia do país. Este

estudo irá desenvolver um modelo para realizar previsões da produção desta material prima nos

próximos anos.

2. Fundamentação Teórica

2.1. Série Temporal

Uma série temporal é qualquer conjunto de observações ordenadas no tempo. Como os

dados são coletados sequencialmente ao longo do tempo, espera-se que ela apresente correlação

seriada no tempo[3].

A análise de séries temporais tem como objetivo: investigar o mecanismo gerador da

série temporal; fazer previsões de valores futuros da série; descrever o comportamento da série;

procurar periodicidades relevantes nos dados.

309

ISSN 2317-3297

2

2.2.2. Autocorrelação

A autocorrelação é uma medida de dependência entre observações da mesma série

separadas por um determinado intervalo chamado retardo.

(1)

Nota-se a existência de raiz unitária se os valores da função de autocorrelação iniciam-

se próximos da unidade e declinam-se lenta e gradualmente à medida que aumenta a distância

(número de defasagens, k) entre os dois conjuntos de observações a que se referem,

denominando-se, não estacionária e segue um passeio aleatório. Se esses coeficientes declinam

rapidamente à medida que tal distância se amplia, tem-se uma série com características de

estacionariedade [3].

2.3. A Metodologia de Box-Jenkins

Este método para a previsão se baseia no ajuste de modelos tentativos denominados

ARIMA, possui uma metodologia de modelagem flexível em que as previsões são feitas a partir

dos valores correntes e passados dessas séries. Portanto, descrevem tanto o comportamento

estacionário como o não estacionário [3].

A determinação do melhor modelo para esta metodologia “Box-Jenkins”, segui os

seguintes passos [2]:

Identificação - Analisam-se a FAC e FACP, e tenta-se identificar o modelo.

Estimação - Os modelos ajustados são comparados utilizando alguns critérios, como o da

parcimônia. Uma das formas de melhorar o grau de ajustamento desse modelo aos dados da

série temporal é incluir defasagens adicionais nos processos AR(p), MA(q), ARMA (p,q) e

ARIMA.

Checagem - Se os resíduos são autocorrelacionados, então, a dinâmica da série não é

completamente explicada pelos coeficientes do modelo ajustado.

Previsão - As previsões podem ser ex-ante, feita para calcular valores futuros, de curto

prazo, da variável em estudo. Ou, ex-post realizada para gerar valores dentro do período

amostral. Quanto melhor forem essas últimas, mais eficiente será o modelo estimado.

3. Metodologia

Os dados foram adquiridos no site do Instituto de Pesquisa Economicamente Aplicada

(IPEA) [1] e, correspondem ao período de 1990 a 2007 da produção de cana de açúcar no

Brasil. A análise descritiva dos dados foram feitas através de gráficos e tabelas. Será verificada

a presença de autocorrelação. Em seguida, modelos Box-Jenkins determinará, por meio do

MAPE o melhor modelo para a série em estudo, com o intuito de efetuar uma previsão para a

produção da cana-de-açúcar nos anos seguintes. O software utilizado para o análise das medidas

estatísticas foi o STATISTICA 17.0.

4. Resultados e Discussões

Figura 1: Gráfico da Produção de Cana-de-Açúcar de 1900-2007

Observa-se na Figura 1, que o crescimento da cana-de-açúcar manteve-se estável entre

os anos 1900 e 1918, na década de 20 nota-se que sua produtividade aumenta, mas sua

310

ISSN 2317-3297

3

ascensão se concretiza no inicio na década de 70 quando foi lançado o Pró-Álcool, com o

objetivo de reduzir a dependência energética do país a partir de grandes investimentos na

produção e subsídios ao desenvolvimento de um mercado consumidor do álcool. Fazendo do

Brasil o único a conseguir contornar a crise internacional de abastecimento de petróleo, com a

produção e utilização de um combustível alternativo, passando pelo incentivo do governo.

Parâmetros Média Media

na

Variân

cia

Desvio

Padrão CV%

Coef.

Assimet

ria

Míni

mo Máximo

Valores 104.29

9.175

39.319.

344

1,68.10-16

129.488.

020

124,15

06

1,43326

5

4.63

4.00

0

549.707.3

14

Tabela 1: Estatística Descritiva

A produção de cana-de-açúcar apresenta uma média de 104.299.175 toneladas/ano. O

seu menor valor de produção foi 4.634.000 toneladas no ano de 1903 e, o maior ocorreu no ano

de 2007 com 549.7070314 toneladas. Pode-se observar também, através da mediana, que 50%

da produção da cana é superior a 39.319344 toneladas/ano.

Analisando o desvio perceber-se que a produtividade oscila ao longo dos anos, porém

na maioria dos anos essa oscilação é positiva (fato que pode ser observado pela Figura 1). Sendo

que a presença dos valores altos se justifica devido à medida de produção ser feita em toneladas.

Através dos testes de normalidade de Kolmogorov-Smirnov (0,23994) e o teste de

Shapiro-Wilk (0,75964) não se pode rejeitar a hipótese de que os dados não seguem uma

distribuição normal, pois o teste p-valor que é menor que 0,05.

Ambos os modelos sofreram uma diferenciação, para tornar a série estacionária.

Verificando os correlogramas, Figuras 5 e 6, do modelo ARIMA(2,1,0), percebe-se que a

autocorrelação é corrigida, mostrando que a maioria dos lags encontram-se dentre dos limites

de controle.

Para o modelo ARIMA (1,1,0), também foi gerado os gráfico que identificam a

presença da autocorrelação e autocorrelação parcial. Verificou-se que apesar do modelo não ser

o mais adequado, a autocorrelação apresentou-se melhor, devido os lags estarem dentro dos

limites de controle, Figuras 2 e 3.

Figura 2 – Autocorrelação Parcial modelo (1,1,0)

Figura 3: Autocorrelação modelo (1,1,0)

De acordo com a Tabela 2, evidencia-se que o primeiro modelo apresenta um menor

erro. Dessa forma, têm-se mais um evento confirmando que o ARIMA (2,1,0) é o melhor

modelo para realizar previsões da produção de cana de açúcar.

Modelo Parâmetros Estimativa Erro-Padrão

(2,1,0) P(1) 0,39729 0,1004

P(2) 0,44002 0,1131

(1,1,0) P(1) 0,48801 0,1040

Tabela 2: Parâmetros dos modelos

311

ISSN 2317-3297

4

Os valores preditos e observados podem ser vistos através da Tabela 3.

Predito (2,1,0) 3,8E+08 3,96E+08 4,09E+08 4,21E+08 4,31E+08

(1,1,0) 3,74E+08 3,79E+08 3,81E+08 3,82E+08 3,83E+08

Observado 3,96E+08 4,15E+08 4,23E+08 4,77E+08 5,5E+08

Tabela 3: Predito e Observado dos modelos

Os dados foram submetidos a dois modelos ARIMA, considerando que quanto menor o

MAPE, melhor será o modelo, nota-se que o ARIMA (2,1,0) com MAPE (10,73362) representa

o melhor modelo para gerar previsões quando comparado com o ARIMA (1,1,0), com MAPE

igual a 18,93%.

Na figura 9 é ilustrado o gráfico de previsão, verificando que a produção da cana-de-

açúcar tende a crescer nos próximos anos.

Figura 9: Gráfico de Previsão da Produção da Cana de Açúcar

5. Conclusões Através do correlograma verificou que os dados observados eram autocorrelacionados,

sendo que após a modelagem esta correlação foi corrigida. Mesmo no modelo que não

apresentou-se adequado devido o MAPE.

A previsão da produção de cana-de-açúcar para os anos seguintes, realizou-se através do

modelo ARIMA (2,1,0), verificando-se que esta produção tende a aumentar. Devido a

investimentos em novas tecnologias, aumento da produtividade interna. E, da descoberta da

utilidade da matéria prima para outros fins como: a produção de etanol, termoeletricidade,

biogás.

6. Bibliografia [1] IPEA. INSTITUTO DE PESQUISA ECONOMICAMENTE APLICADA. produção -

cana-de-açúcar - qde. - tonelada - ibge/pam - lspa_qcana. Disponível em:

http://www.ipeadata.gov.br/. Acesso em: 20/08/2011.

[2] LEROY, F. L. D. ; ALBUQUERQUE, A. P. ; MORAES, M. . Projeção do Preço Futuro

de uma Ação da Usiminas: uma abordagem econométrica. In: Encontro norte-nordeste de

finanças, 2006, Recife.

[3] MORRETIN, P. A. E TOLOI, C. M. Análise de Séries Temporais. Ed Edgard Blucher.

São Paulo. 2006

[4] SOUSA, E. L. L. DE; MACEDO I. DE C. Etanol e Bioeletricidade: a Cana de Açúcar no

Futuro da Matriz Energética. São Paulo : luc projetos de comunicação, 1ª ed., 2010.

[5] ÚNICA. Disponível em: http://www.unica.com.br/downloads/estudosmatriz

energetica/pdf/livro-etanol-bioeletricidade.pdf. Acesso em: 13/09/2011.

312

ISSN 2317-3297