42
Ellder Silva da Costa Análise da Série Temporal de Precipitação Total Mensal do Município de Cruz das Almas-BA Brasil 2019

Análise da Série Temporal de Precipitação Total Mensal do

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Análise da Série Temporal de Precipitação Total Mensal do

Ellder Silva da Costa

Análise da Série Temporal de PrecipitaçãoTotal Mensal do Município de Cruz das

Almas-BA

Brasil

2019

Page 2: Análise da Série Temporal de Precipitação Total Mensal do

Ellder Silva da Costa

Análise da Série Temporal de Precipitação Total Mensal

do Município de Cruz das Almas-BA

Trabalho monografico apresentado para ob-tenção do grau de bacharel em ciênciasexatas e tecnológicas.

Universidade Federal do Recôncavo da Bahia - UFRB Bacharelado em CiênciasExatas e Tecnológicas

Orientador: Mariese Conceição Alves dos Santos

Brasil

2019

Page 3: Análise da Série Temporal de Precipitação Total Mensal do
Page 4: Análise da Série Temporal de Precipitação Total Mensal do

Resumo

Uma série temporal pode ser definida como um conjunto de observações coletadasem sequência. Os estudos da variáveis meteorológicas, como a precipitação, tem sidocada vez mais disseminado em virtude dos eventos extremos de mudanças climáticas.O presente trabalho aplicou a metodologia de série temporal nos dados de precipitaçãodo município de Cruz das Almas (BA) no período de 1995 a 2017, com intenção deuma possível previsão para dados futuros. Foi utilizado modelos Box-Jenkins e Holt-Winters para a modelagem estatística. Os modelos ajustados não apresentaram umaboa previsão dos dados, devido a alta variabilidade dos dados. Demonstrou-se que osmodelos de séries temporais não se aplicam bem nesses dados e outras metodologiaspodem ser aplicadas futuramente.

Palavras-chave: Precipitação, clima, série temporal, Box-Jenkins, estatística.

Page 5: Análise da Série Temporal de Precipitação Total Mensal do

Abstract

A time series can be defined as a set of exposures collected in sequence. Studiesof meteorological variables, such as precipitation, have been increasingly widespreadbecause of the extreme events of climate change. The present work applied the timeseries methodology in the precipitation data of the municipality of Cruz das Almas (BA)from 1995 to 2017, with the intention of a possible prediction for future data. Box-Jenkinsand Holt-Winters models were used for statistical modeling. The adjusted models did notpresent a good prediction of the data, due to the high variability of the data. It has beenshown that time series models do not apply well to these data and other methodologiescan be applied in the future.

Keywords: Precipitation, climate, time series, Box-Jenkins, statistics.

Page 6: Análise da Série Temporal de Precipitação Total Mensal do

Lista de ilustrações

Figura 1 – Exemplo de modelo de séries estacionária e não estacionária. . . . 21Figura 2 – Precipitação Pluviométrica Anual do município de Cruz das Almas

no período de 1995 a 2017. . . . . . . . . . . . . . . . . . . . . . . . 33Figura 3 – Precipitação Pluviométrica Mensal do município de Cruz das Almas

no período de 1995 a 2017. . . . . . . . . . . . . . . . . . . . . . . . 34Figura 4 – Decomposição da série de precipitação mensal no período de 1993

a 2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34Figura 5 – Função de Autocorrelação e Autocorrelação Parcial. . . . . . . . . . 35Figura 6 – Análise Residual do Modelo1 . . . . . . . . . . . . . . . . . . . . . . 36Figura 7 – Gráfico de Histograma dos resíduos do modelo1. . . . . . . . . . . . 37Figura 8 – Gráfico de previsão usando modelo ARIMA(1,0,0). . . . . . . . . . . 38

Page 7: Análise da Série Temporal de Precipitação Total Mensal do

Lista de tabelas

Tabela 1 – Modelos ARIMA aplicados a série histórica. . . . . . . . . . . . . . . 36Tabela 2 – Critério de informação AIC para modelos ARIMA ajustados. . . . . . 36

Page 8: Análise da Série Temporal de Precipitação Total Mensal do

Lista de abreviaturas e siglas

ACF -Autocorrelation Fuction

ADF -Augmented Dickey-Fuller

AIC -Akaike Information Criterion

AR -Autoregressive

ARMA -Autoregressive Moving Average

ARIMA -Autoregressive Integrated Moving Average

IPCC -Painel Intergovernamental sobre Mudanças Climáticas

MA -Moving Average

MK -Mann-Kendall

SARIMA -Seasonal Autoregressive Integrated Moving Average

SEI-BA -Superintendência de Estudos Econômicos e Sociais da Bahia

SMK -Seasonal Mann-Kendall

PACF -Partial Autocorrelation Fuction

Page 9: Análise da Série Temporal de Precipitação Total Mensal do

Sumário

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.2 Objetivos Específicos . . . . . . . . . . . . . . . . . . . . . . . . . . 121.3 Organização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2 METODOLOGIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.1 Série Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.2 Decomposição Clássica . . . . . . . . . . . . . . . . . . . . . . . . 142.3 Séries com Tendência . . . . . . . . . . . . . . . . . . . . . . . . . . 152.3.1 Método de Ajuste Linear . . . . . . . . . . . . . . . . . . . . . . . . . 152.3.2 Método da Regressão Local . . . . . . . . . . . . . . . . . . . . . . . 162.3.3 Método da Filtragem . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.3.4 Testes para Tendência . . . . . . . . . . . . . . . . . . . . . . . . . . 172.4 Séries com Sazonalidade . . . . . . . . . . . . . . . . . . . . . . . . 172.4.1 Sazonalidade Determinística - Método da Regressão . . . . . . . . . 182.4.2 Sazonalidade estocástica - método de médias móveis . . . . . . . . 192.5 Função de Autocorrelação . . . . . . . . . . . . . . . . . . . . . . . 202.6 Processos Estocásticos . . . . . . . . . . . . . . . . . . . . . . . . 202.6.1 Processo Estocástico Estacionário . . . . . . . . . . . . . . . . . . . 212.6.2 Teste de Estacionariedade . . . . . . . . . . . . . . . . . . . . . . . . 212.7 Modelos Box-Jenkins . . . . . . . . . . . . . . . . . . . . . . . . . . 222.7.1 Autoregressivo (AR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.7.2 Médias Móveis (MA) . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.7.3 Auto-regressivo de Média Móveis - (ARMA) . . . . . . . . . . . . . . 232.7.4 Auto-regressivo Integrado de Médias Móveis (ARIMA) . . . . . . . . 242.8 Modelos de Holt-Winters . . . . . . . . . . . . . . . . . . . . . . . . 252.8.1 Modelo Holt-Winters Aditivo . . . . . . . . . . . . . . . . . . . . . . . 252.8.2 Modelo Holt-Winters Multiplicativo . . . . . . . . . . . . . . . . . . . . 262.9 Adequação dos Modelos Estocásticos . . . . . . . . . . . . . . . . 262.9.1 Análise Residual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.9.2 Teste de independência . . . . . . . . . . . . . . . . . . . . . . . . . . 272.9.3 Teste de normalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 282.10 Critérios de Informação . . . . . . . . . . . . . . . . . . . . . . . . . 28

3 APLICAÇÕES EM DADOS REAIS . . . . . . . . . . . . . . . . . . . 29

Page 10: Análise da Série Temporal de Precipitação Total Mensal do

3.1 Hidrologia dos Rios Tietê e Piracicaba: séries temporais de va-zão e hidrogramas de cheia . . . . . . . . . . . . . . . . . . . . . . 29

3.2 Análise da pluviometria e dias chuvosos na região Nordeste doBrasil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4 MATERIAIS E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . . 314.1 Aréa de estudo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314.2 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314.3 Tratamento e Análise de Dados . . . . . . . . . . . . . . . . . . . . 31

5 RESULTADOS E DISCUSSÕES . . . . . . . . . . . . . . . . . . . . 335.1 Analise Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335.2 Análise Estatística Box-Jenkins . . . . . . . . . . . . . . . . . . . . 335.3 Análise Residual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365.4 Previsão usando Modelo Box-Jenkins . . . . . . . . . . . . . . . . 385.5 Previsão usando Modelos Holt-Winters . . . . . . . . . . . . . . . 38

6 CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . . . . 39

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Page 11: Análise da Série Temporal de Precipitação Total Mensal do

10

1 Introdução

Com o aumento da influência do homem sobre a natureza, as mudanças climáti-cas estão diretamente ligadas com as ações antropogênicas. Segundo Nobre (2007),as variações ocorridas de caráter local em diferentes lugares do mundo, podem serinfluenciadas pelas variações globais devido as alterações do homem.

De acordo com Barcellos et al. (2009) os primeiros alertas para as mudançasclimáticas ocorreram na década de 1950, relatando a ocorrência do aquecimento glo-bal, sendo o fenômeno que caracteriza aumento da temperatura dos oceanos e daatmosfera do planeta Terra. E com o passar dos anos foi aumentando a preocupação,dos ambientalistas e pesquisadores, sobre como o aumento das temperaturas influen-ciariam nos ecossistemas. Daí, por volta de 1990 a Organização Mundial da Saúde(OMS), publicou o primeiro relatório relatando as mudanças climáticas, usado paraexplicar o que estava acontecendo com o clima do planeta e desmistificar sobre oscausadores da tal, avaliando as interferências naturais (explosões solares, vulcanismo,eetc) e as causadas pelo homem (queimadas, desmatamento, emissão de gases, e etc).Entretanto, apenas por volta do ano 2007, com a publicação do quarto relatório PainelIntergovernamental sobre Mudanças Climáticas (IPCC), é que o assunto tomou a mídiacom uma maior intensidade, aliado a acontecimentos catastróficos como é o casode seca extrema nas regiões Norte e Nordeste do Brasil e furacões que devastaramos Estados Unidos, sendo o Katrina o mais violento, fizeram com que as causas dasalterações climáticas passasse a ser debatida com mais frequência.

Conforme as projeções do Relatório da Quarta Avaliação do Painel Intergover-namental sobre Mudanças Climáticas (IPCC 2007), as variáveis climáticas em escalaregional tem sofrido alterações em seu comportamento, sendo algumas dessa mudan-ças extremas, principalmente nos padrões de precipitações e temperatura. Além disso,as mudanças que vem ocorrendo com o clima mundial afeta o ciclo hidrológico emtodas as escalas temporais sejam dias, meses ou anos.

Com o passar dos anos, ficou nítido que as mudanças climáticas, no carátermundial, tem ocorrido de maneira exorbitante, torna-se necessário analisar as mu-danças no comportamento da precipitação que vem ocorrendo na cidade de Cruzdas Almas-BA, sendo de muita valia para uma cidade que abriga uma das maioresuniversidades da região.

Portanto, indaga-se: A precipitação da cidade de Cruz das Almas também temsofrido alterações significativas nesses últimos anos?

Assim o objetivo geral desta pesquisa é o estudo por meio de série temporal da

Page 12: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 1. Introdução 11

precipitação pluviométrica do município de Cruz das Almas - Ba.

Page 13: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 1. Introdução 12

1.1 Objetivo Geral

Estudo da série temporal da precipitação pluviométrica do município de Cruzdas Almas - BA.

1.2 Objetivos Específicos

Considerando o desenvolvimento do trabalho e o objetivo geral apresentado,destacam-se os seguintes objetivos específicos:

• Estudar tendência e sazonalidade de dados de precipitação de Cruz das Almas-BA, e;

• Verificar possibilidade de prever resultados climáticos de Cruz das Almas utili-zando modelos Box-Jenkins e Holt-Winters.

1.3 Organização

O presente trabalho apresenta a seguinte organização:

Capítulo 2: Conceitos relacionados a Séries Temporais serão abordados nestecapítulo.

Capítulo 3: Neste capitulo são exemplificados aplicações de séries temporaisaplicados a dados climáticos.

Capítulo 4: Modelagem da série temporal.

Capitulo 5: Apresentação dos resultados e discussões.

Page 14: Análise da Série Temporal de Precipitação Total Mensal do

13

2 METODOLOGIA

2.1 Série Temporal

Uma série temporal pode ser definida como um conjunto de observações deuma dada característica coletadas em sequência, sendo a sua maior característicaa dependência dos dados vizinhos. As séries temporais podem ser classificadas emcontínuas ou discretas, sendo contínuas quando as observações são feitas de modocontínuo no tempo, dado um conjunto T = {t : t1 < t < t2} a série será escrita como{Xt : t ∈ T}. E discretas quando as observações são realizadas em tempos distintos, namaioria das vezes equiespaçados, dada pelo conjunto {Xt = t1, t2, ..., tn}. Importanteressaltar que esses termos, contínuas e discretas, não se referem a variável estudadae só apenas às características das observações(CHATFIELD, 2016).

Em séries temporais a variável tempo pode ser facilmente substituída por outrade estudo, como por exemplo em função do espaço em que as observações deixarãode analisadas em um mesmo local e passarão a ser analisadas em lugares distintos.No modelo da regressão linear não é importante a ordem dos dados, mas já nas sériestemporais é possível observar que a ordem dos dados é indispensável e completamenteimportante para a análise de dados (EHLERS, 2009)

Algumas das características presentes nas séries temporais são o uso detécnicas especificas, pois, suas observações correlacionadas são difíceis de analisar,como também a importância de se levar em conta a ordem dos dados, presença defatores complicadores como a presença de tendência e variações sazonais, além dadificuldade de lidar com valores discrepantes (outliers) devido ao seu caráter sequencialde dados.

Uma série temporal que pode ser escrita resumidamente por uma função mate-mática que varia no tempo, y = f(tempo) é dita determinística. Diversamente, quandoalém de possuir a função matemática,a série passa a conter um termo incerto, denotadopor ε, além da função matemática da série temporal,y = f(tempo,ε), é dita estocásticaou não-determinística(PARMEZAN; BATISTA et al., 2016).

Geralmente existem alguns objetivos para se estudar ou analisar as seriestemporais que vão desde descrever as propriedades das series, através de analises emsua estrutura, ou explicar e predizer valores futuros com bases em valores passados,assumindo que o futuro envolve a incerteza, logo podemos presumir que as previsõesnão são perfeitas (MORETTIN; TOLOI, 2006)

Page 15: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 14

2.2 Decomposição Clássica

Ao começar a estudar uma série temporal é muito importante a representaçãopor meio de gráficos dos dados feitos sequencialmente ao longo do tempo, pois poderevelar padrões de comportamento, e assim através dele observar suas características,que podem ser tendência, sazonalidade e entre outros fenômenos que podem seraleatórios ou não. Segundo um modelo clássico de decomposição muitas das carac-terísticas de uma série pode ser composta por até três componentes, descrita pelaEquação (2.1),

Xt = St + Tt +Rt, (2.1)

Em que:T t - chamada de Tendência é a componente tendencial, causada por algum fator queafete a variável estudada.St - é a componente Sazonalidade que descreve as flutuações que acontecem há umacerta periodicidade.Rt - é a componente de Aleatoriedade ou Ruído - parte indistinguível dos dados eespera-se que seja apenas aleatória.

Sendo importante citar que nem sempre uma série temporal possuirá todas ascomponentes citadas, mesmo essa sendo decomposta pelo método clássico. Logoserá possível encontrar séries apenas com componentes aleatória e tendência, oumesmo com componentes de variações sazonais e tendências. A decomposição dasérie serve justamente pra encontrar e identificar quais componentes estão atuandonos dados estudados.

Como citado em Bouzada (2012), o método da decomposição clássica possibilitaque uma dada séries temporal seja escrita como uma multiplicação ou uma soma,sendo esta sua forma mais básica, de componentes não estudados. Então, é possívelutilizar dos dois modos, aditivo quando se admite que as componentes presentes nasérie se somam para caracterizar os dados e multiplicativo quando se admite que ascomponentes se multiplicam (SMAILES; MCGRANE, 2000).

De acordo com Silver (2000) a decomposição é uma ferramenta útil para não sóo planejamento de dados, consistindo da coleta e análise dos dados, como tambémpara fazer previsões. Sendo acrescentado por Souza, Samohyl e Meurer (2004) que adecomposição se torna muito útil na escolha de um modelo de previsão mais apropriadopara o conjunto de dados acessível.

Milnitz, Marchi e Samohyl (2011) propuseram buscar o aperfeiçoamento dosmétodos de previsões para a demanda de uma empresa do setor têxtil, no estado deSanta Catarina. Os mesmos usaram o método da decomposição Clássica para detectarpadrões de tendências e variações sazonais. E logo foi possível escolher o método de

Page 16: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 15

predição.

Calôba, Calôba e Saliby (2002) usaram Redes Neurais de Artificiais comocomplemento nas técnicas de previsão de vendas. A aplicação foi baseada nos dadosde venda de cerveja das industrias da Austrália. A análise foi feita pelos métodos:decomposição clássica, Holt Winters e a decomposição clássica em conjunto com asRedes Neurais Artificiais. Os autores encontraram que o método de decomposiçãoaliado com as Redes Neurais obteve resultados eminentes quando comparados aosoutros dois métodos.

2.3 Séries com Tendência

Conforme Fischer (1982) uma tendência pode ser definida como uma mudançaa longo prazo da variável no nível médio da série. Considerando que a componentesazonal, denotada por St, nao esteja presente a forma mais básica de uma sérietemporal com tendência é:

X t = α + β.t+ εt (2.2)

Onde:- α e β são parâmetros a ser determinados;- εt é o erro aleatório;

Quando as séries possuem a componente tendência existem vários motivospara se estudar seu comportamento. Dentre alguns, temos a interpretação de seucomportamento para utilizar em previsões e a remoção desta componente para destacaras outras características da série. Logo, existem métodos para a obtenção da tendência,que basicamente consiste em regressão e ajuste exponencial de dados. SegundoMorettin e Toloi (2006) os métodos mais utilizados são:

• Ajuste de função temporal como um polinômio, uma exponencial ou uma funçãosuave qualquer;

• Suavização dos valores da série temporal ao redor de um ponto especifico, paraobter a estimação da tendência no ponto estudado, denominado de processo defiltragem;

• Suavização por meio de sucessivos ajustes de retas de mínimos quadrados,técnica da regressão local conhecida como "lowess";

2.3.1 Método de Ajuste Linear

O ajuste consiste na utilização do método dos mínimos quadrados, no qualpossui a finalidade de encontrar os coeficientes da equação da reta que melhor se

Page 17: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 16

ajusta aos dados. No método linear a equação da tendência é escrita na forma maisbásica que relaciona duas variáveis qualquer X e Y, segundo Barroso et al. (1987) édada abaixo:

Y = a+ bX (2.3)

Onde:- a é o coeficiente linear da reta;- b é o coeficiente angular da reta;

As equações para o coeficiente angular e linear são expressas logo abaixo:

b =m

∑xiyi −

∑xi∑yi

m∑xi

2 − (∑xi)2 (2.4)

a =

∑yi − (

∑xi)b

m(2.5)

Onde:- yi são as observações registradas na série temporal;- xi indica o período das observações associado a yi;- m denota o número de períodos da série;

Quando se trata de equações matemáticas com números maiores de parâmetros,geralmente a tendencia é modelada como uma função polinomial, que além de contera equação da reta é também caracterizada por um ajuste linear múltiplo, sendo escrita,de acordo com Ehlers (2009), como:

X t = β0 + β1t+ ...+ βptp + εt. (2.6)

“Sendo uma função linear ou quadrática mais adequada quando se trata detendências monotonicamente crescentes ou decrescentes” (EHLERS, 2009).

2.3.2 Método da Regressão Local

O método da regressão local, para obter tendências, consiste em estimar umafunção qualquer na vizinhança de seu ponto de interesse, considerando a médiaponderada entre as observações. Esse procedimento iterativo é comumente chamadode "lowess"(MORETTIN; TOLOI, 2006).

“Lowess” quer dizer “locally weighted regression scatter plot smoothing”, oque significa, resumidamente, como uma suavização por meio de sucessivas médiasponderadas em sub-conjuntos de dados (EHLERS, 2009).

Page 18: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 17

2.3.3 Método da Filtragem

A filtragem, também conhecida como processo de média móveis, é outra formade se caracterizar tendências. Esse processo consiste em calcular-se a média paran valores iniciais de uma série e seu resultado é colocado no dado exatamente domeio, tendo como extensão o período com tendência (ROSSI; NEVES, 2000). Sendorealizado sucessivas médias até o fim da série, fazendo com que ao termino doprocesso alguns períodos fiquem sem tendência devido aos resultados das médiasserem colocados no centro dos dados(EHLERS, 2009).

2.3.4 Testes para Tendência

O teste estatístico de Mann-Kendall, conforme Sneyers (1975), pode ser definidocomo um teste não paramétrico em que a hipótese consiste do caráter constanteda série temporal, onde os valores permanecem sempre estáveis e a distribuição daprobabilidade não se altera.

Para uma dada série temporal Xt, com n termos, é realizado a soma dos ntermos mi do conjunto de dados, como segue abaixo

tn =n∑

i−1

mi (2.7)

E logo em seguida, sendo a hipótese nula (Ho) com ausência de tendência,assumindo a distribuição normal com média e variância:

E(tn) =n(n− 1)

4(2.8)

var(tn) =(n)(n− 1)(2n+ 5)

72(2.9)

2.4 Séries com Sazonalidade

Conforme definido em Parmezan, Batista et al. (2016) a sazonalidade pode serdescrita como um comportamento específico de uma serie que tende a se repetir porperíodos idênticos a medida que o tempo passa.

“Tem havido no passado um interesse em se ter dados disponíveis sobrefenômenos importantes, sociais e econômicos, para os quais a variaçãosazonal foi removida. As razões relacionam-se , geralmente, com a ideiaque nossa habilidade em reconhecer, interpretar ou reagir a movimentosimportantes não-sazonais numa série (tais como pontos de mudançae outros eventos cíclicos, novos padrões emergentes, ocorrências nãoesperadas para as quais causas possíveis são procuradas) é perturbadapela presença dos movimentos sazonais” (PIERCE, 1980).

Page 19: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 18

Existem dois tipos de sazonalidade, a aditiva e a multiplicativa, as aditivaspossuem flutuações mais constantes sem depender do nível global da série e jáa multiplicativa varia dependendo do nível global da série. Quando a série possuia componente sazonalidade, é possível estima-la através de dois métodos usuaisdenominados de regressão e médias moveis, descritas anteriormente (MORETTIN;TOLOI, 2006).

2.4.1 Sazonalidade Determinística - Método da Regressão

De acordo com Morettin e Toloi (2006), para previsão de uma série temporalque possua a sazonalidade determinística, o método da regressão é bastante eficiente.Ela pode ser simplesmente encontrada utilizando dados de meses anteriores. Dada asérie temporal do modelo (2.1), temos que:

Tt =m∑j=0

βttj; (2.10)

S t =1∑

j=1

2αjdjt, (2.11)

Em que:- djt são variáveis periódicas;- αj é o ruído branco com média zero e variância σ2

a.

Assumindo uma sazonalidade constante, em que α não depende do tempo t.Podemos obter,

djt =

{1, se o período t corresponde ao mês j, j = 1, ..., 12,0, caso contrario

(2.12)

Sendo,d1t + d2t + ...+ d12t = 1, t = 1, 2, ..., N, (2.13)

Levando em conta que a matriz de regressão não possui posto completo, carac-terística matricial referente a independência linear e o espaço vetorial, e sim um postode m + 12.

Adicionando a restrição adicional,12∑j=1

aj = 0, (2.14)

Logo, é possível obter um modelo com posto completo

St =m∑j=0

β jtj +

11∑j=1

αjDjt + at, (2.15)

Page 20: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 19

onde então, podemos obter

Djt =

1, se o período t corresponde ao mês j,−, se o período tcorresponde ao mês 12,0, caso contrario

(2.16)

Deste modo podemos utilizar a teoria usual de mínimos quadrados e obter osestimadores de αj e β j, ou seja, para uma amostra S1, ..., Sn, obtém o modelo

X = Cβ +Dα + a, (2.17)

2.4.2 Sazonalidade estocástica - método de médias móveis

O método de médias móveis é utilizado quando a sazonalidade é estocástica,ou seja, varia com o tempo. Conforme Morettin e Toloi (2006) e sendo o modelo desérie temporal dado por (2.1), após a componente tendencial ser estimada temos:

Yt = Xt − Tt (2.18)

Em que:- Yt é uma série utilizada para estimar St.

Portanto, considerando que a série temporal possua uma sazonalidade cons-tante, utilizaremos da série temporal Yt para estimar o padrão sazonal.

Primeiramente, tomando médias mensais anuais:

Yj =1

nj

nj∑i=1

Yij, j = 1, ..., 12. (2.19)

Sabendo que as médias mensais não serão zero, é possível estimar as constan-tes sazonais por:

Sj = Yj − Y . (2.20)

em que:

Y =1

12

12∑j=1

Yj (2.21)

Sendo modelo inicial de séries temporais dado por:

Xt = Tt + Sj +Rt (2.22)

Com t = 12i + j, i = 0,1,...,p-1, j= 1, ..., 12, sendo p anos. Podemos reescrever aequação 2.16 como:

Yj =1

p− 1

p−1∑i=1

Y12i+j, j = 1, ..., 6 (2.23)

Page 21: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 20

Yj =1

p− 1

p−2∑i=0

Y12i+j, j = 7, ..., 12 (2.24)

Portanto, após a estimação a série sem a presença da sazonalidade pode serescrita como

X∗t = Xt − St. (2.25)

2.5 Função de Autocorrelação

De acordo com Ehlers (2009) os coeficientes de autocorrelação é uma ferra-menta importante para se descrever uma série. Logo, a função de autocorrelaçãoteórica (FAC), de um processo estocástico, é de grande importância para acessar suaspropriedades.

2.6 Processos Estocásticos

Segundo Morettin e Toloi (2006) um processo estocástico é definido como umconjunto de variáveis aleatórias que variam com o tempo, assim podemos dizer quesérie temporal é um processo estocástico que acontece em instantes regulares. Paraanálise de séries temporais é possível notar uma grande diferença em relação a maioriade outros modelos estatísticos. Enquanto que em outros modelos é possível realizarmais de uma observação em um instante t, para este tipo de dados não é possível,embora seja possível alterar o tamanho do conjunto de dados observados. Logo, tem-seapenas um processo estocástico e uma única observação da variável estudada emum tempo distinto. Pode-se caracterizar um processo estocástico conhecendo-se afunção de distribuição conjunta das variáveis aleatórias e, portanto, é possível dizerque se conhece toda a sua estrutura probabilística denotada por média, variância eautocovariância (EHLERS, 2009).

media(t) = E[X(t)] (2.26)

variancia σ2(t) = V ar[X(t)] (2.27)

autocovarianciaγ(t1, t2) = E[X(t1)− µ(t1)][X(t2)− µ(t2)] (2.28)

De acordo com Morettin e Toloi (2006) quando se deparamos com situações emque precisamos usar modelos descritivos para séries temporais, faz-se necessário a in-trodução de suposições facilitadoras, que nos ajuda a analisar determinados processosestocásticos. Em que podem ser definidos em três categorias:

Page 22: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 21

• processos estacionários ou não-estacionários;

• processos normais (Guassianos) ou não normais;

• processos Markovianos ou não-Markovianos.

Figura 1 – Exemplo de modelo de séries estacionária e não estacionária.

Fonte: Analytics Vidhya

2.6.1 Processo Estocástico Estacionário

De acordo com Migon (2007) um processo estocástico é definido como estacio-nário quando ao deslocar a origem dos tempos por uma quantidade τ , não há efeitosna distribuição conjunta e, portanto, dependem apenas dos intervalos para os instantest1. . . tk. Sendo a distribuição conjunta:

X(t1), ..., X(tk) = X(t1 + τ), ..., X(tk + τ) (2.29)

É muito difícil usar da definição de uma série estritamente estacionária e, portanto,utiliza-se a forma restrita em que a média e a variância são constantes (EHLERS,2009).

2.6.2 Teste de Estacionariedade

A maioria dos recursos utilizados em séries temporais se apoiam no princípiode estacionariedade nas séries. Sendo possível analisar tal fenômeno verificando a

Page 23: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 22

existência de alguma raiz dos operadores de retardos, denominada de raiz unitária.Graficamente é muito complicado afirmar que uma dada série é estacionária.

Logo, existe testes para investigar essa condição dos dados e o teste de Dicky-Fuller Aumentado (ADF) é um desses testes. O teste possui as hipótese nula de que asérie possui raiz unitária ou seja não é estacionária, sendo a hipótese alternativa dasérie ser estacionária.

O teste de Dick-Fuller Aumentado requisita o estudo da seguinte expressãoregressora

δyt = β1 + β2t+ δyt−1 +m∑i=1

αiδyt−1 + εt (2.30)

Onde:β1 = é intercepto da série;β2 = é o coeficiente de tendência;δ = é coeficiente de presença de raiz unitária;m = é o numero de desproporções;

2.7 Modelos Box-Jenkins

2.7.1 Autoregressivo (AR)

Um processo é chamado de autoregressivo de ordem p quando os valoresantecedentes dos dados da série temporal fazem o papel das regressoras. Assim,

Xt = α1Xt−1 + ...+ αpXt−p + εt (2.31)

Para se ajustar um processo autoregressivo (AR) de ordem p dado por:

Xt − µ = α1(Xt−1 − µ) + ...+ αp(Xt−p − µ) + εt (2.32)

Basta obtermos os valores dos parâmetros µ,α por meio do método dos mínimosquadrados, e assim minimizando-se a soma dos quadrados.Outras duas alternativas de aproximação podem ser realizadas quando se faz µ = x. Aprimeira alternativa seria ajustar os dados ao modelo como se fosse uma regressãolinear múltipla dada por:

Xt − x = α1(Xt−1 − x) + ...+ αp(Xt−p − x) + εt (2.33)

Na segunda alternativa, os coeficientes de autocorrelação ρ(k) são substituídospelas estimativas rk e assim pode ser escrito como um modelo linear que pode ser

Page 24: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 23

representado como:

y =

xp+1

xp+2

...xp+n

X =

xp · · · x1

xp−1 · · · x2

· · · · · ·xn−1 · · · xn−p

ε =

εp+1

εp+2

...εp+n

α =

α1

α2

...αp

(2.34)

Segundo Oliveira (2012) a dificuldade dos processos auto-regressivos está noreconhecimento do modelo, visto que pessoas distintas podem encontrar modelos deordens diferentes para uma mesma série temporal.

Como pode ser visto em Latorre, Cardoso et al. (2001) um modelo autoregressivoé utilizado para ajuste de série histórica estacionária, livre de tendência e sazonalidade,sendo proveniente da variação do ruído branco, em torno de uma grande média, ámedida que varia com o tempo.

2.7.2 Médias Móveis (MA)

Consiste de processos de médias em diferentes amostras da grandeza estudadapara suavizar flutuações e destacar tendências. Logo,

Xt = µ+ εt + β1εt−1 + ...+ βqεt−q (2.35)

Para ajustar um processo de médias móveis é mais complicado do que para ummétodo regressivo (AR) explicitado anteriormente, visto que o erro se trata de funçõesnão lineares complicadas dos parâmetros β1,...,β1 e portanto não é possível obterequações analíticas. Assim, é preciso utilizar de métodos computacionais iterativospara estimar a soma de quadrados residual. E sendo o método iterativo consistindo emfixar os parâmetros µ,β1,...,βq e obter os resíduos

εt = xt − µ− β1εt−1 − ...− βqεt−q (2.36)

para todo instante t= 1,..,n.

E, então por meio dos resíduos encontrados é possível calcular a soma dosquadrados residual. Esse procedimento iterativo requer a utilização de algoritmoseficientes e nada vai garantir a convergência para um valor mínimo global.

2.7.3 Auto-regressivo de Média Móveis - (ARMA)

O modelo ARMA consiste em uma técnica para entender e, talvez, prever valoresfuturos da série. Conforme Souza et al. (2011) o mesmo consiste de duas partes, umaparte auto regressiva (AR) e uma parte de média móvel (MA). A parte AR envolve

Page 25: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 24

regressar a variável em seus próprios valores defasados, isto é, passados. A parte MAenvolve modelar o termo de erro como uma combinação linear de termos de erro queocorrem contemporaneamente e em vários momentos no passado.

É possível notar em Ehlers (2009) que o ajuste de dados para o modelo ARMAé praticamente igual ao modelo de média móveis em que os erros se tratam deequações não lineares para os parâmetros α1,..,αp,β1,...,βq difíceis de estimar pela faltade equação analítica e assim os resíduos podem ser calculado de modo análogo aomodelo de médias móveis. Em que o erro é obtido por meio de processo iterativo.

Neves e Leal (2003) ao propor estudar se existe a relação entre o aumento doProduto Interno Bruto (PIB) Brasileiro, com o índice de valor patrimonial e o momentoestudado, utilizou um processo ARMA (1,1) para a modelagem dos resíduos deixadospelas regressões dos dados. Os autores chegaram a conclusão que não existe umrelação entre tais variáveis.

2.7.4 Auto-regressivo Integrado de Médias Móveis (ARIMA)

O modelo ARIMA trata-se de uma extensão do modelo ARMA. Ambos modelossão ajustados aos dados da série temporal para a interpretação e previsão dos dadosfuturos. A diferença se dá pelo modelo ARIMA ser utilizado para dados que apresentamcomportamento de não estacionariedade, e assim é aplicado um processo de diferenci-ação para transformar os dados em estacionários (BRESSAN, 2004). E, logo após épossível aplicar os modelos auto-regressivo (AR) e médias móveis (MA).

Usualmente o modelo ARIMA não sazonal é denotado por ARIMA(p,d,q), sendop,d,q números inteiros não negativos, onde p é o número de defasagens do modeloAR, d é o índice de diferenciação e q é o grau de média móvel.

Abraham e Ledolter (2009) definem uma série não estacionária, que possuemobservações caracterizadas por tendências com caráter estocástico, como homogê-neas.

Segundo Box e Jenkins (1976) é preciso seguir três passos importantes aoutilizar o modelo ARIMA, antes de começar com as predições em uma dada sérietemporal, são eles:

• a) identificação e seleção do modelo;

• b) estimação;

• c) verificação;

Sendo a identificação o passo mais importante, visto que através do mesmoserá possível encontrar valores pertinentes de p,d,q (BRESSAN, 2004).

Page 26: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 25

Conforme Fischer (1982) o modelo ARIMA possui uma certa limitação parahorizontes de previsão. O autor evidencia que o modelo possui uma maior capacidadede previsão para horizontes com uma menor duração, devido a sua característica deretroceder a média quando se é aumentado o horizonte de previsão.

Muitas das séries temporais possuem a componente sazonal que se repetecada s períodos, e logo será necessário aplicar um processo de diferenciação antesde estimar os dados. Entretanto, para este tipo de série não basta tomar a primeiradiferença para torna-la aproximadamente estacionaria, a forma adequada é tomando adiferença sazonal presente nos dados.

E assim surge o modelo SARIMA, um processo sazonal autoregressivo integradode média móvel de ordem (p,d,q) x (P,D,Q)s. No modelo SARIMA, primeira tarefa éespecificar os valores de d e D, parâmetros que tornam a série aproximadamenteestacionária e então, logo em seguida determinar os valores dos outros parâmetro,p,q,P e Q por meio das funções de autocorrelações. E assim, após encontrar os valoresde ordem, é possível utilizar um modelo similar aplicado ao processo de média.

2.8 Modelos de Holt-Winters

Conforme Parmezan, Batista et al. (2016) os modelos de Holt-Winters sãoutilizados para séries temporais que possuam tanto a componente tendência comoa de componente sazonalidade. Tais séries com esse comportamento pode ser ca-racterizada por medidas cíclicas que acontecem em intervalos regulares de tempo(MONTGOMERY; JENNINGS; KULAHCI, 2015).

De acordo com Morettin e Toloi (2006) a estrutura do modelo de HW é basica-mente composta por três equações com a presença de constantes com suavizaçãodiferente, vinculadas às componentes padrão da série temporal: tendência, nível esazonalidade. Sua estrutura de modelagem é dividida em dois grupos: aditivo e multipli-cativo.

2.8.1 Modelo Holt-Winters Aditivo

O modelo aditivo tem maior usabilidade em séries temporais com tendênciae sazonalidade aditiva, em que a demanda de maior e menor valor permanecemconstantes. Esse modelo de predição utiliza as seguintes equações:

Lt = α(xt − St−12) + (1− α)(Lt−1 + Tt−1) (2.37)

St = σ(xt − Lt) + (1− σ)St−12 (2.38)

Page 27: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 26

Tt = γ(Lt − Lt−1) + (1− γ)Tt−1 (2.39)

Onde:Lt = nível da série no tempo t;Tt = tendência da série no tempo t;St = variação sazonal da série no tempo t;α, σ e γ são parâmetros de alisamento para cada componente.

2.8.2 Modelo Holt-Winters Multiplicativo

Segundo Parmezan, Batista et al. (2016) o modelo multiplicativo é utilizadoquando a série temporal possuem tendência e sazonalidade multiplicativa, de modoque amplitude sazonal aumenta em proporção com o também aumento do nível médioda série. O modelo multiplicativo utiliza as seguintes equações:

Lt = α(xt

St−12

) + (1− α)(Lt−1 + Tt−1) (2.40)

Tt = γ(Lt − Lt−1) + (1− γ)Tt−1 (2.41)

St = σ(xtLt

) + (1− σ)St−12 (2.42)

Onde:Lt = nível da série no tempo t;Tt = tendência da série no tempo t;St = variação sazonal da série no tempo t;α, σ e γ são parâmetros de alisamento para cada componente.

2.9 Adequação dos Modelos Estocásticos

Para cada processo estocástico temos um modelo de estimação e prediçãodos dados. Ao se escolher um modelo e utiliza-lo é completamente indispensável averificação do tal modelo antes de utiliza-lo para fazer previsões, por exemplo. Talprocedimento de verificação consiste em acrescentar parâmetros extras para observaro comportamento estatístico do modelo e assim observar se o modelo oferece umadescrição eficiente dos dados estudados. E através dos resíduos é que será possívelobservar quais dados não foram modelados, por meio de analises de gráficos temporais,sendo capaz de mostrar os dados discrepantes e comportamentos sazonais (EHLERS,2009).

Page 28: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 27

2.9.1 Análise Residual

Segundo Ehlers (2009) quando se ajusta um modelo a uma série temporal éobrigatório verificar se o mesmo descreve adequadamente os dados. Assim, torna-se necessário a análise residual, para verificar seu comportamento, em que resíduoé a diferença entre valor observado e valor ajustado. Espera-se que o resíduos sedistribuam aleatoriamente em torno de zero com variância quase constante e nãoapresente correlação para que se tenha um modelo bem ajustado.

De acordo com Morettin e Toloi (2006) os resíduos também são ordenados notempo, podendo então serem tratados como uma série temporal, porém sem evidênciade correlação serial. Logo, possuem duas maneiras de verificação da adequação dosmodelos que consiste em representar graficamente os resíduos e seu correlograma.Portanto, igualmente com outros modelos estatísticos, a ideia é que por meio da análiseresidual seja possível identificar características que não foram modeladas com precisão.

2.9.2 Teste de independência

De acordo com Ehlers (2009) é possível olhar as autocorrelações em grupo aoinvés de individualmente por meio das estatísticas Q. E, para modelos Box-Jenkins éutilizado o chamado teste de Box-Pierce com as hipóteses:

H0 = ρ(1) = ... = ρ(m) = 0

H1 = ρ(k) 6= 0, k ∈ (1, ...,m).

E a estatística do modelo é dada por:

Q = n

m∑k=1

r2k (2.43)

Quando o modelo é bem ajustado, então Q apresenta distribuição de apro-ximadamente qui-quadrado com m-p-q graus de liberdade. Logo, altos valores deQ demonstra que as autocorrelações não são todas nulas, sendo pelo menos umadiferente de zero.

Ehlers (2009) diz que o teste de Box-Pierce não tem bom desempenho comamostras pequenas, e assim um teste alternativo mais conhecido é o Ljung-Box, esseteste possui a estatística dada por

Q = n(n+ 2)m∑k=1

r2kn− k

(2.44)

Page 29: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 2. METODOLOGIA 28

2.9.3 Teste de normalidade

Conforme Pereira e Cordeiro (2010) os testes de normalidade servem parainvestigar se um conjunto de dados possuem comportamento normalizado ou paratestar se uma variável aleatória é bem modelada possuindo assim uma distribuiçãonormal. Na análise de resíduo é utilizado para verificar se o mesmo possui distribuiçãonormal.

Um dos testes mais conhecidos é o Shapiro-Wilk, proposto em 1965, em quecalcula uma estatística W testando se uma determinada amostra de tamanho n, temdistribuição normal.

Sendo o teste calculado por meio da equação

W =(∑n

i=1 aix(i))2∑n

i=1(xi − x)2(2.45)

Onde:ai e xi = são constantes geradas das médias, covariância e variância;x(i) = são os valores amostrais.

2.10 Critérios de Informação

Para uma dada série temporal muitos modelos podem ser julgados como ade-quado em questão do comportamento residual. Assim, os critérios de informação tema capacidade de determinar qual dos modelos competidores podem ser aplicados(EHLERS, 2009). Os critérios de informação levam em conta não apenas a qualidadedo ajuste, mas também a inclusão de parâmetros extras, visto que um modelo commais parâmetros p,d,q pode possuir um ajuste melhor, mas não necessariamente queele seja o melhor em relação ao critério de informação. A regra baseia-se em escolhersempre o modelo com o menor critério de informação.

O Critério de Informação Akaike (AIC) é o mais utilizado nas bibliografias pes-quisadas, possuindo sua definição dada por

AIC = −2logverossimilhança maximizada + 2m (2.46)

onde m é numero de parâmetro, em modelos Box-Jenkins (m=p+d+q).

Quando os dados são normalmente distribuídos e usando-se estimativas demaxima verossimilhança nos parâmetros pode-se mostrar que

AIC = nlog(σ2e) + 2m (2.47)

onde = σ2 = 1n

∑e2t .

Page 30: Análise da Série Temporal de Precipitação Total Mensal do

29

3 Aplicações em dados reais

Neste capitulo serão mostrados alguns trabalhos que utilizaram a metodologiade séries temporais aplicadas a dados climáticos, com intuito de demonstrar os métodosaplicados neste trabalho.

3.1 Hidrologia dos Rios Tietê e Piracicaba: séries tempo-

rais de vazão e hidrogramas de cheia

O estudo deste trabalho, realizado por (MORTATTI et al., 2004), busca exploraras séries de vazões anuais para o Rio Piracicaba, no período entre 1944 a 1997, e parao Rio Tietê, no período de 1965 a 1996. Buscando uma caracterização das alteraçõesdas séries históricas de vazões e se está relacionado com a expansão antrópica queocorrendo rapidamente ao longo dos anos. O aspecto mais importante analisado sobrea hidrologia das bacias dos Rios Tietê e Piracicaba é o comportamento das vazões.Entretanto, não foi o único aspecto estudado. Além da vazão, foi também estudado aprecipitação pluviométrica dessa região.

A parte estatística consistiu da análise da existência de tendências nos dadosde vazões dos rios Tietê e Piracicaba, por meio dos testes estatísticos Mann-Kendalle Pettitt. Os testes utilizados mostrou presença de tendência negativa para o RioPiracicaba e um tendência crescente para o Rio Tietê, porém fora do limite de confiançae assim não garante alteração nos dados da série histórica.

Logo Mortatti et al. (2004) concluem que após o estudo exploratório ocorrerammudanças ao longo dos anos nas séries históricas das vazões, o que foi provocadanão só pelas alterações do regime hídrico, mas também do aumento da interferênciaantrópica da região.

3.2 Análise da pluviometria e dias chuvosos na região Nor-

deste do Brasil.

A região Nordeste é conhecida pela ocorrência de seca durante maior partedo ano, e visto que uma grande parte da população busca sobrevivência por meio daagricultura sequeira, o estudo feito por (SILVA et al., 2011) busca analisar o compor-tamento pluvial e o numero de dias com chuva da região analisando a variabilidadeespacial e temporal, além de examinar o comportamento aleatório das séries temporais

Page 31: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 3. Aplicações em dados reais 30

das mesmas.

Para a parte estatística deste estudo foram utilizados cerca de 600 sériestemporais de precipitação diária dos nove estados que formam a região Nordestedo Brasil, sendo dados de um período 30 anos ininterruptos e sem falhas. Sendoconsiderado dias chuvosos os quais possuíram índice de precipitação superior a 0,1mm.

Em seguida, foi aplicado o teste não paramétrico de Mann-Kendall, definidoanteriormente, para analisar a presença de tendência no conjunto de dados, que forameliminadas quando encontradas para uma melhor interpretação do comportamento dasérie temporal.

Com base no correlograma da precipitação pluviométrica de cada estado anali-sado apresentou valores significativos de 95% de confiança, o que uma investigaçãomais detalhada de cada correlograma individualmente acabou indicando que a precipi-tação da região Nordeste tem um comportamento predominantemente aleatório.

Assim, Silva et al. (2011) evidenciou que a região Nordeste possui um com-portamento desigual da precipitação pluvial, visto que, a região semi-árida nordestinaapresentou uma maior variação na região litorânea e do agreste nordestino. Com maiorvariabilidade dos valores no período de chuva em relação ao período de estiagem.

Page 32: Análise da Série Temporal de Precipitação Total Mensal do

31

4 Materiais e Métodos

4.1 Aréa de estudo

O município de Cruz das Almas, BA, está localizado no Recôncavo Sul da Bahiae se encontra na latitude 12o 40’ 12"S, longitude de 39o 06’ 07"W, uma altitude de 220m, possuindo uma população residente de 58.606 habitantes, segundo o último censorealizado pelo IBGE (2010), distribuídos em uma área territorial de 173,9 Km2.

O clima da cidade de Cruz das Almas foi caracterizado, de acordo com aclassificação de Koppen realizada pela Superintendência de Estudos Econômicos eSociais da Bahia (SEI-BA), como Af, caracterizando um clima tropical quente e úmido,com pluviosidade total anual variando entre 700 e 1500 mm sendo os meses setembroa fevereiro os mais secos e os meses de março a agosto os mais chuvosos.

4.2 Dados

Os dados de precipitação pluviométrica total mensal utilizados foram obtidosatravés do Banco de Dados Meteorológicos para Ensino e Pesquisa (BDMEP), co-letados na Estação Meteorológica Convencional (OMM: 83222), situada na sede daEmbrapa Mandioca e Fruticultura, no município de Cruz das Almas - BA. O períodoanalisado foi de 23 anos, de janeiro de 1995 até dezembro de 2017.

4.3 Tratamento e Análise de Dados

A partir dos dados de precipitação foram realizadas observações descritiva eestatística. Na avaliação descritiva foi observada a característica da variável climato-lógica precipitação durante o período estudado, sendo utilizado gráfico de índice deprecipitação total anual. Os valores de precipitação total anual foram calculados atravésdo somatório dos dados de precipitação total mensal obtidos no BDMEP. Na avaliaçãoestatística, primeiramente foi realizada a analise gráfica dos dados mensais de preci-pitação para o período estudado, buscando encontrar comportamento estacionário, eassim utilizando do teste de Dicky-Fuller e em seguida a decomposição da série parauma melhor interpretação das componentes da série temporal. Posteriormente foramaplicados testes estatísticos não paramétricos Mann-Kendall (MK) e o Mann-KendallSazonal (SMK), com a finalidade de investigar a presença de tendências estatistica-mente significativas na série de precipitação total mensal. E, assim através dos testesfoi decidido se aceita ou rejeita H0, ou seja, confirmar a hipótese de comportamento

Page 33: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 4. Materiais e Métodos 32

estável dos dados ou rejeita-la a favor da presença de tendência. Em seguida, foiaplicado um ajuste sazonal com a finalidade de investigar e, caso encontre, remover asazonalidade dos dados. Após a investigação da tendência e sazonalidade tornou-senecessário plotar os gráfico de Função de Autocorrelação (FAC) e AutocorrelaçãoParcial (FACP) para através dos mesmos encontrar um modelo que melhor se ajusteao dados. Daí, com os possíveis modelos Box e Jenkins escolhidos foi possível realizara escolha do que melhor se ajusta por meio do Critério de Informação Akaike (AIC).Em seguida aplicados os modelos Holt-Winters.

Com a modelagem ARIMA, foi feita a verificação da precisão do ajuste pormeio da análise residual, com ajuda do teste de independência Ljung-Box e o teste denormalidade Shapiro-Wilk.

Para realização do ajustes e aplicação dos testes de hipóteses foi utilizadoo software RStudios versão 1.1.463, usando os pacotes forecast,urca, randtests eseasonal.

Page 34: Análise da Série Temporal de Precipitação Total Mensal do

33

5 Resultados e Discussões

5.1 Analise Descritiva

A Figura 12 mostra a distribuição pluviométrica total anual, no município de Cruzdas Almas, durante o período de 1995 a 2017. Observa-se que a menor ocorrência dechuvas foi no ano de 2012, com apenas 722,7 mm, e a maior ocorreu no ano de 1996(1376,9mm), com uma média de 1135,37mm/ano.

Figura 2 – Precipitação Pluviométrica Anual do município de Cruz das Almas no períodode 1995 a 2017.

Fonte: Elaborada pelo autor

5.2 Análise Estatística Box-Jenkins

Com o intuito de observar características de tendências e sazonalidade dosdados foi realizada a analise descritiva dos dados. A Figura 13 mostra o comporta-mento da série temporal de precipitação mensal no decorrer dos anos. Para verificar aestacionariedade da série foi realizado o teste de estacionariedade Dicky-Fuller (1979),no qual observou-se que a estacionariedade não é significante (p-valor=0,01).

Observa-se também na Figura 13, que não há comportamento explicito detendência e sazonalidade. Com isso foi necessário realizar a decomposição da série,que permite observar separadamente suas componentes: sazonalidade, tendência e osresíduos, dada pela Figura 14, sendo a decomposição crucial para uma interpretaçãodos dados com precisão. No primeiro quadro, de cima para baixo, temos o gráfico

Page 35: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 5. Resultados e Discussões 34

dos dados observados. Observa-se no segundo gráfico que há uma leve tendênciadecrescente na precipitação pluviométrica, porém através do teste de Mann-Kendall foiobservado que não é estatisticamente significante (p-valor=0,048) e do Mann-KendallSazonal (SMK) (p-valor=0,081) que é o mais indicado quando se trata de estudo demedidas climáticas (SONSIN, 2017).

Figura 3 – Precipitação Pluviométrica Mensal do município de Cruz das Almas noperíodo de 1995 a 2017.

Fonte: Elaborada pelo autor

Figura 4 – Decomposição da série de precipitação mensal no período de 1993 a 2017.

Fonte: Elaborada pelo autor

Ainda na Figura 14, no terceiro quadro é dado o gráfico da sazonalidade, naqual foi realizado um ajuste sazonal X-13 ARIMA. Através do ajuste foi possível in-vestigar a presença da sazonalidade nos dados da série original, em que foi aplicado

Page 36: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 5. Resultados e Discussões 35

um modelo de ajuste SARIMA (0,0,0)(0,1,1) e diagnosticado que não há presençade sazonalidade na série de precipitação estatisticamente significante por meio doteste qs (p-valor=0,55184), e em seguida foi testada a presença para a sazonalidademais recente, período dos últimos 8 anos, onde também não foi encontrada sazonali-dade significante (p-valor=0,57919). O modelo realizado, ARIMA(0,0,0)(0,1,1) foi bemdecomposto, visto que os resíduos e os componentes irregulares não apresentaramsazonalidade, demonstrando uma aleatoriedade nos mesmos.

E no quarto quadro temos os resíduos, a parte dos dados que não pôde serexplicada.

Figura 5 – Função de Autocorrelação e Autocorrelação Parcial.

Fonte: Elaborada pelo autor

Para definir um modelo proposto, foi necessário construir os gráficos das funçõesde autocorrelação (FAC) e autocorrelação parcial (FACP), Figura 15. Sendo possívelnotar que há um grande pico no lag 1 seguindo por ondas decrescentes que se alternamentre valores positivos e negativos, demonstrando um padrão auto-regressivo de ordemsuperior nos dados. Daí, foi possível propor um modelo do tipo ARIMA, em que oFACP determina o parâmetro p auto-regressivo. Segundo Morettin e Toloi (2006) osmodelos devem ser combinações simples, logo foram escolhidos 5 modelos para seremaplicados, mostrados na Tabela 4.

Para escolher qual o melhor modelo ajustado aos dados e futuramente fazerprevisões foi utilizado o Critério de Informação Akaike (AIC), sendo o critério maisutilizado quando se trata de séries temporais. Em, seguida foi escolhido o modelo commenor valor AIC, com visto na Tabela 5, foi critério ARIMA(1,0,0) ou apenas AR(1).

Page 37: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 5. Resultados e Discussões 36

Tabela 1 – Modelos ARIMA aplicados a série histórica.

Modelo 1 ARIMA (1,0,0)Modelo 2 ARIMA (2,0,0)Modelo 3 ARIMA (3,0,0)Modelo 4 ARIMA (1,0,1)Modelo 5 ARIMA (2,0,1)

Tabela 2 – Critério de informação AIC para modelos ARIMA ajustados.

Modelo AICModelo 1 2966.87Modelo 2 2968.2Modelo 3 2968.75Modelo 4 2968.57Modelo 5 2969.85

5.3 Análise Residual

Para verificação do modelo ajustado ARIMA(1,0,0) foi preciso analisar os resí-duos, esperando-se que eles possuam comportamento aleatório. Para testar a inde-pendência dos resíduos foi utilizado o teste Ljung-Box, o resultado do teste é possívelobservar na Figura 16.

Figura 6 – Análise Residual do Modelo1

Fonte: Elaborada pelo autor

Sendo possível observar que todas as observações possuem um p-valor alto,rejeitando a hipótese nula, garantindo a independência dos dados. Porém, ainda épreciso testar a normalidade dos resíduos, a Figura 17 mostra o histograma residual e

Page 38: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 5. Resultados e Discussões 37

o resultado do teste de Shapiro-Wilk para normalidade da série.

Figura 7 – Gráfico de Histograma dos resíduos do modelo1.

Fonte: Elaborada pelo autor

Conforme o teste de Shapiro-Wilk os resíduos do modelo1 não apresentamnormalidade, então o modelo1 não foi ajustado com precisão nos dados da série histó-rica de precipitação, e assim foi preciso testar os outros modelos de ajuste mostradosna Tabela 4. E, com os outros modelos, também não foi possível encontrar resíduosnormalizados.

Page 39: Análise da Série Temporal de Precipitação Total Mensal do

Capítulo 5. Resultados e Discussões 38

5.4 Previsão usando Modelo Box-Jenkins

Embora não tenha sido possível encontrar um modelo que melhor ajuste osdados para previsão, ainda foi possível realizar a previsão para o período de jan/2018 adez/2018 utilizando o modelo ARIMA(1,0,0), com suas estimativas intervalar, mostradasna Figura 18.

Figura 8 – Gráfico de previsão usando modelo ARIMA(1,0,0).

Fonte: Elaborada pelo autor

É possível notar que os valores previstos são quase constantes, confirmando afalta de precisão no modelo aplicado.

5.5 Previsão usando Modelos Holt-Winters

Para os modelos Holt-Winters não foi possível realizar a previsão, pois osmodelos necessitam que a série temporal estudada possua a componente tendênciaou sazonal, como nessa série temporal não possue essas duas componentes, o modelonão foi estimado.

Page 40: Análise da Série Temporal de Precipitação Total Mensal do

39

6 Considerações Finais

Conforme investigado, foi observado que as componentes tendência e sazona-lidade presentes na série temporal de precipitação mensal não são estatisticamentesignificativa, ou seja, as mesmas não interferem no comportamento da série histórica,assim é possível dizer que a série é descrita principalmente pelo seu comportamentoaleatório.

Conclui-se que os modelos Box-Jenkins e Holt-Winters não são adequados paraestimar e prever os dados futuros de precipitação pluviométrica do município de Cruzdas Almas.

Usando os modelos Box-Jenkins, o AR(1) foi empregado mas não obteve boaprecisão devido ao modelo não possuir resíduos normalizados. Isso causou um aspectoquase constante no gráfico dos dados previstos e um grande valor de intervalo deconfiança.

E assim verificando-se por meio de outros modelos Box-Jenkins que esta não éa metodologia adequada para descrever e prever os dados pluviométricos de Cruz dasAlmas, devido a grande variabilidade nos dados e sua falta de autocorrelação, o queleva a uma falta de precisão nos valores estimados.

Já no uso do modelo Holt-Winters, a estimação não pôde ser aplicada devido afalta da componente tendência ou sazonalidade na série.

Por final sugere-se que sejam aplicados outros modelos de ajustes para umpossível modelo de previsão dos índices pluviométricos do município de Cruz dasAlmas-BA, o que venha a garantir uma maior precisão dos dados previstos.

Page 41: Análise da Série Temporal de Precipitação Total Mensal do

40

Referências

ABRAHAM, B.; LEDOLTER, J. Statistical methods for forecasting. [S.l.]: John Wiley &Sons, 2009. v. 234.

BARCELLOS, C. et al. Mudanças climáticas e ambientais e as doenças infecciosas:cenários e incertezas para o brasil. Epidemiologia e Serviços de Saúde, Geral deDesenvolvimento da Epidemiologia em Serviços/Secretaria de . . . , v. 18, n. 3, p.285–304, 2009.

BARROSO, L. C. et al. Cálculo numérico (com aplicações). São Paulo: Harbra, v. 384,p. 2a, 1987.

BOUZADA, M. A. C. Aprendendo decomposição clássica: Tutorial para um método deanálise de séries temporais. TAC-Tecnologias de Administração e Contabilidade, p.1–18, 2012.

BOX, G. E.; JENKINS, G. M. Time series analysis: forecasting and control, revised ed.[S.l.]: Holden-Day, 1976.

BRESSAN, A. A. Tomada de decisão em futuros agropecuários com modelos deprevisão de séries temporais. RAE-eletrônica, SciELO Brasil, v. 3, n. 1, 2004.

CALÔBA, G. M.; CALÔBA, L. P.; SALIBY, E. Cooperação entre redes neurais artificiaise técnicas’ clássicas’ para previsão de demanda de uma série de vendas de cerveja naaustrália. Pesquisa Operacional, SciELO Brasil, v. 22, n. 3, p. 345–358, 2002.

CHATFIELD, C. The analysis of time series: an introduction. [S.l.]: CRC press, 2016.

EHLERS, R. Apostila análise de séries temporais, 5a edição. UFPR, Curitiba, 94p,2009.

FISCHER, S. unvariantes de tempo-metodologia de box & jenkins. rn, v. 1000, p. 3,1982.

LATORRE, M. d. R. D. d.; CARDOSO, M. R. A. et al. Análise de séries temporais emepidemiologia: uma introdução sobre os aspectos metodológicos. Revista Brasileira deEpidemiologia, SciELO Public Health, v. 4, p. 145–152, 2001.

MIGON, H. Análise de séries temporais. Departamento de Métodos Esta-tísticos, Instituto de Matemática, UFRJ, Disponível em: http://acd. ufrj. br/˜dani/pdf/slidespartefrequentista. pdf Acesso em, v. 4, 2007.

MILNITZ, D.; MARCHI, J. J.; SAMOHYL, R. W. Previsão de demanda: uma aplicação dométodo holt winters em uma indústria têxtil de grande porte. ENCONTRO NACIONALDE ENGENHARIA DE PRODUÇÃO–ENEGEP, v. 31, 2011.

MONTGOMERY, D. C.; JENNINGS, C. L.; KULAHCI, M. Introduction to time seriesanalysis and forecasting. [S.l.]: John Wiley & Sons, 2015.

Page 42: Análise da Série Temporal de Precipitação Total Mensal do

Referências 41

MORETTIN, P. A.; TOLOI, C. Análise de séries temporais. In: Análise de sériestemporais. [S.l.: s.n.], 2006.

MORTATTI, J. et al. Hidrologia dos rios tietê e piracicaba: séries temporais de vazão ehidrogramas de cheia. Revista de Ciência & Tecnologia, Editora UNIMEP, v. 12, n. 23, p.55–67, 2004.

NEVES, M. B. E. das; LEAL, R. P. C. Existe relação entre o crescimento do pibbrasileiro e os efeitos tamanho, valor e momento? Anais..., p. 1–citation_lastpage,2003.

OLIVEIRA, S. de. Um estudo em séries temporais na análise da receita nominal devendas de veículos e motos. Conexão ciência (Online), v. 7, n. 2, p. 64–73, 2012.

PARMEZAN, A. R. S.; BATISTA, G. E. d. A. P. et al. Descrição de modelos estatísticose de aprendizado máquina para predição de séries temporais. 2016.

PEREIRA, M. V.; CORDEIRO, S. F. Uma aplicação de séries temporais em dados deconsumo de papel em indústrias gráficas. Universidade Federal Do Paraná–Curitiba,2010.

PIERCE, D. A. A survey of recent developments in seasonal adjustment. The AmericanStatistician, Taylor & Francis Group, v. 34, n. 3, p. 125–134, 1980.

ROSSI, J.; NEVES, C. D. Econometria e séries temporais com aplicações a dados daeconomia brasileira. [S.l.]: Grupo Gen-LTC, 2000.

SILVA, V. P. da et al. Análise da pluviometria e dias chuvosos na região nordeste dobrasil. Revista Brasileira de Engenharia Agricola e Ambiental-Agriambi, v. 15, n. 2,2011.

SILVER, M. Estatística para administração. [S.l.]: Atlas, 2000.

SMAILES, J.; MCGRANE, A. Essential business statistics. [S.l.]: Pearson Education,2000.

SNEYERS, R. Sobre el análisis estadístico de las series de observaciones. [S.l.]:Secretariado de la Organización Meteorológica Mundial, 1975.

SONSIN, L. F. Estatística não paramétrica aplicada a evapotranspiração de referênciaem uma área de pastagem no sudoeste da amazônia. 2017.

SOUZA, G. d. S. et al. Previsões para o mercado de carnes. Revista de Economia eSociologia Rural, SciELO Brasil, v. 49, n. 2, p. 473–492, 2011.

SOUZA, G. P.; SAMOHYL, R. W.; MEURER, R. Previsão do consumo de energiaelétrica do setor industrial em santa catarina–um estudo comparativo entre diferentesmétodos de previsão através de suas discrepâncias. Anais do Simpósio Brasileiro dePesquisa Operacional, 2004.