18
[email protected] [email protected] 1 M M ó ó dulo de Regressão e S dulo de Regressão e S é é ries ries Temporais Temporais Parte Parte 3 3 Mônica Barros, Mônica Barros, D.Sc. D.Sc. Julho de 2007 Julho de 2007 [email protected] [email protected] 2 Quem sou eu? Quem sou eu? Mônica Barros Doutora em Séries Temporais – PUC-Rio Mestre em Estatística – University of Texas at Austin, EUA Bacharel em Matemática – University of Washington, Seattle, EUA Professora da PUC-Rio (Depto. De Eng. Elétrica) E-mails: [email protected], [email protected] Home page: http://www.mbarros.com [email protected] [email protected] 3 Programa do Curso Programa do Curso Modelagem ARIMA de Box & Jenkins sazonal e não sazonal Função de autocorrelação e autocorrelação parcial Modelo Identificação de (p, q, d, P, Q, D) Estimação Estatísticas de ajuste e análise dos resíduos Exercícios [email protected] [email protected] 4 MODELO BOX & JENKINS UNIVARIADO (Não Sazonal e Sazonal)

Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância [email protected]@mbarros.com

Embed Size (px)

Citation preview

Page 1: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 1

MMóódulo de Regressão e Sdulo de Regressão e Sééries ries TemporaisTemporais

Parte Parte 33

Mônica Barros, Mônica Barros, D.Sc.D.Sc.

Julho de 2007Julho de 2007

[email protected]@mbarros.com 2

Quem sou eu?Quem sou eu?

Mônica BarrosDoutora em Séries Temporais – PUC-RioMestre em Estatística – University of Texas at Austin, EUABacharel em Matemática – University ofWashington, Seattle, EUAProfessora da PUC-Rio (Depto. De Eng. Elétrica)E-mails: [email protected], [email protected] page: http://www.mbarros.com

[email protected]@mbarros.com 3

Programa do CursoPrograma do Curso

Modelagem ARIMA de Box & Jenkinssazonal e não sazonal

Função de autocorrelação e autocorrelaçãoparcial Modelo Identificação de (p, q, d, P, Q, D) Estimação Estatísticas de ajuste e análise dos resíduos Exercícios

[email protected]@mbarros.com 4

MODELO BOX & JENKINS UNIVARIADO

(Não Sazonal e Sazonal)

Page 2: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 5

BOX & JENKINSBOX & JENKINS

PROCESSO ESTOCPROCESSO ESTOCÁÁSTICOSTICO

Toda variável aleatória que evolui no tempo, i.e., guarda uma estrutura de dependência no tempo é um processo estocástico.

SÉRIE TEMPORAL

É uma realização particular de um processo estocástico.

Exemplo: Inflação, Retornos Financeiros, Demanda, etc...

[email protected]@mbarros.com 6

BOX & JENKINSBOX & JENKINS

( )tZ ZE=μ

MÉDIA de um processo (série)

Teórico

Estimador

VARIÂNCIA de um processo (série)

Teórico

Estimador

T

Zm

T

tt

Z

∑== 1

( )

11

2

2

−=

∑=

T

mZS

T

tZt

Z

( ){ }22ZtZ ZE μ−=σ

[email protected]@mbarros.com 7

BOX & JENKINSBOX & JENKINS

AUTOCOVARIÂNCIA de um processo (série)

Teórico

Estimador

Onde k = 1 , 2 . . . é o “lag” ou defasagem

( )( ){ }ZktZtk ZZE μμγ −−= +

( )( )Zkt

kT

tZtk mZmZ

Tc −−

−= +

=∑

111

[email protected]@mbarros.com 8

BOX & JENKINSBOX & JENKINS

AUTOCORRELAÇÃO de um processo (série)

É a medida padronizada da dependência linear de lag k, (é a autocovariância padronizada)

Teórico

Lembrar que:

( )( ) ( )ktt

kttkk

ZVARZVARZZCOV

+

+==,

0γγρ

( ) ( ) constante ==== 20 , Zttt ZVARZZCOV σγ

Page 3: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 9

BOX & JENKINSBOX & JENKINS

Então: para todos os lags 1, 2, 3,...

Estimador rk (autocorrelação estimada de lag k)

O gráfico de r(k) versus k é chamado correlogramacorrelograma do processo (ou da série Zt) .

11 +≤≤− kρ

( )( )

( )∑

=

=+

−−== T

tZt

kT

tZktZt

kk

mZ

mZmZ

ccr

1

2

1

0

[email protected]@mbarros.com 10

BOX & JENKINSBOX & JENKINS

PROCESSO ESTACIONÁRIO (de 2ª ordem)Um processo estocástico é dito estácionário de 2ª ordem se:

(i) para qualquer t

(ii) (constante) para qualquer t

(iii) Cov [Zt, Zt+k ] = função apenas do lag k paraqualquer instante t

i.e , o processo tem média e variância constantes e aautocovariância só depende do lag k

[ ]E Z t z= μ

[ ]E Zt z z− =μ σ2 2

[email protected]@mbarros.com 11

BOX & JENKINSBOX & JENKINSExemplos

Zt

Não Estacionário na Variância

t

Estacionário Não Estacionário na Média

Não Estacionário na Média E na Variância

[email protected]@mbarros.com 12

BOX & JENKINSBOX & JENKINS

PROCESSO RUÍDO BRANCO

Um processo estocástico é chamado de ruruíído brancodo brancoe denotado por at se, além de estacionário de 2ªordem, ele não apresenta qualquer dependênciaserial, ou seja,

Ou seja, um ruído branco é uma seqüência de observações com média e variância constantes e autocorrelações nulas em todos os lags.

ρkpara kpara k

==>

⎧⎨⎩

1 00 0,,

Page 4: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 13

BOX & JENKINSBOX & JENKINSObjetivo de AnObjetivo de Anáálise de Slise de Séérie Temporalrie Temporal

Dada uma série temporal Zt que não é “branca”, isto é, que exibe uma estrutura de dependência serial, achar o melhor modelo matemático que descreva esta dependência serial e a transforme num ruído branco.

Se uma série já é ruído branco, então não existe modelo univariado para ela!

O operador B, conhecido como Operador de Atraso ou “Backward Shift Operator“ é bastante usado por na descrição dos modelos e é definido como:

BkZt = Zt-k

[email protected]@mbarros.com 14

BOX & JENKINSBOX & JENKINS

Exemplos

1)

2)

Z Z Z a at t t t t= + + +− − −α α β β1 2 2 4 1 1 2

ta

tZ3B

3tZ2B

2tBZ

1Z t +α+α+α=

ta

tZ)3B

32B

2B

1(

tZ +α+α+α=

Z B Z B Z Ba at t t t t= + + +α α β β12

24

1 2

Z B B Z B at t t= + + +( ) ( )α α β β12

24

1 2

Z Z Z Z at t t t t= + + +− − −α α α1 1 2 2 3 3

[email protected]@mbarros.com 15

BOX & JENKINSBOX & JENKINS

FunFunçção de autocorrelaão de autocorrelaçção parcial de lag ão parcial de lag kk

É uma medida de dependência linear ou correlação linear entre Zt e Zt+keliminando a dependência dos termos intermediários Zt+1 , Zt+2 . . . Zt+k-1 i.e.:

( )11 ,,|, −+++= kttkttkk ZZZZCorr Kφ

[email protected]@mbarros.com 16

BOX & JENKINSBOX & JENKINS

MODELO ARIMA de Box e Jenkins

Seja Zt uma série estacionária de 2ªordem . A modelagem BJ propõe modelos lineares para Zt, conhecidos como ARIMA(p, d, q).

Page 5: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 17

BOX & JENKINSBOX & JENKINS

Casos Particulares do ARIMA(p, d, q)

AR(p) = modelo autoregressivo de ordem p

MA(q) = modelo médias móveis de ordem q

[email protected]@mbarros.com 18

BOX & JENKINSBOX & JENKINS

( )AR(1) : Z = Z Zt t -1 tφ φ1 11+ − =a B at t,

( )AR(2) : Z = Z Z Zt t -1 t -2 tφ φ φ φ1 2 1 221+ + − − =a B B at t,

( )AR(p) : Z = Z Z Z Zt t-1 t-2 t-p tφ φ φ φ φ φ1 2 1 221+ + + + − − − − =K Kp t p

pta B B B a,

MODELOS AR(p)

Modelo Autoregressivo de ordem p

[email protected]@mbarros.com 19

BOX & JENKINSBOX & JENKINS

ProblemaSe a ordem “p” do modelo cresce, teremos muitos parâmetros φi ; i = 1, . . . , p para estimar, o que requer séries de tamanhos elevados, nem sempre disponíveis .

Solução encontrada Reduzir a ordem “p” da parte AR através da inclusão no modelo de defasagens no ruído branco (além das defasagens da própria série temporal). Isso eqüivale a adicionar uma estrutura MA ao modelo (média móvel = “MovingAverage”)

[email protected]@mbarros.com 20

BOX & JENKINSBOX & JENKINS

Modelos MA(q) = Médias Móveis de ordem q

( )MA(q) : Z = a a a a Zt t t -1 t -2 t -q t− − − − = − − − −θ θ θ θ θ θ1 2 1 221K Kq q

qtB B B a,

( )MA(1) : Z = a a Zt t t-1 t− = −θ θ1 11, B at

( )MA(2) : Z = a a a Zt t t -1 t -2 t− − = − −θ θ θ θ1 2 1 221, B B at

Page 6: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 21

BOX & JENKINSBOX & JENKINS

Exemplo (modelo MA(1))

Exemplo (modelo AR com infinitos lags)

( )tttt

tt

aZZZaZBB

=+++=+++

−− ...,1

2211

221

θθθθ K

( )tt Z

Ba

taBtZtatatZ

⎟⎟⎠

⎞⎜⎜⎝

⎛−

=⇒

−=−−=

111

11,11

θ

θθ :é isto

[email protected]@mbarros.com 22

BOX & JENKINSBOX & JENKINS

Como no caso do AR (p) , para ordens MA altas é melhor trabalhar com o AR invertido que terá, certamente, menos parâmetros a serem estimados.

Princípio da Parcimônia!

AR( )∞ ≡ MA q( )

MA( )∞ ≡ AR p( )

[email protected]@mbarros.com 23

( ) ( ) tt aBBaa 1111 11 θφθφ −=−−= t1-t1-tt ZZ-Z : ARMA(1,1)

BOX & JENKINSBOX & JENKINS

Modelos ARMA (p, q)

( ) ( )1 11 22

1 22− − − − = − − − −φ φ φ θ θ θB B B B B B ap

pq

qtK KZt

( ) ( )1 11 22

1 22− − = − −φ φ θ θB B B B atZt

ARMA(2,2) : Z - Z - Zt t-1 t-2 t-1 t-2φ φ θ θ1 2 1 2= − −a a at

ARMA(p,q) : Z - Z - - Z -t t-1 t-p t-1 t-qφ φ θ θ1 1K K− = − − −p t qa a a

[email protected]@mbarros.com 24

BOX & JENKINSBOX & JENKINS

Fundamento teórico dos modelos BJPassagem de um ruído branco por um filtro linear de memória infinita gera um processo estacionário de 2a ordem. (Teoria geral de sistemas lineares)

ψ( )B Z =t 1 2 3a a a at t t t− − − −− − −ψ ψ ψ1 2 3 K

( ) Z =t 1 2 31 2 3− − − −ψ ψ ψB B B atK

( ) Z =t ψ B at

at Zt

Page 7: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 25

BOX & JENKINSBOX & JENKINS

Fundamento Teórico

Como contém infinitos parâmetros, então BJ sugerem escrevê-lo como a razão de dois polinômios:

ou seja

Logo, a modelagem BJ consiste em achar a estrutura ARMA (i.e., as defasagens p e q) mais adequada para a série Zt.

( ) ψ θφ

B BB

=( )( )

( ) ψ B

( )( ) ( ) ( ) tttt aBZBaBBZ θφ

φθ

=⇒=

[email protected]@mbarros.com 26

BOX & JENKINSBOX & JENKINS

Processos Não-EstacionáriosHomogêneos

Yt é não Estacionário na Média

Seja Zt = Yt - Yt-1

Zt = Yt - BYt

Zt = (1-B)Yt

Zt = ∇ Yt (série estacionária)

Xt é não Estacionário na MédiaYt = ∇Xt =Xt - Xt-1

Yt: Não Estacionário na MédiaZt = ∇Yt = ∇ ∇ Xt

Zt = ∇ 2Xt (série estacionária)

[email protected]@mbarros.com 27

BOX & JENKINSBOX & JENKINS

GeneralizaçãoUm processo estocástico é não estacionário homogêneo se ele se torna estacionário após a aplicação de “d”diferenças

Se Yt é não estacionário homogêneoentão:

td

t YZ ∇= é estacionário!

[email protected]@mbarros.com 28

BOX & JENKINSBOX & JENKINS

Modelo ARIMA (p,d,q)

φ θ( ) ( )B Z B adt t∇ =

φ φ φ φ( )B B B Bpp= − − − −1 1 2

2 K

θ θ θ θ( )B B B Bqq= − − − −1 1 2

2 K

∇ = −d dB( )1

Page 8: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 29

BOX & JENKINSBOX & JENKINS

Exemplosi) ARIMA (1,1,1)

ii) ARIMA (0,2,2)

Z Z Z a at t t t t- ( +φ φ θ1 1 1 2 1 11+ = −− − −)

[ ]1- ( + (1 -1φ φ θ12

11+ =) )B B Z B at t

(1 - (1 - (1 -φ θ1 1B B Z B at t) ) )=

Zt = (φ1 +1)Z t-1 - φ1Zt-2 + a t - θ1at-1

( )( ) ( )

221121

221121

221

2

221

2

22

121

1

−−−−

−−−−

−−+−=−−=+−

−−=+−

−−=∇

tttttt

tttttt

tt

tt

aaaZZZaaaZZZaBBZBB

aBBZ

θθθθ

θθ

θθ

[email protected]@mbarros.com 30

BOX & JENKINSBOX & JENKINS

II) MODELO BJ

Fluxograma Operacional ==> ∇d ==> θ(B) , φ(B) ==>

at

Zt

Yt

Série estacionária após d diferenças

Série original (não estacionária)

[email protected]@mbarros.com 31

BOX & JENKINSBOX & JENKINSFluxo Operacional BJ

Operador diferença

Ordem AR(p) e

MA(q)

Estimação

Ruído

é branco

Previsão

Não

Identificação

Estimação

Testes

Sim

Yt~

Zt~

$ $φ θi j

e

at~

[email protected]@mbarros.com 32

BOX & JENKINSBOX & JENKINS

APLICAÇÃO DO MÉTODO

Identificação

Valores de p,d,q para Yt.

i) d através dos gráficos de ∇dYt.

ii) p e q através das ACF e PACF (correlograma e correlograma parcial de ∇dYt ).

Page 9: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 33

BOX & JENKINSBOX & JENKINS

APLICAÇÃO DO MÉTODONo gráfico a seguir está uma série não estacionária, para a qual são necessárias duas diferenças atéencontrar uma série estacionária.

500

1000

1500

2000

2500

3000

0 5 10 15 20 25

Gráfico da Série original

[email protected]@mbarros.com 34

BOX & JENKINSBOX & JENKINS

APLICAÇÃO DO MÉTODOA autocorrelação (ACF) da série original decresce MUITO lentamente, como mostrado a seguir.

[email protected]@mbarros.com 35

BOX & JENKINSBOX & JENKINS

APLICAÇÃO DO MÉTODOO gráfico da 1a. diferença da série é:

0

5

10

15

0 5 10 15 20 25

[email protected]@mbarros.com 36

BOX & JENKINSBOX & JENKINS

APLICAÇÃO DO MÉTODOA ACF da série diferenciada é:

Page 10: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 37

BOX & JENKINSBOX & JENKINS

APLICAÇÃO DO MÉTODOA série duplamente diferenciada é:

-2

-1

0

1

2

3

0 5 10 15 20 25

[email protected]@mbarros.com 38

BOX & JENKINSBOX & JENKINS

APLICAÇÃO DO MÉTODOE sua função de Autocorrelação:

Logo, foram necessárias duas diferenças para tornar a série original estacionária.

[email protected]@mbarros.com 39

BOX & JENKINSBOX & JENKINS

APLICAÇÃO DO MÉTODO

Estimaçãoφi’s e θj’s são estimados minimizando a soma dos quadrados dos resíduos (ou erro de previsão), i.e.

tφi’s e θj’s tais que Σ at

2 seja mínimat=1

Obs: Os erros padrões estimados permitem testar as hipóteses nulas

Ho: φi = 0 e Ho: θj= 0

[email protected]@mbarros.com 40

BOX & JENKINSBOX & JENKINS

APLICAÇÃO DO MÉTODOTestes de Testes de sobrefixasobrefixaççãoão – ajuste modelos “maiores” (mais elaborados) – substitua p por p + 1 e q por q + 1 e verifique se os parâmetros são significantes

Testes nos ResTestes nos ResííduosduosDevem ser ruído branco, com média nula e variância pequenaNÃO DEVE EXISTIR AUTOCORRELAÇÃO NOS RESÍDUOS!!!!

Page 11: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 41

BOX & JENKINSBOX & JENKINS

APLICAÇÃO DO MÉTODOTeste de Ljung e Box (ou Portmanteau)Estatística de teste é calculada a partir das ACFs estimadasdos resíduos. A estatística de Ljung e Box mede a magnitude da ACF dos resíduos para diversos lags, ou seja, estende a estatística de Durbin-Watson (só lag 1).

Q n n r in ka

i

k= +

-=Σ( ) ( )

( )2

2

1

Sob a hipótese de um ruído branco, Q é uma variável com densidade Qui-quadrado com M graus de liberdade.

OndeM = k-(p+q)

n = T-d

[email protected]@mbarros.com 42

BOX & JENKINSBOX & JENKINSBOX & JENKINS

MODELOS PARA SÉRIES SAZONAIS (SARIMA)

BJ propõem uma estrutura similar ao modelo ARIMA(p,d,q) para as séries sazonais, considerando o intervalo de "S" (S; período sazonal, e.g. S = 12, S = 4, etc.) ao invés do intervalo unitário dos modelos simples.

Modelo MA(Q) Puramente SazonalMA(Q)sazonal ≡ MA(QS) simples com parâmetros não-nulos somente nos lags S, 2S,...,QS.

[email protected]@mbarros.com 43

BOX & JENKINSBOX & JENKINSBOX & JENKINS

Correlograma do MA(Q)

Ou seja: não existe qualquer tipo de dependência dentro de um período sazonal; só existem dependências entre períodos sazonais.

....

S 2S 3S QS

ρk

k

[email protected]@mbarros.com 44

BOX & JENKINSBOX & JENKINSBOX & JENKINS

12 24

ρk

K

Exemplo: S = 12; MA(2) SazonalExemplo: S = 12; MA(2) Sazonal

Pelo visto anteriormente para o modelo simples, a PACF do Pelo visto anteriormente para o modelo simples, a PACF do MA(Q) sazonal MA(Q) sazonal éé composta de exponenciais e/ou sencomposta de exponenciais e/ou senóóides ides amortecidas nos lags S, 2S, 3S, amortecidas nos lags S, 2S, 3S, ........

wt = at - Θ1 at-12 - Θ2 at-24

Page 12: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 45

BOX & JENKINSBOX & JENKINSBOX & JENKINS

Modelo AR(P) Puramente SazonalModelo AR(P) Puramente Sazonal

DaDaíí:: AR(P)AR(P) Sazonal = AR(PS)Sazonal = AR(PS) Simples com parâmetroSimples com parâmetronãonão--nulos somente nos lag's S, 2S, ..., PSnulos somente nos lag's S, 2S, ..., PS

Por analogia (e dualidade) as funPor analogia (e dualidade) as funçções ACF e PACF do AR(P) Sazonalões ACF e PACF do AR(P) Sazonal são:são:

w

wt t s t s p t ps

ts s

pps

t

w w w

ou B B B a

= + + +

= + + + +− − −

Φ Φ Φ

Φ Φ Φ1 2 2

1 221

...

: ( ... )

S 2S PS (P+1)S

ρk

.... K

....

[email protected]@mbarros.com 46

BOX & JENKINSBOX & JENKINSBOX & JENKINS

S 2S PS

φkk

.... K

Modelo ARMA(P,Q) puramente Sazonal.Modelo ARMA(P,Q) puramente Sazonal.

w w w w a a a

ou wt t s t s P t Ps t t s Q t Qs

s sP

pst

s s Qs

= + + + + − − −− − − − −Φ Φ Φ Θ Θ

Φ Φ Φ Θ Θ Θ

1 2 2 1

2

... ...

: (1- B - B - B ) = (1- B - B -...- B )a1 22

1 2 Q t

[email protected]@mbarros.com 47

TambTambéém conhecido como ARIMA multiplicativom conhecido como ARIMA multiplicativo

Zt

(S)ARIMA (p, d, q) x (P, D, Q)S

Onde ∇SD = (1-BS )D

at

bt

θ(B)/ φ(B) ∇ Θ (B s)/Φ (B s). ∇ sDd

⇓ ⇓

φ(B) ∇ d b t = θ(B)a t Φ (B s).∇ sD Z t = Θ (B s)b t

⇓ ⇓

.....Φ Θ( ). ( ). ( ). ( ).B B Z B B aS

sD d

ts

tφ θ∇ ∇ =grau PS + p +SD + d grau QS + q

1 2444 3444 1 244 344

BOX & JENKINSBOX & JENKINS –– Modelos SARIMAModelos SARIMA

[email protected]@mbarros.com 48

Exemplo: Modelo AirlineExemplo: Modelo AirlineÉÉ o modelo sazonal multiplicativo que representa so modelo sazonal multiplicativo que representa sééries sazonais que ries sazonais que exibem uma tendência e sobreposta a esta, uma componente sazonalexibem uma tendência e sobreposta a esta, uma componente sazonalmultiplicativa, tmultiplicativa, tíípica de dados de negpica de dados de negóócios e, particular, de vendas de cios e, particular, de vendas de passagens apassagens aééreas. O modelo reas. O modelo éé::

SARIMA (0, 1, 1) x (0, 1, 1)SARIMA (0, 1, 1) x (0, 1, 1)1212ÉÉ facil mostrar que o correlograma do modelo airline apresenta vafacil mostrar que o correlograma do modelo airline apresenta valores lores não nulos nos lag's 1, 11, 12 e 13, como abaixo:não nulos nos lag's 1, 11, 12 e 13, como abaixo:

BOX & JENKINSBOX & JENKINSBOX & JENKINS

ρk

K1 11 12 13

Page 13: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 49

BOX & JENKINSBOX & JENKINS

Modelo Airline (SARIMA(0,1,1)x(0,1,1)S)Exemplo: Exemplo: Modelo Airline para dados trimestrais (s = 4)Modelo Airline para dados trimestrais (s = 4)

De uma maneira geral, se o perDe uma maneira geral, se o perííodo sazonal odo sazonal éé S, o modelo tornaS, o modelo torna--se:se:

( )( ) ( )( ) tt aBBZBB 44 1111 Θ−−=−− θ

( )( ) ( )( ) tS

tS aBBZBB Θ−−=−− 1111 θ

[email protected]@mbarros.com 50

BOX & JENKINSBOX & JENKINSBOX & JENKINS

Define-se variável de intervenção, como a série temporal, denotada por Xit , composta de valores "0“ e "1", onde "0" representa a ausência de um fenômeno. O modelo BJ com intervenção é dado por:

onde wi é o "efeito" da variável de intervenção Xit em Zt .

bi é o lag de defasamento do efeito da variável Xit em Zt .

( ) ( ) itb

tttd XBwaBZB i+=∇ θφ

[email protected]@mbarros.com 51

BOX & JENKINSBOX & JENKINSBOX & JENKINS

Tipos de IntervenTipos de Intervenççãoão

1

PulsoSazonal X 3t (j+ks) ; j=1,...,S ; k=1,2...

X3t(j+ks)

tj j+s j+2s j+3s ...

[email protected]@mbarros.com 52

BOX & JENKINSBOX & JENKINS

Exemplo – Série não sazonalPIB a preços de 2006 (1947 a 2006)

5

10

15

20

X 1E+005

1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005

Legend

PIB_R$_2006

Page 14: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 53

BOX & JENKINSBOX & JENKINS

A série é claramente não estacionária, portanto a identificação das ordens p e q irá requerer a diferenciação prévia da série.

Mas, qual “a cara” da ACF e PACF da série sem diferenciação?

[email protected]@mbarros.com 54

BOX & JENKINSBOX & JENKINS

ACF da série sem diferenciação

[email protected]@mbarros.com 55

BOX & JENKINSBOX & JENKINS

PACF da série sem diferenciação

[email protected]@mbarros.com 56

BOX & JENKINSBOX & JENKINS

ACF da série após a 1ª. Diferença

Page 15: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 57

BOX & JENKINSBOX & JENKINS

PACF da série após a 2ª. Diferença

[email protected]@mbarros.com 58

BOX & JENKINSBOX & JENKINS

Pelos gráficos anteriores...ACF da série diferenciada sugere MA(1) ou MA(2).PACF da série diferenciada sugere AR(1).Opções:

ARIMA(1,1,2) ouARIMA(1,1,1)

[email protected]@mbarros.com 59

BOX & JENKINSBOX & JENKINS

Ajuste de ARIMA(1,1,2)Forecast Model for PIB_R$_2006ARIMA(1,1,2)

Term Coefficient Std. Error t-Statistic Significance-------------------------------------------------------------------------------a[1] 0.6697 0.1639 4.0854 0.9999b[1] 0.1754 0.1842 0.9524 0.6550 <-b[2] -0.3098 0.1476 -2.0987 0.9596

Within-Sample Statistics-----------------------------------------------------------Sample size 60 Number of parameters 3Mean 1.021e+006 Standard deviation 6.939e+005R-square 0.9969 Adjusted R-square 0.9968Durbin-Watson 2.052 Ljung-Box(18)=26.9 P=0.919Forecast error 3.922e+004 BIC 4.235e+004MAPE 0.02674 RMSE 3.823e+004MAD 2.519e+004

[email protected]@mbarros.com 60

BOX & JENKINSBOX & JENKINS

Ajuste de ARIMA(1,1,1)Forecast Model for PIB_R$_2006ARIMA(1,1,1)

Term Coefficient Std. Error t-Statistic Significance-------------------------------------------------------------------------------a[1] 0.9996 0.0278 35.9010 1.0000b[1] 0.7978 0.0965 8.2696 1.0000

Within-Sample Statistics---------------------------------------------------------------Sample size 60 Number of parameters 2Mean 1.021e+006 Standard deviation 6.939e+005R-square 0.997 Adjusted R-square 0.9969Durbin-Watson 1.71 * Ljung-Box(18)=34.11 P=0.9878Forecast error 3.852e+004 BIC 4.054e+004MAPE 0.02642 RMSE 3.787e+004MAD 2.607e+004

Todos os coefs. significantes, mas alguns dos erros “in sample”ligeiramente maiores que no modelo anterior

Expert selection do FPW sugere este modelo

Page 16: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 61

BOX & JENKINSBOX & JENKINS

Exemplo – Série sazonalConsumo mensal de energia elétrica – total Brasil

10000

15000

20000

25000

30000

80 85 90 95 0 5

Legend

TOTAL

[email protected]@mbarros.com 62

BOX & JENKINSBOX & JENKINS

ACF da série original

[email protected]@mbarros.com 63

BOX & JENKINSBOX & JENKINS

PACF da série original

[email protected]@mbarros.com 64

BOX & JENKINSBOX & JENKINS

ACF da série com uma diferença NÃO sazonal

Page 17: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 65

BOX & JENKINSBOX & JENKINS

PACF da série com uma diferença NÃO sazonal

[email protected]@mbarros.com 66

BOX & JENKINSBOX & JENKINS

ACF da série com uma diferença sazonal

A diferença sazonal não serve para tornar a série estacionária. Então, o que interessa é apenas a diferença não sazonal.

[email protected]@mbarros.com 67

BOX & JENKINSBOX & JENKINS

Pelos gráficos anteriores...O problema é BEM MAIS complicado que no caso não sazonal....

ACF da série diferenciada – olhe o lags 1 e também lags múltiplos de 12, sugerindo MA(1) não sazonal e MA(1) sazonal.PACF da série diferenciada sugere AR(1) e AR(1) sazonal.Modelo tentativo: SARIMA(1,1,1)(1,0,1)

[email protected]@mbarros.com 68

BOX & JENKINSBOX & JENKINS

SARIMA(1,1,1)(1,0,1)Forecast Model for totalARIMA(1,1,1)*(1,0,1)

Term Coefficient Std. Error t-Statistic Significance-------------------------------------------------------------------------------a[1] -0.2619 0.1788 -1.4644 0.8569 <-b[1] 0.1100 0.1694 0.6493 0.4838 <-A[12] 0.9994 0.0001 7677.2516 1.0000B[12] 0.9252 0.0308 30.0414 1.0000

Try alternative model ARIMA(0,1,1)*(1,0,1)

Within-Sample Statistics-------------------------------------------------------------Sample size 340 Number of parameters 4Mean 1.871e+004 Standard deviation 6141R-square 0.991 Adjusted R-square 0.9909Durbin-Watson 1.727 Ljung-Box(18)=17.15 P=0.4872Forecast error 585.8 BIC 602.6MAPE 0.01865 RMSE 582.3MAD 343

Necessidade de reajustar estrutura do modelo, jogando fora parâmetros não significantes.

Page 18: Módulo de Regressão e Séries Temporais - mbarros.com · Estacionário Não Estacionário na Média Não Estacionário na Média E na Variância monica@mbarros.commonica@mbarros.com

[email protected]@mbarros.com 69

BOX & JENKINSBOX & JENKINS

SARIMA(0,1,1)(1,0,1)Forecast Model for totalARIMA(0,1,1)*(1,0,1)

Term Coefficient Std. Error t-Statistic Significance-------------------------------------------------------------------------------b[1] 0.3380 0.0571 5.9169 1.0000A[12] 0.9979 0.0099 101.0419 1.0000B[12] 0.8984 0.0175 51.3158 1.0000

Within-Sample Statistics-------------------------------------------------------------Sample size 340 Number of parameters 3Mean 1.871e+004 Standard deviation 6141R-square 0.9909 Adjusted R-square 0.9909Durbin-Watson 1.767 Ljung-Box(18)=18.18 P=0.5564Forecast error 587 BIC 599.6MAPE 0.01882 RMSE 584.4MAD 344.5

[email protected]@mbarros.com 70

BOX & JENKINSBOX & JENKINS

SARIMA(1,1,0)(1,0,1)Forecast Model for totalARIMA(1,1,0)*(1,0,1)

Term Coefficient Std. Error t-Statistic Significance-------------------------------------------------------------------------------a[1] -0.3629 0.0629 -5.7732 1.0000A[12] 0.9992 0.0001 8168.8195 1.0000B[12] 0.9163 0.0294 31.1158 1.0000

Within-Sample Statistics-------------------------------------------------------------Sample size 340 Number of parameters 3Mean 1.871e+004 Standard deviation 6141R-square 0.991 Adjusted R-square 0.9909Durbin-Watson 1.757 Ljung-Box(18)=17.44 P=0.5072Forecast error 585.1 BIC 597.7MAPE 0.0186 RMSE 582.5MAD 343.6

[email protected]@mbarros.com 71

BOX & JENKINSBOX & JENKINS

Como escolher dentre os dois últimos modelos?

Estatísticas de erros dentro da amostraBICHoldout – separar alguns meses como se não pertencessem à série e verificar capacidade de previsãoACF dos resíduos – é importante que os resíduos de um modelo B/J não tenham estrutura.