Apostila MBarros Series Temporais

Embed Size (px)

Citation preview

  • 1

    Captulo 5: Introduo s Sries Temporais e aos Modelos ARIMA Neste captulo faremos uma introduo s sries temporais. O nosso objetivo aqui puramente operacional e estaremos mais preocupados com as definies bsicas e alguns exemplos simples, j que o estudo de sries temporais to extenso que justifica um curso em separado. Sries Temporais no so comumente estudadas em cursos bsicos de Estatstica. Por que? Pois no estudo de Sries Temporais a noo de dependncia entre as observaes crucial. Ao contrrio, na maioria dos procedimentos estudados em cursos elementares, supe-se que as observaes formam uma amostra aleatria, isto , so independentes e identicamente distribudas. 5.1. Introduo - algumas consideraes sobre sries temporais Definio 5.1.1. (Srie Temporal) Uma Srie Temporal um conjunto de observaes ordenadas no tempo (no necessariamente igualmente espaadas), e que apresentam dependncia serial (isto , dependncia entre instantes de tempo). A notao usada aqui para denotar uma Srie Temporal Z1, Z2, Z3..., ZT , que indica uma srie de tamanho T. O instante T geralmente indica o ltimo instante disponvel. De uma maneira um pouco mais formal, dizemos que uma srie temporal uma realizao de um processo estocstico. Definio 5.1.2. (Processo ergdico) Um processo estocstico dito ergdico se uma nica realizao do processo o suficiente para caracteriz-lo. Na anlise de sries temporais existe apenas uma realizao do processo disponvel e portanto precisamos supor que o processo subjacente ergdico, pois iremos usar apenas uma de suas realizaes para caracteriz- lo. Em geral, ao estudarmos uma Srie Temporal estaremos interessados em dois aspectos: a) Anlise e Modelagem da Srie Temporal - descrever a srie, verificar suas caractersticas mais

    relevantes e suas possveis relaes com outras sries; b) Previso da Srie Temporal - a partir de valores passados da srie (e talvez de outras sries tambm)

    encontrar boas previses (de curto prazo) de valores futuros da srie. A previso da srie no instante T + k ser denotada por . O nmero de instantes frente para o qual feita a previso (neste caso,

    k) chamado de horizonte de previso. Por exemplo, a previso de Z

    $ZT k+T+1 denotada por . $ZT+1

    A dependncia serial entre os valores da srie um aspecto essencial, pois nos permite gerar previses de valores futuros da srie. Estas previses seriam puro chute se no houvesse dependncia serial. Tambm, diferentes sries possuem diferentes graus de previsibilidade; por exemplo, freqentemente mais fcil prever uma srie de temperaturas mdias mensais do que a taxa mensal de inflao. Logo, no se pode garantir que a previso encontrada por este ou aquele mtodo ser sempre boa, tudo depende das caractersticas da srie que est sendo estudada! No entanto, um aspecto deve ser levado em conta ao

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 2

    fazermos previses de sries temporais: o nvel de incerteza aumenta com o horizonte de previso quanto mais longe no futuro, maior a incerteza associada previso. Isto intuitivamente razovel, sempre mais difcil prever o futuro distante, e a nossa previso estar cercada de incertezas! Uma medida do acerto das nossas previses o erro de previso k-passos frente, definido a seguir. Definio 5.1.3. (Erro de Previso k passos frente) O erro de previso k passos frente no instante t (onde k um inteiro maior ou igual a um) definido como a diferena entre o valor real da srie no instante t e a previso deste valor feita k instantes antes, isto :

    ( ) ( )kZZte kttk = Um caso particular importante o erro de previso um passo frente, dado por:

    ( ) ( )1 11 = tt ZZte Um bom modelo de previso produz previses com erro pequeno, e assim interessante acompanhar quantidades como a soma dos quadrados dos erros de previso, ou a soma dos valores absolutos dos erros de previso. E como funcionam estas ferramentas quantitativas que nos permitem prever o futuro de uma srie temporal? Vamos utilizar o passado (dados histricos) para descrever a trajetria mais provvel da srie no futuro. Isso no uma bola de cristal! Na maioria dos problemas o passado traz informaes relevantes sobre o que ir ocorrer no futuro, pois

    existe correlao entre as variveis em diversos instantes. claro que o conhecimento do passado no nos diz exatamente como ser o futuro, e ento sempre

    existe incerteza associada s nossas previses ! Mas, podemos ter uma boa idia de quais sero os valores mais provveis no futuro ! Ou seja, podemos especificar previses futuras e limites de confiana. Por que usar previses quantitativas, baseadas em modelos estatsticos? As previses quantitativas, baseadas em modelos estatsticos, so importantes pois podem ser reproduzidas, isto : dois analistas diferentes chegam s mesmas concluses se utilizarem o mesmo modelo. Tambm, as previses obtidas por mtodos estatsticos tm uma justificativa terica - o resultado encontrado no baseado apenas em argumentos do tipo : eu acho que..., baseado na minha experincia ... , etc... Finalmente, as previses so obtidas a partir de um modelo, que uma simplificao da realidade. O processo de modelagem nos leva naturalmente a considerar apenas os aspectos essenciais do nosso problema e por si s costuma trazer bastante informao sobre o problema que est sendo tratado. Afinal, o que queremos ao modelar uma srie temporal ? Capturar toda a estrutura de dependncia existente na srie; Logo, nos resduos no deve sobrar estrutura, pois ela j foi captada pelo modelo. Nota: o resduo

    apenas a diferena entre o valor real e o ajustado por um modelo qualquer. Por exemplo, seja Zt o valor

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 3

    real da srie no instante t, e seu valor ajustado pelo modelo. Ento, o resduo no instante t apenas Z

    tZ

    t - . tZ Em particular, se o modelo bom, os resduos no devem apresentar correlao serial (isto ,

    correlao entre os resduos em diferentes instantes de tempo); Explicar o comportamento da srie com o menor nmero de parmetros (parcimnia). Dica Prtica .... Por onde comear Em geral, a primeira coisa que fazemos ao estudar uma srie temporal construir um grfico para mostrar a sua evoluo ao longo do tempo. Este procedimento simples costuma ser bastante esclarecedor, e nos permite identificar como evolui a tendncia da srie, se existe ou no sazonalidade, se ocorrem observaes aberrantes, etc ... Logo, a minha sugesto : sempre comece a sua anlise da maneira mais simples faa o grfico da srie de interesse! Sries temporais ocorrem com enorme freqncia na prtica. No quadro a seguir exibimos os grficos de algumas sries temporais reais. Quadro 5.1.1. - algumas sries temporais Preos Mensais Internacionais de Celulose em US$ fixos

    Vendas Mensais de Refrigerantes em embalagens de 290 ml

    350.00

    450.00

    550.00

    650.00

    750.00

    850.00

    950.00

    1050.00

    jan-78jan-79jan-80jan-81jan-82jan-83jan-84jan-85jan-86jan-87jan-88jan-89jan-90jan-91jan-92jan-93jan-94jan-95jan-96jan-97

    V E N D AS - E M BA LAG E N S 2 9 0 ml

    m s e a no

    0

    50

    100

    150

    200

    250

    300

    g ua 290

    lim290

    la ra nj290

    Temperatura Mxima Mensal no Rio de Janeiro (mdia das mximas dirias)

    Preos de Ttulos da Dvida Externa do Brasil, Argentina e Mxico

    20.0022.0024.0026.0028.0030.0032.0034.0036.0038.00

    Legend

    BRPRECARGPRECMEXPREC

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 4

    Consumo Mdio de Energia Eltrica Inflao Mensal do Rio de Janeiro Consumo Mdio de Energia Eltrica

    150160170180190200210220230

    Jan-

    89

    Jun-

    89

    Nov

    -89

    Apr-9

    0

    Sep-

    90

    Feb-

    91

    Jul-9

    1

    Dec

    -91

    May

    -92

    Oct

    -92

    Mar

    -93

    Aug-

    93

    Jan-

    94

    Jun-

    94

    Nov

    -94

    Inflao Mensal no Rio de Janeiro

    -20%

    0%

    20%

    40%

    60%

    80%

    100%

    Jan- 88 Jun- 89 N

    ov-

    90 Apr-

    92 Sep- 93 Feb-

    95 Jul-

    96

    IPC

    -RJ

    (FG

    V)

    Podemos fazer uma distino bsica entre duas grandes classes de modelos: Modelos Univariados: a srie temporal explicada (prevista) apenas pelos seus valores passados; Modelos Multivariados ou Causais: a srie temporal explicada (prevista) pelos seus valores

    passados e tambm pelos valores passados de outras variveis. Neste captulo consideraremos apenas modelos univariados. Exemplo 5.1.3. (Alguns Modelos Univariados) i) Naive (ingnuo) A previso de ZT+1 (valor da srie no instante T +1) apenas a ltima observao (ZT). claro que voc no precisa de um software para ajustar isso e, em alguns casos, o nico mtodo disponvel. Um exemplo clssico a previso do preo de uma ao - geralmente a melhor previso para o preo de amanh o preo de hoje, o que certamente frustrante! ii) Mdias mveis de tamanho N

    A cada instante, a previso apenas a mdia das ltimas N observaes. Um dos problemas com este mtodo a escolha de N, o tamanho da janela a ser utilizado. Quanto maior o valor de N, mais suave a previso. Ao contrrio, se N pequeno, a previso tende a ser meio nervosa, isto , oscila muito. Uma caracterstica importante do mtodo de mdias mveis : todas as observaes usadas para o clculo tm o mesmo peso (que 1/N). Mas, na prtica razovel supor que as observaes mais recentes sejam mais relevantes para a previso dos prximos valores da srie, e portanto deveriam receber um peso maior que as observaes mais antigas. Esta idia de pesar ou ponderar as observaes de acordo com as suas idades leva aos diversos mtodos de amortecimento exponencial. iii) Amortecimento Exponencial (Exponencial Smoothing)

    Existem inmeras variaes destes mtodos, para sries sazonais e no sazonais. A idia geral parecida com a do mtodo de mdias mveis, mas os pesos das observaes decrescem medida que as observaes esto mais longe no passado. A taxa de decrscimo do(s) peso(s) determinada por uma ou mais constantes de amortecimento. A maior dificuldade na aplicao escolher a(s) constante(s) de amortecimento, mas alguns softwares j ajustam os modelos de amortecimento automaticamente com constantes de amortecimento otimizadas.

    M. Barros Consultoria Ltda.

    e-mail: [email protected]

    [email protected]

  • 5

    Na prtica, os mtodos de amortecimento so os mtodos de previso mais usados no dia a dia das empresas, o que em parte explicado pela sua facilidade de implementao e capacidade em gerar boas previses. iv) Modelos ARIMA de Box e Jenkins

    So modelos mais sofisticados, que usam as correlaes entre as observaes em diversos instantes. A idia por trs dos modelos ARIMA envolve filtros lineares e algum conhecimento de Teoria de Sistemas til. A identificao da estrutura do modelo um pouco complicada, mas alguns softwares j identificam automaticamente a estrutura do modelo ARIMA, evitando o passo mais complicado da anlise. Como casos particulares dos modelos ARIMA temos os processos AR (Autoregressivo) e MA (Mdias mveis ou moving average), j estudados brevemente no captulo 2. Os modelos ARIMA costumam apresentar melhores resultados que os mtodos de amortecimento quando a srie relativamente longa e bem comportada. Se a srie muito irregular, os resultados so, geralmente, inferiores aos obtidos por mtodos de amortecimento. Existem tambm modelos ARIMA multivariados, geralmente chamados de modelos de funo de transferncia, mas eles no sero estudados aqui. Decomposio de uma srie temporal A maneira tradicional de analisar uma srie temporal atravs da sua decomposio nas componentes de tendncia, ciclo e sazonalidade. A tendncia de uma srie indica o seu comportamento de longo prazo, isto , se ela sobe, desce, ou permanece estvel, e qual a velocidade destas mudanas. Nos casos mais comuns trabalhamos com tendncia constante, linear ou quadrtica, como mostrado na prxima figura. Quadro 5.1.2. Tendncia de uma srie Tendncia Constante Tendncia Linear Tendncia Quadrtica

    A sazonalidade indica a repetio de um padro na srie dentro do perodo de um ano. Por exemplo, vendas de sorvete so altas no vero e baixas no inverno. No quadro 5.1.1., as sries de temperatura, consumo de energia eltrica e vendas de refrigerantes so claramente sazonais, mas no se pode dizer o mesmo das outras sries. Os ciclos indicam padres que se repetem na srie em perodos superiores a um ano. Por exemplo, ciclos relacionados atividade econmica ou ciclos meteorolgicos.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 6

    Caractersticas de uma srie temporal e estimadores Um processo estocstico estacionrio de 2 ordem pode ser descrito (no domnio do tempo) por sua mdia, varincia e funo de autocovarincia (ou de autocorrelao). Na prtica no conhecemos totalmente o processo estocstico que gerou a srie que est sendo observada, e estas quantidades (mdia, varincia, autocorrelao) devem ser estimadas a partir da srie temporal, como indicado no captulo 2. 5.2. Mtodos de Amortecimento Exponencial (sries no sazonais) Existem inmeras variaes de mtodos de amortecimento exponencial. Todas elas, na verdade, tm uma caracterstica comum: a informao atual (representada pelo ltimo valor observado) ponderada com a informao contida nos instantes anteriores. A existncia de uma ou mais constantes de amortecimento ir determinar como funciona este mecanismo de ponderao ou, em outras palavras, o quo rapidamente decai a influncia das observaes passadas. Os parmetros do modelo sofrem uma atualizao seqencial, e a chegada de uma nova observao resulta numa nova estimativa dos parmetros. Nesta seo estudamos diversos mtodos de amortecimento exponencial para sries no sazonais. A extenso destes mtodos para sries sazonais mostrada na prxima seo. Os mtodos de amortecimento exponencial so formas at certo ponto arbitrrias de representar uma srie temporal, mas so muito importantes na prtica, pois geralmente produzem previses razoveis a partir de um esforo computacional baixo. Na verdade, estes mtodos so freqentemente citados como os favoritos dos no especialistas em sries temporais, pela qualidade das previses geradas e facilidade de implementao. Os mtodos de amortecimento mais famosos so: Brown, Holt e Winters. Um ponto potencialmente complicado em todos estes mtodos a escolha da(s) constante(s) de amortecimento, mas na prtica isso no mais problema, j que a maioria dos softwares de sries temporais ajusta modelos com a(s) constante(s) otimizadas.

    Seja (Z Z Z ZT = 1 2, ,..., )T uma srie temporal de tamanho T. Desejamos escrever um modelo geral para explicar o comportamento da srie a cada instante e permitir a produo de previses futuras. Suponha que o modelo geral para uma observao qualquer no instante t genrico : ( )Z tt t= + onde t um rudo aleatrio com mdia zero e varincia constante 2 . O termo (t) representa o nvel mdio da srie, que funo apenas do instante de tempo. Iremos estudar trs casos particulares: (t) constante, uma funo linear e uma funo quadrtica do tempo. A partir das propriedades da mdia e da varincia podemos concluir que: ( ) ( )

    ( )E Z t t

    VAR Zt

    t

    = == =

    para todo

    constante

    1 2 32

    , , ,.... (5.2.1)

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 7

    A seguir derivamos estimadores para os parmetros desconhecidos dos modelos de nvel constante, linear e quadrtico e encontramos as respectivas equaes de previses. Freqentemente iremos supor que os erros 1, 2, ..., T so independentes com uma distribuio de probabilidade conhecida (por exemplo, a Normal) com mdia zero e varincia constante. Das equaes acima fcil ver que a estimao da varincia de Zt (que igual varincia de t) no apresenta grandes dificuldades, basta utilizar os estimadores usuais da varincia de uma amostra aleatria. Por isso, na discusso a seguir, ns nos concentraremos na estimao dos parmetros que definem o nvel mdio da srie. 5.2.1. Modelo Constante (Horizontal) Este um modelo apropriado quando a srie temporal apenas oscila em torno de um valor constante, sem exibir tendncia de crescimento ou queda. A funo nvel mdio dada por: (t) = a1 para todo instante t = 1, 2, 3, ....., T.

    Neste modelo necessrio estimar apenas 2 parmetros: a1 (o nvel mdio da srie) e 2 (a varincia da srie). A previso k passos frente obtida no instante T :

    )(}|{}|{)( 11 TaZaEZZEkZ TkTTkTT =+== ++ (5.2.2) Logo, se conhecermos um estimador do parmetro a1 poderemos encontrar as previses pontuais para qualquer horizonte de tempo k. E como podemos estimar a constante a1 (nvel mdio da srie)? Existem diversas possibilidades, mostradas a seguir. Modelo Constante - Estimao do nvel mdio da srie 1) Estimador ingnuo (naive) ( ) TZTa =1 onde ZT indica a ltima observao disponvel.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 8

    2) Estimador Mdias Mveis de tamanho N O nvel mdio da srie num certo instante estimado como a mdia mvel de tamanho N usando as observaes ZT, ZT-1, ..., ZT-N+1, isto :

    NZZZ

    MTa TTNTT+++== + 111 ...)(

    (5.2.3) Uma questo crucial neste caso definir qual o tamanho da janela a ser usada, isto , quantas observaes sero utilizadas no clculo da mdia mvel. Note que, se N = 1, apenas a ltima observao usada, e o mtodo se reduz ao mtodo ingnuo. Por outro lado, se N = T (tamanho da srie), temos o chamado mtodo conservador, em que todas as observaes disponveis so empregadas na estimao do nvel mdio da srie, e ( ) ZT =1a , a mdia amostral da srie. O tamanho da janela utilizada (N) pode ser escolhido como aquele inteiro positivo que minimiza a soma de quadrados dos erros de previso 1 passo frente, isto , escolhe-se N de forma a minimizar:

    S N e tt

    T

    ( ) ( )==

    121

    3) Estimador pelo Mtodo de Amortecimento Exponencial Note que o estimador do nvel da srie produzido pelo mtodo de mdias mveis pode ser escrito como:

    NZZ

    MN

    ZZZMTa NTTT

    TTNTT

    + +=+++== 1111 ...)( (5.2.4)

    Onde MT-1 a mdia mvel de tamanho N calculada no instante anterior. Em outras palavras, o estimador do nvel envolve uma informao atual (representada por ZT, o ltimo valor observado da srie) e uma informao passada (MT-1 e ZT-N). O mtodo de amortecimento exponencial estende esta idia de ponderao da informao presente e passada. Na equao (5.2.4) substitua ZT-N por MT-1. Isso nos leva ao seguinte estimador:

    11

    11111)(

    +

    =+= TTTTT MNZNN

    MNZMTa

    Ou seja, este novo estimador tem a forma: (peso)*(informao atual) + (1 peso)*(informao passada). Note que 1 (T) a previso do nvel da srie efetuada no instante atual T e podemos reescrever esta ltima equao como:

    ( )1111111)( 111

    +

    =

    +

    = TaNZNMNZNTa TTT onde 1 (T 1) a mdia mvel de tamanho N calculada at (inclusive) a observao T-1, ou seja, a estimativa prvia do nvel da srie, Em outras palavras: a previso atual do nvel (dada por 1 (T) )

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 9

    baseada na ponderao do valor mais recente da srie (ZT) e da ltima previso para o nvel (1 (T 1)). Uma forma mais geral de definir um estimador com esta caracterstica de ponderao das informaes passadas e presentes : ( ) ( ) ( )11.)1( 111 +=+== TaZMZMTa TTTT (5.2.5) onde [0, 1] a constante de amortecimento, que controla a taxa de decaimento da informao. A equao (5.2.5) apresenta algumas caractersticas interessantes:

    1) bastante econmica do ponto de vista computacional, pois preciso guardar, a cada instante, apenas o ltimo valor observado e a estimativa anterior do nvel, isto , no precisamos guardar todos os valores anteriores da srie temporal para gerar a previso do nvel;

    2) o mtodo funciona bastante bem, desde que a srie no apresente uma tendncia. Ao rearranjar os termos da equao (5.2.5) e encontramos: ( ) ( ) ( )( 11)1( 1111 )+=+= TaZTaMZTa TTT (5.2.6) A expresso (5.2.6) freqentemente conhecida como forma de correo do erro. Nela, o mecanismo de atualizao da previso do nvel fica explcito: o nvel estimado num instante T igual ao nvel estimado no instante anterior mais um mltiplo do erro de previso um passo frente cometido no instante anterior (que ZT 1(T-1)). Seja eT-1 o erro de previso um passo frente no instante T-1, isto : eT-1 = ZT 1(T-1) e ento podemos rearranjar os termos e escrever: ZT = eT-1 + 1(T-1). Se aplicarmos a equao (5.2.6) previso do nvel no instante T + 1 encontramos: ( ) ( ) ( )( ) ( ) TTTT eTaTaZTaMZTa .)1(1 111111 +=+=+=+ ++ Da: ( )( ) ( )( ) ( ) ( )( ) ( ) TTTTTTTTTTT eeeeeTaTaeeTaeTaeZZ .1.11 111111111 +=+=+=++= +++++ Esta expresso no til do ponto de vista preditivo, pois o lado direito contm os outputs (erros de previso um passo frente) enquanto o dado esquerdo contm os inputs (observaes). Mas, esta expresso importante em termos estruturais, pois se os es (erros de previso um passo frente) so substitudos por choques aleatrios, o modelo resultante um ARIMA (0,1,1), que ser estudado na prxima seo. Num modelo ARIMA(0,1,1) o mtodo de amortecimento exponencial simples estudado aqui fornece previses timas. Por substituies sucessivas na equao (5.2.5) encontramos: MT = ZT + (1-) ZT-1 + (1-)2 ZT-2 + ... + (1-)T-1 Z1 (5.2.7) Esta ltima equao mostra claramente como funciona o mtodo de amortecimento exponencial: cada estimativa do nvel (dada por MT) uma soma ponderada da observao atual (ZT) e das observaes

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 10

    passadas. Os pesos decrescem exponencialmente, e a taxa de decaimento dos pesos depende da constante . Qual o efeito da constante de amortecimento ? Note que, da equao (5.2.7), o peso da observao ZT-k (1-)k (para k = 0, 1, 2, ...). Logo, a razo entre os pesos da observao ZT-k e da observao atual (ZT) (1-)k . Se grande (prximo de 1) os pesos decaem rapidamente, e uma observao que est longe no passado no tem qualquer influncia sobre a estimativa atual do nvel, que estimado usando quase exclusivamente as observaes mais recentes. Ao contrrio, se pequeno (por exemplo, menor que 0.3), uma observao longe no passado pode ainda ter uma influncia considervel na estimao do nvel feita hoje. A tabela a seguir apresenta alguns valores de e a meia vida das observaes, isto , quantas defasagens so necessrias at que o peso da observao se reduza metade. A meia vida das observaes encontrada resolvendo a seguinte equao para k (o lag):

    ( ) ( ) ( ) ( )

    ====

    1log)2log(2log1log.

    211

    21

    de peso de peso kkZZ k

    T

    kT onde log(.) indica o

    logaritmo natural. Como k indica uma defasagem, deve-se escolher o valor k inteiro no negativo que satisfaz (aproximadamente) esta equao. Tabela 5.2.1. Meia Vida das Observaes como Funo de

    nmero de "lags" at o peso cair pela metade

    0,99 0,15

    0,95 0,23

    0,90 0,30

    0,80 0,43

    0,70 0,58

    0,60 0,76

    0,50 1,00

    0,45 1,16

    0,40 1,36

    0,35 1,61

    0,30 1,94

    0,25 2,41

    0,20 3,11

    0,15 4,27

    0,10 6,58

    0,05 13,51

    0,02 34,31

    0,01 68,97 Por exemplo, se = 0,02, a observao situada h 34 lags contm aproximadamente metade da informao do dado atual. Se = 0,05, so necessrias cerca de 14 defasagens at que o peso da observao caia pela metade.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 11

    Nota: reparametrizao Em alguns livros encontra-se o mtodo de amortecimento escrito de maneira diferente. Seja = 1- na equao (5.2.7). Em termos de esta equao torna-se: MT = (1-)ZT + (1-) ZT-1 + 2(1-) ZT-2 + ... + T(1-)Z1 (5.2.8) Logo, o peso da observao atual (1-) e o da k-sima observao no passado k (1-). Nesta parametrizao, valores altos de indicam que a memria do processo relativamente longa, ou seja, a influncia das observaes passadas demora a decair. Exemplo 5.2.1. A tabela a seguir exibe os primeiros valores da srie temporal: Zt = 2 + et onde os et s so rudos iid com distribuio Normal de mdia 0 e desvio padro . Supomos que em t = 0, Z0 = 0 (apenas para permitir a inicializao do processo), e o objetivo aqui demonstrar a estimao seqencial de a1 por amortecimento exponencial e mdias mveis (de tamanho 2, 3 e 4). Note que, dependendo da escolha da constante de amortecimento (ou da janela utilizada na mdia mvel), a estimativa do nvel mais ou menos nervosa (e oscila mais ou menos medida que recebemos cada valor da srie). Verifique os valores estimados para o nvel da srie. Faa (em casa) o grfico da evoluo no nvel estimado ao longo do tempo para todos os mtodos indicados.

    Instante t Erros (e(t)) Srie (Z(t)) Estimador

    MM(2) Estimador

    MM(3) Estimador

    MM(4)

    Estimador Amort. Expo.

    (Alfa = 0.2)

    Estimador Amort. Expo.

    (Alfa = 0.3) 1 -1,512 0,488 0,244 0,098 0,147

    2 0,080 2,080 1,284 0,856 0,494 0,692

    3 -0,433 1,567 1,824 1,379 1,034 0,709 0,816

    4 0,437 2,437 2,002 2,028 1,643 1,054 1,227

    5 0,107 2,107 2,272 2,037 2,048 1,265 1,370

    6 -0,025 1,975 2,041 2,173 2,021 1,407 1,478

    7 -0,192 1,808 1,891 1,963 2,082 1,487 1,527

    8 0,629 2,629 2,219 2,137 2,130 1,716 1,830

    9 0,463 2,463 2,546 2,300 2,219 1,865 1,940

    10 0,332 2,332 2,398 2,475 2,308 1,958 2,005

    11 -0,469 1,531 1,931 2,109 2,239 1,873 1,830

    12 0,538 2,538 2,034 2,134 2,216 2,006 2,072

    13 0,277 2,277 2,408 2,115 2,170 2,060 2,087

    14 0,017 2,017 2,147 2,277 2,091 2,052 2,047

    15 -0,256 1,744 1,880 2,013 2,144 1,990 1,959

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 12

    5.2.2. Modelo Linear Esta estrutura adequada quando existe uma tendncia clara de crescimento (ou queda) ao longo do tempo, como indicado na prxima figura. A funo nvel mdio dada por: (t) = a1 + a2.t para todo instante t = 1, 2, 3, ....., T.

    O modelo linear pode ser escrito como:

    TttaaZ tt ,....,2,1 onde .21 =++= e os t so os erros (choques) aleatrios, supostos independentes e identicamente distribudos com mdia zero e varincia constante 2. Desta expresso (e usando as propriedades da mdia e varincia) segue direto que: ( ) taaZE t .21 += e ( ) ( )tt VARZ == 2VAR (5.2.9) Neste modelo necessrio estimar trs parmetros: a1 (coeficiente linear da srie), a2 (coeficiente angular da reta, ou seja, a taxa de crescimento da srie) e 2 (a varincia da srie). A previso k passos frente obtida no instante T :

    ( ) ( )kTTaTaZkTaaEZZEkZ TTTkTT ++=+++== ++ ).()(}|{}|{)( 2121 (5.2.10) A previso dada pela equao (5.2.10) pode ser escrita de uma forma ligeiramente diferente, desde que faamos uma mudana da origem. Modelo Linear - Estimao dos parmetros a1 e a2 Analogamente ao que fizemos para o modelo constante, a seguir apresentaremos diversos estimadores para os parmetros desconhecidos que descrevem a evoluo do nvel da srie. A partir dos valores estimados de a1 e a2 podemos encontrar a previso de uma observao futura qualquer, apenas aplicando a equao (5.2.10).

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 13

    1) Estimadores de Mnimos Quadrados Ordinrios (MQO) Nosso objetivo encontrar a1 e a2 tais que a seguinte soma seja minimizada:

    2

    121 ])([SSE

    = +=

    T

    tt

    t

    taaZ 44 344 21 (5.2.11)

    SSE chamado de soma dos quadrados dos erros (ou soma do quadrado dos resduos). O mtodo de mnimos quadrados bastante geral, e se aplica estimao de um nmero qualquer de parmetros a1, a2, ..., ak (supe-se que k menor que o tamanho da srie, para permitir a estimao). Considere, de maneira mais geral, um modelo com a seguinte estrutura: ( ) tkt taaafZ += ,,....,, 21 onde f(.) uma funo (possivelmente no linear) do tempo e dos parmetros desconhecidos. Ento a soma dos quadrados dos erros dada por:

    ( )( ) = =

    ==T

    t

    T

    ttkt taaafZSSE

    1 1

    2221 ,,....,,

    O mtodo de mnimos quadrados procura encontrar estimadores dos parmetros desconhecidos de forma a minimizar a soma do quadrado dos erros (SSE). Note que os estimadores por mnimos quadrados encontrados pela minimizao da soma do quadrado dos erros so calculados usando a srie inteira, ou seja, usamos todos os dados disponveis de uma s vez. Ao contrrio, nos mtodos mdias mveis e de amortecimento, a atualizao dos parmetros seqencial, e o recebimento de uma nova observao resulta em novos valores estimados para a1 e a2. 2) Estimadores pelo Mtodo de Mdias Mveis Duplas Defina a mdia mvel dupla de tamanho N como:

    NM...MM

    M 1NT1TT[2]T+ +++=

    (5.2.12) Onde MT a mdia mvel (simples) de tamanho N calculada usando todas as observaes at o instante T (inclusive). Por que usar mdias mveis duplas? Se os dados exibem uma tendncia linear, o uso de mdias mveis simples para a previso dos valores da srie induz a erros sistemticos, pois a mdia mvel simples segue a tendncia com um certo atraso, e este efeito amplificado quando tentamos prever valores futuros. O mtodo de mdias mveis duplas procura diminuir este efeito sistemtico. Pode-se mostrar que:

    )()1()(.)(}E{M

    )(.2

    1)(.)(}E{M

    221[2]T

    221T

    TaNTaTTa

    TaNTaTTa

    +=

    +=

    Resolvendo o sistema anterior para a1 e a2 leva a:

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 14

    { }}{}{

    )1(2)(a

    )(. - }{}{.2)(a

    ]2[2

    2]2[

    1

    TT

    TT

    MEMEN

    T

    TaTMEMET

    ==

    (5.2.13) Se substituirmos os valores esperados de MT e MT[2] na expresso (5.2.13) pelos valores efetivamente observados MT e MT[2] encontramos os estimadores de a1 e a2 com base na srie observada at o instante T, dados por:

    [ ]( ){ }]2[2

    2]2[

    T2 2

    T T1

    )1(2)(a

    )(.2.M)(.- MM )(a

    TT

    TT

    MMN

    T

    TaTMTaTMT

    ==+=

    (5.2.14) O estimador 1(T) encontrado corrigindo-se a mdia mvel simples (MT) pela diferena entre ela e a mdia mvel dupla. Se, na verdade, no existisse uma tendncia linear, o fator de correo seria pequeno. A previso k passos frente no instante T :

    { } +=+==++=++=+

    ]2[]2[2

    ]2[

    222]2[

    21

    12..2)(..2

    )(.)(.)(..2)).(()(

    TTTTTT

    TTkT

    MMN

    kMMTakMM

    TakTaTTaTMMkTTaTaZ

    Expresso alternativa para as equaes de atualizao do mtodo de mdias mveis duplas DeLurgio (1998) prope o uso de uma verso modificada das equaes de atualizao (5.2.14). As novas (e mais simples) equaes de atualizao so: [ ]( )

    { }]2[2]2[

    T 2

    T T1

    )1(2)(a

    2.M MM )(a

    TT

    TT

    MMN

    T

    MMT

    ==+=

    (5.2.15) E a equao de previso k passos frente torna-se:

    { } +=+=+=+ ]2[]2[2]2[21 12..2)(..2)).(()( TTTTTTkT MMNkMMTakMMkTaTaZ Vantagens e Desvantagens deste mtodo a implementao trivial; os estimadores obtidos pelo mtodo no so muito influenciados por outliers; a escolha do nmero timo de lags a serem usados nas mdias mveis simples e duplas no trivial.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 15

    Exemplo 5.2.2. Um ponto importante a ser lembrado quando tratamos de mtodos de mdias mveis : estes procedimentos implicam num conjunto de pesos definidos para as observaes passadas. Isso nos permite compar-los com os mtodos de amortecimento exponencial. Por exemplo, considere um modelo linear onde os parmetros desconhecidos so estimados por mdias mveis simples e duplas de tamanho 3. Como podemos escrever os estimadores em termos dos valores observados da srie? Note que, neste caso, para qualquer instante t maior que 3:

    321 ++= tttt ZZZM

    321]2[ ++= tttt MMMM

    E assim a previso 1 passo frente no instante T (com a origem transladada) :

    ( ) ( )( ) ( )

    ( ) ( ) ( )

    +

    +

    +

    +

    =

    =

    ++++++

    =

    =

    =

    ++==+=

    =+=+=

    +

    4321

    4323212121

    21]2[]2[]2[

    ]2[]2[211

    32

    34

    33

    35

    37

    31

    32

    32

    3.7

    3122

    37

    31

    32.3.2.32

    13221.

    TTTTT

    TTTTTTTTTTTT

    TTTTTTTTTT

    TTTTT

    ZZZZZ

    ZZZZZZZZZMMM

    MMMMMMMMMM

    MMMMTaTaZ

    3) Mtodo de Amortecimento Exponencial Duplo (Mtodo de Brown) Um mtodo semelhante ao anterior o mtodo de amortecimento exponencial duplo, tambm conhecido como mtodo de Brown. Nele, uma nica constante de amortecimento empregada no processo de atualizao de ambos os parmetros a1 e a2. Analogamente ao mtodo de mdias mveis duplas, a componente de tendncia estimada atravs da diferena entre um valor amortecido simples e um duplo. As equaes de atualizao no mtodo de Brown so:

    ]2[1

    [2]T

    1T

    M)1(MM

    M)1(ZM

    +=+=

    TT

    TT

    (5.2.16) onde a constante de amortecimento. Os estimadores de a1 e a2 encontrados pelo mtodo de Brown so:

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 16

    [ ]( )( ){ }]2[2

    ]2[T

    2 T T1

    1)(a

    2.M MM )(a

    TT

    TT

    MMT

    MMT

    ==+=

    (5.2.17) Ou seja, estes estimadores tm a mesma forma que na equao (5.2.15). No entanto, agora MT e MT[2] no mais representam as mdias mveis descritas no tem 5.2.2., e so calculados atravs das equaes (5.2.16). A previso k passos frente no instante T :

    { }kMMMMkTaTaZ TTTTkT .1.2)).(()( ]2[]2[21 +=+=+ (5.2.18) Escolha dos valores iniciais Em todos os mtodos de amortecimento necessrio escolher valores iniciais dos parmetros de forma a inicializar as equaes de atualizao. Algumas escolhas possveis so: M1 = Z1

    ( ) ( )2

    )1(a

    )1(a

    34122

    11

    ZZZZZ

    +==

    Vantagens e Desvantagens do mtodo de Brown modela o nvel e a tendncia da srie; mais eficiente em termos computacionais que as mdias mveis duplas; menos flexvel que o modelo de Holt (a seguir), que usa duas constantes de amortecimento. 4) Mtodo de Holt (2 parmetros) Este mtodo bastante parecido com o anterior, mas agora existem duas constantes de amortecimento diferentes, responsveis pela velocidade de decaimento da informao na estimao dos coeficientes linear e angular, respectivamente. O modelo de Holt implementado atravs das seguintes equaes: ( ) (( )1.1. 21 ++= TaMZM TTT ) ( ) ( ) ( ) ( )1.1. 212 += TaMMTa TT (5.2.19) ( ) TMTa =1 onde e so as constantes de amortecimento.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 17

    Caractersticas importantes do mtodo As constantes de amortecimento usadas para clculo do nvel e tendncia so diferentes; Na equao de atualizao do nvel, o novo nvel funo de 3 variveis: a observao mais recente

    (ZT), a estimativa anterior do nvel (MT-1) e a taxa de crescimento estimada no instante anterior (2 (T-1));

    A taxa de crescimento atualizada funo da taxa de crescimento no instante anterior e tambm depende da diferena entre os nveis nos instantes T-1 e T.

    Escolha dos valores iniciais Possveis escolhas so:

    ( ) ( )2

    )1(a

    )1(a

    34122

    11

    ZZZZZ

    +==

    Vantagens e Desvantagens do mtodo de Holt modela o nvel e a tendncia da srie; mais flexvel que o mtodo de Brown, pois usa constante de amortecimento separadas para o nvel e

    a tendncia; a contrapartida deste ganho em flexibilidade a existncia de um parmetro adicional a ser otimizado, o

    que dificulta o processo de otimizao. Exemplo 5.2.3. Considere uma srie temporal puramente determinstica, Zt = 2 + 3.t. A tabela a seguir exibe alguns valores da srie e as previses um passo frente de Zt usando: 1) uma mdia mvel simples de tamanho 3, 2) a mdia mvel simples e a mdia mvel dupla, como na equao (5.2.15). Verifique os valores encontrados na tabela, e note que o erro da previso um passo frente obtida atravs da equao (5.2.15) nulo em todos os instantes.

    Instante t

    Srie Z(t) (puramente

    determinstica) MM(3)

    Previso 1 passo

    frente de Z(t) usando MM(3)

    Erro de Previso 1

    passo frente

    usando MM(3) MM Dupla (3)

    Diferena entre MM(3) e MM Dupla

    (3)

    Previso 1 passo frente

    = MM(3) + (MM(3)-

    MMDup(3)) + tendncia

    Erro de Previso 1 passo frente

    usando MM Dupla

    1 5,00 2 8,00 3 11,00 8,00 4 14,00 11,00 8,00 6,00 5 17,00 14,00 11,00 6,00 11,00 3,00 6 20,00 17,00 14,00 6,00 14,00 3,00 20,00 0,00 7 23,00 20,00 17,00 6,00 17,00 3,00 23,00 0,00 8 26,00 23,00 20,00 6,00 20,00 3,00 26,00 0,00 9 29,00 26,00 23,00 6,00 23,00 3,00 29,00 0,00

    10 32,00 29,00 26,00 6,00 26,00 3,00 32,00 0,00 11 35,00 32,00 29,00 6,00 29,00 3,00 35,00 0,00 12 38,00 35,00 32,00 6,00 32,00 3,00 38,00 0,00 13 41,00 38,00 35,00 6,00 35,00 3,00 41,00 0,00 14 44,00 41,00 38,00 6,00 38,00 3,00 44,00 0,00 15 47,00 44,00 41,00 6,00 41,00 3,00 47,00 0,00

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 18

    Exemplo 5.2.4. Considere o exemplo anterior, mas agora adicione um erro aleatrio Zt. O modelo gerador destes dados : Zt = 2 + 3.t + et onde os ets so rudos aleatrios independentes Normais, com mdia zero e varincia . Refaa o exemplo anterior e note que os erros de previso um passo frente usando mdias mveis simples so consideravelmente maiores que os erros encontrados quando usamos a equao (5.2.15) para prever Zt. Calcule a soma do quadrado dos erros de previso um passo frente segundo os dois mtodos.

    Instante t Erros (e(t)) Srie (Z(t)) MM(3)

    Previso 1 passo frente de Z(t) usando

    MM(3)

    Erro de Previso 1

    passo frente

    usando MM(3) MM Dupla (3)

    Diferena entre MM(3) e MM Dupla (3)

    Previso 1 passo frente =

    MM(3) + (MM(3)-

    MMDup(3)) + tendncia

    Erro de Previso 1

    passo frente

    usando MMDupla

    1 -0,150 4,850

    2 -0,639 7,361

    3 0,122 11,122 7,778

    4 0,638 14,638 11,041 7,778 6,861

    5 0,599 17,599 14,453 11,041 6,559 11,090 3,363

    6 0,867 20,867 17,701 14,453 6,413 14,398 3,303 21,179 -0,31

    7 -1,092 21,908 20,125 17,701 4,207 17,426 2,698 24,307 -2,40

    8 -0,117 25,883 22,886 20,125 5,758 20,237 2,649 25,521 0,36

    9 0,548 29,548 25,780 22,886 6,662 22,930 2,850 28,183 1,36

    10 -0,543 31,457 28,962 25,780 5,677 25,876 3,086 31,479 -0,02

    11 -0,345 34,655 31,886 28,962 5,693 28,876 3,010 35,135 -0,48

    12 -0,845 37,155 34,422 31,886 5,268 31,757 2,665 37,907 -0,75

    13 -0,923 40,077 37,295 34,422 5,654 34,535 2,761 39,752 0,32

    14 -0,489 43,511 40,248 37,295 6,216 37,322 2,926 42,817 0,69

    15 -0,387 46,613 43,400 40,248 6,366 40,314 3,086 46,099 0,51 Exemplo 5.2.5. No grfico a seguir mostramos o consumo comercial de energia eltrica anual no Brasil no perodo 1963 a 1998, e os resultados do ajuste de um modelo de Holt srie.

    Componente Constante de Amortecimento

    Valor Final

    Nvel 0.8086 41539 Tendncia 0.9994 3536

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 19

    Consumo Comercial (GWh)

    0

    5,000

    10,000

    15,000

    20,000

    25,000

    30,000

    35,000

    40,000

    45,000

    1963 1965 1967 1969 1971 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999

    As previses geradas pelo modelo para o perodo 1999-2002 so indicadas a seguir, assim como os respectivos erros de previso em 1999 e 2000.

    Ano Limite Inferior Previso

    (2.5%)

    Previso Limite Superior Previso (97.5%)

    Valor Real Erro Percentual

    Absoluto de Previso

    1999 42,949 45,074 47,199 43,583 3.4% 2000 44,570 48,610 52,650 47,365 2.6% 2001 46,842 52,145 57,448 2002 49,362 55,681 62,000

    5.2.3. Modelo Quadrtico A funo nvel mdio dada por (t) = a1 + a2t + a3t2 para t = 1, 2, ...T. Agora existem trs parmetros a serem estimados para o nvel, a1, a2 e a3. Supondo que o modelo tem a forma:

    22321 )( ,0)( e ,....,2,1 onde .. ===+++= tttt VARETttataaZ segue que:

    E(Zt) = (t) = a1 + a2t + a3t2 e VAR(Zt) = 2 = constante. O modelo quadrtico se aplica a sries que tm o comportamento indicado na figura a seguir.

    A previso k passos frente no instante T dada por:

    M. Barros Consultoria Ltda.

    e-mail: [email protected]

    [email protected]

  • 20

    (T)a .+(T)a.+(T)a=

    0)=T fazendo , isto da, transladaorigem a (com },....,,|a.E{a=

    },....,,|{)(

    32

    21

    212

    321

    21

    kk

    ZZZkka

    ZZZZEkZ

    T

    TkTT

    ++== +

    Analogamente aos modelos constante e linear, existem diversos mtodos para a estimao dos parmetros que especificam o nvel da srie. Aqui, ao contrrio dos casos anteriores, no iremos exibir em detalhes as equaes de atualizao. 1) Estimadores de Mnimos Quadrados Ordinrios (MQO) Devemos encontrar os estimadores de a1, a2 e a3 que minimizem:

    2

    1

    2321 ]).([SSE

    = ++=

    T

    tt

    t

    tataaZ 444 3444 21

    2) Mdias Mveis Triplas Defina a mdia mvel tripla de tamanho N avaliada no instante T como:

    ...

    M]2[

    1]2[1

    ]2[[3]T N

    MMM NTTT + +++= (5.2.20)

    Onde MT[2] a mdia mvel dupla de tamanho N avaliada no instante T. Os estimadores dos parmetros do modelo so obtidos como funes das mdias mveis simples, dupla e tripla.

    3 2, 1,=i ; ] , ,[ )( ]3[]2[ii TTT MMMfTa = 3) Amortecimento Exponencial

    ]3[1

    ]3[]3[

    ]2[1

    ]2[1

    )1(

    )1(

    )1(

    +=+=

    +=

    TTT

    TTT

    TTT

    MMM

    MMM

    MZM

    Onde [0,1] a nica constante de amortecimento usada para atualizar todas as mdias mveis. Os estimadores dos parmetros a1, a2 e a3 (correspondentes origem transladada para o instante T) no instante T so obtidos atravs das equaes:

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 21

    ( )( ) )(.2

    21)(1)( 3221 TaTaTaMT

    +

    =

    ( )( ) )(.2

    2312)(12)( 3221]2[ TaTaTaMT

    +

    = ( )( ) )(

    .2341.3)(13)( 3221

    ]3[ TaTaTaMT

    +

    =

    5.3. Mtodos de Amortecimento Exponencial (sries sazonais) Sries sazonais ocorrem com enorme freqncia na prtica. Por exemplo, sries de temperatura mdia mensal e sries de consumo de energia eltrica so claramente sazonais, e exibem caractersticas que se repetem ano a ano sempre no mesmo ms (ou semana, ou trimestre, ...). No caso de sries de consumo de energia no Brasil, existe um ntido aumento de consumo nos meses de vero, devido s elevadas temperaturas e ao uso de ar refrigerado. Entender a sazonalidade de uma srie fundamental no apenas para gerar previses consistentes, mas tambm para propor polticas governamentais ou empresariais. Por exemplo, o horrio de vero no Brasil conseqncia direta do aumento de consumo observado neste perodo, e tem o objetivo de reduzir o consumo e evitar black-outs cujas conseqncias em termos econmicos poderiam ser dramticas. A sazonalidade pode ser modelada de duas formas: atravs de fatores sazonais ou atravs de funes trigonomtricas. Aqui estaremos interessados apenas na modelagem atravs de fatores sazonais. As tcnicas j estudadas de amortecimento exponencial podem ser estendidas para modelar sries que apresentam tendncia e sazonalidade. Um dos modelos mais utilizados na prtica (especialmente em empresas) o modelo de amortecimento exponencial de Holt e Winters. Este procedimento capaz de modelar sries sazonais e gera, na maioria dos casos, boas previses, a um custo computacional bastante baixo. O modelo de Holt e Winters utiliza a idia de amortecimento das informaes passadas trs vezes para:

    estimar o nvel da srie; estimar a taxa de crescimento da srie; estimar os fatores sazonais.

    Em cada um dos passos indicados emprega-se uma constante de amortecimento diferente. Seja S o perodo sazonal, por exemplo, S = 12 no caso de dados mensais, S = 4 no caso de observaes trimestrais. Na discusso a seguir iremos nos referir, com freqncia, ao ms t, mas todos os resultados se aplicam a perodos arbitrrios, e no se referem exclusivamente a dados mensais. Denote por t o fator sazonal correspondente ao ms t, onde t = 1, 2, ...S. Existem dois tipos de modelos para a sazonalidade: modelos aditivos e multiplicativos. Nos modelos aditivos, o padro sazonal no se altera medida que o nvel da srie muda. Ao contrrio, nos modelos multiplicativos, a sazonalidade da srie afetada pelo nvel da mesma, como indicado nos grficos a seguir.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 22

    MODELO ADITIVO MODELO MULTIPLICATIVO Zt = (t) + t + t Zt = (t) . t . t ou Zt = (t) . t + t

    5.3.1. Modelo Horizontal (constante) Sazonal Multiplicativo Neste caso o nvel da srie ((t)) uma constante, e a estrutura do modelo : Zt = a1. t + et (5.3.1) Neste caso precisamos estimar o nvel da srie (a1) e os fatores sazonais t para todos os meses t. Note que, no caso de dados mensais, precisamos estimar 12 fatores sazonais e o nvel, ou seja, existem 13 parmetros a serem estimados. No caso de dados trimestrais, existem 4 fatores sazonais (e tambm o nvel), o que resulta na estimao de 5 parmetros. Na verdade, se S o perodo sazonal, existem S fatores sazonais a serem estimados, mas a soma destes fatores est sujeita a uma restrio, e na prtica o nmero de fatores sazonais a serem estimados S 1. Logo, na prtica, no modelo mensal devemos estimar 11 fatores sazonais (pois o remanescente obtido a partir da restrio). A previso k passos frente feita no instante T dada por:

    ( ) ( ) .}|{)( 1 TTaZZEkZ kTTkTT ++ == (5.3.2) importante conhecer o significado dos estimadores de a1 e t na equao (5.3.2). ( )Ta1 indica o estimador do nvel da srie usando todas as observaes at o instante T (inclusive), ou seja, a estimativa mais atualizada do nvel da srie. ( )TkT + o estimador do fator sazonal correspondente ao ms T + k no futuro efetuado usando todas as observaes at o instante T (inclusive). Ou seja, ( )TkT + a estimativa mais atualizada do fator sazonal que corresponde ao ms T + k. Os parmetros do modelo so atualizados seqencialmente da forma indicada a seguir. Suponha que, para um instante genrico T, as estimativas de a1 e do fator sazonal para o instante anterior esto disponveis

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 23

    (isto , so conhecidas), ou seja, )1(1 Ta e )1( )( TTm so dados, onde m(T) o ms correspondente ao instante T. Ento, os parmetros atualizados no instante T so encontrados a partir das seguintes frmulas:

    )1().1()1(

    )( 1)(

    1 +

    = TaTZTaTm

    T (5.3.3)

    )1().1()(

    )( )(1

    )( +

    = TTaZT TmTTm (5.3.4)

    Note que, nas equaes (5.3.3) e (5.3.4) so usadas duas constantes de amortecimento diferentes, uma para o nvel e outra para o fator sazonal. Alm disso, uma caracterstica importante da atualizao do fator sazonal : ele s muda quando recebemos uma informao referente ao ms m(T). Por exemplo, o fator sazonal referente ao ms de maio s atualizado quando recebemos uma informao relativa a este ms. Ou seja:

    )( e ,...,2,1 para )1()( TmjSjTT jj == Em seguida, os fatores sazonais estimados so normalizados, de tal forma que a sua soma seja igual ao perodo sazonal (S). Esta condio de normalizao vlida para fatores sazonais multiplicativos. No caso de fatores aditivos, sua soma (para todos os meses) zero.

    =

    =S

    jj ST

    1)(

    (5.3.5) necessrio fornecer estimativas iniciais do nvel e dos fatores sazonais. O procedimento de inicializao descrito brevemente a seguir. 1 PASSO: Clculo das Mdias Anuais Ano 1 Z1 Z2 ... ZS Mdia do Ano 1 Z (1) Ano 2 ZS+1 ZS+2 ... Z2S Mdia do Ano 2 Z ( )2 . . ... . J = T/S Ano J ZJS -(S-1) ZJS -(S-2) ... ZJS Mdia do Ano J )(JZ

    2 PASSO: Clculo dos fatores sazonais grosseiros Ci

    C ZZ1

    1

    1)=

    (

    ... C Z

    ZSS=(1)

    ... ... ...

    CZZJS SJS S

    J

    =( (( )

    1)1)

    ... C Z

    ZJSJS

    J=

    ( )

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 24

    O fator sazonal grosseiro para o ms i apenas a observao Zi dividida pela mdia do ano correspondente. Este procedimento simples funciona bem desde que a srie no apresente componente de tendncia, Do contrrio, se existe tendncia, as estimativas dos fatores sazonais encontradas por este mtodo iro conter componentes de tendncia, e as previses resultantes sero prejudicadas. Note que, neste passo, encontramos J (um para cada ano em que existem dados) fatores sazonais para cada ms. No passo seguinte tomamos a mdia destes J fatores para obter um nico fator sazonal para o ms i. 3 PASSO: Clculo dos fatores sazonais "suaves" Os fatores sazonais para cada um dos meses so encontrados atravs da mdia dos fatores encontrados no passo anterior, isto :

    C C C C

    C C C C J

    S JS S

    S S S JS

    1 1 1 1)

    2

    *(

    *

    [ ... ] /

    [ ... ] /

    = + J+ +

    = + + +

    +

    . . . . .

    Por exemplo, o fator sazonal correspondente ao ms 1 a mdia dos fatores sazonais previamente estimados para os meses 1, 13, 25, 37, .... 4 PASSO: Normalizao dos fatores sazonais "suaves" A partir dos fatores sazonais suaves encontrados no passo anterior, calcula-se os fatores sazonais normalizados simplesmente aplicando a restrio de que a soma dos fatores sazonais deve ser igual a S (perodo sazonal). Ou seja, o fator sazonal normalizado correspondente ao ms i apenas:

    ( ) *1

    *.0 iS

    ii

    i CC

    S

    =

    = onde C o fator sazonal suave calculado no passo anterior. *i

    5 PASSO: Obteno da estimativa inicial do nvel A partir dos fatores sazonais normalizados ( )0 i encontrados no passo anterior, e supondo que o nvel inicial estimado seja igual mdia do primeiro ano de dados, ( )11 )0( Za = , pode-se inicializar o processo de estimao. Em seguida usa-se as equaes (5.3.3) e (5.3.4) para obter as estimativas do nvel e fatores sazonais em cada instante. 5.3.2. Modelo Linear Sazonal Multiplicativo Neste caso o nvel da srie ((t)) uma funo linear, e a estrutura do modelo : Zt = (a1 + a2. t).t + et (5.3.6)

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 25

    Neste caso precisamos estimar o nvel da srie (a1), sua taxa de crescimento (a2) e os fatores sazonais t para todos os meses t. A atualizao de parmetros feita seqencialmente, pelo mtodo de Holt-Winters descrito a seguir. Suponha que no instante T-1 conhecemos as estimativas do nvel, taxa de crescimento e fatores sazonais dadas por: )1( e )1( ,)1( 21 TTaTa j . O procedimento de atualizao bem semelhante ao apresentado antes (modelo com nvel constante e sazonalidade multiplicativa). A grande diferena em relao ao modelo da seo 5.3.1. que agora temos mais uma quantidade a ser atualizada seqencialmente, a taxa de crescimento a2. Atualizao do nvel (a1)

    )]1()1()[1()1(

    )( 21)(

    1 ++

    = TaTaTZTaTm

    T (5.3.7)

    Note que, do lado direito da equao (5.3.7), o termo ( )1 )( TZ

    Tm

    T

    representa a observao do instante T dessazonalizada. Atualizao da tendncia

    )1().1()]1()(.[)( 2112 += TaTaTaTa (5.3.8) A equao de atualizao da tendncia exatamente igual do mtodo de Holt (usado para sries com tendncia linear e sem sazonalidade), como indicado na expresso (5.2.19). Note que o termo

    a diferena entre os nveis estimados nos instantes T e T-1. )1()( 11 TaTa Atualizao dos fatores sazonais (T) j

    )1()1()(

    )(1

    *)( +

    = T

    TaZ

    TmT

    Tm (5.3.9)

    )( ; ,...,2,1 );1()( * TmjSjTT jj == (5.3.10) A atualizao dos fatores sazonais feita apenas no ms correspondente ao fator sazonal que se procura estimar. Logo, pela equao (5.3.10) segue que o fator sazonal permanece fixo at recebermos a informao relativa ao ms atual. Quando esta informao recebida (isto , quando o instante T corresponde ao ms m(T)), o fator sazonal estimado atravs da expresso (5.3.9). Nesta equao nota-se que o fator sazonal correspondente ao ms m(T) atualizado no instante T uma mdia ponderada da estimativa feita no ano passado para o fator deste ms e tambm da observao sem o nvel (dada por

    ( )TaZT1

    ).

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 26

    Normalizao (padronizao) dos fatores sazonais

    ST

    TT S

    jj

    jj .

    )(

    )()(

    1

    *

    *

    =

    =

    O objetivo desta normalizao fazer com que os fatores sazonais encontrados pela equao (5.3.9) tenham soma igual a S (perodo sazonal). A previso k passos frente no instante T obtida substituindo-se os parmetros desconhecidos a1, a2 e por suas estimativas, isto :

    )()](.)([)( )(21 TTakTaTZ kTmkT ++ += (5.3.11) Inicializao do Mtodo A exemplo do que fizemos na seo anterior, aqui encontramos estimativas iniciais para o nvel, taxa de crescimento e fatores sazonais. Sejam )()2()1( ,....,, JZZZ as mdias anuais, onde J o ltimo ano disponvel. A estimativa inicial da taxa de crescimento :

    ( ) ( )SJZZ

    a J1

    0 )1()(2 =

    A estimativa inicial do nvel :

    ( ) ( ) ( )02

    10 2)1(1 aSZa +=

    A estimativa inicial dos fatores sazonais :

    ( ) ( )

    +=

    0.2

    12)( atm

    SZ

    ZC

    i

    tt onde t = 1, 2, ...., JS e i o ano correspondente ao instante t.

    Em seguida o procedimento igual ao da seo anterior. 5.3.3. Modelo Linear Sazonal Aditivo A estrutura do modelo : Zt = a1 + a2t + t + et . A atualizao seqencial dos parmetros anloga s equaes (5.3.7) a (5.3.10), com pequenas modificaes, mostradas abaixo.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 27

    Atualizao do nvel (a1) [ ] )]1()1()[1()1()( 21)(1 ++= TaTaTZTa TmT (5.3.12) Note que, do lado direito da equao (5.3.12), o termo ( )1 )( TZ TmT representa a observao do instante T dessazonalizada. Atualizao da tendncia

    )1().1()]1()(.[)( 2112 += TaTaTaTa (5.3.13) A equao de atualizao da tendncia exatamente igual do modelo multiplicativo e do mtodo de Holt (expresses (5.3.8) e (5.2.19)). Atualizao dos fatores sazonais (T) j [ ] )1()1()( )(1* )( += TTaZ TmTTm (5.3.14)

    )( ; ,...,2,1 );1()( * TmjSjTT jj == (5.3.15) Note que, em (5.3.14), o termo uma medida da variao sazonal dos dados, obtida pela diferena entre a observao atual e a estimativa mais recente do nvel.

    [ )(1 TaZT ] Da equao (5.3.15) conclui-se que as estimativas de cada fator sazonal s so atualizadas uma vez a cada ano, quando observamos o dado correspondente quele ms. A previso 1 passo frente no instante T obtida substituindo-se os parmetros desconhecidos a1, a2 e por suas estimativas, isto :

    )()]()([)( )1(211 TTaTaTZ TmT ++ ++= (5.3.16) importante lembrar que os fatores sazonais aditivos sofrem uma restrio diferente dos fatores multiplicativos. No caso dos fatores aditivos, a sua soma (para todos os meses) zero. Inicializao do mtodo Montgomery e Johnson sugerem obter as estimativas iniciais dos parmetros atravs de um procedimento de mnimos quadrados ordinrios, que permite a estimao simultnea dos S + 2 parmetros desconhecidos. Requisitos mnimos para usar o mtodo de Holt e Winters Para modelar adequadamente a sazonalidade, necessrio pelo menos 3 anos de dados mensais e 4 anos de dados trimestrais.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 28

    Exemplo 5.3.1. O prximo grfico exibe o nvel dos reservatrios (isto , a combinao das usinas hidroeltricas) na regio Sudeste do Brasil entre Janeiro de 1989 e Agosto de 2001.

    s resultados de um modelo Holt-Winters ajustado a esta srie so:

    Constante Valor

    Nvel dos Reservatrios - Sudeste

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    100

    jan/89

    jul/89

    jan/90

    jul/90

    jan/91

    jul/91

    jan/92

    jul/92

    jan/93

    jul/93

    jan/94

    jul/94

    jan/95

    jul/95

    jan/96

    jul/96

    jan/97

    jul/97

    jan/98

    jul/98

    jan/99

    jul/99

    jan/00

    jul/00

    jan/01

    jul/01

    O

    Comp ente on Amortec. Final Nvel 0.540 25.109 ndnci 0.002 -0.179

    Te a

    Sazonalidade 0.529

    s fatores sazonais multiplicativos estimados so:

    atores Sazonais

    O FJan 1.028Fev 1.181Mar 1.282Abr 1.241Mai 1.176Jun 1.126Jul 1.052Ago 0.936Set 0.877Out 0.751Nov 0.727Dez 0.829 Este modelo foi ento ajustado at Dezembro de 2000 e as previses obtidas para o perodo entre Janeiro e Agosto de 2001 para testar sua capacidade preditiva. A prxima tabela apresenta os valores reais e ajustados no perodo, alm dos erros percentuais de previso.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 29

    Data do IC 95% Previso do IC 95% Valor Realiso

    (em %) Limite Inferior

    Limite Superior

    Erro de prev

    jan/01 24.3 36.6 31.4 48.9 -5.2 27.4 59.0 -9.8

    mar/01 28.1 46.6 65.1 34.5 -12.1 abr/01 24.6 44.2 63.7 32.2 -12.0 mai/01 20.7 40.9 61.2 29.7 -11.2 jun/01 17.2 38.1 59.0 28.6 -9.6 jul/01 13.7 35.0 56.3 26.8 -8.2

    ago/01 9.4 30.9 52.3 23.5 -7.4

    erros s stan des, o certam con ncia

    fev/01 43.2 33.4

    Os o ba te gran que ente seq de uma mudana no padro de evoluo

    os reservatrios, que se torna ntida a partir de 2001. Note que, neste ltimo ano, a amplitude no nvel de servatrios bem menor que nos anos anteriores, indicando que no foi possvel recuperar o nvel dos

    la. Os erros, especialmente nos meses de inverno, o sensilvelmente reduzidos.

    drereservatrios com as chuvas de vero. Portanto, (pelo menos a posteriori) clara a necessidade de impor o racionamento de energia (iniciado em Junho de 2001). Se agora consideramos apenas as previses um passo frente, a capcidade preditiva do modelo sensivelmente melhor, como indicado na prxima tabes Previses um passo frente

    Data IC 95% Previso

    Limite Superior

    do IC 95% Valor Real

    Erro de previso (em %)

    Limite Inferior do

    24.3 48.9 -5.2 24.9 53.5 -5.8

    mar/01 23.3 38.6 53.9 34.5 -4.1 abr/01 20.1 34.7 49.3 32.2 -2.5 mai/01 17.5 31.1 44.8 29.7 -1.4 jun/01 15.7 28.5 41.3 28.6 0.1 jul/01 14.5 26.4 38.2 26.8 0.4

    ago/01 13.0 23.6 34.2 23.5 -0.1

    jan/01 36.6 31.4 fev/01 39.2 33.4

    5.4. Modelos ARIMA de Box e Jenkins no sazonais A classe de modelos ARIMA de Box e Jenkins talvez a classe mais geral de modelos de previso para

    es modelos, e iremos considerar apenas s modelos para sries no sazonais.

    estacionrias que a estacionariedade possa ser obtida atravs de iferenas e/ou transformaes no lineares da srie original (por exemplo, logaritmo ou raiz quadrada).

    sries temporais. Nesta seo faremos uma breve introduo a esto Modelos ARIMA podem ser aplicados a sries estacionrias ou no. A condio necessria para a aplicao destes modelos a sries nod

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 30

    A abreviao ARIMA em Ingls significa "Auto-Regressive Integrated Moving Average", ou seja, auto-regressivo, integrado e mdias mveis. Os termos autoregressivos correspondem a defasagens da srie transformada, e os termos mdias mveis ("moving averages") referem-se s defasagens dos erros

    leatrios. Finalmente, o termo "integrado" refere-se ao processo de diferenciar a srie original para torn-la

    ma srie temporal {Z1, Z2, ..., ZT} pode ser encarada como uma realizao de um processo estocstico.

    Zt s so conjuntamente Gaussianos. Ento, para conhecer a sua istribuio conjunta, basta especificar o vetor de mdias {1, 2, ...., T} e a matriz de varincia-covarincia

    , t2 + k, ...., tm + k para qualquer k, ou seja, um descolamento de k unidades e tempo no afeta a distribuio de probabilidade conjunta. Note que, nesta definio, m arbitrrio. Se

    nte; Covarincia entre Zt e Zt+k depende apenas do lag k.

    nrio (ou estacionrio de 2a. Ordem) se estas trs condies so aos dois primeiros momentos da distribuio de

    robabilidade dos Zts, o que explica a terminologia processo estacionrio de 2a. ordem" . A definio de stacionariedade mais geral envolve momentos de todas as ordens (m arbitrrio na definio) e muito

    autocovarincia de lag k definida como a covarincia entre Zt e Zt+k isto :

    0, 1,2, .... (5.4.1)

    aestacionria. Modelos "Random Walk" (passeio aleatrio), autoregressivos e de amortecimento exponencial so apenas casos particulares de modelos ARIMA. UPara descrevermos completamente um processo estocstico precisamos especificar a distribuio conjunta do vetor {Z1, Z2, ..., ZT}. Suponha que osd. Mas, uma matriz simtrica de dimenso T, e contm T(T+1)/2 elementos diferentes. Logo, a completa especificao deste processo requer o conhecimento de T + T(T+1)/2 parmetros. Podemos perceber claramente que inferir sobre todos estes parmetros com base em apenas uma realizao do processo uma tarefa impossvel, e portanto algumas simplificaes devem ser feitas. A hiptese simplificadora mais comum estacionariedade. Dizemos que um processo estocstico estacionrio se ele atingiu o equilbrio. Em termos formais, num processo estacionrio, a distribuio de probabilidade conjunta nos instantes t1, t2, ...., tm a mesma que a distribuio nos instantes t1 +kdtomarmos m = 1 acima, segue que, num processo estacionrio, a distribuio marginal de Zt a mesma que a distribuio marginal de Zt+k. Logo, a distribuio marginal de Zt no depende do instante de tempo escolhido e, em particular, a mdia e varincia de Zt so constantes para qualquer t. Analogamente, se m = 2, as distribuies de probabilidade bivariadas p(Zt, Zt+k) no dependem de t, e ento a covarincia entre Zt e Zt+k depende apenas do lag k. Em resumo, a condio de estacionariedade implica em: Mdia do processo constante; Varincia do processo consta Um processo dito fracamente estaciosatisfeitas. Note que estas condies referem-se apenas pemais complicada de verificar que a estacionariedade de segunda ordem. Se os Zt s so conjuntamente Gaussianos, as duas condies (estacionariedade estrita e estacionariedade de 2a. ordem) so equivalentes. Algumas das definies a seguir j foram apresentadas no captulo 2, e esto novamente aqui apenas para relembrar o leitor! Definio 5.4.1. (Autocovarincia de lag k) A k = Cov(Zt , Zt+k) = E[(Zt - )(Zt+k - )] para k =

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 31

    Note que 0 = Var(Zt) = 2 pois Cov(Zt, Zt) = Var(Zt). A autocovarincia uma das funes usadas na identifica eo da strutura de um modelo ARIMA.

    efinio 5.4.2. (Autocorrelao de lag k)

    autocorrelao de lag k definida como:

    D A ( ), kktt ZZCov == + para k = 0, 1,2, ....( ) 2k ZVar t (5.4.2) Note que 0 = 1 sempre.

    s definies 5.4.1. e 5.4.2. referem-se autocovarincia e autocorrelao tericas. Na prtica, apenas mporal, e estas funes devem ser estimadas a partir da srie. A seguir definimos

    autocovarincia e autocorrelaes amostrais, isto , calculadas a partir dos dados observados (ou seja, a

    ositivos. Este grfico chamado de correlograma.

    Aobservamos uma srie teapartir da srie temporal). Normalmente iremos nos referir funo de autocorrelao como ACF (do ingls, Autocorrelation Function). Tambm, pela estacionariedade do processo, k = -k , e portanto basta fazer o grfico para as autocorrelaes com lags p

    Definio 5.4.3. (Autocovarincia amostral de lag k)

    +k-Tk )).(( T1=c zktt ZZZZ (5.4.3) 1=tNote que, para o lag zero, esta expresso torna-se:

    T 20 )( T1=c ZZt1=t que a varincia amostral da srie.

    efinio 5.4.4. (Autocorrelao amostral de lag k) D

    == T

    1=t

    2

    k-T

    0k

    )( ZZc t

    +1=t

    )).(( ZZZZc kttkr (5.4.4)

    Da expresso (5.4.4) segue que r0 = 1 sempre!

    ssas estimativas so assintoticamente no-tendenciosas quando T (o tamanho da srie) . Em geral deve-se ter T 50 (e k T/4). E

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 32

    Frmula de Bartlett Sob a hiptese k = 0 para todo lag k > U (onde U indica um lag grande) segue que:

    U1( ) skk Trr ,cov += sUi Sii Valores sucessivos de rk podem exibir altas correlaes e portanto as autocorrelaes estimadas podem levar a concluses errneas.

    azendo s = 0 na equao anterior leva a: F

    ( ) U 21 ikrar V=

    Para T grande e sob a hiptese k = 0, a distribuio de rk aproximadamente Normal com mdia zero e arincia

    UiT

    v =

    U

    UiiT21 . Na prtica substitui-se as correlaes (desconhecidas) na expresso acima por seus

    estimadores rk e ento:

    =

    Esta frmula ser usada para obter intervalos de confiana para rk. Tambm, se o tamanho (T) da srie grande, rk aproximadamente Normal com mdia zero, e os intervalos de confiana podem ser construdos

    partir desta distribuio.

    m modelo ARIMA no sazonal classificado como um modelo ARIMA(p,d,q) onde: p o nmero de o sazonais e q o nmero de termos mdias

    veis. Note que p, d e q so todos inteiros maiores ou iguais a zero.

    RIMA(0,1,0) passeio aleatrio ("random walk")

    U

    iik T 1

    ( ) + rrVar 2211

    a Justificativa Terica para os Modelos ARMA e ARIMA Utermos autoregressivos, d o nmero de diferenas nm Alguns casos particulares importantes so: AARIMA(1,1,0) modelo auto-regressivo de ordem 1 aplicado srie diferenciada ARIMA(0,1,1) sem termo constante amortecimento exponencial simples ARIMA(0,1,1) com termo constante amortecimento exponencial simples com crescimento Seja {a1, a2, ..., aT} uma seqncia de v te distribudas com mdia zero

    s 1, w2, ..., wT}, ariveis independentes e identicamen

    e varincia constante, isto , os ats o um rudo branco. Considere uma outra seqncia {w

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 33

    que representa um processo estocstico estacionrio. Note que os ws exibem dependncia serial. A Teoria eral de Sistemas nos permite gerar a seqncia dos ws a partir de uma combinao linear infinita de G

    rudos brancos. Esquematicamente temos:

    ModeloLinear

    Rudo BrancoProc.

    Estacionrio

    wtt a

    Ou seja, wt = at - 1 at-1 - 2 at-2 - .... (memria infinita) (5.4.5)

    prxima definio nos permite escrever de maneira conveniente os polinmios que aparecem na ARIMA de Box e Jenkins.

    operador de atraso B definido como: B.wt = wt-1. Tambm, suas potncias so dadas por: k w = w .

    operador de

    A expresso anterior pode ser invertida, e a seqncia {at} pode ser expressa em termos dos wt s como:

    1 2 Na prtica, as representaes (5.4.5) e (5.4.6) no so implementveis, pois os respectivos polinmios em

    kins ropuseram uma representao equivalente, na qual o polinmio infinito (B) substitudo pelo quociente e dois polinmios de graus finitos.

    u um).

    .B).at onde || < 1 e os at s formam uma seqncia de rudos rancos. Neste caso, (B) = 1-.B e o polinmio (B) pode ser encontrado facilmente:

    Amodelagem Definio 5.4.5. (Operador de atraso, backward shift operator ) OB t t-k Logo, a expresso (5.4.5) pode ser reescrita em termos de um polinmio infinito envolvendo oa aso como: tr

    ....221 tttt BaBaaw =

    )(a ...)-B-(1= t

    221 tt aBBw =

    tttt wBaaBw 434211)( )(

    ==

    B)(

    nde: (B) = 1 - B - B2 ..... (5.4.6) o

    B so de grau infinito, e precisaramos estimar um nmero infinito de coeficientes. Box e Jenpd Um exemplo elementar deste argumento dado pela srie Geomtrica. O polinmio infinito (B) = 1 + B + B2 + B3 + ..... igual a 1/(1-B) (se |B| < 1) e portanto igual razo de dois polinmios (um numerador constante e um denominador de gra Exemplo 5.4.6. Considere o modelo: wt = at - .at-1 = (1-b

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 34

    ( ) ( ){ } == BB .........1.1

    1 33221 ++++= BBB

    B

    Box e Jenkins propem escrever (B) como a razo de dois polinmios em B, ou seja:

    ( ) ( )( )BBB

    =

    B - B2 ....- Bp denominado polinmio AR(p).

    (5.4.7)

    (B) = 1 - 1B - 2B ....- qB um polinmio de grau q, chamado de Polinmio MA(q), e (B) = 1 - 1 2 p

    Onde: 2 q

    Substituindo (5.4.7) em (5.4.5) leva a:

    ( ) ( ) ( ) ttttt wBaBaBaB .... ===( ) ( )B w

    I sto :

    ( ) ( ) tt aBwB .. = (5.4.8)

    lo (5.4.8) chamado de ARMA(p,q). Note que o parmetro p indica a ordem do polinmio (B) olinmio AR), enquanto q o grau do polinmio (B) (polinmio MA).

    s modelos AR(p) (ou modelos autoregressivos de ordem p) j foram apresentados no captulo 2, e so penas um caso particular do ARMA(p, q) fazendo q = 0. A estrutura do modelo AR(p) :

    O mode(p

    Exemplo 5.4.7. (Modelo AR(p)) Oa ( ) ( BBawB = ..1. )p awB = .....2

    t 1 t-1 t

    tptpttt

    ttptt

    awwww ++++= ...... 221121

    (5.4.9) Um caso particular importante o modelo AR(1), dado por: w = .w + a .

    modelo MA(q) (modelo mdias mveis (ou moving average )de ordem q) apenas um modelo ARMA(p, ) no qual p = 0. Pela equao (5.4.8) temos a seguinte estrutura:

    Exemplo 5.4.8. (Modelo MA(q)) Oq ( ) ( BwaBw == .1. )q aBB ...... 2

    qtqtttt

    tqttt

    aaaaw ++++= ....... 221121

    (5.4.10) O modelo MA(1) escrito como: wt = at + 1.at-1.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 35

    Exemplo 5.4.9. (Modelo ARMA(1,1))

    esta caso p = q = 1 na equao (5.4.8) e o modelo : - 1B)wt = (1- 1B)at e ento:

    - w = a - a

    = wt- + a - at-

    xemplo 5.4.10. (Modelo ARMA(2,2))

    - B - B2)w = (1- B - B2)a e ento:

    1at-1 - 2at-2

    = wt- - wt- + a - at- - 2at-

    N(1 wt 1 t-1 t 1 t-1 Ou seja: wt 1 1 t 1 1 E A equao do modelo : (1 1 2 t 1 2 t wt - 1wt-1 - 2wt-2 = at - Ou seja: wt 1 1 2 2 t 1 1 2

    s de Estacionariedade e Inversibilidade dos modelos ARMA(p,q)

    um processo ARMA(p,q) como o da equao (5.4.8) precisamos verificar quais as condies a serem ostas sobre os coeficientes i's (ou i's, i's e i's) para garantir a estacionariedade e a inversibilidade do

    o de inversibilidade

    cionariedade. Se a entrada de um filtro linear como (5.4.5) um rudo branco (que sempre estacionrio) ento a sada

    o filtro (wt) s pode ser no estacionria se houver alguma instabilidade no comportamento do filtro. Isso armetros do filtro (isto , as condies que

    evem ser aplicadas aos i s e j s) para garantir a estacionariedade da srie de sada wt.

    = Cov(wt , wt-k) =

    Condie Nimpprocesso wt. Existem dois tipos de condies de interesse:

    1) Condio de estacionariedade 2) Condi

    Examinaremos inicialmente a condio de esta

    dnos permite encontrar as restries necessrias sobre os pd Pode-se mostrar que se wt = (B)at ento a funo de autocovarincia do processo {wt} :

    =

    0

    2 .j

    kjj

    2

    k

    Em particular, a varincia de wt dada por:

    ( ) =

    =0

    2

    jjtwVAR

    onde 0 = 1 e 2 a varincia de at. Logo, a varincia de wt finita apenas quando:

  • 36

    Logo, a varincia do o

    decarem para zero rapidamente. Ou seja, o processo {wt} no estacionrio se a soma for infinita.

    Isso implica na necessidade de restringir os pesos i para que o filtro seja estvel e, conseqentemente, o rocesso de sada seja estacionrio.

    Box e Jenkins mostram que a srie

    processo de sada no vai convergir para uma constante se os pesos 0, 1, ... n

    =

    1

    2

    ii

    0j

    i

    Ou seja:

    p

    ( ) = .i BB

    O processo {wt } estacionrio se o

    = converge se |B| 1.

    s zeros de (B) = 0 estiverem dentro do crculo unitrio

    A idia de inversibilidade est relacionada com a possibilidade de escrevermos a srie de rudo branco omo sada de um filtro linear cuja entrada a srie estacionria {wt}. Em linhas gerais, o processo {wt} c

    inversvel se podemos escrever a expresso (5.4.6), isto , se: a tt wB43421

    1)( = B)(( ) tt wBa .=

    onde (B) = 1 - 1 B - 2 B2 ..... Note que (B) = -1(B) e ento os coeficientes I s podem ser encontrados a partir dos Is e vice versa. A condio de inversibilidade aplicada aos coeficientes I, e totalmente independente da condio de

    stacionariedade.

    izemos que o processo {wt} inversvel se

    e

    D

  • 37

    Exemplo 5.4.11. (Estacionariedade dos

    onsidere o modelo AR(1) dado por:

    modelos AR(1))

    C

    ( ) BB .1 1 ttt aaw .1.1 ==

    Neste caso ( ) ( ) .......11 2 +++== BBB

    1for a do crcu

    .1 111 B (5.4.11) ara garantir a estacionariedade do processo precisamos que (B) convirja para |B| 1. Mas, por (5.4.11),

    esta srie converge apenas quando | 1 | < 1. Como a raiz P ( ) BB .1 1 =

    Exemplo 5.4.12. (Estacionariedade dos processos AR(p)

    B = 1/1, segue que | 1 | < 1 implica numa raiz deste polinmio situada fora do crculo unitrio.

    ogo, a condio raiz de (B) dentro do crculo unitrio equivalente condio raiz de (B) fora do crculo unitrio, e assim, a estacionariedade estar garantida se a raiz do polinmio (B) = 1 - .B estiver

    lo, ou seja, se | 1 | < 1.

    )

    onsidere um processo AR(p) dado pela equao:

    L

    C

    ( ) tptt aBBBaBw .......11.1 2

    21 ==

    p

    Note que (B) pode ser escrito como: ( )( ) ( )( ) BGBGBGB p .1.....1.1 21 = onde 1/G1, 1/G2, ..., 1/Gp so as razes de (B) = 0.

    e expandirmos 1/(B) em fraes parciais obtemos: S

    ( ) ti ii

    tt aBGa

    B.

    .1.

    1

    = == o k1w

    Para garantir a estacionariedade do processo {wt} precisamos que o polinmio (B) = -1 (B) convirja uando | B| 1, o que implica em: Gi | < 1, isto , | 1/Gi | > 1 para i = 1, 2, ...p, isto , as razes de (B) = 0 esto fora do crculo unitrio.

    m resumo:

    q |

    E Um processo AR(p) estacionrio se as razes do polinmio (B) = 0 esto fora do crculo unitrio.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 38

    Exemplo 5.4.13. (Estacionariedade dos processos AR(2)) processo AR(2) pode ser escrito como: O

    ( ) ttt aBBaB ...11.1 2

    21 ==w

    Para garantir a estacionariedade, as razes do polinmio: (B ) 221 ..1 BB =

    -1

    precisam estar fora do rculo unitrio. Isto implica que os parmetros 1 e 2 precisam estar na regio triangular: c

    1111

    2

    12

    12

  • 39

    Exemplo 5.4.15. (Estacionari e r os MA(q)) Con (q) p

    edad dos p ocess

    sidere um processo MA dado or: ( ) ( )

    qtqtttt

    tq

    qttt

    aaaawaBBBwaB

    ++++===

    .......

    .......1.

    2211

    221

    w Neste caso (B) = (B) um polinmio finito de grau q, e portanto a convergncia trivial.

    Logo, um modelo MA(q) sempre estacionrio!

    Exemplo 5.4.16. (Estacionariedade de um processo ARMA(p,q)) A equao geral do processo : ( ) ( ) tt aBwB .. =

    odemos representar este processo esquematicamente como:

    P

    Seja bt = (B).at. O processo bt a sada de um modelo MA(q), e portanto um processo estacionrio.

    Para garantir que {wt} seja estacionrio basta que de um processo AR(p).

    (B) satisfaa as condies de estacionariedade

    Logo, um modelo ARMA(p, q) estacionrio se as razes do polinmio (B) = 0 esto fora do crculo unitrio. Exemplo 5.4.17. (Inversibilidade dos processos AR(p)) Seja o processo AR(p) dado por: ( ) twB =. ta (5.4.12)

    ote que, nesta equao o rudo escrito explicitamente como funo da srie estacionria wt e portanto .4.12) j define um processo inversvel. Tambm, o polinmio AR tem grau finito e assim segue que um

    Rudo branco

    (B) (B)-1a -1-1-1a wtProcesso

    Estacionrio

    t

    Rudo branco

    (B) (B) wtProcesso

    EstacionrioRudo branco

    (B) (B) wtProcesso

    Estacionrio

    (B) (B) wtProcesso

    Estacionrio

    t

    N(5processo AR(p) trivialmente inversvel.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 40

    Neste caso, ( ) ( )BB =

    wt = (1-.B)at

    , que um polinmio de grau finito p.

    ogo:

    Exemplo 5.4.18. (Inversibilidade de um MA(1)) Considere um processo MA(1):

    L ( kk22

    tkk wBBBB

    11.......11

    ++++++==

    )tt wB

    a1.1

    Ou seja, escrevendo wt em termos de seus valores passados e de at encontramos:

    (5.4.13) Nesta expresso, os coeficientes j do polinmio (B) so os -j.

    o importa qual o valor de , o processo wt ser estacionrio, pois um processo MA(1), e estes so s passados wt-1, wt-2,

    ..wt-k com pesos crescentes medida que o lag aumenta. Podemos evitar esta situao se forarmos | | < 1, e neste caso dizemos que o processo inversvel.

    uando k tende a infinito teremos:

    ktk

    tktk

    ttt aawww +

    + ........ 1221 w =

    Ntrivialmente estacionrios. Mas, se | | 1, o valor atual de wt depende dos valore..

    Na expresso (5.4.13) se supormos | | < 1 e tomarmos o limite q

    ttttt awwww += ....... 33221 Ou seja, o processo wt (um MA(1) inversvel) pode ser escrito como um AR de ordem infinita e estacionrio ( pois | | < 1 por hiptese). Este resultado , na verdade, mais geral do que se possa supor primeira vista:

    MA(q) = AR() e AR(p) = MA()

    Note que a condio de inversibilidade , neste caso | | < 1 e equivale condio: raiz de (B) = (1-.B) =

    fora do crculo unitrio.

    Exemplo 5.4.19. (Inversibilidade de um mod

    condio de inversibilidade de um modelo MA(2) completamente anloga condio de

    condies podem ser escritas como:

    0

    elo MA(2)) Aestacionariedade de um processo AR(2). Para garantir a inversibilidade, precisamos que a seguinte condio seja satisfeita: razes de (B) = 0 fora do crculo unitrio. Em termos dos coeficientes que definem o processo estas

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 41

    2 + 1 < 1

    -1 < 2 < 1

    2 - 1 < 1

    E a regio de inversibilidade do processo indicada na figura a seguir.

    -1

    Razes reais

    Razes Complexas

    0-2 +2

    1

    0

    +1

    2

    Exemplo 5.4.20. (Inversibilidade de um modelo ARMA(p,q)) A inversibilidade do modelo ARMA(p,q) s depende da parte MA do modelo, pois a parte AR trivialmente inversvel. O modelo ARMA(p,q) ser inversvel se as razes de (B) = 0 estiverem fora do crculo unitrio.

    xemplo 5.4.21. (Estacionariedade e inversibilidade de um modelo ARMA(1,1))

    versibilidade so independentes. Tambm, ara garantirmos a estacionariedade precisamos olhar apenas para a parte AR(1) do modelo, e a

    Estacionariedade: |1 | < 1

    E Como j mencionado, as condies de estacionariedade e inpinversibilidade assegurada olhando-se s para a parte MA(1) do modelo. Assim, para garantir que o modelo ARMA(1,1) seja estacionrio e inversvel precisamos das seguintes condies:

    Inversibilidade: |1 | < 1 O processo ser estacionrio e inversvel se os parmetros 1 e 1 estiverem na regio abaixo:

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 42

    +1

    -1

    -10

    +1

    1

    1

    Definio 5.4.22. Funo de Autocorrelao Parcial (PACF) A funo de autocorrelao parcial mede a dependncia linear entre wt e wt+k , eliminando o efeito das variveis intermedirias wt+1 , wt+2 , ... , wt+k-1. A funo de autocorrelao parcial usada para identificar a ordem de um modelo AR(p). Note que necessrio usar uma outra funo, alm da ACF, para identificar a ordem de um modelo AR, pois todos os modelos AR tm uma ACF que decresce exponencialmente, e portanto apenas o correlograma no traz informao sobre o grau p do polinmio autoregressivo na representao ARMA. Considere um modelo AR(p). Uma maneira de definir a PACF atravs da regresso linear de wt+k em wt+k-1 ...wt , ou seja: wt+k = k1 wt+k-1 + k2 wt+k-2 + ... + kk wt + et+k Multiplicando ambos os lados da equao acima por wt+k-j e tomando o valor esperado tem-se:

    ].[].[....].[.].[.].[ 2211 jktktjkttkkjktktkjktktkjktkt weEwwEwwEwwEwwE +++++++++ ++++=

    Fazendo j = 1, 2, ..., k e levando em conta que k = -k obtemos o seguinte sistema de k equaes com k incgnitas (k1 , k2 , ..., kk):

    =

    kkk

    k

    k

    okk

    ko

    ko

    .

    ...

    .... . . .. . . .... ....

    2

    1

    2

    1

    21

    21

    11

    (5.4.14)

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 43

    As equaes (5.4.14) so conhecidas como equaes de Yule-Walker. Elas fornecem um algoritmo simples para determinar a ordem de um processo AR. Na prtica, os j s na equao acima so substitudos por seus estimadores rj. A resoluo do sistema (5.4.14) para todo k fornece as autocorrelaes parciais de lag 1, 2, .... Pela regra de Cramer aplicada ao sistema anterior temos:

    =

    1.... .....

    ..... 1..... 1

    det

    .... .....

    ..... 1..... 1

    det

    3-k2-k1-k

    1-k21

    121

    k3-k2-k1-k

    221

    121

    k

    kk (5.4.15)

    Ou seja, a matriz no numerador em (5.4.15) a mesma que a matriz no denominador, exceto pela ltima coluna, que substituda por [ 1, 2, ..., k]t.

    Em particular, 11 = 1 sempre, e 21

    212

    1

    1

    21

    1

    22 11

    1det

    1det

    =

    =

    Pode-se provar que, num processo AR(p), as autocorrelaes parciais so nulas para todos os lags maiores que p. Logo, o grfico da PACF nos permite identificar o grau do polinmio AR, pois a partir de um certo lag todas as autocorrelaes parciais so nulas. Por exemplo, veja Box, Jenkins e Reinsel (1994), pgina 66. Exemplo 5.4.23. Comportamento da ACF e PACF para o modelo AR(p) Considere um modelo AR(p), cuja equao : (1 - 1 B - 2 B2 - ... - p Bp ).wt = at Isto : wt = 1wt-1 + 2wt-2 +...+ pwt-p + at Multiplicando por wt-k e tirando o valor esperado, lembrando que E(wt .wt-k) = k , obtm-se:

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 44

    E(wt . wt-k ) = 1 . E(wt-1 . wt-k ) + 2 . E(wt-2 . wt-k ) + ... + p . E(wt-p . wt-k ) + E(at . wt-k) k = 1 k-1 + 2 k-2 + ... + p k-p Como k = k / 0 , obtm-se finalmente: k = 1 k-1 + 2 k-2 + p k-p Ou seja, as autocorrelaes de um processo AR(p) satisfazem a equao: (B).k = 0. A ACF do modelo AR(p) obtida por uma equao de diferenas de ordem p, cuja soluo formada por uma mistura de exponenciais e/ou senides amortecidas. Em resumo: para um AR(p) tem-se: ACF: k x k exponenciais e/ou senides amortecidas PACF: kk x k corte brusco no lag k = p Exemplo 5.4.24. (ACF e PACF de um modelo AR(1) ) Considere um modelo AR(1) estacionrio, isto : (1-1 ,B)Zt = at onde |1| < 1. Ento a autocorrelao de lag k k = 1k. As autocorrelaes parciais so: 11 = 1 = 1

    011

    11

    det

    1det

    21

    21

    21

    21

    212

    1

    1

    21

    1

    22 ==

    =

    =

    e kk = 0 para k = 3, 4, 5, .... Os grficos da ACFe PACF tericas so mostrado a seguir.

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 45

    k k= 1

    k

    k

    ou

    k

    k

    A PACF s diferente de zero no lag 1, e exibe um corte brusco aps este lag. Logo, num processo AR(1) apenas a primeira autocorrelao parcial no nula, e o grfico da PACF versus o lag exibe um corte brusco. Resultado 5.4.25. (Intervalo de Confiana para a PACF Frmula de Quenouille) Seja o estimador da autocorrelao parcial de lag k, encontrado pela substituio dos kk i pelos seus estimadores ri nas equaes de Yule-Walker. Ento:

    ( )T

    Var kk1 onde T o tamanho da srie.

    Para T grande, tem aproximadamente a distribuio Normal. kk Exemplo 5.4.26. (ACF e PACF do modelo MA(q)) Considere um modelo MA(q), isto : wt = (B)at wt = (1 - 1B - 2B2 ... qBq)at wt = at - 1 at-1 - 2at-2 - ... - qat-q Multiplicando a equao anterior por wt-k e tomando o valor esperado leva a: E(wt . wt-k) = E[(at - 1 at-1 - ... - q at-q)(at-k - 1 at-k-1 - ... - q at-k-q)] Ou seja, a autocovarincia de lag k : k = (-k + 1k+1 + q-kq) onde k = 1, 2, ..., q e k = 0 para lags maiores que q. Como k = k / 0 conclui-se que:

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 46

    qk

    qk

    k

    q

    qkqkkk

    >

    =++++++= +

    se 0 =

    e ,...,2,1 )...1(

    )...(22

    1

    11

    Ou seja, num processo MA(q) a ACF tem um corte brusco a partir do lag q+1. Pela propriedade de inversibilidade, um modelo MA(q) equivale a um AR() e ento a regresso de wt+k nos ws anteriores (que usada para definir a PACF) indica que kk no possuir a propriedade de corte brusco; decaindo com k. Em resumo: Num modelo MA(q) tem-se: ACF: apresenta um corte brusco no lag k = q PACF: tem o comportamento de exponenciais e/ou senides amortecidas, e ento no apresenta corte brusco. Exemplo 5.4.27. (Modelo MA(1)) wt = (1 - 1B)at O processo trivialmente estacionrio, e inversvel quando | 1 | < 1. A varincia do processo dada por:

    ( ) ( )2120 1 +== atwVar , e as autocorrelaes so: 21

    11 1

    += e 0=k se k > 1.

    A k-sima autocorrelao parcial (vide Box, Jenkins e Reinsel (1994), pgina 73): ( )( )2212

    11

    11

    += k

    k

    kk

    Como kkk 1 < , a funo de autocorrelao parcial dominada por uma exponencial amortecida. Se 1 for positivo (e ento 1 negativo), as PACFs tm sinais alternantes. Ao contrrio, se 1 for positivo, as autocorrelaes parciais so todas negativas. Existe uma dualidade no comportamento das funes ACF e PACF para os modelos AR(p) e MA(q), ou seja, o aspecto da PACF de um processo AR tem um corte brusco (assim como a ACF de um MA), e a ACF de um AR tem a cara da PACF de um MA (senides amortecidas e/ou decrscimo exponencial).

    M. Barros Consultoria Ltda.

    e-mail: [email protected] [email protected]

  • 47