25
AN ´ ALISE DE S ´ ERIES TEMPORAIS COM COVARI ˆ ANCIAS VARIANDO NO TEMPO ATRAV ´ ES DE FATORES COM VOLATILIDADE ESTOC ´ ASTICA Rodrigo TSAI 1 Luiz Koodi HOTTA 1 . RESUMO: O modelo fatorial, considerando os fatores latentes comuns e espec´ ıficos como processos de volatilidade estoc´astica, ´ e uma forma frugal de representar a matriz de variˆancias/covariˆ ancias (condicionais) variante no tempo de retornos de s´ eries financeiras multivariadas. Esse modelo tem sido estimado na literatura por inferˆ encia Bayesiana por meio de simula¸ c˜ao MCMC. O objetivo deste trabalho ´ e comparar dois esquemas desimula¸c˜ ao recentemente desenvolvidos ap´os modific´a-los adequadamente. Ambos esquemas s˜ao implementados pelo amostrador de Gibbs, um deles re´ une parˆametros e vari´aveis latentes correlacionados em blocos de simula¸ ao, o que diminui a autocorrela¸c˜ ao da cadeia de Markov gerada na simula¸ ao e aumenta a eficiˆ encia do algoritmo. A compara¸c˜ ao entre os m´ etodos ´ e realizada pela aplica¸c˜ ao a dois conjuntos de dados simulados, e a um conjunto de dados composto de dez taxas de cˆambio. ´ E tamb´ em analisada a robustez da estima¸c˜ao em rela¸c˜ ao`asdiferentesespecifica¸c˜ oes do modelo e `a presen¸ca ou n˜ao de uma das s´ eries. PALAVRAS-CHAVE: An´alise de eries temporais; an´alise multivariada; vari´ aveis latentes; m´ etodos de simula¸ ao; volatilidade estoc´astica. 1 Introdu¸c˜ ao eries financeiras tˆ em a caracter´ ıstica de exibir matrizes de variˆ ancias/co- variˆ ancias (condicionais) variantes no tempo. Suas estimativas s˜ao utilizadas em alguns modelos em finan¸cas: a teoria de precifica¸c˜ ao de ativos (Ross, 1976), que relaciona o valor esperado de um ativo individual `a covariˆ ancia de retornos; a an´alise de carteiras (Alexander e Francis, 1986), que busca alocar recursos de forma 1 Departamento de Estat´ ıstica, Instituto de Matem´atica, Estat´ ıstica e Ciˆ encia Computacional, Universidade Estadual de Campinas - UNICAMP, CEP:13.083.859, Campinas, S˜ao Paulo, Brasil. E-mail: [email protected] / [email protected] Rev. Mat. Estat., S˜ao Paulo, v.23, n.2, p.33-57, 2005 33

Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

ANALISE DE SERIES TEMPORAIS COM COVARIANCIASVARIANDO NO TEMPO ATRAVES DE FATORES COM

VOLATILIDADE ESTOCASTICA

Rodrigo TSAI1

Luiz Koodi HOTTA1 .

RESUMO: O modelo fatorial, considerando os fatores latentes comuns e especıficos comoprocessos de volatilidade estocastica, e uma forma frugal de representar a matriz devariancias/covariancias (condicionais) variante no tempo de retornos de series financeirasmultivariadas. Esse modelo tem sido estimado na literatura por inferencia Bayesianapor meio de simulacao MCMC. O objetivo deste trabalho e comparar dois esquemasde simulacao recentemente desenvolvidos apos modifica-los adequadamente. Ambosesquemas sao implementados pelo amostrador de Gibbs, um deles reune parametros evariaveis latentes correlacionados em blocos de simulacao, o que diminui a autocorrelacaoda cadeia de Markov gerada na simulacao e aumenta a eficiencia do algoritmo. Acomparacao entre os metodos e realizada pela aplicacao a dois conjuntos de dadossimulados, e a um conjunto de dados composto de dez taxas de cambio. E tambemanalisada a robustez da estimacao em relacao as diferentes especificacoes do modelo e apresenca ou nao de uma das series.

PALAVRAS-CHAVE: Analise de series temporais; analise multivariada; variaveislatentes; metodos de simulacao; volatilidade estocastica.

1 Introducao

Series financeiras tem a caracterıstica de exibir matrizes de variancias/co-variancias (condicionais) variantes no tempo. Suas estimativas sao utilizadas emalguns modelos em financas: a teoria de precificacao de ativos (Ross, 1976), querelaciona o valor esperado de um ativo individual a covariancia de retornos; aanalise de carteiras (Alexander e Francis, 1986), que busca alocar recursos de forma

1Departamento de Estatıstica, Instituto de Matematica, Estatıstica e Ciencia Computacional,Universidade Estadual de Campinas - UNICAMP, CEP:13.083.859, Campinas, Sao Paulo, Brasil.E-mail: [email protected] / [email protected]

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 33

Page 2: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

a minimizar a variancia de uma carteira para um dado nıvel de retorno; e o Valorem Risco de uma carteira (Frank, et al., 2000), que estuda seu comportamentoextremo.

Por apresentarem melhores ajustes e previsoes, os modelos de volatilidade esto-castica (VE) e auto-regressivos com heterocedasticidade condicional (ARCH) saoduas classes dominantes de modelos para variancia de series temporais em financas.

Dado que as series financeiras possuem a caracterıstica de estarem relacionadasa efeitos comuns do mercado em que participam, o modelo de analise fatorial euma forma frugal de descrever sua matriz de variancias/covariancias. Esse modeloconsiderando a estrutura ARCH e explorado em Bollerslev et al. (1988), Diebolde Nerlove (1989), Engle et al. (1990) e Ng et al. (1992). O modelo de fatores,considerando os fatores latentes como processos de VE, e explorado em Harveyet al. (1994), Pitt e Shephard (1999), Aguilar e West (2000), Chib et al. (2005).Neste trabalho o modelo fatorial considera componentes de VE. Esses modelosintroduzem muitos parametros suplementares na funcao de verossimilhanca comoas log-variancias e os fatores latentes, o que torna difıcil a obtencao de maximosdessa funcao, necessaria para realizar estimacao atraves da formulacao classica. Ouso de inferencia Bayesiana, de certa forma contorna esse problema pois nao requera maximizacao dessa funcao.

A simulacao pelo metodo de Monte Carlo – cadeia de Markov (MCMC)e uma solucao para realizar esse tipo de inferencia. Uma cadeia de Markov egerada para os parametros e variaveis latentes amostrando das distribuicoes, aposteriori condicionais, das log-variancias, dos fatores latentes e dos parametros,em sequencia. Apos a convergencia sao realizadas inferencias nas distribuicoesmarginais a posteriori dos parametros e tambem das log-variancias e fatores latentes.

Pitt e Shephard (1999) e Aguilar e West (2000), implementam a simulacaoMCMC gerando cada parametro de sua distribuicao a posteriori condicionalenquanto que Chib et al. (2005) geram simultaneamente parametros e variaveislatentes, que sao correlacionados, a partir de sua distribuicao a posteriori conjunta,isto e, em blocos de simulacao. Embora apresente maior custo computacional, aamostragem em blocos gera a cadeia de Markov com autocorrelacao que apresentamaior decaimento a zero exigindo um tamanho de cadeia menor.

O objetivo deste trabalho e comparar o desempenho desses dois metodos desimulacao com respeito as caracterısticas de eficiencia na simulacao e qualidade dasestimativas, e analisar a robustez do metodo de estimacao em relacao a algumasespecificacoes do modelo. Para realizar esta comparacao, o metodo de Chib et al.(2005) e extendido a fim de considerar as log-variancias dos fatores como processoscorrelacionados. O modelo e estimado pelos metodos sem blocos e com blocospara dois conjuntos de dados de dez series simuladas, que possuem um historico deoitocentas observacoes cada. Em seguida, apenas o metodo com blocos e aplicadoa um historico de 934 retornos diarios de dez taxas de cambio, envolvendo moedasda Europa, Asia e Americas do Sul e Central.

Na secao 2, sao descritos o modelo de fatores utilizado neste trabalho, oscomponentes de VE, e tambem as prioris utilizadas. Na secao 3, o procedimento

34 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 3: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

de estimacao do modelo e detalhado de acordo com os dois esquemas de simulacaoMCMC analisados. Na secao 4, utilizando series simuladas, os ajustes do modelorealizados pelos dois metodos sao testados e comparados. Na secao 5, o conjuntode taxas de cambio e analisado de acordo com o MF-VE e a secao 6 apresenta asconsideracoes finais.

2 O modelo de fatores latentes com volatilidade estocastica

2.1 O modelo de fatores

A serie de retornos yt q-variada, dimensoes q × 1, e modelada como

yt = θ + Xft + εt, t = 1, ..., T, (1)

isto e, uma media θ (q×1), mais um termo produto da matriz de cargas X (q×k, k <q) com um vetor ft (k×1) expressando o relacionamento linear da serie centrada yt

com esses fatores comuns, mais um vetor de perturbacoes especıficas εt (q × 1). ft

e εs sao independentes para quaisquer t e s. Os fatores comuns ft, condicionadosa sua matriz de variancias diagonal Ht, sao considerados realizacoes serialmenteindependentes de um processo latente:

ft|Ht ∼ Nk(0; Ht), t = 1, ..., T, (2)

onde W |Z ∼ D denota que D e a distribuicao da variavel aleatoria W condicionadaa variavel aleatoria Z, e Np(µ; Σ) denota uma distribuicao normal p-variada comvetor de medias µ e matriz de variancias/covariancias Σ.

Da mesma forma, os efeitos especıficos εt condicionados a sua matriz devariancias Ψt diagonal, sao considerados serialmente independentes e realizacoesde um processo latente:

εt|Ψt ∼ Nq(0;Ψt), t = 1, ..., T. (3)

Com essas condicoes a estrutura de variancias/covariancias da serie de retornos yt,quando condicionada a θ, X, Ht e Ψt, e

Σt = XHtX′ + Ψt, (4)

e temos yt|(θ, X,Ht, Ψt) ∼ Nq(θ; Σt). Note que as series de retornos, quando condi-cionadas tambem aos fatores comuns, sao serialmente independentes e gaussianasyt|(θ,X, ft, Ψt) ∼ Nq(θ+Xft; Ψt), com matriz de variancias/covariancias diagonal.Logo, os fatores comuns explicam toda a estrutura de dependencia entre as series.

Na forma em que e apresentado em (1), o modelo de fatores tem muitosparametros e nao e identificavel pelos dados. A fim de se obter uma decomposicaounica em (4), sao impostas restricoes a matriz X: a matriz deve ter posto completo,ser invariante com respeito a transformacoes lineares inversıveis nos fatores e ternumero de colunas k tal que o sistema dado pelas equacoes de (4) nao sejaindeterminado – ver Aguilar (2000) para maior descricao desses problemas.

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 35

Page 4: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

Como solucao para a necessidade das restricoes de posto completo e invarianciacom respeito a transformacoes lineares nos fatores ft, e utilizada para X a formahierarquica da matriz de cargas proposta em Geweke e Zhou (1996) com as restricoesxij = 0 para i < j e xij = 1 para i = j:

X =

1 0 · · · 0x2,1 1 · · · 0

......

. . ....

xk,1 xk,2 · · · 1xk+1,1 xk+1,2 · · · xk+1,k

......

...xq,1 xq,2 · · · xq,k

. (5)

Com essas restricoes, a primeira serie y1 sera modelada por uma media θ1 somadaao primeiro fator f1 mais sua perturbacao especıfica ε1; a segunda serie y2, poruma media θ2 somada a x2,1f1 + f2 mais a sua perturbacao especıfica ε2, e assimsucessivamente. Segundo Aguilar e West (2000) e Lopes e West (2000), utilizandoa forma hierarquica da matriz X, a ordem das q series univariadas no vetor yt eimportante para a interpretacao dos valores estimados de X. A ordem influenciao ajuste do modelo e tambem a determinacao do numero de fatores k, mas naointerfere nas previsoes feitas pelo modelo, pois as variancias e covariancias entre asseries sao independentes da escolha da ordem de entrada das series univariadas nacomposicao do vetor yt.

Considerando o numero de equacoes e incognitas no sistema (4), k deve sertal que o numero de equacoes q(q + 1)/2 seja maior que o numero de incognitasqk + q − k(k − 1)/2. Quanto menor o valor de k, mais parcimonioso e o modelo.

2.2 Componentes de volatilidade estocastica

Os modelos de VE utilizados neste trabalho modelam o logaritmo neperianodas variancias dos fatores comuns ft e efeitos especıficos εt, que sao os termosda diagonal das matrizes Ht em (2) e Ψt em (3) respectivamente, como processos(vetoriais) auto-regressivos estacionarios de 1a ordem (VE-VAR(1)).

Denotando λfit = log hit, para i = 1, ..., k, e, λf

t = (λf1t, ..., λ

fkt)’, na notacao

vetorial, temos que o processo k-variado das log-volatilidades dos fatores comuns ft

e modelado como

λft = µf + Φf (λf

t−1 − µf ) + ηft (6)

com ηft ∼ Nk(0; Σf

η) t=1, 2, ... independentes. λft tem media µf=(µf

1 , ..., µfk)’,

persistencia Φf = diag(φf1 , ..., φf

k) e matriz de variancia das inovacoes Σfη . A matriz

Σfη e cheia, para permitir correlacao entre as k inovacoes do processo no tempo t.

Note que a distribuicao de λft |(λf

t−1, µf , φf , Σf

η) e normal com media µf +Φf (λft−1−

µf ) e matriz de variancias/covariancias Σfη .

36 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 5: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

Para as perturbacoes especıficas, denote λεit = log ψit - na forma vetorial,

λεt = (λε

1t, . . . , λεqt)’. O processo de log-volatilidades q-variado dos efeitos

especıficos e escrito utilizando parametros media µε = (µε1,.., µ

εq)′, persistencia

Φε= diag(φε1, . . . , φ

εq) e matriz de variancias das inovacoes Σε

η, que neste processoe diagonal, ou seja, Σε

η = diag(σ2η,j). Essa forma equivale a considerar q processos

univariados, mas, para efeito de simplificacao, o processo tera notacao vetorial, etemos

λεt = µε + φε(λε

t−1 − µε) + ηεt (7)

com ηεt ∼ Nq(0; Σε

η) independentes e a distribuicao condicional de λεt |(λε

t−1, µε, φε,

Σεη) e N(µε + φε(λε

t−1 − µε); Σεη).

2.3 Prioris

Na especificacao do MF-VE, a distribuicao a priori para o conjunto deparametros {θ,X, Φf , Σf

η , µf ,Φε, Σεη, µε}, e tomada como o produto de prioris

independentes

p(θ) p(X) p(Φf ) p(Σfη) p(µf ) p(Φε) p(Σε

η) p(µε),

onde p(w) denota a funcao densidade de probabilidade da variavel aleatoria Wno ponto w. As prioris de θ, X, µf e µε, mostradas na Tabela 1, sao centradasem valores obtidos pela aproximacao fatorial de Aguilar e West (2000), aplicadaem um trecho inicial dos dados. Para a transformacao φ‡ = 2 × φ − 1, com φrepresentando cada elemento em φf ou φε, e utilizada a distribuicao beta. Para osdemais parametros sao utilizadas prioris encontradas na literatura, ver Tabela 1.

Tabela 1 – Prioris para os parametros do MF-VE. z denota estimativa da aproxi-macao fatorial para z. Para Σf

η , os valores * consideram os elementosda diagonal

Parametro Priori Media Desvio padraoθi N(θi; 25) θi 5

xi,j N( ˆxi,j ; 25) ˆxi,j 5µf

j e µεi N(µ; 25) µ 5

φ‡ Beta(21; 1, 5) 0,86 0,11σε

η,i IGamma(2, 4; 0, 35) 0,25 0,40Σf

η (2×2) IWishart(6; 0, 10× I) 0,20* 0,28*

3 Analise Bayesiana e simulacao MCMC

Nesta secao sao utilizadas as notacoes y = (y1, ..., yT ), f = (f1, ..., fT ), ε =(ε1, ..., εT ), λf = (λf

1 , ..., λfT ) e λε

i = (λεi,1, ..., λ

εi,T ) para i = 1, ..., q. Nos processos

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 37

Page 6: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

de VE-VAR(1) sao utilizados Γf = (φf ,Σfη , µf ) e Γε = (φε, Σε

η, µε), e Γεi =

(φεi , σ

εηi, µ

εi ) denota os parametros do i-esimo efeito especıfico do processo de VE-

AR(1). O conjunto dos parametros do modelo e denotado por Υ = (θ,X, Γf ,Γε)que, agregado as variaveis latentes e processos de VE, resulta na extensao ΥA =(Υ, f, ε, λf , λε). Tambem e utilizado A\B como referencia a todos os elementos deum conjunto A exceto B.

3.1 Inferencia Bayesiana

A funcao de verossimilhanca do MF-VE, marginalizada sobre os parametrosΥ do modelo, pode ser definida por uma integral 2× k × q × T -dimensional

l(Υ) ∝∫ ∫ ∫

p(Y |θ, X, f, λε) p(f |λf ) p(λf |Γf ) p(λε|Γε) dfdλfdλε. (8)

Essa estrutura, no entanto, torna difıcil a maximizacao com respeito aosparametros Υ. Na analise Bayesiana, os modelos sao tratados como estruturashierarquicas de distribuicoes condicionais. Essa hierarquia, para o MF-VE,e dada pela distribuicao dos dados condicionados aos parametros e variaveislatentes - p(Y |θ, X, f, Ψ), pelas distribuicoes das variaveis latentes condicionadas aosparametros - p(f |λf ), p(λf |Γf ) e p(λε|Γε), e pelas marginais ou distribuicoes a prioridos parametros em Υ - p(θ), p(X), p(Γf ) e p(Γε). Essas distribuicoes condicionaissao obtidas a partir do produto, no ındice t, das distribuicoes condicionais (1), (2),(6) e (7). A distribuicao conjunta das variaveis latentes e parametros condicionadosaos dados p(Υ, f, λf , λε | y) e proporcional ao produto destes tres grupos dedistribuicoes, isto e, igual a

p(Y |θ, X, f, Ψ) p(θ) p(X) p(f |H) p(H|Γf ) p(Γf ) p(Ψ|Γε) p(Γε). (9)

A marginal p(Υ|y) dessa distribuicao e utilizada para fazer inferencia sobre osparametros do modelo; as marginais p(λf |y) e p(λε|y), para conhecer o processodas log-variancias suavizado; e a marginal p(f |y), para conhecer os fatores latentesas series yt. Essas distribuicoes marginais sao estimadas por meio de amostrasretiradas da distribuicao p(Υ, f, λf , λε|y), utilizando simulacao MCMC.

Consideramos, neste trabalho, duas variantes desse metodo de simulacao paraa estimacao do MF-VE. A primeira e o esquema MCMC adotado em Pitt e emShephard (1999) e Aguilar e West (2000), nos quais a distribuicao (9), proporcional aconjunta a posteriori, e quebrada em distribuicoes condicionadas de cada parametroe variavel latente em relacao aos restantes. Esse esquema de simulacao e detalhadona Secao 3.2.

A outra forma de simulacao MCMC, que e discutida na Secao 3.3, foidesenvolvida em Chib et al. (2005) utilizando metodos previamente apresentadosem Chib e Greenberg (1995) e Chib et al. (2001). Nessa simulacao MCMC,as distribuicoes condicionais que compoem (9) sao distribuicoes conjuntas deparametros e variaveis latentes correlacionados. A partir dessas distribuicoesconjuntas, o processo de simulacao produz uma cadeia MCMC com autocorrelacaomenor, aumentando a eficiencia da simulacao.

38 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 7: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

3.2 Analise MCMC sem blocos

Na abordagem de Pitt e Shephard (1999) e Aguilar e West (2000), oamostrador de Gibbs para o MF-VE gera amostras dos parametros Υ e variaveislatentes sequencialmente. Nos passos de simulacao da cadeia sao utilizadassimulacoes diretamente da distribuicao condicional (amostragem direta), ou pormeio do algoritmo de Metropolis-Hastings (MH). Nos passos para amostrar assequencias de log-variancias e utilizado o simulador-suavizador de De Jong eShephard (1995) (SSMO). O algoritmo e resumido como segue, ver Figura 1.

1.Inicia Υ\θ

''

3.X|Υ\X

##Normal

2.θ|Υ\θ

00

4.ft|Υ\ft

Normal Normal

¯¯6(a)φε

i |Υ\φεi

KK

··

5(a)φf |Υ\φf

¸¸

MHεt=yt−θ−Xft

hh MH

(Normal) (Normal)

6(e)λεi |Υ\λε

i

88

6(b)σεηi|Υ\σε

ηi5(e)λf |Υ\λf

88

5(b)Σfη |Υ\Σf

η

SSMO inv.Gamma

¯¯

SSMO MH

(inv.Wishart)

±±6(d)wi|Υ\wε

i

KK

6(c)µεi |Υ\µε

i5(d)wf |Υ\wf

KK

5(c)µf |Υ\µf

Multinomial Normal^^ Multinomial Normal^^

FIGURA 1 – Amostrador de Gibbs para a analise MCMC sem blocos.

Algoritmo 1. Esquema MCMC sem considerar blocos1

1. Inicializa f, ε, λf , λε, w e Υ2. amostra θ (direta da distribuicao normal)3. amostra X (direta da distribuicao normal)4. amostra ft, t=1, . . . , T. (direta da distribuicao normal)5. para o processo de VE-VAR(1) dos fatores comuns

(a) amostra φf (MH proposta normal)(b) amostra Σf

η (MH proposta inversa de Wishart)

1No esquema do algoritmo, w e uma variavel indicadora utilizada no metodo de aproximacaopor misturas para simulacao das log-variancias, e sera definida nos passos (5d-e).

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 39

Page 8: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

(c) amostra µf (direta da distribuicao normal)(d) amostra wf

t , t=1, . . . , T. (direta da distribuicao multinomial)(e) amostra λf (SSMO)

6. para cada processo de VE-AR(1) dos efeitos especıficos (i = 1, .., q)(a) amostra φε

i (MH proposta normal)(b) amostra σε

ηi (direta da distribuicao inversa de Gamma)(c) amostra µε

i (direta da distribuicao normal)(d) amostra wε

ti, t=1, . . . , T. (direta da distr multinomial)(e) amostra λε

i (SSMO)7. va para 2.

Passos do algoritmo

Essa subsecao detalha os passos do Algoritmo 1 na ordem apresentada.

Passo (1): valores iniciais para ΥA. Os valores iniciais para os parametrose variaveis latentes sao obtidos pela analise inicial como em Aguilar e West (2000),exceto para os coeficientes auto-regressivos que sao inicializados em 0,97 e asvariancias das inovacoes, inicializados em 0,04, como sugerido em Kim et al. (1998).

Passo (2): amostra de θ|ΥA\θ. Utilizando a priori conjugada p(θ) ∼

Nq(m0; M0), temos a partir de (9) a distribuicao a posteriori p(θ|ΥA\θ, Y ) ∼

Nq(m; M) com

M =

(T∑

t=1

Ψ−1t + M−1

0

)−1

, e m = M

(T∑

t=1

Ψ−1t (yt −Xft) + M−1

0 m0

),

da qual θ e amostrada diretamente.

Passo (3): amostra de X|ΥA\X. Condicionada em ΥA

\X , a distribuicao aposteriori de X e o produto das distribuicoes k dimensionais conjuntas dos elementosdas linhas l = 2, ..., k de X. Isso ocorre porque a funcao de verossimilhancapara a matriz X, dada por p(Yt − θ|X, ft, Ψt) para t = 1, ..., T , e o produtode funcoes dos vetores linha de X. Utilizando uma priori p(x′l) ∼ Nk(m0; M0)para xl o l-esimo vetor linha de X, a distribuicao condicional a posteriori de xl ep(x′l|ΥA

\xl) ∼ Nk(ml;Ml), onde

Ml =

(T∑

t=1

ftψ−1lt f ′t + M−1

0

)−1

, e ml = Ml

(T∑

t=1

ftψ−1lt (Yt − θ) + M−1

0 m0

).

Portanto, xl e amostrado diretamente. Para 2 ≤ l ≤ k, xl e amostrado em suasposicoes de 1 a l− 1 condicionado a restricao das posicoes restantes, isto e, xl,l = 1e xl,j = 0 para j = l + 1, ..., k.

40 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 9: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

Passo (4): amostra de ft|ΥA\ft

, t = 1, .., T . A partir das distribuicoes (1) e (2),a distribuicao conjunta de ft e Yt − θ e

[ft|(θ,X, Ht, Ψt)

(Yt − θ)|(θ,X, Ht, Ψt)

]∼ Nk+q

(0;

[Ht HtX

XHt XHtX′ + Ψt

]),

o que leva a distribuicao condicional

ft|(Yt − θ) ∼ Nk

(HtX

′Qt−1(Yt − θ); Ht −HtX

′Qt−1XHt

)

para Qt = XHtX′+Ψt, da qual os fatores ft sao amostrados de forma independente

t = 1, ..., T .

Passo (5a): amostra dos coeficientes auto-regressivos φf |ΥA\φf . A partir

de (9), a distribuicao condicional a posteriori de φf , isto e, p(φf |ΥA\φf ), e

proporcional ao produto de p(λf |Γf ) com a priori p(φf ). p(λf |Γf ) e o produtoda distribuicao marginal γ1 ∼ Nk(0; W ) com as condicionais γt|(γt−1, µ

f , Σf ) ∼Nk(φfγt−1; Σf

η) para t = 2, .., T , com γt = λft − µf e W = φfWφf + Σf

η . Apriori p(φf ) e dada pelo produto de prioris transformadas de betas independentes,veja Secao 2.3, com parametros ai e bi para i = 1, .., k. Segue quep(φf |ΥA

\φf ) ∝ c(φf )Nk(φf |b; B) com

c(φf

)=

k∏

i=1

{φai−1i (1− φi)bi−1} |W |− 1

2 exp{−tr(γ1γ′1W

−1)/2},

B = {T∑

t=2

diag(γt−1)Σf−1

η diag(γt−1)}−1, b = B{T∑

t=2

diag(γt−1)Σf−1

η γt},

denotando N(w|µ; Σ) para a expressao algebrica da funcao densidade normal deW com parametros µ e Σ avaliada no ponto w. Dessa forma, φf e amostradopelo algoritmo de MH utilizando Nk(b;B) truncada em (-1,1) como distribuicaoproposta. Para φf† , o valor corrente de φf , o valor candidato φf∗ amostrado eaceito com probabilidade min{1, c(φf∗) / c(φf†)}.

Passo (5b): amostra da matriz de inovacoes Σfη |Υ\Σf

η. A partir de (9),

condicionada a ΥA\Σf

η, e utilizando uma priori para Σf

η , como uma Wishart inversa

- W−1(r0; R0), segue que a distribuicao a posteriori condicional para Ση e

p(Σf

η |Υ\Σfη

)∝ a

(Σf

η

)W−1

k (r;R) ,

onde r = r0 + T − 1, R = (r0R0 +∑T

t=2(γt − Φfγt−1)(γt − Φfγt−1)′)/r e a(Σfη) =

|W |− 12 exp{− 1

2 tr(γ1γ′1W

−1)} para W = φfWφf +Σfη . Dessa forma, Σf

η e amostradoutilizando o algoritmo de MH, sendo W−1(r;R) a distribuicao proposta. Para Σf†

η ,o valor corrente da cadeia para Σf

η , o valor candidato Σf∗η e gerado da distribuicao

proposta e aceito com probabilidade min{1, a(Σf∗η )/a(Σf†

η )}.

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 41

Page 10: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

Passo (5c): amostra da media da log-volatilidade µf |ΥA\µf . A distribuicao

condicional p(µf |ΥA\µf ) segue a partir de (9) de forma equivalente aos passos (5a)

e (5b). Para a priori conjugada p(µf ) ∼ Nk(m0; M0), µf e amostrado diretamentede p(µf |ΥA

\µf ) ∼ Nk(m; M), onde

M = {W−1 + (T − 1)(I − Φf )Σ−1η (I − Φf ) + M−1

0 }−1, e

m = M{W−1λ1 + (I − Φf )Σf−1

η

T∑t=2

(λt − Φfλt−1) + M−10 m0}.

Passo (5d-e): amostra das sequencias de log-variancias λf |ΥA\λf e da

mistura de normais wf |ΥA\wf . O modelo de espaco de estados e dado pela

equacao de observacao para log(f2t ) a partir de (2) e pela equacao de estados (6):

log(f2t ) = λf

t + log(ε2t ) (10)

λft+1 =

(I − Φf

)µf + Φfλf

t + ηt (11)

com εt ∼ Nk(0; Ik) e ηt ∼ Nk(0; Σfη). Na transformacao logarıtmica, surge o proble-

ma de lidar com observacoes que sao zero, ou muito proximas de zero, chamados deinliers. Uma solucao para o problema e a transformacao sugerida por Fuller (1996,p.464), isto e, log(y2

t ) = log(y2t +cs2

y)−cs2y/(y2

t +cs2y), com c = 0,02 e s2

y a varianciaamostral dos y′ts. O efeito e a reducao da curtose das observacoes transformadas,excluindo a cauda longa de valores negativos, resultado do logaritmo dos inliers.

Como a distribuicao de log(ε2t ) nao e normal, e utilizada a aproximacao pelamistura de sete distribuicoes normais, sugerida por Kim et al. (1998). Atravesda mistura, o modelo de espaco de estados torna-se condicionalmente gaussianoviabilizando o emprego de algoritmos para modelos gaussianos como o Filtrode Kalman e o SSMO. A selecao do componente da mistura e amostrada peladistribuicao multinomial condicional

P (wft = i|ft, λ

ft ) ∝ qi N(ft|λf

t + mi − 1, 2704; v2i ), i = 1, ..., 7, (12)

sendo qi, mi, v2i as quantidades dadas pela aproximacao por misturas. Em seguida,

as sequencias de log-variancias sao amostradas segundo o algoritmo SSMO.

Passo (6a): amostra de φε|ΥA\φε. Os q elementos de φε sao amostrados de

forma independente. Para i = 1, ..., q, a distribuicao condicional a posteriorip(φε

i |ΥA\φε

i) e obtida por meio de (9) pelo produto de p(λε

i |Γεi ) com a priori p(φε

i ).

p(λεi |Γε

i ) e o produto da distribuicao marginal de δi,1 ∼ N(0; σεη,i(1 − φε2

i )−1) comas condicionais de δi,t|δi,t−1 ∼ N(φε

i δi,t−1; σε2

η,i), t = 2, . . . , T , onde δt,i = λεt,i − µε

i ,para t = 1, . . . , T . A priori p(φε

i ) e uma transformacao da distribuicao beta(ai; bi) -veja secao 2.3. Segue que a distribuicao condicional a posteriori de φε

i e

p(φεi |ΥA

\φεi) ∝ N(b; B) c(φε

i ),

42 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 11: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

onde B = {σε2

η,i/(∑T

t=3 δ2i,t−1)}, b = B{σε2

η,i/(∑T

t=2 δi,tδi,t−1)} e c(φεi ) = (1 − φε2

i )12

φεai

i (1−φεi )

1−bi . Dessa forma, φε e amostrado utilizando o algoritmo de MH comdistribuicao proposta N(b;B) truncada em (-1,1). Para φε† , o valor corrente de φε,φε∗ amostrado e aceito com probabilidade igual a min{1, c(φε∗)/c(φε†)}.

Passo (6b): amostra de Σεη|ΥA

\Σεη. A partir de (9), utilizando p(λε

i |Γεi ) como

em (6a) e uma priori conjugada inversa de Gamma IG(σεη,i|r0,i; α0,i), ver Secao 2.3,

a posteriori para σε2

η,i e uma inversa de Gamma, p(σε2

η,i|ΥA\σε

η) ∝ IG(ri; αi), onde

ri = r0,i + T/2 e αi = α0,i + {(1 − φε2

i )δ21,i +

∑Tt=2(δt,i − φε

i δt−1,i)2}/2. Portantocada σε2

η,i e amostrado de forma direta e independente.

Passo (6c): amostra de µε|ΥA\µε. A partir de (9), utilizando p(λε

i |Γεi ) como em

(6a) e uma priori conjugada p(µεi ) ∼ N(m0;M0), temos que p(µε

i |ΥA\µε) ∼ N(m; M),

onde M = {[(1−φε2

i )+(T−1)(1−φεi )

2]/σε2

η,i+M−10 }−1 e m = M{λε

1,i(1−φε2

i )/σε2

η,i

+(1− φεi )

∑Tt=2(λ

εt,i − φε

i λεt−1,i) / σε2

η,i + M−10 m0}.

Passo (6d-e): amostra das sequencias de log-variancias λεt |ΥA

\λεt

e das

variaveis indicadoras da mistura wεt |ΥA

\wεt. Os efeitos especıficos εt sao

tomados como a diferenca Yt − θ −Xft, seguindo, para cada (wεti, λ

εti), i = 1, ..., q

e t = 1, ..., T um procedimento de simulacao univariado analogo aos passos (5d-e).

3.3 Analise MCMC utilizando blocos

No modelo de fatores considerado em Chib et al. (2005), as log-varianciasdo processo de VE dos fatores sao processos nao correlacionados, e o esquema desimulacao MCMC utilizado reune, em blocos de simulacao, variaveis latentes eparametros correlacionados.

A simulacao em blocos e estruturada de forma que a matriz de cargas dosfatores X e os fatores latentes f formem um unico bloco de simulacao [X, f ]. A ternade parametros de cada processo de VE-AR(1), juntamente com sua sequencia delog-variancias, formam um unico bloco. Portanto, a partir dos 3(k + q) parametrose k + q sequencias de log-variancias [φf

i , σfηi, µ

fi , λf

i ] para i = 1, .., k e [φεi , σ

εηi, µ

εi , λ

εi ]

para i = 1, .., q sao formados k + q blocos de simulacao.Algumas modificacoes aos metodos de simulacao de Chib et al. (2005)

sao necessarias para considerar as log-variancias dos fatores como processoscorrelacionados. Em relacao ao algoritmo de Chib et al. (2005), a simulacao dos kblocos de parametros dos k processos de VE-AR(1) dos fatores e substituıda pelasimulacao de um unico bloco de parametros do processo de VE-VAR(1), ou seja,pela simulacao das k sequencias de log-variancias dos fatores λf

i , i = 1, .., k e dosparametros [φf , Σf

η , µf ] simultaneamente.

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 43

Page 12: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

O algoritmo e resumido como apresentado a seguir, colocando-se entre paren-teses os passos equivalentes do algoritmo 1. Para o algoritmo 2 os passos (1) e (2)de inicializacao e amostragem de θ, e tambem os passos (4) e (6) de amostragem dasvariaveis indicadoras w da mistura de normais, sao identicos aos passos equivalentesno algoritmo 1. Os passos de simulacao dos blocos da matriz de cargas X efatores latentes f (3), os passos das quantidades do processo de VE-VAR(1) dosfatores (5), e os passos das quantidades de cada processo de VE-AR(1) dos efeitosespecıficos (7) seguem essencialmente o metodo desenvolvido em Chib e Greenberg(1994), de simulacao via algoritmo de MH, utilizando como distribuicao propostaa multivariada t obtida por otimizacao.

Algoritmo 2. MCMC considerando blocos

1. (1) Inicializa f, ε, λf , λε, w e Υ

2. (2) amostra θ

3. (3, 4) amostra [X, f ] por MH

(a)amostra X(b)amostra ft, t=1, . . . , T.

4. (5d) amostra wft da multinomial condicional

5. (5a, 5b, 5c, 5e) amostra [φf , Σfη , µf , λf ]

(a) amostra (φf ,Σfη , µf ) por MH

(b) amostra λf | (φf , Σfη , µf ) por SSMO

6. (6d) amostra wεt de multinomial condicional

7. (6a, 6b, 6c, 6d) amostra [φεi , σ

εη,i, µ

εi , λ

εi ] i = 1, .., q

(a) amostra (φεi , σ

εη,i, µ

εi ) por MH

(b) amostra λεi |(φε

i , σεη,i, µ

εi ) por SSMO

8. va para 2.

Passos do algoritmo

Passo (3): amostra de [X, f ] | ΥA\(X,f). Neste passo, equivalente aos passos

(3) e (4) do algoritmo 1, a matriz X e amostrada de sua distribuicao condicional aposteriori marginalizada sobre f , isto e, sem utilizar o nıvel hierarquico dado por(2) em (9). Em seguida os fatores em f sao amostrados condicionados em X.

Passo (3a): X e amostrada da densidade

p(X|ΥA\(X)) ∝ p(X)

T∏t=1

Nq(yt|θ; XHtX′ + Ψt),

com p(X) priori normal. A simulacao e implementada por meio do algoritmode MH utilizando uma distribuicao proposta, como uma multivariada t, isto

44 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 13: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

e, fT (m; M ; ν), com vetor de medias m aproximando a moda de l =log(

∏Tt=1 Nq(yt|θ; XHtX

′ + Ψt)), matriz de variancias/covariancias M como onegativo da segunda derivada de l, e numero de graus de liberdade ν tomadoarbitrariamente igual a dez. Para encontrar (m,M) denotamos xij o ij-esimoelemento irrestrito de X, e temos

∂l

∂xij=

12

T∑t=1

{(yt − θ)′Σ−1t

∂Σt

∂xijΣ−1

t (yt − θ)− tr(Σ−1t

∂Σ′t∂xij

)}

=T∑

t=1

{s′t∂X

∂xijHtX

′st − tr(Et∂X ′

∂xij)} (13)

com st = Σ−1t (yt − θ) e Et = Σ−1

t XHt e utilizando a forma de inversa para Σt

como Σ−1t = Ψ−1

t − Ψ−1t X(H−1

t + X ′Ψ−1t X)−1X ′Ψ−1

t . A partir das derivadas(13), os parametros (m, M) sao encontrados utilizando o algoritmo de maximizacaode Newton-Raphson. O algoritmo de MH e implementado amostrando X∗ defT (·|m;M ; ν) que, condicionado ao valor corrente da cadeia X† e aceito comprobabilidade de movimento α(X∗, Xc|Y, θ, λ) igual a

min

(1,

p(X∗)∏T

t=1 Nq(yt|θ; X∗HtX∗′ + Ψt) fT (Xc|m; M ; ν)

p(Xc)∏T

t=1 Nq(yt|θ; XcHtXc′ + Ψt) fT (X∗|m;M ; ν)

), (14)

onde fT (w|m;M ; ν) denota a expressao algebrica da funcao densidade t comparametros (m,M, ν), avaliada no ponto w.

Passo (3b): Em seguida ft e amostrado de forma direta e independente parat = 1, .., T , a partir da densidade p(ft|ΥA

\ft) ∝ Nq(yt|θ + Xft; Ψt) Nk(ft|0; Ht) =

Nq(m∗; M∗), para M∗ = (H−1t + X ′Ψ−1

t X)−1 e m∗ = M∗XΨ−1t (yt − θ).

O MF-VE condicionado em (Y, θ, X, f) e proporcional ao produto de (1 + q)modelos de espaco de estados, isto e, do processo de VE-VAR(1) dos fatores

log(f2t ) = λf

t + νt

λft = µf (I − φf ) + φfλf

t + ηt, (15)

com ηt ∼ Nk(0; Σfη) e de cada processo de VE-AR(1) dos efeitos especıficos

log(ε2t,i) = λε

t,i + νi,t

λεt,i = µε

i (1− φεi ) + φε

i λεt,i + ηt,i, (16)

com ηi,t ∼ N(0; σεη,i) para i = 1, .., q.

Passo (5): amostra de [Γf , λf ] | ΥA\(φf ,Σf

η ,µf ,λf ). Neste passo, equivalente aos

passos (5a), (5b), (5c) e (5e) do algoritmo 1, a simulacao dos parametros e log-variancias e realizada simultaneamente a partir de (15). Para f∗t = log(f2

t ), temos

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 45

Page 14: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

p(Γf |f∗, wf ) ∝ p(Γf ) p(f∗|wf ,Γf ). Denotando F∗t−1 = (f∗1 , ..., f∗t−1), temos que

p(f∗|wf , Γf ) ∝ p(f∗1 |wf1 , Γf )

T∏t=2

p(f∗t |F∗t−1, wft ,Γf ) (17)

pode ser obtida a partir das recursoes do filtro de Kalman (Kim et al., 1998). Γf eamostrado utilizando, no algoritmo de MH, uma distribuicao proposta multivariadat com parametros encontrados de forma analoga ao passo (3). Em seguida, aslog-variancias λf sao amostradas pelo SSMO. Note que (17) e marginalizada sobreλf , viabilizando a amostragem do bloco.

Passo (7): amostra de [φεi , σ

εη,i, µ

εi , λ

εi ] | ΥA

\(φεi ,σε

η,i,µεi ,λε

i ) i = 1, .., q.

Equivalente aos passos (6a), (6b), (6c) e (6e) do algoritmo 1, para cadaprocesso de VE-AR(1) dos efeitos especıficos, sao realizadas amostras de [Γε

i , λεi ]

simultaneamente, de forma analoga a realizada para o processo dos fatores. Eutilizada a distribuicao p(Γε

i |ε∗i , wεi ) ∝ p(Γε

i ) p(ε∗i |wεi , Γ

εi ), para ε∗t = log(ε2

t ) e sendop(ε∗i |wε

i ,Γεi ) obtida das recursoes do filtro de Kalman. Uma distribuicao proposta

multivariada t e empregada para o algoritmo de MH. Em seguida, a sequencia delog-variancias λε

i e amostrada pelo SSMO.

4 Analise de dados simulados

A partir de parametros do MF-VE simulados, foram gerados dois conjuntos dedados, chamados simulacao A e simulacao B, aos quais foram aplicados os algoritmosde estimacao da secao anterior para comparacao dos metodos.

Foram escolhidos q = 10 series de retornos de tamanho T = 800 observacoescada, e relacionadas linearmente a k = 2 fatores. Os parametros do MF-VEforam simulados de forma a se obter valores proximos aos encontrados na literatura(Pitt e Shephard, 1999, Aguilar e West, 2000, Nardari e Scruggs, 2003, Chibet al., 2005), isto e, medias dos retornos θi, em modulo menores que 10−3, ouseja, θi ∼ U(−10−3; 10−3), elementos da matriz de cargas xij ∼ N(0, 9; 1),variancias marginais das variaveis latentes ft e εt em torno de 10−4 ≈ exp(−9)fazendo µf

j e µεi ∼ N(−9; 1), alta persistencia na log-volatilidade, com coeficientes

auto-regressivos maiores que 0, 88, fazendo φfj e φε

i ∼ U(0, 88; 0, 995) e varianciasdos processos de VE em torno de 0, 05, fazendo σε

η ∼ U(0, 005; 0, 10) e Σfη ∼

W−1k (10; 0, 05Ik) para i = 1, ..., q e j = 1, ..., k.

A partir dos parametros simulados, sao gerados sucessivamente os processosde log-variancias, os fatores latentes e a serie. Os processos de log-variancias λf

t eλε

t seguem os modelos (6) e (7), para t = 1, ..., 8.000, a partir dos valores iniciaisµf e µε respectivamente, descartando-se o trecho inicial de 90% das observacoesde cada sequencia. Em seguida, os fatores comuns e efeitos especıficos ft e εt saogerados para t = 1, ..., 800, utilizando as log-variancias em (2) e (3). Finalmente, apartir de θ, X, ft e εt, e gerada a serie de retornos yt, t = 1, ..., 800, por (1).

46 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 15: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

Tomando para o ajuste do modelo o numero real de fatores k = 2, econsiderando as dimensoes das series geradas temos, para o MF-VE, 64 parametrosem Υ e 24 sequencias de tamanho 800 entre fatores comuns, efeitos especıficos elog-variancias a serem estimados.

Na aplicacao da analise MCMC sem blocos, foi gerada uma cadeia deN=50.000 simulacoes da distribuicao a posteriori conjunta de ΥA, descartandoas primeiras 10.000 simulacoes consideradas como fase de convergencia da cadeia.A convergencia da cadeia foi atingida antes de 3.000 simulacoes, considerando aestabilidade da locacao das distribuicoes marginais a posteriori dos parametros µ eX principalmente. Dessa amostra restante e extraıda uma subamostra de n=1.000observacoes tomadas da cadeia a cada 40 simulacoes. As percentagens medias deaceitacao nos passos que utilizam o algoritmo de MH foram 80% para os coeficientesauto-regressivos φf em (5a), 85% para a matriz Σf

η em (5b), e de 80% a 92% paraos coeficientes auto-regressivos φε

i , i = 1, ..., q em (6a).Para a analise MCMC com blocos, foi utilizada uma cadeia de N=11.000

simulacoes, descartando as primeiras 1.000 como perıodo para convergencia dacadeia mesmo obtendo esta convergencia antes de 700 simulacoes, considerandoa estabilidade da locacao das distribuicoes marginais a posteriori dos parametros µe X. Dessa amostra restante e extraıda uma sub-amostra de n=1.000 observacoestomadas da cadeia, a cada 10 simulacoes. As percentagens de aceitacao, nos passosque utilizam o algoritmo de MH, foram 75% para o bloco de [X,f ] em (3), 20%para o bloco do processo de VE dos fatores em (5), e de 25% a 50% para os blocosdos processos de VE dos efeitos especıficos em (7).

Os valores reais dos parametros em Υ de cada conjunto de dados, semantiveram dentro, ou muito proximo, dos limites de 95% dos intervalos decredibilidade obtidos por ambos metodos de simulacao. A Figura 2 mostra os errosnas estimativas obtidas dos parametros do MF-VE obtidas pelas subamostras dacadeia contra os valores reais desses parametros. As estimativas dadas pelos doismetodos para os elementos de X, µf e µε mostram uma possıvel tendencia dedecrescimento.

Com excecao de duas series, as sequencias de variaveis latentes fit e εjt, parai = 1, 2 e j = 1, ..., 10, estimadas por ambos metodos de simulacao, com blocose sem blocos, apresentam correlacoes de 0,90 a 0,99 com as sequencias reais. Asexcecoes ocorreram na simulacao A para as estimativas de ε4t e ε6t, com correlacoesde 0,77 e 0,81 respectivamente. Esses efeitos foram gerados a partir de varianciascondicionais baixas, contribuindo pouco em relacao aos fatores na formacao dasseries. Os desvios padroes condicionais h

1/2jt e ψ

1/2jt , para i = 1, 2 e j = 1, ..., 10,

nas duas simulacoes, apresentam correlacoes de 0,58 a 0,92, com as respectivassequencias reais, exceto os desvios padroes condicionais ψ

1/24t e ψ

1/26t da simulacao

A com correlacoes de 0,31 e 0,32 respectivamente. A Figura 3 mostra as sequenciasεjt e seus desvios padroes condicionais ψ

1/2jt para j = 1, ..., 10, estimados para os

dados da simulacao A pelo metodo MCMC com blocos.

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 47

Page 16: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

FIGURA 2 – Erro de estimacao (real-estimativa) dos dois metodos MCMCaplicados aos dados simulados, a cruz representa sem blocos e o cırculo,com blocos.

48 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 17: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

0 150 300 450 600 750

0

.1 e1 e1(MCMC)

0 150 300 450 600 750

.025.05

.075 Psi1^(1/2) Psi1(MCMC)^(1/2)

0 150 300 450 600 750

-.0250

.025 e2 e2(MCMC)

0 150 300 450 600 750

.005

.01Psi2^(1/2) Psi2(MCMC)^(1/2)

0 150 300 450 600 750

-.050

.05 e3 e3(MCMC)

0 150 300 450 600 750

.025

.05 Psi3^(1/2) Psi3(MCMC)^(1/2)

0 150 300 450 600 750

0

.02 e4 e4(MCMC)

0 150 300 450 600 750

.006

.008 Psi4^(1/2) Psi4(MCMC)^(1/2)

0 150 300 450 600 750

-.10.1 e5 e5(MCMC)

0 150 300 450 600 750

.025

.05 Psi5^(1/2) Psi5(MCMC)^(1/2)

0 150 300 450 600 750

-.0250

.025 e6 e6(MCMC)

0 150 300 450 600 750

.01.015.02 Psi6^(1/2) Psi6(MCMC)^(1/2)

0 150 300 450 600 750

-.10.1 e7 e7(MCMC)

0 150 300 450 600 750

.02

.04Psi7^(1/2) Psi7(MCMC)^(1/2)

0 150 300 450 600 750

-.0250

.025.05 e8 e8(MCMC)

0 150 300 450 600 750

.01

.02Psi8^(1/2) Psi8(MCMC)^(1/2)

0 150 300 450 600 750

-.0250

.025 e9 e9(MCMC)

0 150 300 450 600 750

.005.01

.015 Psi9^(1/2) Psi9(MCMC)^(1/2)

0 150 300 450 600 750

0

.05 e10 e10(MCMC)

0 150 300 450 600 750

.01.015.02

.025 Psi10^(1/2) Psi10(MCMC)^(1/2)

FIGURA 3 – Feitos especıficos (εj = ej) e desvios padroes condicionais (Ψ1/2j =

Psij∧(1/2)) reais e estimados pela analise MCMC com blocosaplicada a simulacao A.

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 49

Page 18: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

5 O MF-VE para taxas de cambio

O MF-VE foi ajustado para 10 taxas de cambio no perıodo de 1.1.1999 a31.6.20022. Os retornos utilizados foram yt = pt/pt−1 − 1 compondo um historicode 934 retornos diarios. As taxas analisadas sao a paridade com o dolar de moedasda Asia, Europa e America do Sul e Central: Yen – Japao (JPY), Libra Esterlina –Reino Unido (GBP), Dolar de Cingapura (SGD), Bath da Tailandia (THB), Won daCoreia do Sul (KRW), Coroa Sueca (SEK), Franco Suıco (CHF), Euro (EUR), Real– Brasil (BRL) e Peso Mexicano (MXN). A Tabela 2 mostra as estatısticas sumariasdas series de retornos, destacando BRL com maiores media e desvio padrao, o grupode moedas europeias – SEK, CHF e EUR, juntamente ao JPY exibindo mediaspositivas e desvios padroes proximos de 0,007.

A matriz de correlacoes das 10 taxas, ver Tabela 3, indica, em uma analiseinicial por meio da analise fatorial estatica, a existencia de dois fatores comunsdados por dois grupos de moedas. O primeiro grupo e o das moedas europeias –GBP, SEK, EUR e CHF, do qual o JPY tambem participa. O segundo grupo e odas moedas asiaticas SGD, THB, KRW e JPY. O Real/Brasil apresenta estimativasbaixas para correlacao com as demais moedas, exceto com MXN.

Dessa forma, para o MF-VE, e tomado o numero de fatores comuns k = 2,utilizando, nas posicoes em que ha restricao de correlacao um com os fatores, asmoedas JPY, por apresentar correlacao com as moedas da Europa e Asia, e GBPpor pertencer ao grupo de moedas europeias de altas correlacoes duas a duas.

Tabela 2 – Estatısticas sumarias para os retornos das taxas de cambio: media,desviopadrao (DP) e percentis de 2,5% e 97,5% - perıodo de 1.1.1999a 31.6.2002. As series estao dispostas na ordem utilizada para oajuste do modelo

Media DP %2,5 %97,5Moeda ×10−4 ×10−2 ×10−2 ×10−2

JPY 0,82 0,70 -1,36 1,35GBP 0,78 0,49 -1,00 1,02SGD 0,75 0,27 -0,50 0,51THB 1,56 0,43 -0,83 0,99KRW -0,03 0,47 -0,92 1,09SEK 1,91 0,69 -1,39 1,41CHF 1,06 0,69 -1,41 1,41EUR 2,13 0,68 -1,38 1,35BRL 12,00 1,21 -1,92 2,42MXN 0,10 0,50 -0,92 1,02

Na analise MCMC foi utilizada uma amostra de n=1.000 observacoes apartir de N=15.000 simulacoes, descartando as primeiras 5.000 como perıodo deconvergencia, e tomando amostras da cadeia a cada 10 simulacoes. A inferencia

2Dados cedidos pela Global Risk Management, Unibanco-SA.

50 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 19: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

realizada nessa amostra fornece as estimativas para os parametros em Γ e variaveislatentes f , ε, λf e λε.

Tabela 3 – Correlacoes entre os retornos das taxas analisadas, destacando-se osgrupos de moedas de correlacoes mais altas – perıodo de 1.1.1999 a31.06.2002

JPY0,43 SGD0,26 0,49 THB0,20 0,23 0,26 KRW0,20 0,11 0,04 0,02 GBP0,19 0,17 0,09 0,04 0,49 SEK0,23 0,19 0,11 -0,02 0,58 0,72 CHF0,21 0,19 0,11 -0,01 0,58 0,79 0,91 EUR0,07 0,06 0,03 0,00 0,04 0,04 -0,05 -0,02 BRL-0,04 0,01 0,07 0,02 -0,15 -0,10 -0,23 -0,19 0,22 MXN

A estimativa do modelo fatorial (1) e dada na Tabela 4. Entre as medias (θ)destaca-se a serie BRL, com maior valor para o perıodo. Na matriz estimada X, osbaixos valores para as cargas dos fatores de BRL e MXN mostram que essas taxasde cambio tem pouca participacao na composicao dos fatores f1 e f2. No primeirofator ha uma ponderacao entre todas as moedas exceto BRL e MXN, com pesosmaiores para as moedas europeias e o Japao. No segundo fator, ha um contrasteentre as moedas europeias e asiaticas, exceto o JPY, que foi excluıdo. Em resumo,temos que, para a estrutura do modelo utilizada, sao extraıdos dos dados doisfatores comuns sendo o primeiro relacionado ao mercado comum Europa – Asia, eo segundo exclusivo das taxas europeias.

Tabela 4 – Estimativas de θ(×104) e X – mediana e desvio padrao da cadeia MCMC

θi Xi1 Xi2

Moeda Med DP Med DP Med DPJPY 2,39 2,03 1 0GBP 0,46 1,49 0,43 0,07 1SGD 1,05 0,72 0,54 0,04 -0,17 0,06THB 0,63 0,99 0,62 0,10 -0,26 0,07KRW -0,89 1,01 0,31 0,05 -0,17 0,05SEK 2,60 2,10 0,79 0,01 1,83 0,10CHF 2,35 2,19 0,91 0,01 2,19 0,11EUR 2,98 2,18 0,90 0,01 2,23 0,11BRL 4,16 1,98 0,00 0,07 -0,12 0,07MXN -1,14 1,36 -0,02 0,05 0,32 0,06

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 51

Page 20: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

As estimativas dos parametros dos modelos de VE (6) e (7) sao mostradas naTabela 5. A Figura 4 mostra as sequencias de log-variancias λf e dos dois fatorescomuns ft estimadas pela analise MCMC.

Tabela 5 – Estimativas para os parametros µ, φ e ση dos processos de VE – medianae desvio padrao da cadeia MCMC

µ φ ση

fator Med DP Med DP Med DPFator1 -11,68 0,17 0,47 0,16 0,568 0,18Fator2 -12,02 0,12 0,56 0,21 0,199 0,11

Fator1x2 0,110 0,09JPY -10,47 0,12 0,92 0,07 0,057 0,06GBP -11,22 0,18 0,97 0,02 0,015 0,10SGD -13,21 0,34 0,93 0,03 0,192 0,10THB -12,24 0,38 0,95 0,02 0,187 0,10KRW -11,34 0,19 0,92 0,03 0,166 0,06SEK -11,24 0,12 0,90 0,04 0,089 0,05CHF -12,61 0,24 0,93 0,02 0,154 0,06EUR -13,48 0,56 0,98 0,08 0,023 0,04BRL -9,80 0,35 0,97 0,01 0,115 0,04MXN -11,01 0,10 0,80 0,06 0,226 0,09

0 150 300 450 600 750 900

-.01

0

.01

.02 f1

0 150 300 450 600 750 900

.0025

.005

.0075H1^(1/2)

0 150 300 450 600 750 900

-.01

0

.01

.02 f2

0 150 300 450 600 750 900

.0025

.005

.0075H2^(1/2)

FIGURA 4 – Fatores comuns as taxas de cambio e seus desvios padroes condicionais.

52 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 21: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

Dado que a escolha das primeiras k series para o ajuste do modelo influenciasua estimativa e a interpretacao, para avaliar a robustez do metodo MCMC emestimar o MF-VE para uma ordem alterada das series, apresentamos o ajustepara as mesmas taxas de cambio, porem fazendo EUR e JPY como as primeira esegunda series em y. A Tabela 6 mostra as estimativas de θ e X, obtidas parao MF-VE segundo a ordem das series estabelecida. A escolha utilizada para asseries, determina o primeiro fator como o das moedas Europeias juntamente aoJPY, e o segundo fator, o das moedas Asiaticas. Novamente BRL e MXN exibempouca participacao na parte fatorial.

Tabela 6 – Estimativas de θ(×104) e X, colocando-se EUR e JPY como primeira esegunda series e destacando-se as cargas de maior correlacao variavel-fator

θi Xi1 Xi2

Moeda Med DP Med DP Med DP

JPY 1,66 2,05 0,24 0,03 1,00GBP 0,45 1,45 0,47 0,02 0,00 0,06SGD 0,54 0,72 0,07 0,01 0,65 0,08THB -0,2 0,98 0,05 0,02 1,12 0,26KRW -1,16 1,06 0,01 0,02 0,43 0,08SEK 2,62 2,07 0,84 0,02 0,06 0,06CHF 2,21 2,11 0,99 0,02 0,03 0,03EUR 2,82 2,10 1,00 0,00BRL 4,12 1,90 -0,04 0,03 0,09 0,09MXN -1,28 1,32 -0,12 0,02 0,15 0,07

No perıodo analisado, a serie BRL exibe maior volatilidade, e nao apresentaparticipacao importante na parte fatorial. Para estudar a robustez do metodo deajuste com respeito a presenca ou nao dessa serie, foi realizada a comparacao dasestimativas pontuais obtidas para o MF-VE com as estimativas dadas por um novoajuste do modelo, porem retirando-se a serie BRL. As estimativas para os modelos(1), (6) e (7), considerando apenas as nove series presentes nos dois ajustes, forambastante proximas, ver Figura 5.

Conclusoes

Foram aplicados os metodos de simulacao MCMC para conjuntos de dadossimulados, e o metodo que utiliza simulacao em blocos apresentou maior eficienciapor gerar cadeias de menor auto-correlacao. De uma forma geral, ambos metodosproduziram boas estimativas para os parametros e variaveis latentes do MF-VE,as maiores diferencas relativas ocorreram, para os modelos de VE, nos parametroscoeficiente auto-regressivos e variancia da inovacao, e para o modelo fatorial, noparametro de media dos retornos. Pelas aplicacoes realizadas, as diferencas naodeterminam um metodo como melhor para estimar os parametros do modelo emgeral.

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 53

Page 22: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

FIGURA 5 – Estudo da robustez na estimacao dos parametros de VE pelos ajustesdo MF-VE com e sem a serie de retornos BRL. A reta de referenciae f(x) = x.

54 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 23: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

Foi verificada a suposicao de matriz de variancias/covariancias (condicionais)variante no tempo, e o relacionamento linear entre esses retornos e fatores comunspara um conjunto de 10 taxas de cambio. A partir de uma estrutura fatorialproposta, com base em fatores relacionados as moedas Yen e Libra Esterlina,sao interpretados esses fatores, a correlacao variavel-fator e os grupos de moedascorrelacionadas. O metodo de estimacao apresentou bom desempenho e robustezcom respeito a alteracao da ordem das series participantes do modelo, e a retiradade uma das series que e mais volatil.

Agradecimentos

Os autores agradecem aos revisores, a Capes, pela bolsa de mestrado, aFAPESP e ao CNPq pela bolsa de produtividade e projeto PRONEX.

TSAI, R., HOTTA, L. K. Time series analysis with time varying covariances vialatent factors with stochastic volatility. Rev. Mat. Estat., Sao Paulo, v.23, n.2,p.33-57, 2005

ABSTRACT: The factor model, structured with common and idiossincratic latentfactors that follow stochastic volatility processes, is a technique to parsimoniouslyrepresent the time-varying matrix of variances and covariances of financial time series.This model has been fitted in the literature using Bayesian inference via MCMCsimulation. The purpose of this work is to compare two recently developed schemes forMCMC simulation, after modifying them adequately. Both schemes are implementedthrough the Gibbs sampler. One of them puts parameters and latent variables that arecorrelated into blocks and samples them simultaneously. This procedure reduces theautocorrelation of the generated Markov chains and increases simulation efficiency. Thecomparison between these methods is accomplished by applying them both to simulateddata and to a data set consisting of ten foreign exchange rates. The robustness relatedto different model specifications and to the presence or absence of one of its series is alsoanalysed.

KEYWORDS: Time series, multivariate statistics; latent variables; simulation methods;stochastic volatility.

Referencias

AGUILAR, O. Latent structure in Bayesian multivariate time series models. 2000.212f. Tese (Doutorado em Ciencias) – Instituto de Estatıstica e Ciencias de Decisao,Universidade Duke, Durham, 2000.

AGUILAR, O.; WEST, M. Bayesian dynamic factor models and portfolio allocation.J. Bus. Econ. Stat., Alexandria, v.18, p.338-357, 2000.

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 55

Page 24: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

ALEXANDER, G. J.; FRANCIS, J.C. Portfolio analysis. 3. ed. New York: PrenticeHall, 1986. 306p.

BOLLERSLEV, T.; ENGLE, R. F.; WOOLDRIDGE, J. M. A capital asset pricingmodel with time varying covariances. J. Polit. Econ., Chicago, v.96, p.116-131,1988.

CHIB, S.; GREENBERG, E. Bayes inference for regression models with arma(p,q)errors. J. Econ., Amsterdam, v.64, p.183-206,1994.

————. Understanding the Metropolis Hastings algorithm. Am. Stat., Alexandria,v.49, p.327-335, 1995.

CHIB, S.; NARDARI, F.; SHEPHARD, N. Markov chain Monte Carlo methods forstochastic volatility models. J. Econ., Amsterdam, v.108, p.281-316, 2001.

————. Analysis of high dimensional stochastic volatility models. J. Econ.,Amsterdam, 2005. No prelo

De JONG, P.; SHEPHARD, N. The simulation smoother for time series models.Biometrika, London, v.82, p.339-350, 1995.

DIEBOLD, F. X.; NERLOVE, M. The dynamics of exchange rate volatility: amultivariate latent factor arch model. J. Appl. Econ., Chichester, v.4, p.1-21, 1989.

ENGLE, R. F.; NG, V. K.; ROTSCHILD, M. Asset pricing with a factor-archcovariance structure: empirical estimates for treasury bills. J. Econ., Amsterdam,v.45, p.213-238, 1990.

FRANK, J.; HARDLE, W.; STAHL, G. Measuring risk in complex stochasticsystems. New York: Springer-Verlag, 2000. 257p.

FULLER, W. A. Introduction to statistical time series. 2. ed. New York: JohnWiley, 1996. 728p.

GEWEKE, J.; ZHOU, G. Measuring the pricing error of the arbitrage pricing theory.Rev. Financ. Stud., Oxford, v.9, p.557-587, 1996.

HARVEY, A. C.; RUIZ, E.; SHEPHARD, N. Multivariate stochastic variancemodels. Rev. Econ. Stud., London, v.61, p.247-264, 1994.

KIM, S.; SHEPHARD, N.; CHIB, S. Stochastic volatility: likelihood inference andcomparison with arch models. Rev. Econ. Stud., London, v.65, p.361-393, 1998.

LOPES, H. F.; WEST, M. Bayesian model assessment in factor analysis. Stat.Sinica, Taipei, v.14, p.41-67, 2004.

NARDARI, F.; SCRUGGS, J. T. Analysis of linear factor models withmultivariate stochastic volatility for stock and bond returns. Arizona: Faculdadede Administracao W. P. Carey, Universidade Estadual do Arizona, 2003. Relatoriode trabalho.

NG, V. K.; ENGLE, R. F.; ROTSCHILD, M. A multi-dynamic-factor model forstock returns. J. Econ., Amsterdam, v.52, p.245-266, 1992.

56 Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005

Page 25: Rodrigo TSAI Luiz Koodi HOTTAjaguar.fcav.unesp.br/RME/fasciculos/v23/v23_n2/A3_Tsai.pdf · de estima»c~ao do modelo ¶e detalhado de acordo com os dois esquemas de simula»c~ao MCMC

PITT, M. K.; SHEPHARD, N. Filtering via simulation: auxiliary particle filters.J. Am. Stat. Assoc., Alexandria, v.94, p.590-599, 1999.

ROSS, S. The arbitrage theory of capital asset pricing. J. Econ. Theory, New York,v.13, p.341-360, 1976.

WEST, M., HARRISSON, J. Bayesian forecasting and dynamic models. 2. ed. NewYork: Springer-Verlag, 1997. 680p.

Recebido em 06.08.2004.

Aprovado apos revisao em 16.05.2005.

Rev. Mat. Estat., Sao Paulo, v.23, n.2, p.33-57, 2005 57