异质性自回归模型的预测优势
异质性自回归模型的预测优势
异质性自回归模型(HAR模型)是金融计量学中用于预测波动率的重要工具。本文从自回归模型的基本概念出发,详细介绍了HAR模型的理论基础、建模方法及其在实际预测中的优势。通过与传统自回归模型的比较,展示了HAR模型在预测外汇、期货和国债等金融资产波动率时的优越性。
摘要
异质性自回归模型(Heterogeneous Autoregression model)是由Corsi(2009)提出的,用来对经济金融时间序列,特别是波动率时间序列中的长记忆性进行建模。该模型可以更好地刻画时间序列随着时间范围而改变的尖峰厚尾性质。同时,该模型的估计方法非常简便,运用最小二乘(OLS)并且配合Newey-West修正就可以得到无偏的、经过自相关和异方差调整的估计参数。这使得该方法广泛应用于对国际能源波动和金融资产波动建模并外推预测。
一、从自回归模型说起
自回归模型(Autoregressive model)是统计时间序列分析方法中一种最常见、最广泛应用的时间序列分析工具。这一方法的思想和移动平均模型相结合演变出了自回归移动平均模型(Autoregressive moving average model,ARMA模型)、季节模型(Seasonal autoregressive moving average model)以及ARCH和GARCH模型。这些模型均在经济学的各领域中得到广泛的应用,如ARMA模型常用于资产收益率建模、季节模型常用于航空业定价和预测、ARCH和GARCH模型常用于资产波动率建模。尽管这些模型已经对经济、金融变量的时间序列建模产生重要作用,它们依然无法完全描述和复现出经济金融时间序列中的范围和时间尺度信息,如收益率平方和绝对值的自回归系数具长时间范围的显著性、收益率概率分布函数的尖峰厚尾(leptokurtic)性质会随着时间范围而改变并且会非常慢地收敛于正态分布。由此,经济金融数据表现出一定程度的长记忆性。
这种长记忆性既可以看作是数据真实固有的性质也可以看作是几个不同时间范围的简单过程叠加而成。因此,有两种不同的方法来对这种长记忆性时间序列建模。针对第一种解释,有FIGARCH方法对收益率(returns)进行建模和ARFIMA模型对已实现波动率(realized volatility)进行建模。针对第二种解释,有异质性自回归模型对波动率(volatility)进行建模。由于第二种方法在实现同等目标下更加方便和具有明确的经济金融含义,大量研究采用这一方法对经济金融中各种变量进行研究,并取得了大量成果,其中特别是在国际能源波动率的建模和预测方面取得显著成效(Jawadi等,2024)。这里主要介绍异质性自回归模型(Heterogeneous autoregressive model)建模、估计和预测等相关内容。
二、什么是异质性自回归模型?
异质性自回归模型理论源于Muller等(1993)提出的异质性市场假说(Heterogeneous Market Hypothesis),该理论认为市场中交易者存在着异质性。这一观点与如下这些观点和假说不谋而合,如Peters(1994)的分形市场假说(Fractal Market Hypothesis),Lux和Marchesi(1999)以及Alfarano和Lux(2007)的经纪人交互视角(Interacting Agent View),LeBaron(2006)的基于经纪人模型(Agent-based model)。Anderson和Bollerslev(1997)在他们的混合分布假说(Mixture of Distribution Hypothesis)中也预言了波动率过程中的异质性成分,这种异质性成分源于信息到达的异质性。由于市场中异质性投资者存在,波动率在时间范围上也会存在异质性。Anderson等(2003)发现直接从时间序列对已实现波动率进行建模要远好于由GARCH和随机波动率模型(stochastic volatility)计算出的波动率。异质性自回归模型(HAR),它的参数可以直接用最小二乘方法(OLS)进行估计,同时可以通过Newey-West方法来对异方差和自相关进行修正。
三、一个实例说明HAR的预测优势
Corsi(2009)利用异质性自回归模型对美元对瑞朗外汇、标普500期货和30年美元国债的收益率进行分析。他们利用最小二乘(OLS)和Newey-West调整方法得到回归参数。并且与自回归模型进行比较,并且测试了该模型的样本内预测表现以及样本外预测:
表1:外汇、期货和国债在不同模型的不同时间段内的预测性能比较
结论:分别使用AR(1)、AR(3)、ARFIMA(5, d, 0)和HAR(3)预测外汇、期货和国债的的一天、一周和两周的样本外表现可知:
(1)AR(1)、AR(3)与HAR(3)模型是基于一个包含1000个观测值的滚动窗口每日重新估计的。
(2)对于ARFIMA(5, d, 0)模型,系数d是预先估计的。
(3)在进行了差分处理之后,Taylor展开的截断极限设为1000,此时估计AR(5)参数的最佳滚动窗口长度大约为250天。
(4)评价指标包括均方根误差(RMSE)、平均绝对误差(MAE),以及Mincer-Zarnowitz回归的决定系数R²。
(5)多步预测的表现通过比较多期范围内实际波动率与预测波动率的总和来进行评估。
可以看出,该模型整体上优于已有的自回归模型。
总结
异质性自回归模型可以对波动率时间序列中的长记忆性进行建模。该模型可以更好地刻画时间序列随着时间范围而改变的尖峰厚尾性质。同时,该模型的估计方法非常简便,运用最小二乘(OLS)并且配合Newey-West修正就可以得到无偏的、经过自相关和异方差调整的估计参数。这使得该方法广泛应用于国际能源波动和金融资产波动建模。
本文原文来自澎湃号