多模型预测DR007:2024年2月资金利率或维持1.85%
多模型预测DR007:2024年2月资金利率或维持1.85%
DR007(7天期存款类机构质押式回购加权利率)是衡量短期资金价格的重要指标。本文尝试建立宏观指标与DR007之间的量化分析模型,以期预测资金市场短端利率走势。
变量选择与处理
因变量
为了预测资金市场利率走势、剔除日度波动,本文选取DR007的月度均值作为因变量。此外,7天期逆回购利率(7D-OMO)作为政策利率,是市场利率的定价锚,DR007以其为中枢上下波动。政策利率的调整,对于DR007的趋势有着重要的影响。通过计算DR007与7D-OMO之间的利差(DR007-OMO),可以剔除利率中枢整体下移的影响,捕捉资金利率相较基准的相对变化。本文亦将DR007-OMO作为因变量,分别建立模型,观察拟合效果有否改善。
上图显示,DR007与DR007-OMO走势整体一致;考虑到报告可读性,下文展示解释变量与因变量关系时,作图和文字部分仅显示与DR007的结果。此外,如未另外说明,则本文时间区间为2016年1月至2023年12月。
解释变量
1.2.1 货币供需
DR007作为资金利率,受到货币供应和需求的影响。通过对比DR007和M1同比、M2同比、社会融资规模存量同比之间的相关系数和走势,发现DR007与社融同比-M2同比之间的相关性最显著,相关系数为0.788[1]。为避免引入多重共线性,仅将社融同比-M2同比作为解释变量。
1.2.2 通胀水平
利率与通胀之间存在着密切的联系,通过对比DR007与CPI同比、核心CPI同比、以及PPI同比之间的相关性与走势,发现DR007与核心CPI同比之间相关性最高,相关系数约为0.784[2]。因此选用核心CPI作为解释变量。
1.2.3 产需缺口与企业经营状况
制造业采购经理指数(PMI)是重要的经济前瞻指标,其中新订单指数减去产成品库存可以近似看作是供需缺口。DR007与PMI的相关系数为0.292,与新订单-产成品库存差值的相关性提高至0.485,因此选用PMI供需缺口作为解释变量。
与PMI类似,长江商学院编制的BCI企业利润前瞻指数,每月发布时间较早,走势上对于DR007的拐点具有一定的领先性;而且同PMI相比,BCI企业利润前瞻指数与DR007的相关性更强,相关系数为0.731,因此选做解释变量。
1.2.4 银行间杠杆水平
用银行间质押式回购成交量的月度均值,除以中债登和上清所口径的债券托管量,作为银行间杠杆水平的衡量。该指标和DR007之间相关系数为-0.569,纳入解释变量。
1.2.5 票据融资占比
企事业单位贷款是重要的信贷投放领域,也体现着实体经济的融资需求的强弱。当信贷需求疲软时,往往存在票据冲量的现象,因此用票据融资占企业贷款的比重衡量实体部门融资需求的强弱。该指标与DR007之间相关系数为-0.862,纳入解释变量。
1.2.6 房价
房价作为重要的资产价格,对于资金利率具有一定影响。通过对比商品房销售均价和二手房出售挂牌价指数同比,发现二手房出售挂牌价指数与DR007具有较强的相关性,相关系数达0.823[3],纳入解释变量。
1.2.7 海外因素
人民币利率水平,一定程度上也受到海外利率走势的影响。通过计算对比DR007与美国10年期国债利率、美元兑人民币中间价、美元指数之间的相关系数,发现美元指数与DR007之间相关性最显著,相关系数为-0.571,纳入解释变量。
1.2.8 其他未纳入指标
第一,尽管出口对拉动国民经济具有举足轻重的作用,但计算显示进出口当月同比和出口当月同比与DR007之间相关性较弱,因此暂不纳入模型。
第二,尽管失业率与DR007具有较强的相关性,相关系数达到-0.603,但考虑到城镇调查失业率数据始于2018年,2016年至2017年数据缺失,因此暂不纳入。
第三,OECD综合领先指标与DR007相关性较弱,相关系数为0.265,因此暂不纳入。
第四,央行公开市场操作量以及政府债融资额分别作为货币投放和资金回笼,对于资金利率有着重要的影响。但从其作为单一指标与DR007月度均值之间的相关性并不显著,且一定程度体现在了M2和社融指标之中,因此暂不纳入解释变量。
第五,央行货币政策的宽松操作亦会影响资金利率。若月内央行采取降准(以变动公告日期为准)或降息操作,则计作该月存在货币宽松操作,以此形成哑变量。该指标与DR007以及与DR007的差分项之间相关系数皆不显著,且加入模型后预测表现未有明显改善,因此暂不纳入。
1.3 变量处理
大部分宏观指标的发布具有一定时滞性,直接纳入模型易引入未来信息。以具有前瞻性指标PMI为例,PMI于每月最后一天发布,而此时当月资金市场交易至剩下1天,数据发布对于当月DR007的均值已无法造成显著影响。相反,PMI数据发布会影响下月月初的资金面。多数宏观指标的发布迟于PMI,往往在次月发布前月数值,其影响也主要体现在次月,因此本文将解释变量中的月度指标进行滞后。
解释变量中的高频指标,在月内发布多期,对于当月DR007走势会产生影响。因此,对于美元指数、二手房出售挂牌价指数等高频指标,本文取月内多期发布值的算术平均作为当月值,且不进行滞后处理。
模型拟合与表现评价
一方面,假设每一个由解释变量描述的宏观场景对应着一个资金利率,DR007各期之间独立分布,则可直接建立解释变量与DR007之间的映射关系;另一方面,考虑到资金利率具有自相关属性,需要构建时间序列模型来纳入此前走势对于当期的影响。本文分别使用两种建模思路进行拟合,并通过比较样本外预测效果,来评价模型表现。
2.1 非时间序列
2.1.1 OLS模型
采用5折交叉检验(5-Fold Cross Validation)的方式,将2016年1月至2023年12月的96期月度数据,随机拆分成训练集和测试集,使用训练集建立线性回归(OLS)模型,并对测试集进行预测。重复上述随机过程500次,并计算测试集预测值相较真实值的MAE(mean absolute error),以此评价模型表现。
以DR007作为因变量,OLS模型的MAE为11.39,意味着预测值较真实值平均偏差11.39bp。
2.1.2 KNN模型
同样采用5折交差检验的方式,以DR007作为因变量,建立K最邻近模型。尝试不同的K值,并重复随机过程后,KNN模型的MAE为7.91,意味着预测值较真实值平均偏差7.91bp。
2.1.3 RF模型
同样采用5折交差检验的方式,以DR007作为因变量,建立随机森林模型。重复随机过程后,RF模型的MAE为8.24,意味着预测值较真实值平均偏差8.24bp。
2.2 时间序列
2.2.1 ARIMA模型
由于时间序列的自相关性,无法使用交叉检验的方式进行样本外预测,本文使用前N期观测值建立模型,预测第N+1期数据,以此查看样本外预测效果。ARIMA需要一定的数据长度来训练模型,本文使用前24期数据训练,从2018年1月开始查看样本外预测值,并逐期滚动。2018年至2023年,ARIMA模型的MAE为15.52,意味着预测值较真实值平均偏差15.52bp。
从图形上看,由于考虑了自相关,DR007此前的变动趋势被模型捕捉,导致ARIMA模型的预测值的拐点较真实值存在一定的滞后。通过差分使数据平稳后,亦无法完全消除前一期携带的变动趋势。
2.2.2 VAR模型
同样使用差分平稳后的数据建模,2018年至2023年VAR模型样本外MAE为12.23。由于同为时间序列模型,自相关因素使得预测值亦存在着1期左右的滞后问题。
2.3 模型表现评价
如果能够有效预测DR007与7D_OMO之间的利差,亦可实现对于短端资金利率的有效预测。因此,使用DR007-OMO作为因变量,重复前文所述建模过程,得到不同模型的表现。
上表显示,对于非时间序列模型来说,使用DR007作为模型因变量表现整体好于DR007-OMO作为因变量;对于时间序列模型而言,使用DR007-OMO作为因变量,整体表现好于直接预测DR007。
模型的应用
五个模型中,VAR模型使用所有变量的滞后项预测下一期数据,因而可以直接用于预测。使用输入变量的1月值,可以得到2月DR007和DR007-OMO的预测值。
根据VAR模型,2月DR007预测值为1.88%。DR007-OMO预测值为10.29bp,若2月7D-OMO维持1.80%,则对应DR007为1.90%;若2月7D-OMO降息10bp,则对应DR007约为1.85%。
对于其他四种模型而言,在给出预测时需要输入变量,对此本文采取两种思路。
3.1 输入变量手动赋值
与前文的思路一致,即模型已训练完毕,为预测下一期,只需给出输入变量下一期的值即可。2月输入变量中已发布:PMI供需缺口为-0.40;BCI企业利润前瞻指数为52.74;截至2月8日,美元指数均值为103.94。其他解释变量需要手动给出预测值,假设社融-M2较上月上升至0.0%,票据融资占比上升至9.0%,核心CPI下降至0.50%,银行间杠杆上升至5.6%,二手房挂牌价同比下行至-6.4%。上述输入变量对应的预测值为:
多数模型对于DR007的预测值落在1.86%-1.88%之间。对于DR007-OMO的预测值,各模型差异较大,根据前文MAE结果,非时间序列的OLS、KNN和RF对于DR007-OMO预测力较差,因此主要采信ARIMA预测结果12.76bp,对应降息情景的1.88%,不降息情景的1.93%。
该思路的优势在于,预测的输入变量包含了潜在的未来信息,或协助判断拐点;缺点在于,预测的准确性更加依赖输入变量预测值的准确性,同时增加了预测的繁琐程度。
3.2 滞后错期
为应对未来输入变量缺失,建模时可对输入变量滞后错期,通过先建立T-1期解释变量与第T期因变量的映射关系,再使用T期的解释变量对T+1期因变量进行预测。则可使用输入变量的1月值,对2月DR007进行预测:
鉴于各模型MAE表现,OLS、KNN、RF模型主要采信DR007结果,则2月DR007预测值在1.81%-1.87%区间;ARIMA模型主要采信DR007-OMO结果,则OMO降息情景下DR007中枢为1.88%,不降息情景下DR007中枢为1.93%。
该思路通过滞后,用T期解释变量预测T+1期因变量。优势在于,可直接利用已发布宏观数据进行预测,避免预测输入变量的主观性;缺点是输入模型的只是历史数据,并不包含新信息,因此对于拐点的预测会呈现滞后特征,且滞后导致模型的MAE较原始模型略微上升。
小结
综合各个模型和预测思路,2月DR007中枢整体持平上月,各模型均值为1.857%,较1月小幅下行0.33bp;若2月逆回购操作降息10bp,则中枢或下移至1.846%。
注:
[1]DR007与M1同比的相关系数为0.319,与M2同比的相关系数为-0.550,与社融同比的相关系数为0.571。
[2]DR007与CPI同比的相关系数为0.136,与PPI同比的相关系数为0.272。
[3]DR007与商品房销售均价相关系数为0.363。