问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

量化策略:商品期货的中高频数据的高阶特征分析

创作时间:
作者:
@小白创作中心

量化策略:商品期货的中高频数据的高阶特征分析

引用
新浪网
1.
https://finance.sina.com.cn/money/future/wemedia/2024-09-13/doc-incnzezq5705334.shtml

本篇报告针对时序高阶类型因子进行研究。对该类因子为何能够存在的底层逻辑、其收益来源、以及影响其效果的关键因素一一展开讨论。

一、因子概述

高阶特征利用期货高阶矩与其未来收益建立联系,刻画日内价格分布以及快速变化的特征,能够有效反映价格的除动量和波动率这样一阶和二阶特征外更高阶的特征。本文主要就高频数据中的峰度与偏度系数进行验证,峰度系数衡量的是数据分布的尖峰程度,数值越大,数据点越集中在峰值周围,而偏度系数则揭示了分布的不对称性,绝对值越大,表明数据点在正负方向上的偏离越明显,中位数与平均值之间的差距会更显著。峰度系数过小意味着分布平滑,可能导致区分度不足,而过大则可能导致信号过于集中,尾部不稳定。偏度系数则为我们揭示因子的特性,如新闻情绪因子常常倾向于正向偏离,暗示积极信息占主导。

1. 中高频数据的应用

在量化交易策略中,我们通过多次资产组合,对风险资产的权重进行动态调整。除了关注截面上资产组合本身的风险、收益率之外,还应该关注制定策略在时序上的稳定性、胜率、风险等。常用的业绩评价指标主要包括:

  • 信息含量更加丰富:相较于日频数据,高频数据具有更加丰富的信息量。高频数据体量往往明显大于低频数据。相对于日频数据,高频交易数据的体量是其几万倍,考虑到计算机的算力水平,本文主要使用的是30分钟的中高频数据,其体量也能达到日频数据的10倍以上。
  • 因子开发度较低:当前市场上,日频数据的开发与研究相对更加成熟,日频因子的拥挤程度很高,但是高频数据结构相对复杂,处理成本较高,且信息主要来源于日内行情,因子开发流程相对复杂,这些因素都使得因子拥挤度相对较低,且高频数据的开发也可以借鉴日频因子的开发思路,可以为高频因子的开发提供灵感。
  • 因子相关性较低:日频数据的数据维度较低,通常使用的包括价格,成交量,涨跌幅,换手率等,高频数据拥有更高的数据维度,类似期货市场中的tick 数据,盘口五档的报价信息等,这是在日频维度中无法得到的数据,所以我们可以从更多的维度去开发因子,由于高频因子的高维度信息和丰富的数据处理方式,使用高频数据构造的因子内部相关性较低,投资者更有可能从中获得更丰富的信息增量。

2. 因子开发过程

  1. 成交量峰度因子
  • 逻辑:使用的是日内15分钟的成交数据,我们这里使用的是距当前成交价格500根K线的成交量作为计算标准,计算出前K线各商品品种与前500根K线成交量占比,选取成交量占比偏度最大的部分品种做多,选取成交量占比偏度最小的部分品种做空。
  1. 成交量偏度因子
  • 逻辑:我们这里使用的是距当前成交价格500根K线的成交量作为计算标准,计算出前K线各商品品种与前500根K线成交量占比,选取成交量占比偏度最大的部分品种做多,选取成交量占比偏度最小的部分品种做空。
  1. 成交量峰度与偏度比值因子
  • 逻辑:我们这里使用的是距当前成交价格500根K线的成交量作为计算标准,计算出前K线各商品品种与前500根K线成交量占比,再计算其峰度与偏度的比值,选取数值最大的部分品种做多,选取数值最小的部分品种做空。
  1. 收益率峰度因子
  • 逻辑:使用的是日内15分钟的成交数据,我们这里使用的是距当前成交价格500根K线的收益率作为计算标准,选取收益率峰度最大的部分品种做多,选取收益率峰度最小的部分品种做空。
  1. 收益率偏度因子
  • 逻辑:使用的是日内15分钟的成交数据,我们这里使用的是距当前成交价格500根K线的收益率作为计算标准,选取收益率偏度最大的部分品种做多,选取收益率偏度最小的部分品种做空。
  1. 收益率峰度与偏度比值因子
  • 逻辑:使用的是日内15分钟的成交数据,我们这里使用的是距当前成交价格500根K线的收益率作为计算标准,再计算其峰度与偏度的比值,选取收益率偏度最大的部分品种做多,选取收益率偏度最小的部分品种做空。

二、因子表现





全市场范围内,收益率偏度与峰度比值因子表现较好,具有良好的单调性,与常见因子不存在显著相关性;而成交量占比峰度因子的表现较差,在各个年份均不存在明显正收益。

收益率偏度与峰度比值因子与收益率偏度因子具有良好有效性,在15分钟中高频测试下,两个因子的年化收益超过30%。夏普比率与卡玛比率均超过0.5,收益率偏度因子在22至23年间收益爆发力较强,其余年份收益能力一般,收益率偏度与峰度比值因子在各个年份收益相对均匀。

从上面测试结果中我们可以看到,收益率高阶特征因子的绩效水平明显强于成交量占比高阶特征因子,但两类因子之间的相关性较低,我们后续将对六个因子进行等权合成,并评估其效果。

三、组合测试结果

  1. 回测参数
  • 资金分配:我们比较全品种等权资金分配方案策略效果,基础资金分配时间为每季度最后一个交易日,基础资金分配如下:
    注:杠杆系数在下文测试中统一设为2.0。

  • 测试参数

  • 回测时段:2014年7月1日 - 2024年9月9日

  • 回测品种:期货市场内流动性较好的30多个品种

  • 成交时间:信号出现后下一个K线周期开盘价;手续费设置: 交易所手续费 +20%;

  • 交易频率:15min;

  • 杠杆系数:1;

  • 品种资金分配:每个季度最后一个交易日,按照当前可交易品种分配基础资金单位。

  1. 双因子组合表现


年度表现如下:

从组合信号的测试结果来看,我们可以发现,合成策略后,策略的绩效水平显著高于前述6个波动率策略的绩效水平,合成策略的夏普比率超过2,卡玛比率超过2.7,相较于之前策略,组合策略夏普比率提升超过400%,但最大回撤大幅度缩小,缩小超过40%,从年度收益表现来看,策略也在每个年度均能取得正收益,策略在16年与近年表现相对较差,均未能取得较高的正收益。

从策略稳定性来看,组合策略16年至18年与20年至22年之后爆发力较强,年度收益据超过20%,其中17年与22年收益甚至超过40%,但是今年几乎未取得正收益,且当前正处于回撤调整的状态。总体来看,策略22年之前较为稳健,净值稳步提升,但近年来,随着宏观风险增大,策略波动加大,回撤幅度也相应增大。

四、结论

本文就期货商品市场中各品种高频成交量与收益率的高阶特征进行研究,其中的主要特征为两者的峰度与偏度系数。峰度和偏度系数,作为统计分析的重要组成部分,为我们揭示因子的动态特性,是构建投资策略的有力支撑。它们没有固定的优劣之分,而是根据具体情境灵活运用,帮助我们捕捉到有价值的交易信号,经本文验证,收益率的高阶特征因子相较于成交量的高阶特征因子表现更好,且两者之间相关性较低,将6个因子合成后,组合策略绩效提升幅度较大,但近年来,随着宏观事件干扰,影响策略表现,近期策略净值增长幅度下降较大,回撤幅度也相应增大。

本文原文来自中信建投期货

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号