精华帖分享|因子分析方法和策略评价指标总结
精华帖分享|因子分析方法和策略评价指标总结
因子分析是量化投资领域的重要研究方向,通过对因子的有效性进行评估,可以帮助投资者更好地理解市场规律,制定更合理的投资策略。本文将介绍几种常用的因子分析方法和策略评价指标,帮助读者深入理解因子分析的核心内容。
本文来源于量化小论坛策略分享会板块精华帖,作者为孙小迪,发布于2024年10月08日。
前言
上一篇文章《因子基本结构总结》,介绍了因子的基本结构和构造方法。当生成了一个新因子后,如何评价新因子是否有效呢?这篇文章将会介绍几种常用的因子分析方法和策略评价指标:
- 因子分析方法:IC、RANK_IC、IC分布、IC累计、IC衰退、IR、RANK_IR、分组测试等。
- 策略评价指标:年化收益、最大回撤、年化收益/回撤比、胜率、盈亏比等。
下面逐一进行详细讲解。
信息系数IC
定义:IC是信息系数(Information Coefficient,简称 IC)。
公式:IC值是T周期因子值(或排序值)与T+1周期收益率(或排序值)之间的相关系数。
IC意义:IC代表因子和收益之间的相关性,通常用于评价因子预测能力,IC绝对值越大,表示预测能力越好,即选股能力越强。
IC分类:IC分为NORMAL_IC和RANK_IC两种,一般说的IC指的是NORMAL_IC。金融类数据是非线性的,采用RANK_IC来进行评价。
IC计算示例代码:
IC计算原理:按照IC计算公式,每一个截面数据会生成一个IC值,所有截面数据将会生成一个IC值序列,如下图。
IC分布:把IC值序列在时间轴上绘制直方图,可以展示IC分布图,如下图。
IC累计:对IC序列求累计和,如果累计曲线是单调递增的,说明整体收益和因子正相关。
IC衰退:指一个因子对于标的未来收益的预测能力随时间推移而减弱的现象。如果一个因子的IC值随着时间滞后期数的增加而迅速下降,这表明因子的预测能力具有较短的时效性。
如果要计算IC衰退,需要将相关系数扩展到T+i周期,具体步骤如下:
第1步:计算截面上T周期因子值与T+i周期收益率之间的相关系数(i=1,2,3...)
第2步:计算IC每隔i周期的均值
第3步:绘制直方图,观察IC均值随i变化的衰减情况。比如:IC半衰期,半衰期是指IC值下降到其初始值一半所需的时间,可以用来衡量因子预测能力的持久性。
IC衰退计算原理如下图所示:
信息比率IR
定义:IR是信息比率(Information Ratio,简称IR)。
公式:IR= IC多周期均值/IC标准差。
意义:IR兼顾因子选股能力(由IC代表)和因子选股能力的稳定性(由IC的标准差的倒数代表)。
分类:同样,IR分为NORMAL_IR和RANK_IR两种,一般说的IR指的是NORMAL_IR。
IR计算示例代码:
分组测试
定义:分组测试又叫分箱测试,主要用于评价因子的稳健性。第一组的收益越高越好,最后一组收益越低越好,如果最终的分箱测试结果是单调的,则说明因子和收益的单调关系在测试时间段内是是稳健的。
分组测试流程如下:
分组测试原理演示:(为了演示简单,只做分为5组)
分组测试示例代码:
指标汇总
上面介绍了常用的几种因子分析方法,结合彩虹官方的策略评价指标,将各指标的意义汇总如下: