量化交易-因子评价(1)
总结一下因子评价,最简单的方法,是使用quantopian的alphalens,简单粗暴,但不够灵活,每个人都因子评价的指标着重点不同,因此,我们最好自己写一套因子评价,来为我们自己服务
(1) 单因子
-- ic/ir
-- 回归
-- 分组
以上是单因子评价,常用的3个方法,(当然在alphalens里也都可以实现,但用别人的东西,除了臃肿,而且不够随意,现在一一说一下
1. ic/ir
ic是信息系数,是每个周期横截面下,因子值与下周期收益率的相关系数
所以ic是一个时间序列,每个周期都有一个ic,ic的值可以是正的,也可以是负,正的代表正相关,负的,代表负相关,ic的最大值为1,最小为-1,通常认为,绝对值大于0.02为可用因子,大于0.04为较好的因子
ir是信息比率,ir=ic(mean)/ic(std) 表示获取超额收益能力的指标
2.回归
每个周期横截面,因子值为自变量,下个周期的收益为因变量,做线性回归,r=kf+b 因子项k即因子收益率,还可以看出k的t值,(可使用最小二乘法或稳健回归),评价指标,因子收益的mean,t值(均值/标准差),,mean大于0,计算因子收益大于0的概率,反之.还有t
值的军队值的均值,t值有效性等(因子收益均值大于0,t大于2的概率,均值小于0,t小于-2的概率)
3. 分组
每周期横截面,按因子值分组,计算每组的资金曲线,(alphalens里还加了第一组和最后一组的对冲,评价指标,单调性,最大回撤,夏普,calmar等)分组单调性,线性回归r方,分组分离度,线性回归 斜率
(2) 多因子
即因子组合,相比单因子因子组合可以更加稳健
1 相关性过滤,如果两个因子多空收益的相关性大于0.5 ,过滤调与所有因子相关性均值较高的因子
2 因子组合
-- 等权
-- ic均值加权:使用因子过去一段时间ic的均值为权重
-- ic/ir加权:使用过去一段时间ir为权重
-- 遗传规划
-- lasso
写了个简单单因子评价框架 https://github.com/guojunlei/factorevaluation
后面会在加入多因子的组合