量化交易-因子评价(1)


    总结一下因子评价,最简单的方法,是使用quantopian的alphalens,简单粗暴,但不够灵活,每个人都因子评价的指标着重点不同,因此,我们最好自己写一套因子评价,来为我们自己服务

(1) 单因子

  -- ic/ir

  -- 回归

  -- 分组

以上是单因子评价,常用的3个方法,(当然在alphalens里也都可以实现,但用别人的东西,除了臃肿,而且不够随意,现在一一说一下

 1. ic/ir

  ic是信息系数,是每个周期横截面下,因子值与下周期收益率的相关系数

  所以ic是一个时间序列,每个周期都有一个ic,ic的值可以是正的,也可以是负,正的代表正相关,负的,代表负相关,ic的最大值为1,最小为-1,通常认为,绝对值大于0.02为可用因子,大于0.04为较好的因子

  ir是信息比率,ir=ic(mean)/ic(std) 表示获取超额收益能力的指标

2.回归

  每个周期横截面,因子值为自变量,下个周期的收益为因变量,做线性回归,r=kf+b 因子项k即因子收益率,还可以看出k的t值,(可使用最小二乘法或稳健回归),评价指标,因子收益的mean,t值(均值/标准差),,mean大于0,计算因子收益大于0的概率,反之.还有t

值的军队值的均值,t值有效性等(因子收益均值大于0,t大于2的概率,均值小于0,t小于-2的概率)

3. 分组

  每周期横截面,按因子值分组,计算每组的资金曲线,(alphalens里还加了第一组和最后一组的对冲,评价指标,单调性,最大回撤,夏普,calmar等)分组单调性,线性回归r方,分组分离度,线性回归 斜率

(2) 多因子

  即因子组合,相比单因子因子组合可以更加稳健

  1 相关性过滤,如果两个因子多空收益的相关性大于0.5 ,过滤调与所有因子相关性均值较高的因子

  2 因子组合

    -- 等权

    -- ic均值加权:使用因子过去一段时间ic的均值为权重

    -- ic/ir加权:使用过去一段时间ir为权重

    -- 遗传规划

    -- lasso

写了个简单单因子评价框架 https://github.com/guojunlei/factorevaluation

后面会在加入多因子的组合