一、因子那么多,怎么用才有效?(剔除多重共线性)


        1、因子分类:将因子按照风格或经济学含义不同分为收入因子、规模因子、技术因子、估值因子、统计因子等大类;


        2、相关系数法:计算所有因子的相关系数在高度相关的因子中挑选代表因子留下,保证剩余因子相关性不高,避免多重共线性;


        3、主成分分析法:采用主成分分析法,计算能够代表各大类因子的第一、第二、第三主成分,只取主成分因子避免多重共线性


        4、多因子合成:利用QEPM中的最大化因子IC_IR的优化方法,把同类因子合成为一个大类因子,因子数据必须经过处理(winsorize去极值、neutralize中性化,消除行业和风格因子等的影响、standardize标准化、orthogonalize残差正交化调整,因子间存在较强相关同质性时,使用施密特正交化方法对因子做正交化处理,用得到的正交化残差作为因子去除共线性




二、因子那么多,几个因子组合才是最好?(我们来搭积木)


        国信证券的金融工程研究报告中,选择了23个因子,通过穷举的方法组合构建了23个单因子模型、253个双因子模型、347个三因子模型、520个四因子模型以及300个五因子模型,通过分析他们的历史表现,得出因子边际效用递减的结论。

 1、单因子模型回测:



2、双因子模型回测:




3、三因子模型回测:





4、各因子模型横向比较:



强烈要求:果仁提供快速搭积木的工具包,单因子、双因子、三因子的快速组合回测



三、因子轮动,如何挑选最佳适配期因子


        1、如何区分因子属于长期因子还是短期因子:用高频的因子预测低频因子


  • 长期因子:随价格缓慢变动,所以变化更慢,平缓,理论上应该更低频率(长波低频) 
  • 短期因子:随价格迅速变动,所以变化更快,陡峭,理论上应该更高频率(短波高频)



        2、如何区分长短波

  • 方差法
  • 均值交叉点,曲线按照均值平移,均值为0轴,交点多少可以反映出频率大概情况。实际是因子做diff然后计算反转个数替代。
  • 相关系数 


        3、方差法

  • 因子先做差分diff
  • 差分后因子在一定时间内的 “相对均值标准差=标准差/均值” 作为频率的衡量
  • 如果频率高于价格closeprice对应的频率,就认为比基准更高频,可以使用
  • 如果低于closeprice频率,认为因子属于长期因子,不适用短期预测


       4、交叉点法

  • 对因子做差分diff(后面的因子都是指差分后的)
  • 差分后因子相邻的两天,如果有正负变化,认为有一次交叉
  • 统计周期内closeprce的正负变化次数为基准,差分后因子次数,如果因子高于closeprice基准则认为高频,可以采用。否则不用


     5、最佳适配期因子列表(采用方差法)

        给出策略轮动周期(5天、20天等),输出适合此周期的因子列表(其实是比此周期高频因子)



三、因子轮动,测算近期最强的因子


        1、把各因子按照最高最低1/10排列,每5天进行一次调仓,来测算近一段时期的有效因子情况,

        2、按周、半月、一月、一季度、近半年、近一年分别排序。







强烈要求:果仁提供近期因子表现的清单


备注:以上内容来自微信文章的修改