【原创】第1149篇  很多同学在参加因子挖掘比赛,但对于如何做因子一直没搞清楚,这篇文章就来说说这个事儿(大家可以参考文尾的PPT)。

科学目前按一个方向来走,其实已经很难走得更远了,所以,学科交叉成为了当下科研的重要方向。同理,新因子,也可以是之前老因子的交叉组合,这里面用遗传算法就行了。重点的研究方向可以是之前的阿尔法101因子,也可以是祖拉教授新出的151因子,还可以是学术界最新的447因子。

即使找到了新的因子,也会受有效性的制约,这点也要注意。在教学生做因子分析的时候,我是会考虑到因子的有效性问题,这要从两个方面分析:一是这个因子是否是统计出来的暂时现象,如果是,有效时长就短;二是这个因子如果是符合人性长期在市场上存在的,有效时长就长。

年轻的时候,看牛人喝着咖啡研究策略,感觉人家真有品;等自己到了这个年纪,才发现喝咖啡原来不是为了装酷,而是老了,专注度不够,不喝咖啡干不了活。

今年,我专门在量化投资的课程中开辟了一个系列是讲因子挖掘的。目前,我在世坤的brain平台上成功提交了9个因子,在1.75万人中排名第1409。国内参赛1255人,各大名校基本上都有高手参加,提交9个因子基本上可以排名国内前100,提交15个就能进前50,提前20个就有可能进前10了。

这9个因子扣除前3个平台有支持(可以参考调用的3个示例)比较简单,后续的就需要自己提想法了,这个比较难,再加上要与之前的策略相关性低于0.7,所以,之后的难度确实是几何级增长的。我提交9个大约研究了一周,如果经验少的人估计时间会比较久(有的学生手把手交到目前都没提交成功过1个)。这样看,在量化交易公司做因子研究进入瓶颈也很正常。但如果观测北大那个6万+的因子大牛,说明还是应当有办法突破的,毕竟,这已经是工业化生产了。

这周,我给同学们讲的是如何理解基本面量化,以及利用基本面挖掘因子,从而在brain平台上实现因子提交。从一个想法到一个函数,再到函数的组合,以及如何通过平台的要求,我都进行了讲解,其实,我也是刚用这个平台,也是在和同学们一起学习。

后记:人生需要三个朋友,“有趣”,“有料”,“有多闻”,加“十点洞见”这个公众号吧。