首先要说的是,下文说的策略不包含择时,所说的都是策略本身
1.克服想当然思想
面对未知事物,尤其是没有什么经验的,想当然这种思想是一定要除去的。我先提两个问题,昨日A股市值最小的30%股票,是小于多少亿?A股当日成交额最小的50%股票,成交额是小于多少亿?是不是没什么概念,先想当然回答吧,然后跟果仁的数据比较一下,就会发现自己错的有多离谱。
为什么要克服想当然思想这么重要,这里有个心理学现象,人总是对自己特别自信,一旦你写下了答案,你就对这么答案的信心一下子提高了,别人的答案很大可能是歪理邪说,总之大概率没有你自己写的正确。股市中这个现象特别普遍,也常被提起,一旦你买入某只股票,就对这只股票特别有信心,别人买入的股票,肯定是垃圾,就算你几天后没跑赢别人的股票,也会觉得未来肯定是自己的胜出。
写策略也是,你会对自己写的策略特别认可,别人的策略如果收益低,那么就是垃圾,如果收益比你高,那么肯定是过度拟合了。
写策略还有个现象,你想当然的认为两个权重是1:1,那么是极好的,如果是2:3,就会觉得拟合了。可别忘了,你想当然的八成错的离谱。你想当然觉得不对的,很可能比你好。
所以这种心理一定要克服,没有一点根据,参数怎么能随便写?
2.拟合怎么来的?
创建策略就是拟合的过程。
创建策略时,第一步有个想法,价值型,成长型,小市值,超跌,小成交额,想法很多,先统统试一遍,发现小市值最好,而且遥遥领先,其次是小成交额。那好,别的策略我不做了,只做小市值和小成交额。相信到这一步还没人说存在拟合。
开始第二步,我觉得既不能太分散,也不能太集中,我要创建个4个股票的策略,采用模型2,简单排除涨跌停,不择时,排名大于等于7卖出,测试发现年化113%,真是感觉棒棒哒。但是这里就产生了一个问题,这个策略有几个可变参数?虽然这个策略很简单,但还是存在一个参数,那就是“大于等于7卖出”,为什么是7,而不是5、6、8、9或者更大?我竟然回答不上来,只能说,是我想当然觉得是7。做事怎么能想当然,何况是面对未知事物,没有任何经验,想当然这种思想是一定要除去的。于是我一个个验证,大于等于5卖出,年化95%;大于等于6卖出,年化113%;大于等于8卖出,年化116%;大于等于9卖出,年化117%;大于等于10卖出,年化114%;大于等于11卖出,年化114%。到这里就差不多结论出来了,大于等于9卖出是最好的,于是我就选择大于等于9卖出。到这一步,拟合就出来了,9就是拟合出来的,但是这个拟合相信大家都是还能接受的,毕竟9跟其他几个差别不大。
第三步开始就稍微有点技术含量了。刚刚一开始发现,5日成交额也特别好用,我得看看加入策略里会有什么变化,可以加在刷选条件里,也可以加在排名条件里。我这里举例子就加入在排名条件里,于是这个策略一下子有了3个可变参数,分别是市值权重,5日成交额权重,卖出排名。有三个参数后,策略怎么写的可能性那就很多了,权重比例可以是任意的,可能性是无限的。于是我先按大于等于9卖出这个条件不变,市值和5日成交额权重比例1:1,一测年化129%,有提高。但是在无数种写法里,如果我这么随便一写,就是最高年化,那真是太天真了。策略做到这里,最好就是用计算机自动测试,做穷举法,取最优解。作为人类,我稍微试了下,市值和5日成交额权重比例11:10,卖出条件为大于10,年化就到了135%。到这一步,拟合就会越来越多,这还只有三个参数,相信大家的策略参数只会更多,不会更少。
3.为什么参数调动就是拟合,而不是一开始想当然的参数有缺陷?
古代铸铁,知道铁是一个不错的材料,铁中掺入碳,就成了钢,性能就更好了,但是碳加多了也不好,这个比例是一个个试出来的,而不是随便想出来的。
即便是现在航空合金,也是各种金属混合比例试出来的,你要说几个金属1:1:1最好,这是说笑话了。没办法,即便是航空材料,也是不断试出来的。
但有个区别,做完材料,它是稳定的,未来也不变,但策略未来的好坏难料。
还是讨论上面的例子,为什么1:1不是拟合,11:10就是拟合?虽然11:10也很接近1。都是小市值小成交额策略,难道比例变了,本质就变了,逻辑就变了?既然逻辑不变,为什么年化高的就是拟合?
假设上面的例子中,将比例调整为3:1,年化收益能提高50%,那是拟合了?还是原来1:1的参数有缺陷?我认为是1:1的参数有缺陷,毕竟是想当然写的,能是最好才怪了。
假设上面的例子中,参数3:1,年化180%,参数1:1年化130%,你选择哪个实盘?这就涉及下一个问题,什么样的策略可信。
4.什么样的策略可信?
这个问题在我的帖子“从科学和哲学角度漫谈 没有逻辑的策略 的该怎么相信”讲得很多,这里取其关键部分。
有个无限的口袋,里面装满了红球白球,没人知道真正的比例,但先取了2400个球,发现红球比白球是6比4,你正好要赌球,你怎么下注?肯定下注红球出现的概率大吧。但事实上未来红白球比例会不会变化没人知道,但之前的概率必定会影响你。
这时如果你发现还有另一个赌球,也先取了2400个球,发现红球比白球是8比2,这时两个赌球选哪个去赌,相信你更愿意选这个吧。
股市就可以认为是这个无限大的口袋,07年至今2400个交易日不到点,你正在下注,按照你以为的大概率下注。你所谓的大概率也好,经验也好,都基于历史的表现。
给你两个黑箱策略,告诉你逻辑一样,检验都从07年开始,一个年化200%,一个年化250%,你有什么理由非要选择年化200%的?又凭什么咬定250%的是过度拟合,200%不是水平不行?
未来那个黑箱好,我不知道,但让我选择我肯定选年化高的,因为我找不到年化200%未来会比250%好的理由。生活中的经验多数是,成绩好的总是那几个,工资高的也是那几个,逆袭确实有,但是少,我总愿意相信过去表现好的。
5.高收益的策略未来一定比低收益的好?
上面说这么多,就是为了说明,都是一样的逻辑,没理由去选年化低的策略。至于未来表现哪个好?
可以很负责任的告诉你,策略逻辑一样,未来谁好谁坏不知道。但逻辑不一样的策略,未来还是高收益会更好。
尽人事,听天命
球爷也给到解释了
或者你可以看这两个帖子下我的回复:
https://guorn.com/forum/post/p.1300960.185635074514438
https://guorn.com/forum/post/p.3.138711185429993
小盘股扣除贝塔估计偏差和数据偏差后从来没有真正跑赢过大盘,所以并非小盘股不行了,而是一直都不行
不过,近30年的话,股息率因子和价值因子还是可以的,尤其是股息率因子相比市净率因子的超额主要是因为其暴露于盈利因子,最近30年回报其实不错
果仁这年化能上200%的,基本上无一例外是9:31调仓的实时策略
这类策略某种意义上钻了回测的空子,实际上并不具备实盘可能性,没必要花精力去研究这类策略
策略确实有趋势的,这个也是在中国市场被实证过的,他的本质是因子趋势(果仁这做的绝大部分策略可以理解为因子策略或者 smart beta策略)
一般来说,我们会比较提倡做不同风格的策略,然后构成一个策略组合,增加对不同风格的一个暴露,最典型的例子就是对于大市值策略和小市值策略做个简单的组合,从风险层面上来说确实会有一定幅度的降低。
我们做一个假设,如果你用3-5个策略将几个比较主流的风格给涵盖住了,且这3-5个策略从长期的历史以及近期的实盘来看,是具备贡献超额收益的可能性的。
那这样的话,其实你的整个策略所面临的最大的风险就是整个市场都下跌的风险,而这个风险本身也是每个股票投资者都会面临到的。当然如果你有能力做到更高层面的大类资产配置(意味着你不止做股票,还做其他诸如债券、地产、数字币、期货等具备投资属性的资产),那么整个股票市场下跌的风险也能够被很好的分散了。这样的话,你所面临的最大的风险可能就是人类社会倒退导致的资产贬值了。
我理解的量化是你给的选择然后让数据帮你决策
这个文章虽然是多年前的。但是也给我解惑很多的我以为。
我这个回复很牵强,主要是我自己在回复中梳理自己的思路。
来果仁快两个月了吧?做出过年收益300的。也出过近五年回测4000的。更有10年到现在达到20000%的
但是我总觉得有什么不对。可能有点想当然了。
策略应该是也是有趋势的。要符合大势?
好公司也有几年不大涨的。比如万科A
应该是多种策略在不同环境下有不同表现。然后做成组合?
目前我还不能很好的避免买到趋势下跌的股票。有好几只亏了50%以上。
从数学上说,是可以测试的:可以用类似t-statistic的数学检验。
如果一个年化200%回撤10%,一个年化250%回撤20%,这时候该怎么选呢?
各位有没有啥经验?
有点小意见:有些很简单的过拟合测试可以使用,比如将日期分区间,先做一部分区间的测试,将结果与另一区间做比较,可以排除部分过拟合策略;不应该以未来不全知=不需检验拟合情况作简单判断,反而应该加大统计学的知识学习,掌握科学方法
果仁我只服球爷
在基本逻辑一致的基础上,根据历史数据去微调参数,这本身就是一个拟合的过程。比如某参数选7比选9年化高,这必然属于拟合,是否过度,可以考虑下面的几点:
1,每次交易的收益率是否均衡,是否过分依赖单次最大收益,特别是对于持有一两支股票的策略
2,策略分季度,分年度的收益是否稳定,比如单纯测试2010-2011年,和2011-2013年,是否有稳定的收益率
果仁对策略虽然给出了一个稳定性分数,但多少分数算是合理,具体怎么计算的,都不是很明确。
所以很希望果仁能给出一个分月度/季度/年度滚动的平均收益率,这样可以更容易衡量策略的稳定性。