在量化投资圈,有一个很常见的现象:回测陷阱,错用了历史回测的数据,而不知道自己错在哪里,反而不断通过调参方式迭代模型,再进入实盘而受挫,如此反复;却从来不去思考:问题出在哪里?错用回测了?是否逻辑出问题了?
如一个投资者开发了一个策略,回测报告显示年化收益30%、最大回撤10%、胜率65%。他看着这些数字,心里默默盘算:“未来一年,我大概也能赚这么多。”
然后他投入真金白银。结果呢?亏得一塌糊涂。
问题出在哪里?不是回测错了,而是他用错了回测。
一、一个根深蒂固的习惯
大多数投资者使用历史回测的方式,可以用一句话概括:
用过去的数字,预测未来的结果。
他们会盯着回测报告上的年化收益率,心想“未来大概就是这个水平”;看着最大回撤,告诉自己“最坏也就亏这么多”;算着胜率,期待未来也能保持同样的胜率。
这个思维习惯如此自然,以至于很少有人意识到它的危险性。
但它确实很危险。因为当一个策略过拟合时,这些漂亮的数字——年化收益率、最大回撤、胜率、夏普比率——统统失去了预测未来的能力。
它们能告诉你的,只是“过去你拟合得有多好”,而不是“未来你能赚多少”。
二、为什么这个习惯是错的?
我们来看一个比喻。
假设有一个人,花了很多时间研究彩票历史开奖号码。他发现:在过去1000期开奖中,凡是星期四开奖且当天下雨,号码中一定出现数字7。他据此构建了一套“策略”,回测准确率高达90%。
然后他信心满满地用这个“策略”去买彩票。
你会觉得他可笑吗?当然会。因为你很清楚:彩票号码是随机的,历史中那些“规律”只是巧合,根本不具备预测未来的能力。
量化投资中的过拟合策略,本质上和这个“彩票策略”没有区别。
它在历史数据上表现优异,不是因为发现了市场规律,而是因为记住了太多的巧合。当未来没有这些巧合时,它就原形毕露。
那些漂亮的回测数字,记录的不是策略的能力,而是巧合的程度。
三、两个投资者,两种思维方式
为了更清楚地说明问题,我们来看两个投资者。
投资者A:打开回测报告,第一眼看年化收益,第二眼看最大回撤,第三眼看胜率。数字好看,他就觉得策略好。数字不好看,他就放弃。
投资者B:打开回测报告,他关注的是另一组问题——这个策略在什么市场环境下赚钱?在什么环境下亏钱?盈利主要来自哪类交易?策略表现最差的时期发生了什么?这些表现是否符合策略的逻辑?
哪个投资者更可能成功?答案是投资者B。
投资者A在用历史数字“算命”——他用过去的收益去猜未来的收益。投资者B在用历史回测“理解策略”——他试图弄清楚策略的行为模式、风险特征和逻辑一致性。
前者关注的是“结果”,后者关注的是“过程”。
四、为什么逻辑比数字重要?
假设你面前有两个策略:
策略甲:回测显示年化35%、回撤8%、胜率70%。但当你问“这个策略为什么赚钱”时,开发者说:“我们跑了5000次参数优化,发现这组参数在历史上表现最好。”
策略乙:回测显示年化15%、回撤20%、胜率55%。但它的逻辑很清晰:当市场恐慌指数飙升时,买入被错杀的优质股票,等情绪修复后卖出。开发者可以清楚解释——这个策略赌的是人性中的过度反应,只要人类还会恐惧,这个逻辑就成立。
哪个策略更值得信任?
答案是策略乙。因为它的逻辑建立在真实、持久的市场现象之上。而策略甲的“优秀表现”,很可能只是对历史噪音的精确拟合。
一个基于可靠逻辑的策略,即使历史数字不那么漂亮,它的未来表现也是可预期的。一个过拟合的策略,即使历史数字再漂亮,它的未来也是一片漆黑。
五、如何走出“数字迷信”?
如果你发现自己习惯性地用回测数字去预测未来,不妨试试这几个方法:
第一,把关注点从“多少”转移到“为什么”。
不要只问“年化收益是多少”,多问“为什么能有这个收益”。如果一个策略的赚钱逻辑你说不清楚,那它就不值得投入真金白银。
第二,学会问“什么时候会亏钱”。
任何策略都有亏钱的时候。一个能清晰说明自己“在什么环境下会表现不佳”的策略,比一个号称“什么时候都赚钱”的策略更可信。
第三,做简单的逻辑检验。
如果策略逻辑是“低估值股票会跑赢高估值股票”,那它在历史上大部分时期都应该有效。如果它只在某三年有效,其他时间都失效,那这个“逻辑”可能根本站不住脚。
第四,接受“不完美”。
真正有效的策略,历史回测通常不会太完美——它会有回撤,有表现不佳的年份,有让人怀疑人生的时刻。那些曲线完美向上的回测报告,反而是危险的信号。
六、回测的真正用途
说了这么多,并不是要否定回测的价值。回测是量化投资不可或缺的工具,但要用对地方。
回测的真正用途,不是预测未来,而是理解策略。
通过回测,你应该弄清楚:
· 这个策略在不同市场环境下表现如何?
· 它的收益来源是什么?是选股能力,还是择时能力,还是运气?
· 它最差的时候发生了什么?那些情况未来还会出现吗?
· 策略的表现是否符合它的投资逻辑?
当你能回答这些问题时,回测就完成了它的使命。至于未来能赚多少——没有人能告诉你答案,包括回测。
结语
量化投资的世界里,有一个朴素的道理:
数字会说谎,但逻辑不会。
历史回测的年化收益率、最大回撤、胜率,这些数字看起来很客观,但当它们来自一个过拟合的策略时,它们就是最危险的谎言。
真正成熟的量化投资者,不会用回测数字去“算命”。他们会用回测来理解策略的逻辑,检验策略的行为,识别策略的风险。然后,基于对逻辑的信任,而不是对数字的迷信,去面对不确定的未来。
下次当你看到一份漂亮的回测报告时,不妨先放下那些令人心动的数字,问自己一个最简单的问题:
这个策略为什么能赚钱?我懂它的逻辑吗?我相信它的逻辑吗?
答案,比任何数字都重要。
