模型的设计离不开不断的优化与拟合。过度的优化与拟合看上去很美,但对于投资人却仅仅是一个美丽但无法长久面对阳光的肥皂泡。每一个策略设计者都想在自己的策略中排斥过度拟合,但怎样既能排除拟合而又能获得一个不仅看起来不错同时实际使用也不错的系统,始终是一个令人头痛的问题。下面给大家介绍一个既能防止过度拟合,同时也能保持策略稳定性的办法。当然,这也许会让你的策略看起来没有那么美丽了♪(^∇^*)


         参数优化中一个重要的原则就是要争取参数高原而不是参数孤岛。所谓参数高原,是指存在着一个较宽的参数范围,模型在这个参数范围内都能取得较好的效果,一般会以高原的中心形成近似正态分布状。而所谓参数孤岛,是指只有在参数值处于某个很小的范围内时,模型才有较好表现,而当参数偏离该值时,模型的表现便会显著变差。

       举例说明,假设某交易模型内有两个参数,分别为参数1和参数2,当对两个参数进行遍历测试后,得到一张三维的绩效图。好的参数分布应当是参数高原,即使当参数的设置有所偏移,模型的获利绩效依然能够得到保证。这样的参数因稳定性强,可以使得模型在未来实战中遇到各类行情时,具有较强的因应能力。但如果遍历参数后的绩效结果如参数孤岛,当参数发生小的偏移时,模型的获利绩效就发生较大变动,那么这样的参数因适应性能差,往往难以应对实际交易中变化多端的市场环境。

       一 般来说,如果附近参数系统的性能远差于最优参数的性能,那么这个最优参数有可能是一个过度拟和的结果,在数学上可以认为是奇点解,而不是所要寻找的极大值解。从数学角度来说,奇点是不稳定的,在未来的不确定行情中,一旦市场特征发生变化,最优参数可能会变为最差参数。

       过度拟合与选取的样本有关系,如果选取的样本不能代表市场总体特征,只是为了使测试结果达到正的期望值而去调整参数,这种做法无疑是自欺欺人,所得到的参数值是过度拟合的无效参数值。例如,通过分析参数过度拟合,交易模型分别在数值35和63出现了收益率突增现象,如果模型中的相应指标选用35和63做参数,则模型的收益看上去很完美,但实际上却是典型的参数孤岛效应。

        过度拟合与参数优化的主要矛盾在于,模型参数优化得到的最优参数只是建立在已经发生过的历史数据样本上,而未来的行情是动态变化的,与历史行情相比既有相似性,也有变异性。模型设计者可以找到模型在历史上表现最好的参数,但是这个参数在未来模型实际应用中未必表现最好,更有甚者历史上表现最好的模型参数,在未来模型实战中可能是表现很糟糕的参数,甚至带来大幅亏损。比如,筛选出了一个能抓住历史上一波大行情的一个参数,但设置这样参数值的模型,并不意味着模型在未来实战中也能有如此好的表现,这个历史上较佳的参数值可能在未来模型的应用中没有起到任何帮助。

        此外,参数高原与参数孤岛往往还与交易次数存在较大关系。如果模型的交易次数较少,往往能找到一个合适的参数点,使得模型在这几次交易中都盈利,这种参数优化后的模型获利体现出较强的偶然性。如果模型的交易次数较多,模型获利的偶然性就会下降,更多地体现出获利的必然性和规律性,也就会存在一个参数高原。而这种参数优化模型才是进行参数优化的目的所在。