序言

上次我们用3篇小文章浅尝辄止地介绍了“量化投资”中的一个分支—“量化组合投资”,有兴趣的读者请参看《瞎扯量化组合投资》系列文章。管中窥豹一番后,我一直在想是不是应该先从大的方面把量化投资的全貌给大家介绍一下,然后再分门别类地介绍分支,这样框架性强便于迅速抓住要点,也方便实际应用中按图索骥。
 
想当初自己在米国大农村啃着饼逛着未名,看着版上在墙街的大牛矿工们讨论着听不懂的牛X话题,弱弱地问一声要上船该看什么书,然后对着甩在脸上的几页书单膜拜不已,心里只有一个声音:量化投资太高大上,太牛X了!
 
稀里糊涂地上了船,懵懵懂懂地学了这么多年,也摸爬滚打地做了些投资,今天一想到要把量化投资说明白,心里依然忐忑不安,感觉自己跟当年那个吃饼的状态也没多大进步,扯得明白吗?勉力而为,尽量说说自己一些不成熟的理解吧。
 
量化投资,从名字上很容易看出来,它就是关于“用数量化的方法进行投资”的一些东西。
 
这里的“数量化方法”包含很多学科的方法,主要是数学、统计学、计算机学:数学不用多说,它是所有关于数、关于量的东西的根本;只要分析数据、只要使用数据推导结论、只要包含不确定性的地方就得用统计学;没有计算机和程序,你得用纸笔去计算、用大脑去做所有思考,没法活。除此之外,运筹学中的优化方法、社会学中对投资群体的量化分析方法、物理学和工程学中的相关算法和模型等都可以应用于投资,都是量化投资工具箱中的一员。
 
那我就来一一介绍“投资中的数量化方法”?想了想,用这个思路去介绍量化投资貌似不太对头,这样整下去就成一篇数理工具文章了(有不少这方面的好书值得学习,我推荐了几本放在后面的参考资料里面)。
 
量化投资,量化投资,量化只是一个工具,投资才是主题嘛。在介绍投资的过程中把可以使用到的量化方法穿插介绍可能更合适。那怎么介绍投资呢?这又是一个让我抓耳挠腮的问题。嗯……投资本质上是通过买卖东西来达到资金保值增值的目的,那么从可以买卖的东西这个角度介绍是不是容易让人看明白呢?我也想不出更好的方式,那就如此吧。接下来的几章会按照如下的顺序进行介绍:
 
第一章:一般性投资
第二章:期货和外汇投资
第三章:股票投资
第四章:金融衍生品
第五章:资产配置
第六章:基金投资
第七章:其他一些东西:譬如高频交易
 
在介绍过程中我很有可能是想到哪说到哪,因此这系列文章我也只敢叫“漫谈”,漫无目的地瞎扯淡,哈哈,大家多多包涵。
 
第一章 一般性投资
 
提到投资,我猜目前大多数人最先想到的是“买房”吧……毕竟现在房价这么高,关乎大多数人的生活幸福,更关乎一部分人的身家性命(去年刚因为股市在天台排了次队,这次房市的队不知道啥时候要开始排了)。这一年翻一倍的价格,“国家支撑,地方政府支撑,利益集团支撑,刚需支撑,丈母娘支撑……”的坚实基本面,多少人、多少资金、多少贷款投身其中推波助澜,投资买房必然是当下资金量最大、影响面最广的投资方式了。
这个和量化投资有关吗?正常来说,当然是无关,一般提到量化投资,大家不指这个。但既然这是目前最热门的一种投资方式,我们也可以来打些比方,借此说明,如何将数量化的方法应用于投资中。毕竟,这种使用数量化方法来投资的思路才是量化投资的本质,在应用过程中都有共通性。
 
假如我们打算投资买房,哪些是我们关心的问题?从投资角度来说,最关心的直接问题有3个:
 
现在房价是多少?
房价未来是涨还是跌?
会以什么样的形式(速度、幅度)涨跌呢?
第一个问题关乎投资成本。
第二个问题关乎这笔投资的预期收益。
第三个问题关乎投资的风险。
 
很多人做投资不问第三个问题,个人觉得这很不可取。收益和风险永远是投资这个硬币的两面,成熟的投资过程必需两方面都有合理的方法应对。
 
在投资成本可以承受的情况下,为了解决第二个和第三个问题,又可以引申出如下一些问题:
 
哪些因素影响房价?
这些因素都是如何影响房价的?
这些影响房价的因素未来会如何变化呢?
我们看中的房产的“真实价格”是多少?
 
到这里,我们再想想,如果把“房价”替换成股价、金价、油价、汇率等其他投资方式的价格是不是也可以,做这些投资的时候,我们是不是也需要问这些问题?
 
可见,各种投资方式之间有一些共通的投资逻辑,为了投资成功有一些需要解决的基本问题。下面我们来看看,如何使用数量化的方法解决这些投资中的基本问题。
 
价格本身的数量化分析
 
不管做哪种投资,投资对象的价格一般最直接的关乎投资结果,所以对价格本身的数量化分析是量化投资中的一个重要分支。
 
从统计角度看,价格是一个变量,它随时间变化而变化(但注意并不是时间引起它的变化)。从数据角度看,价格是一个时间序列数据,在时间线(横轴)的每个时间点上都有一个价格的数值(纵轴),画成图的话就是一条曲线,如下图所示:
有了这些理解,我们就可以寻找与之相配套的数量化分析方法了——对于时间序列变量和数据,统计中有个方向叫“时间序列分析”,专门就是整这个事的,自然可以拿过来用(时序分析是专门的学科,也是很多专业的必修课,这里就不展开介绍了)。
 
技术分析
 
另外,对于价格这个特殊的时间序列数据,历史上一群做投资的牛人们每天盯着这些价格曲线图不断琢磨,也摸索出一种特殊的分析方法——“技术分析”,英文叫做technical analysis。
 
这里的“技术”并不是我们通常理解的含义,我感觉是没有毛关系。技术分析经常也被叫做charting,这才是准确描述其含义的称呼:chart就是图的意思,指价格曲线图,charting就是“弄图形”、“根据图形搞事情”,所以技术分析就是根据价格曲线图形进行分析的一种方法。技术分析中最重要的概念有两个,技术指标和技术形态。
 
我们先来看技术形态,譬如其中一种技术形态叫做“头肩顶”(head-and-shoulders),如下图所示:它指价格曲线先走了一个小高峰(图中A点),然后又走了一个最高峰(C点)和小高峰(E点),这样就形成了“肩-头-肩”的形态(具体还有些细节,大致如此)。
 
根据先人们的无数经验总结,一旦价格走出头肩顶形态的话,它有较大概率表示价格见顶要转而下跌了。
也许有的人要说了,这主要就是看图说话,不需要数量化分析嘛,这跟量化投资有关系吗?是哒,长久以来看技术形态这个事情都是投资分析人员人肉去做的,盯着价格图形翻着《技术形态宝典》,跟我们小时候测试色盲看那些图案找小动物差不多。
 
不过,科技在发展,人来在进步,机器人和AI在崛起,AlphaGo都能下围棋赢李世石了,设计一个数量化的方法来识别技术形态还做不到吗?
自然是可行的,Andrew Lo(最牛的华人经济金融学家之一,MIT斯隆商学院教授)在2000年的“Foundations of Technical Analysis”论文中就指出了一种对技术形态进行量化的方法,其中关键的一步是使用数量化的方法定义技术形态,以上面的头肩顶形态为例,我们可以定义这么几个条件:
 
(1)  A、D、E为连续3个极大值点,B、D为它们之间的极小值点;
(2)  C > A & C > E;
(3)  A, E在[98.5%avg{A,E}, 101.5%avg{A,E}]之间,avg{A,E}表示A点和E点的平均高度;
(4)  B, D在[98.5%avg{B,D}, 101.5%avg{B,D}]之间;
 
一旦连续的5个局部极值点满足上面的4个条件,就生成一个头肩顶信号。有了这样的数量化定义,我们就可以写程序自动而且批量的处理各种价格数据来进行技术形态识别,这样一来,是不是传统的技术分析投资就变成“量化技术分析投资”了。
 
同理可知,很多传统上非量化的投资方法,在如今这个数据丰富、计算机处理能力高效、数学统计知识积累深厚的年代,都可以进行“数量化”的武装,加入到量化投资的大家庭,这也是量化投资前景光明远大的主要原因——未来是信息数据化,数据海量化的时代,人脑的工作是设计基于数据的模型和分析方法,电脑的工作是具体执行和操作,可能一切皆可量化吧。
 
再多插几句:
 
(1)实际上弄技术形态量化识别的时候不是我上面说的那么简单,不然真有人仅仅按上面的方法去弄,效果不好要怪我忽悠人。里面还有很多问题需要考虑,譬如价格曲线是极不规则和有噪声的,图形上“毛刺”特别多,那是不是要用一些数据平滑算法处理一下呢。
(2)为什么出现头肩顶形态就有大概率价格要反转下跌呢?
 
简单回答是,因为前辈大师们的经验教训是这么总结的;复杂回答呢,很多人可能就要说“多空力量对抗”这些抽象的东西了,究其本质的话需要涉及金融行为学等方面的研究。
 
从逻辑上说,光从价格本身基本是无法找到引起价格变动的因素,这需要我们后面所要涉及的“影响价格因素的数量化分析”。
 
至于技术指标,它是前辈们总结的基于价格(以及成交量)计算的一些表达特定含义的数字。譬如,过去3个月的价格的平均值就是一个指标,你每天都可以计算一次这个指标的值。技术指标一般随着价格的变动而变动,价格又是随着时间的变动而变动,所以技术指标也跟价格一样随着时间的变动而变动。怎么使用技术指标呢?譬如有个技术指标叫做RSI(relative strength index,相对强弱指标),它也是根据价格计算出来的,取值范围在0到100之间,一般认为:RSI指标代表买卖双方的力量对比,正常在30-70之间波动;当RSI超过80甚至90的时候,说明市场到了超买状态(太多人买了),价格有望调整回落;反之亦然。
 
又是插话时间:
 
为什么RSI指标有这种能力呢?同上面的回答:简单回答是,因为前辈大师们的经验教训是这么总结的;复杂回答呢……有兴趣的读者建议读一读技术指标发明大师Welles Wilder的小册子《New Concepts in Technical Trading Systems》,轻薄易读,深入浅出,也有中文版。
 
可以看出,技术指标本身就是价格数量化定义的产物,所以它天然属于量化投资的范畴,也很容易和其他量化分析方法结合,超越传统的技术分析范畴。譬如,我们可以把RSI作为一个输入变量放入机器学习模型中来判断或预测市场状态,这些都是可以无缝结合的操作。
 
参考知识:
量化投资统计知识:
《2008_Lai_Statistical Models and Methods for Financial Markets》
《2011_Ruppert_Statistics and Data Analysis for Financial Engineering》
《2015_Franke_Statistics of Financial Markets: An Introduction_4th_edition》
技术分析部分:
Lo, Andrew W., Harry Mamaysky, and Jiang Wang (2000), Foundations of Technical Analysis: …
《1978_Wilder_New Concepts in Technical Trading Systems》
《2003_Cobley_The Encyclopedia Of Technical Market Indicators》