随着投资管理行业持续的发展 -- 理论升级和技术更新,投资经理们需要更高级和有力的分析和管理工具,Barra就是这样一家国际领先的投资决策和风险管理工具的提供商。本文挑选了部分典型的风险模型进行介绍,具体的细节并没有深入展开,旨在抛砖引玉,了解Barra对于风险管理的思维方式和理念。

多因子模型

相似的资产会有相似的回报,这是多因子模型的基本假设。由于某些特定的原因(因子),资产会表现的十分类似,例如价量变化、行业、规模或者利率变化。多因子模型就是为了发掘这些因子,并且确定收益率随因子变化的敏感程度。通常来说,多因子模型包括了宏观因子模型、基本面因子模型和统计因子模型。这几种模型在分析不同的大类资产风险收益的时候也有不同的效果。

实现原理

单个资产的多因子模型可以表示成:

ri=k=1Kxikfk+ui

其中,
xik是第k个因子的风险暴露,比如我们常说的市值、PE这些值
fk是第k个因子的收益率,是通过多元回归得到的系数
ui是第i个资产的非因子收益率

在历史上的某个时间截面,每个资产相当于一个样本,那么所有的资产就可以通过多元线性回归得到得到fk

X:n种资产对k个不同因子的风险暴露矩阵

F:k个因子的因子收益率协方差矩阵

Δ:非因子收益率方差对角矩阵

这个几个矩阵到底有什么用呢?重要的结论如下:

Risk=XFXT+Δ

上面式子是通过矩阵运算,得到资产组合的总风险。

多因子模型的价值

  1. 提供了一种全面分析风险的框架
  2. 大大降低了运算量。假设有1000种资产的组合,传统基于收益的方法需要计算1000x1000的协方差矩阵,而假设这里只有50种因子,矩阵的规模减少到了50x50
  3. 每个周期都更新数据,更好地适应变化的市场环境
  4. 因子具有经济意义,可以更好地解释收益,收益可以跟踪
  5. 缺点是一般只用于预测大部分风险,但是无法预测收益

站在历史的角度

预测股票未来波动率的方法有很多,其中比较流行的一种就是分析历史数据,然后推测未来可能具有类似的表现。这种方法最大的问题在于,历史数据的长短,并且和测试的历史市场环境紧密相关。也就是说,随着时间的变化,股票的特性可能发生变化,比如公司的并购重组、战略转型等行为,都会造成股价的波动,过去的数据并不能预测未来。而经典的CAPM模型里面,就是通过这些历史数据来计算Beta值的。

1950年之前,系统性、或者市场相关的收益这种概念,还未出现,直到1950年初HarryMarkowitz首先将风险定量地用标准差来表示。随着后来有学者不断完善和补充这一理论,认为市场的风险是由不可被分散的系统性风险和可以被投资组合分散的残余风险:

随着对市场认识的不断加深,一种叫做资本资产定价模型(CAPM)的理论也被提出,用来描述收益和市场风险的关系:

这个理论认为证券的预期收益正比于系统性风险系数,即Beta。形象地说,Beta就是描述证券组合对市场波动的敏感程度,比如Beta= 2时,市场上涨10%,那么该证券就上涨20%。

模型演变

CAPM描述的是一种市场的平衡状态,前提假设是市场是有效的,但不要求残余收益是不相关的。威廉夏普基于对这种理论进行了延伸,提出了单因子风险模型,其实就是CAPM公式的一个变形,但是假设了残余收益是不相关的。

后来,学者们逐渐发现,相似的资产总是表现出一些共同的特点,后来就总结出了套利定价模型(APT),认为资产的预期收益等于一些未知的系统性因子的线性组合。APT模型的提出是为了用来预测收益的,后来逐渐就演变成了多因子模型。

Barra怎么做

如前文所述,基于历史数据的定价模型存在诸多不合理之处,用这样的方法计算出来的Beta也称为“历史Beta”,而Barra基于风险模型,提出了“预测Beta”的方法。Barra所使用的风险因子主要来自于基本面,包括行业、规模、波动性等。由于这些风险因子是每月重新计算的,因此这种“预测Beta”可以很好地反应公司的近期风险结构。

Barra的模型将风险按照以下的方式进行划分:

其中,共同风险包括了风险指数,代表资产的一些共同特点,如成长/价值、小盘/大盘;也包括了不同行业的区分。特有风险是将每种资产的风险和市场风险的相对值,进行标准化处理之后得到。

Barra风险模型建立过程

1.数据获取

获取数据和处理数据是第一步,在权益风险模型中,以市场数据和基本面的数据为主,其中市场数据一般是可以每日获取的,而基本面数据一般是一个季度甚至半年以上。在这里,尤其要注意到一些数据的跳跃,如资产规模的突变,缺失的价格数据等;此外,还要尤其注意公司的特殊事件,如资产重组,这些都会导致数据的不连续。

2.统计量(因子)筛选和测试

这是核心!因子来源很广泛,传统的方法里面主要包括了市场量价指标和基本面指标,以及它们的组合。因子的检验是很严格的,不仅需要在逻辑上有意义,同时还要经过严格的统计测试。这些因子必须是要能够预测风险,并且在时间上体现出一定的时效性,换句话说,它一定是可以给模型带来一定的预测效果的。

3.标准化

各种因子指标的大小范围差距很大,需要标准化。方法有很多,可以通过排序,然后分布在(0,1)之间,也可以用高斯标准化的方法,因情况而定。

4.风险指数建立

数据处理全部完毕之后,每个风险因子都要在不同行业之间回归并做统计显著性测试,检验其对收益的解释性,通过测试的因子就可以成为一个风险指数。风险指数建立的过程是一个迭代的过程,首先入选的是解释性最好的因子,此后的因子都要保证能够带来更多的解释效果,才可以入选。

5.行业分配

不同行业的收益、风险都会表现出很大的区别,因此在模型中有必要进行这样的划分。

6.因子收益估计

在每个时间截面上,可以通过横截面回归的方法确定因子收益,也就是回归系数。接着,在对于历史数据,对因子收益的时间序列求协方差矩阵。这里有一个很重要的问题,就是因子收益之间的相关性是在随时变化的,比如高波动性的月份可能比较集中。对此,主要有两种解决方案:
1是通过指数加权,约近的月份获得越大的权重,而距离现在越远的月份获得越小的权重,这可以通过一个指数衰减的公式确定。
2是通过市场指数的波动率来估计这个协方差矩阵,这里需要将因子的协方差矩阵乘上一个由市场收益率方差确定的系数。

7.特有风险

这个风险矩阵常规来说就是通过历史方差确定,但是这里假设了收益方差是稳定的。Barra提出了一种新的方法,可以捕获特有风险的市场平均水平,以及特有风险和资产基本面的相关关系。建立这样一种模型包括了计算特有风险的市场平均水平和资产特有风险和基本面特征的相对值。

8.更新模型

以上的计算过程在每个时间截面都需要更新和重新计算,一般选择一个月为周期。

总流程图: