多因子模型系列5-套利定价模型的应用

 

套利定价模型

套利定价模型是金融领域中非常重要的资产定价理论。对于某个资产,该模型把其的收益使用线性因子模型来表示:

$$R_i = a_i + b_{i1} F_1 + b_{i2} F_2 + \ldots + b_{iK} F_K + \epsilon_i$$

该理论认为,如果我们可以按照上面的式子来表示收益的话,那么资产的预期收益就应该符合:

$$ E(R_i) = R_F + b_{i1} \lambda_1 + b_{i2} \lambda_2 + \ldots + b_{iK} \lambda_K $$

其中$R_F$表示无风险收益,$\lambda_j$表示因子$j$的风险溢价。风险溢价的出现时因为人们需要更高的收益去补偿其受到的更高风险。知道资本资产定价模型(CAPM)的读者可以很明显的发现套利定价模型模型是其的推广形式,CAPM使用了市场回报作为其唯一的因子。

我们可以构建一个投资组合来计算$\lambda_j$,这个投资组合对因子$j$的弹性是1,对于其他因子的弹性为0(因子$j$的纯因素组合),之后得到超出无风险收益的回报。

套利

实际上我们可以选择许多许多股票来构建我们的投资组合。如果我们使用不同的股票来计算$\lambda$s,我们的结果会一致吗?如果不一致的话,那么好了,就存在着套利空间。
比如,下面这种情况就存在套利空间:
某资产未来一年的预期回报是0.3,和市场的$\beta$是1.1,市场的预期收益是0.15,无风险利率是0.05。那么根据APT模型,这个资产的预期收益应该是

$$ R_F + \beta \lambda = 0.05 + 1.1 (0.15 – 0.05) = 0.16$$

这个和资产未来一年的预期回报是0.3不相符。所以如果我们购买100元的此资产,卖空110元的市场组合,买10元的无风险资产,这样我们没有任何投入而且没有承受任何市场风险,但是我们的预期收入是
$$0.3 \cdot 100 – 0.15 \cdot 110 + 10 \cdot 0.05 = 14$$

APT模型假设所以的机会被人们发现并利用,直到价格发生变化导致套利机会消失,也就是说市场上的套利者有足够的资金和耐心。这也给使用经验因子模型提供了理由:如果模型结果是不一致的,就存在套利机会,价格也会随之变化。

我们需要多少个因子?

因子的数量越多会对收益解释的越多,但是也会对数据中噪音适应的越多。如果想要发现一个好的信号,就需要参数越少越好,但是同时还要能解释收益里面大部分的变动。

下面我们就来计算一下资产的预期收益。

首先导入必要的包

In [1]:
import numpy as np
import pandas as pd
from statsmodels import regression
import matplotlib.pyplot as plt
import datetime

获取股票、市场及无风险资产(这里的无风险利率是每日中国固定利率国债收益率曲线上国债的年化到期收益率的spot rate)一年的数据。

In [2]:
start_date = '2015-01-01'
end_date = '2016-01-01'

# 我们会看标的资产未来一个月的收益去构建未来收益模型
offset_start_date = '2015-02-01'
offset_end_date = '2016-02-01'

# 获得资产收益
asset1 = get_price('601857.XSHG', start_date=offset_start_date, end_date=offset_end_date, fields='ClosingPx').pct_change()[1:]
# 获得市场收益
benchmark = get_price('000300.XSHG', start_date=start_date, end_date=end_date, fields='ClosingPx').pct_change()[1:]
date = benchmark.index
temp = pd.read_csv("2015.csv")
rf = temp['rate']
rf.index = pd.to_datetime(temp['Date'], format="%Y%m%d")
rf = rf[rf.index >= date[0]]
rf = rf[rf.index <= date[-1]]
# 转换成每日的收益率
rf = (1+rf/100)**(1/365)-1

需要定义一个常量用来计算截距。

In [3]:
constant = pd.TimeSeries(1, index = asset1.index)
df = pd.DataFrame({'A1': asset1, 'HS300': benchmark, 'RF': rf, 'Constant': constant})
df = df.dropna()
df
Out[3]:
A1ConstantHS300RF
2015-02-030.04188910.0248910.000064
2015-02-04-0.0239521-0.0103790.000064
2015-02-05-0.0227871-0.0102360.000062
2015-02-06-0.0233181-0.0161940.000061
2015-02-090.01285610.0101140.000060
2015-02-100.01813210.0182380.000061
2015-02-11-0.00623310.0079780.000063
2015-02-120.00179210.0025480.000067
2015-02-130.00000010.0078290.000068
2015-02-16-0.00983910.0085470.000070
2015-02-170.00090310.0065260.000076
2015-02-250.0135381-0.0123760.000074
2015-02-260.00979510.0251720.000073
2015-02-270.00705510.0018360.000074
2015-03-02-0.00875710.0079550.000074
2015-03-03-0.0344521-0.0259260.000074
2015-03-04-0.00091510.0065340.000074
2015-03-05-0.0192311-0.0097650.000073
2015-03-060.0056021-0.0050980.000073
2015-03-090.01114210.0170270.000072
2015-03-10-0.0110191-0.0048450.000071
2015-03-11-0.00185710.0011480.000071
2015-03-120.02604710.0193470.000074
2015-03-130.00272010.0069060.000074
2015-03-160.01265810.0243290.000073
2015-03-170.02500010.0138840.000072
2015-03-180.01480810.0236710.000072
2015-03-19-0.0008581-0.0016420.000071
2015-03-200.00343610.0137600.000070
2015-03-230.01027410.0204200.000068
2015-11-20-0.0055311-0.0001550.000043
2015-11-23-0.0077861-0.0055770.000043
2015-11-24-0.00112110.0001470.000043
2015-11-250.00785610.0073840.000043
2015-11-26-0.0011141-0.0058650.000043
2015-11-27-0.0568561-0.0538480.000043
2015-11-30-0.00709210.0026480.000043
2015-12-010.00119010.0070890.000043
2015-12-020.02734810.0362670.000043
2015-12-030.02083310.0073470.000044
2015-12-04-0.0272111-0.0191250.000045
2015-12-07-0.00349710.0027230.000045
2015-12-08-0.0198831-0.0175150.000045
2015-12-09-0.00358010.0035660.000045
2015-12-10-0.0023951-0.0035350.000045
2015-12-11-0.0036011-0.0041470.000045
2015-12-140.01566310.0286200.000045
2015-12-15-0.0071171-0.0045630.000045
2015-12-160.0107531-0.0024220.000045
2015-12-170.00236410.0191150.000045
2015-12-180.00000010.0032020.000045
2015-12-210.00589610.0260230.000046
2015-12-22-0.00117210.0027850.000047
2015-12-230.0023471-0.0026700.000048
2015-12-24-0.0070261-0.0095640.000048
2015-12-250.00000010.0022980.000048
2015-12-28-0.0129721-0.0288080.000048
2015-12-290.00597410.0091860.000048
2015-12-30-0.00118810.0008770.000048
2015-12-31-0.0071341-0.0090750.000048

223 rows × 4 columns

OLS的回归结果。

In [4]:
OLS = regression.linear_model.OLS(df['A1'], df[['HS300', 'RF', 'Constant']])
fitted_model = OLS.fit()
print('p-value', fitted_model.f_pvalue)
print(fitted_model.params)
A1_params = fitted_model.params
p-value 8.17578293389e-22
HS300       0.689253
RF         -8.686192
Constant   -0.001100
dtype: float64

仅仅通过这个结果并不能说明什么问题,我们需要看一看预测系数的分布以及其是否稳定。我们来看一下一个滑动的100天的回归结果。

In [5]:
model = pd.stats.ols.MovingOLS(y = df['A1'], x=df[['HS300', 'RF']], 
                             window_type='rolling', 
                             window=100)
rolling = model.beta

plt.figure(figsize=(25, 18)) 
plt.plot_date(rolling.index,rolling,'-')
plt.hlines(A1_params['HS300'], df.index[100], df.index[-1], linestyles='dashed', colors='blue')
plt.hlines(A1_params['RF'], df.index[100], df.index[-1], linestyles='dashed', colors='green')
plt.hlines(A1_params['Constant'], df.index[100], df.index[-1], linestyles='dashed', colors='red')

plt.title('Asset1 Computed Betas');
plt.legend(['Market Beta', 'Risk Free Beta', 'Intercept', 'Market Beta Static', 'Risk Free Beta Static', 'Intercept Static']);

由于无风险收益的$\beta$波动范围很大,导致我们无法观测到市场$\beta$是否稳定,下面我们在图中去掉无风险收益的$\beta$来看一下。

In [6]:
rolling = rolling.drop('RF', 1)
plt.figure(figsize=(25, 18)) 
plt.plot_date(rolling.index,rolling,'-')
plt.hlines(A1_params['HS300'], df.index[100], df.index[-1], linestyles='dashed', colors='blue')
plt.hlines(A1_params['Constant'], df.index[100], df.index[-1], linestyles='dashed', colors='green')

plt.title('Asset1 Computed Betas');
plt.legend(['Market Beta', 'Intercept', 'Market Beta Static', 'Intercept Static']);

可以发现市场$\beta$还是有一定的波动的。

预测未来走势

下面我们使用APT来预测一下股票未来的走势。

In [7]:
start_date = '2015-01-01'
end_date = '2015-11-01'

# 我们会看标的资产未来一个月的收益去构建未来收益模型
offset_start_date = '2015-02-01'
offset_end_date = '2015-12-01'

# 获得资产收益
asset1 = get_price('000030.XSHG', start_date=offset_start_date, end_date=offset_end_date, fields='ClosingPx').pct_change()[1:]
# 获得市场收益
benchmark = get_price('000300.XSHG', start_date=start_date, end_date=end_date, fields='ClosingPx').pct_change()[1:]
date = benchmark.index
temp = pd.read_csv("2015.csv")
rf = temp['rate']
rf.index = pd.to_datetime(temp['Date'], format="%Y%m%d")
rf = rf[rf.index >= date[0]]
rf = rf[rf.index <= date[-1]]
# 转换成每日的收益率
rf = (1+rf/100)**(1/365)-1
constant = pd.TimeSeries(1, index=date)
df = pd.DataFrame({'A1': asset1, 'HS300': benchmark, 'RF': rf, 'Constant': constant})
df = df.dropna()
In [8]:
OLS = regression.linear_model.OLS(df['A1'], df[['HS300', 'RF', 'Constant']])
fitted_model = OLS.fit()
print('p-value', fitted_model.f_pvalue)
print(fitted_model.params)

b_HS300 = fitted_model.params['HS300']
b_RF = fitted_model.params['RF']
a = fitted_model.params['Constant']
p-value 7.97319026658e-150
HS300       1.058529
RF          3.633765
Constant   -0.000448
dtype: float64

获取过去一个月因子数据用来预测未来一个月的数据。

In [9]:
start_date = '2015-11-01'
end_date = '2015-12-01'

# 获得市场收益
last_benchmark = get_price('000300.XSHG', start_date=start_date, end_date=end_date, fields='ClosingPx').pct_change()[1:]
date = last_benchmark.index
temp = pd.read_csv("2015.csv")
last_rf = temp['rate']
last_rf.index = pd.to_datetime(temp['Date'], format="%Y%m%d")
last_rf = last_rf[last_rf.index >= date[0]]
last_rf = last_rf[last_rf.index <= date[-1]]
# 转换成每日的收益率
last_rf = (1+last_rf/100)**(1/365)-1

预测未来收益。

In [10]:
predictions = b_HS300 * last_benchmark + b_RF * last_rf + a

预测结果和实际对比见下图:

In [11]:
offset_start_date = '2015-12-01'
offset_end_date = '2016-01-01'
asset1_act = get_price('000030.XSHG', start_date=offset_start_date, end_date=offset_end_date, fields='ClosingPx').pct_change()[1:]
plt.figure(figsize=(25, 18)) 
plt.plot(asset1_act.values, 'ro-')
plt.plot(predictions, 'bo--')
plt.ylabel('Returns')
plt.legend(['Actual', 'Predicted']);

 

 

多因子模型系列目录

1.多因子模型系列1-数据预处理之离群值处理
2. 多因子模型系列2-多因子模型的步骤梳理
3. 多因子模型系列3-Fama Franch三因子及其拓展五因子模型
4. 多因子模型系列4-验证Fama French三因子分解的有效性
当前阅读> 5. 多因子模型系列5-套利定价模型的应用
6. 多因子模型系列6-沪深300指数的风格因子暴露度分析
7. 多因子模型系列7-多因子模型水平测试题试答
8. 多因子模型系列8-基于组合权重优化的风格中性多因子选股策略框架
9. 多因子模型系列9-阿里巴巴与101个alpha
10. 多因子模型系列10-因子分析
11. 多因子模型系列11-绩效分析之Brinson模型