R语言基于ARCH模型股价波动率建模分析

金融中一个重要度量是与资产相关的风险,而资产波动率是最常用的风险度量。然而,资产波动率的类型有多种。

由Kaizong Ye,Sherry Deng撰写

金融中一个重要度量是与资产相关的风险,而资产波动率是最常用的风险度量。

然而,资产波动率的类型有多种。波动率不能直接观测的性质在波动率研究和建模中有非常重要的含义。

×

ARCH模型的英文直译是:自回归条件异方差模型。

是一种用来处理时间序列的模型。在股票中,ARCH可以用来预测股票的波动率,从而控制风险。(在金融领域,波动率与风险直接挂钩,一个资产波动越大,风险越大,而获得更高收益的可能也更大)

ARCH模型广泛应用于波动性有关广泛研究领域。包括政策研究、理论命题检验、季节性分析等方面。

要了解这是一种怎样的模型,我们可以从这个名字入手:自回归、条件异方差。

自回归

回归分析,是我们经常用到的统计模型。

我们经常用回归分析来解释一些事物的变化,用的最多的是线性回归,可以帮助我们找到一些事物之间的相关系。

举个简单的例子:

身高=70%遗传因素+30%后天因素

在这个简单的公式中,就用到了回归分析,身高可以被遗传因素和后天因素两种因素解释,我们还找到了他们各自的比重:如果你的个子不高,那就要努力提高下一代的后天因素了。

这就是一个回归。那自回归呢,我们可以理解为自己与自己的回归,在时间序列上,也就是昨天的你、前天的你,对今天的你的影响。

今天的身高=a昨天的身高+b前天的身高+c*前两天的身高+……

因为,用到的因素都是你自己,只是时间不同,所以这种回归叫做自回归。

自回归模型,是统计上一种处理时间序列的方法,是用同一变量之前各期的表现情况,来预测该变量本期的表现情况,并假设它们为线性关系。因为这是从回归分析中的线性回归发展而来,只是不是用来预测其他变量,而是用来预测自己,所以叫做自回归。

随机扰动项

昨天的你,前天的你,都可以用来预测今天的你,只是预测的结果是否准确,受到很多因素的影响。

也许,你的身高变化不仅受到自己的影响,还受到气候、家庭,甚至空气、水源的影响,但是在你刚刚建立的模型中,他们都是被忽略掉的。

他们藏在了一个地方:随机扰动项。

今天的身高=昨天的身高+b前天的身高+c*前期天的身高+……随机扰动项

也许根据你的模型,你今天应该达到1.70,但是你只有1.65,那就是你的模型中可能有些因素被你忽略掉了,它也对你的身高有影响,它就是随机扰动项。

异方差

由于随机扰动项包含了所有无法用解释变量表示的各种因素对被解释变量的影响,即模型中略去的经济变量对被解释变量的影响。

如果其中被略去的某一因素或某些因素随着解释变量观测值的不同而对被解释变量产生不同的影响,就会使随机扰动项产生异方差性。

你可以这样理解,如果你的身高,受到昨天、前天的身高的影响,而这个随机扰动项也受到昨天、前天身高的影响,那这个扰动项也会随着每天的数据变化,这就是异方差。

异方差一般可归结为三种类型:
(1) 单调递增型:随X的增大而增大,即在X与Y的散点图中,表现为随着X的增大Y值的波动越来越大。
(2)单调递减型:随X的增大而减小,即在X与Y的散点图中,表现为随着X值的增大Y值得波动越来越小。
(3)复杂型:与X的变化呈复杂形式,即在X与Y的散点图中,表现为随着X值的增大Y值的波动复杂多变没有系统关系。


数据选取

笔者选取1973年1月到2009年12月,英特尔公司(INTC)股票的每月收盘价数据,同时也收集同期的S&P指数数据,前六个数据样本如下所列:

## date intc sp
## 1 19730131 0.010050 -0.017111
## 2 19730228 -0.139303 -0.037490
## 3 19730330 0.069364 -0.001433
## 4 19730430 0.086486 -0.040800
## 5 19730531 -0.104478 -0.018884
## 6 19730629 0.133333 -0.006575

模型分析

用rtrt表示某项资产在tt时刻的对数收益率。波动率研究的基本思想是,序列rtrt是前后不相关的或低阶前后相关的,但是序列不是独立的。


课程

R语言数据分析挖掘必知必会

从数据获取和清理开始,有目的的进行探索性分析与可视化。让数据从生涩的资料,摇身成为有温度的故事。

立即参加

作为说明,考虑Intel公司股票从1973年1月到2009年12月的月对数收益率,共有444个观察值,下图给出了该对数收益率的时序图。

收益率序列看起来是平稳且随机的。接下来,我们给出其样本自相关函数(ACF),同时也作出对数收益率的绝对值序列|rt||rt|的样本自相关函数。

对数收益率序列的ACF显示除了在滞后为7和14时有较小相关性之外,没有显著的序列前后相关性,并且序列rtrt的Ljung-Box统计量表明 18.6760744,相应的p值为 0.0966514。

而对数收益率的绝对值序列|rt||rt|显示具有序列相关性,并且序列|rt||rt|的Ljung-Box统计量表明 124.9064353,相应的p值接近于 0。

因此,Intel公司股票月对数收益率序列是前后不相关的,但不是独立的。我们用ARCH模型去刻画收益率序列的这种不独立性。

为了把波动率模型放在一个适当的框架中,考虑给定Ft−1Ft−1时rtrt的条件均值和条件方差,即:

μt=E(rt|Ft−1),σ2t=Var(rt|Ft−1)=E[(rt−μt)2|Ft−1]μt=E(rt|Ft−1),σt2=Var(rt|Ft−1)=E[(rt−μt)2|Ft−1]

其中,Ft−1Ft−1是在t−1t−1时刻已知的信息集。样本公司的股票收益率序列rtrt即使有前后相关性也很弱。我们假定rtrt服从简单的ARMA(p,q)模型,Ljung-Box统计量表明Intel股票的月对数收益率序列没有序列相关性。我们对对数收益率序列进行单样本检验,确认序列rtrt的均值显著不等于0.

## $statistic
## t
## 2.37881
##
## $p.value
## [1] 0.01779151

更具体地说,检验H0:μ=0和Ha:μ≠0H0:μ=0和Ha:μ≠0的t比为2.3788,p值为0.01779.因此,对Intel公司股票的对数收益率,有rt=μt+εtrt=μt+εt,其中μt=μμt=μ为常数。

②ARCH效应的检验

对于Intel公司股票的月对数收益率序列,均值方程仅仅由一个常数构成。

记εt=rt−μtεt=rt−μt为均值方程的残差。平方序列ε2tεt2可以用来检验条件异方差性,即ARCH效应,我们采用Mcleod和Li(1983)提出的将Ljung-Box统计量QQ(m)Q(m)应用于序列ε2tεt2,该检验统计量的原假设是序列ε2tεt2前m个间隔的ACF值都为0.

ε2t=α0+α1ε2t−1+⋅⋅⋅+αmε2t−m+et,t=m+1,⋅⋅⋅,Tεt2=α0+α1εt−12+···+αmεt−m2+et,t=m+1,···,T

ε2tεt2的Ljung-Box统计量Q(12)Q(12)=92.938884,其p值接近于0,因此表明有很强的ARCH效应。也可以用Engle的拉格朗日乘子法(m=12),archTest检验结果显示,F的值为4.978,相应的p值接近于0,进一步表明Intel公司股票对数收益率有很强的 ARCH效应。

③ARCH模型的建立

ARCH模型的基本思想是:1)资产收益率的扰动序列εtεt是前后不相关的,但不是独立的;2)εtεt的不独立性可以用其滞后值的简单二次函数来表述。ARCH(m)模型假定

εt=σtϵt,σ2t=α0+α1ε2t−1+⋅⋅⋅+αmε2t−mεt=σtϵt,σt2=α0+α1εt−12+···+αmεt−m2

,其中ϵtϵt是均值为0、方差为1的独立同分布(iid)随机变量序列,且α0>0α0>0,对i>0i>0有αi≥0αi≥0.系数αiαi必须满足一些正则性条件以保证εtεt的无条件方差是有限的。我们假定ϵtϵt服从标准正态分布。

上图给出了均值调整对数收益率的平方序列的样本ACF和PACF.从PACF图中,我们可以看出在间隔为1、2、3和11上有显著的相关性。为了保持模型简单,我们对波动率建立一个ARCH(3)模型。相应的,为Intel公司股票的月对数收益率建立一个如下模型:

rt=μ+εt,εt=σtϵt,σ2t=α0+α1ε2t−1+α2ε2t−2+α3ε2t−3rt=μ+εt,εt=σtϵt,σt2=α0+α1εt−12+α2εt−22+α3εt−32

假定ϵtϵt是独立同分布的标准正态序列。

我们得到的拟合模型为:rt=0.0126+εt,σ2t=0.0104+0.2329ε2t−1+0.0751ε2t−2+0.0520ε2t−3rt=0.0126+εt,σt2=0.0104+0.2329εt−12+0.0751εt−22+0.0520εt−32并且,各个参数估计值的标准误差分别是0.0055、0.0012、0.115、0.0473和0.0451,统计报告见附录。

可见,α2α2和α3α3的估计值在5%的水平下不是统计显著的。我们去掉两个不显著参数,简化模型为ARCH(1) ,重新得出如下拟合模型rt=0.0131+εt,σ2t=0.0110+0.3750ε2t−1rt=0.0131+εt,σt2=0.0110+0.3750εt−12其中,各个参数估计值的标准误差分别是0.0053、0.0021和0.1126,并且所以估计都是高度显著的。

④ARCH模型的思考

我们对于Intel公司股票波动率建立的上述模型是不是就能充分地描述给定数据的条件异方差性了呢?

以下,我们对残差进行标准化处理,得到序列{εt^εt^},{εt^εt^}的样本ACF和样本PACF图如下所示:

PACF图表明在标准化残差的平方序列的高阶间隔上仍然有序列相关性。{εt^εt^}的Ljung-Box统计量为Q(10)=16.58Q(10)=16.58,p=0.08p=0.08;Q(20)=38.81Q(20)=38.81,p=0.007p=0.007.因此,如果只是关注低阶的模型,那么在5%水平下,以上所求的ARCH(1)模型就能充分地描述给定数据的条件异方差。

 



可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds