如何构建合适的模型以恰当的方法对风险进行测量是当前金融研究领域的一个热门话题。

由Kaizong Ye，Coin Ge撰写

VaR方法作为当前业内比较流行的测量金融风险的方法,具有简洁,明了的特点,而且相对于方差来讲,更多的将投资人的损失作为风险具有更好的合理性。

VaR（Value at Risk）方法，即风险价值模型，是当前金融风险管理领域中广泛采用的一种风险评估工具。该方法的核心思想在于估计在一定的置信水平下，某一金融资产或证券组合在未来特定的一段时间内的最大可能损失。VaR方法之所以受到业内的青睐，主要得益于其简洁明了的特点以及相较于方差更为合理的风险评估方式。

我们和一位客户讨论如何在R软件中处理GARCH族模型。

可下载资源

完整程序、数据和文档（word）

作者

Kaizong Ye
✉ 联系我们

数据的选取

本文选取Wind资讯发布的股票型券商理财指数作为数据处理对象。

× 对于波动率的研究，以往所利用的主要方法有GARCH族模型建模方法、SV建模方法、多分形建模方法等。Bollerslev ( 1986 )年所提出的GARCH族模型是对时间序列进行建模的重要方法，后来形成了刻画杠杆效应等不同特征的GARCH族模型，并一直不断发展和完善。Hansen等( 2012)在传统GARCH族模型的基础上，提出了RealizedGARCH族模型。李文君和尹康( 2009)对多元GARCH族模型进行了全面总结和系统评述，并对其未来的研究进行了展望。徐有俊和王小霞(2010) 利用GARCH族模型，对比了我国和印度与世界各国间股市之间的联动关系，研究结论显示，我国股票市场与亚洲新兴国家股票市场之间的联动关系，要强于印度股票市场与之的联动关系，并且在金融危机之后，我国股票市场与世界市场之间的关系越来越紧密。王曦和朱立挺( 2017)利用多元GARCH族模型对我国货币政策与资产价格之间的相互关系展开了详细分析，严哲人和徐嫒媛等(2018)同样利用该方法进行了国内外原料奶市场之间的相互关系。

选取的时间期间为2011年1月4日至2015年11月24日，共1187个交易日。该指数基日为2007年12月31日，基点为1000点。

视频

时间序列分析模型 ARIMA-ARCH GARCH模型分析股票价格数据

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

视频

量化交易陷阱和R语言改进股票配对交易策略分析中国股市投资组合

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

收益率的计算

采用对数收益率对指数收盘点位进行计算，表达式为

记为序列。由图观察可知，该收益率序列存在波动聚集现象。

clpr<-stock$Clsprc
yield<-diff(log(clpr))
ts.plot(yield)

基本特征分析

对序列进行基本统计分析，结果如表所示：


summary(yield)
sd(yield)
var(yield)

表 指数日收益率基本统计表****

Min.	1st Qu.	Median	Mean	3rd Qu.	Max.	Sd	skewness’	kurtosis
-0.03517	-0.00389	0.0003749	0.0001963	0.00473	0.03348	0.008163353	-0.4018462	2.169439

由表可知，收益率序列的最小值为-0.03517，最大值为0.03348，平均值为0.0001963，标准差为0.008163353。偏度为-0.4018462，表现为右偏。峰度为2.169439，该分布比正态分布更陡峭。

1、正态性检验

对指数的日收益率序列进行正态性检验。检验方法采用Jarque-Bera统计量。检验结果显示Jarque-Bera统计量为261.3839，P值接近0，拒绝对数收益率服从正态分布的原假设，表明序列为非正态分布。

表 Jarque-Bera检验结果

检验方法	统计量	P值
Jarque-Bera	261.3839	< 2.2e-16

为了进一步探究序列的分布形态，对样本数据作直方图、QQ图。由图可见，该收益率序列的尾部更长更厚，且其分布存在明显的不对称的现象，为非正态分布。

最受欢迎的见解

1.R语言对S＆P500股票指数进行ARIMA + GARCH交易策略

2.R语言改进的股票配对交易策略分析SPY—TLT组合和中国股市投资组合

3.R语言时间序列：ARIMA GARCH模型的交易策略在外汇市场预测应用

4.TMA三均线期指高频交易策略的R语言实现

5.r语言多均线量化策略回测比较

6.用R语言实现神经网络预测股票实例

7.r语言预测波动率的实现：ARCH模型与HAR-RV模型

8.R语言如何做马尔科夫转换模型markov switching model

9.matlab使用Copula仿真优化市场风险

R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列

阅读文章 ➜

2、自相关性检验

对指数的日收益率序列的自相关性进行检验。检验方法采用Ljung-Box检验。表中LB2(12)指滞后期为12的收益率平方的Ljung-Box统计量，该统计量在无序列相关的零假设下，服从自由度为12的分布。具体检验结果如下：收益率平方的Ljung-Box统计量为34.1853，P值为0.0006306，拒绝无自相关的零假设，表明收益率的平方存在自相关现象。

表 Ljung-Box检验结果

检验方法	统计量	P值
LB2(12)	34.1853	0.0006306

为了进一步探究序列的自相关性，对序列作ACF、PACF图。由图可见，该收益率序列存在自相关现象。

随时关注您喜欢的主题

3、异方差性检验

对指数的日收益率序列进行异方差性检验。检验方法采用ARCH-LM检验。表中LM(12)指ARCH效应的拉格朗日乘数检验，在没有ARCH效应的零假设下，统计量服从自由度为12的分布。

具体检验结果如下：LM统计量为170.9818，P值接近0，故拒绝无ARCH效应的零假设，表明收益率序列存在ARCH效应。

表 ARCH-LM检验结果

检验方法	统计量	P值
LM(12)	170.9818	< 2.2e-16

在时间序列模型中，序列的平稳性会直接影响到模型的拟合效果，非平稳的序列容易产生谬误回归（Spurious Regression）。

4、平稳性检验

本节将采用 ADF 检验来对收益率序列进行单位根检验。检验结果显示Dickey –Fuller值为-9.7732（滞后10阶），P值小于0.01，故拒绝存在单位根的原假设，认为该收益率序列是平稳的。

表 ADF检验结果

检验方法	统计量	P值
ADF	-9.7732	<0.01

综上，收益率序列存在明显的尖峰厚尾效应，JB检验同样否认了收益率服从正态分布的假设。LM检验表明收益率存在ARCH效应，而LB检验表明收益率的平方存在自相关现象，因此可以采用条件异方差模型来分析收益率序列的波动特性

GARCH族模型的建立

本文将分别采用基于正态分布、t分布、广义误差分布(GED)、偏态t分布(ST)、偏态广义误差分布(SGED) 的GARCH(1,1)、EGARCH、TGARCH来建模。

表中，c为收益率的均值，为方差方程的常数项，为方差方程的ARCH项系数，为GARCH项系数，反映杠杆效应的大小。参数为概率分布中的参数，其中控制尖峰高度和尾部厚度，控制偏斜度。

GARCH(1,1)模型

GARCH(1,1)模型表示如下：


spec<-ugarchspec(variance.model=list(garchOrder=c(1,1)),
       mean.model=list(armaOrder=c(0,0)))
fit <- ugarchfit(spec = spec, data = yield)

ariance.model=list(garchOrder=c(1,1)),
       mean.model=list(armaOrder=c(0,0)),distribution.model = "std")

表 收益率指数 GARCH 模型估计结果*

	正态分布	t分布	GED	偏t分布	SGED
c	0.000264( 0.21277)	0.000342 ( 0.077829)	0.000342 (0.040020)	0.000299(0.161218)	0.000230 (0.587094)
	0.000001 ( 0.14473)	0.000001 ( 0.257057)	0.000001(0.441759)	0.000001(0.259532)	0.000001(0.456113)
	0.048706( 0.00000) ***	0.054123 ( 0.000001) ***	0.050726 (0.002247) ***	0.053698(0.000001) ***	0.050853(0.00353) ***
**	0.927184( 0.00000) ***	0.933160(0.00000) ***	0.931267(0.000000) ***	0.933230(0.000000) ***	0.930511 (0.000000) ***
				0.981867(0.000000) ***	0.939087(0.000000) ***
		5.219963(0.00000) ***	1.201313(0.00000) ***	5.243745(0.000000) ***	1.202264 (0.000000) ***
LOG(L)	4098.099	4133.571	4138.72	4133.688	4139.112
LB2(1)	0.0005385	0.03154	0.01327	0.02633	0.01035
LB2(5)	0.7282074	1.00717	0.88424	0.97089	0.83074
LB2(9)	1.2003692	1.63025	1.43485	1.58488	1.36785

注：括号中是P值。***表示0.1%置信水平下统计显著；**表示在 1%置信水平下统计显著；*表示5%水平下统计显著。

对GARCH(1,1)模型来说,无论收益率残差服从哪种分布,其方差方程中ARCH项和GARCH项系数均高度显著，然而均值方程和方差方程中的的常数项均不显著。

EGARCH(1,1)模型

EGARCH是从GARCH衍生出的模型，可用于解释“杠杆效应”。“杠杆效应”是指金融资产收益率的涨和跌对未来波动性的影响是不同的。

chspec(variance.model=list(model="eGARCH", garchOrder=c(1,1)),
       mean.model=list(armaOrder=c(0,0)))

收益率指数 EGARCH 模型估计结果****

	正态分布	t分布	GED	偏t分布	SGED
c	0.000271(0.075278)	0.000336( 0.079723)	0.000340( 0.016498)	0.000271(0.12507)	0.000199 ( 0.14978)
	-0.206804(0.000000) ***	-0.157944(0.000000) ***	-0.184483(0.000000) ***	-0.160675(0.000000) ***	-0.190357(0.00000) ***
	0.001715(0.862698)	-0.013118 ( 0.388489)	-0.007304( 0.603938)	-0.012933(0.393570)	-0.007622 (0.41512)
**	0.978191(0.000000) ***	0.983721(0.000000) ***	0.981159(0.000000) ***	0.983429(0.000000) ***	0.980540(0.00000) ***
	0.107504( 0.001149)***	0.128684(0.000000) ***	0.118786(0.001145)**	0.128607(0.000001)***	0.119496(0.00000) ***
				0.978059(0.000000) ***	0.970479(0.00000) ***
		4.999931(0.000000) ***	1.185703(0.000000) ***	5.025099(0.000000) ***	1.186277(0.00000) ***
LOG(L)	4092.934	4131.264	4136.163	4131.438	4136.691
LB2(1)	0.1871	0.00369	0.03273	0.004377	0.03288
LB2(5)	0.8244	0.93644	0.83619	0.898516	0.76626
LB2(9)	1.4308	1.55934	1.41608	1.511597	1.32613

注：括号中是P值。***表示0.1%置信水平下统计显著；**表示在 1%置信水平下统计显著；*表示5%水平下统计显著。

对EGARCH(1,1)模型来说,无论收益率残差服从哪种分布,其方差方程中常数项和GARCH项系数均高度显著，然而均值方程和方差方程中的的ARCH项系数均不显著。

GJR-GARCH模型

GJR-GARCH模型即是在GARCH模型的基础上考虑到杠杆效应，引入一个虚拟变量来表示正负冲击对的影响。

ariance.model=list(model="gjrGARCH", garchOrder=c(1,1)),
	mean.model=list(armaOrder=c(0,0)),distribution.model = "std")

收益率指数 GJR- GARCH 模型估计结果****

	正态分布	t分布	GED	偏t分布	SGED
c	0.000275( 0.198829)	0.000335 ( 0.084013)	0.000338( 0.040523)*	0.000292(0.17233)	0.000221 (0.540614)
	0.000001( 0.171795)	0.000001 (0.298628)	0.000001(0.000000) ***	0.000001( 0.30375)	0.000001(0.590270)
	0.051272( 0.000072)***	0.051272 (0.000072)***	0.046304(0.012649) *	0.045985(0.00000)***	0.046440 (0.007732)**
**	0.928798(0.000000) ***	0.928798(0.000000) ***	0.927762 (0.000000) ***	0.929132(0.00000) ***	0.928254 (0.000000) ***
	-0.005443( 0.702778)	-0.005443(0.702778)	0.010575(0.493464)	0.018174(0.32446)	0.010036(0.542627)
				0.983235(0.00000) ***	0.975509(0.000000) ***
		4.999931(0.000000) ***	1.197353(0.000000) ***	5.148342(0.00000) ***	1.199348 (0.000000) ***
LOG(L)	4098.144	4133.955	4138.849	4134.063	4139.244
LB2(1)	0.00032	0.06294	0.03472	0.05974	0.02502
LB2(5)	0.68873	1.14346	0.98759	1.11792	0.91801
LB2(9)	1.15402	1.81742	1.56472	1.78469	1.48424

注：括号中是P值。***表示0.1%置信水平下统计显著；**表示在 1%置信水平下统计显著；*表示5%水平下统计显著。

对GJR-GARCH(1,1)模型来说, 无论收益率残差服从哪种分布,其杠杆系数都是不显著的。但是就其他参数而言，GED分布下，参数拟合都是显著的。方差方程中ARCH项和GARCH项系数均高度显著，然而均值方程和方差方程中的的常数项均不显著。通过对比对数似然函数值，发现残差服从GED分布和SGED分布时，模型拟合效果要优于正态分布、t分布和偏t分布。另外,五种分布条件下，均接近1，这说明尽管收益率的波动会逐步衰减,但是持续的时间将会非常长。最后，LB2统计量显示模型的标准化残差平方均不再具有异方差现象，且在统计上都是显著的。

APARCH模型

APARCH(1,1)模型波动性方程为：

variance.model=list(model="apARCH", garchOrder=c(1,1)),

收益率指数 APARCH 模型估计结果****

	正态分布	t分布	GED	偏t分布	SGED
c	0.000301( 0.15463)	0.000349 (0.071965)	0.000349( 0.049846)*	0.000338 (0.108480)	0.000239 (0.379013)
	0.000000(0.92767)	0.000000(0.979064)	0.000000(0.972073)	0.000000(0.984476)	0.000000(0.992160)
	0.036457(0.00021)***	0.036235(0.061548)	0.036665(0.123664)	0.038866(0.179902)	0.036743 (0.540439)
**	0.914738(0.00000) ***	0.920788(0.000000) ***	0.917647(0.000000) ***	0.920930(0.000000) ***	0.919184 (0.000000) ***
	0.001559( 0.98256)	0.076905(0.416691)	0.048123(0.624721)	0.063356(0.277636)	0.019934 (0.835479)
	2.770787(0.00000) ***	2.835321(0.000000) ***	2.732345(0.000000) ***	2.774741(0.000000) ***	2.794404(0.000000) ***
				0.991283 (0.000000) ***	0.970652(0.000000) ***
		5.534190(0.000017) ***	1.207995(0.000000) ***	5.400260 (0.000001) ***	1.213429(0.000687) ***
LOG(L)	4100.315	4134.174	4139.32	4134.308	4139.746
LB2(1)	0.07729	0.1613	0.1208	0.1772	0.09563
LB2(5)	0.94386	1.2998	1.1247	1.3636	1.05785
LB2(9)	1.45195	2.0242	1.7278	2.1042	1.64646

注：括号中是P值。***表示0.1%置信水平下统计显著；**表示在 1%置信水平下统计显著；*表示5%水平下统计显著。

对APARCH (1,1)模型来说, 除了方差方程和显著外，其他系数基本不显著。通过对比对数似然函数值，发现残差服从GED分布和SGED分布时，模型拟合效果要优于正态分布、t分布和偏t分布。LB2统计量显示模型的标准化残差平方均不再具有异方差现象，且在统计上都是显著的。

计算VaR

plotMSFT.garch11.fitwhich=2

序列预测

plotMSFT.garch11.boot

GARCH11滚动预测

MSFT.garch11.roll =spec y  
  
  
classMSFT.garch11.roll

## [1] "uGARCHroll"  
## attr"package"  
## [1] "rugarch"

## VaR Backtest Report  
## ===========================================  
## Model:               eGARCH-norm  
## Backtest Length: 1000  
## Data:                 
##  
## ==========================================  
## alpha:               1%  
## Expected Exceed: 10  
## Actual VaR Exceed:   50  
## Actual %:            5%  
##  
## Unconditional Coverage Kupiec  
## Null-Hypothesis: Correct Exceedances  
## LR.uc Statistic: 82.582  
## LR.uc Critical:      3.841  
## LR.uc p-value:       0  
## Reject Null:     YES  
##  
## Conditional Coverage Christoffersen  
## Null-Hypothesis: Correct Exceedances and  
##                  Independence of Failures  
## LR.cc Statistic: 118.726  
## LR.cc Critical:      5.991  
## LR.cc p-value:       0  
## Reject Null:     YES

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

R语言GARCH族模型：正态分布、t、GED分布EGARCH、TGARCH的VaR分析股票指数

如何构建合适的模型以恰当的方法对风险进行测量是当前金融研究领域的一个热门话题。

数据的选取

收益率的计算

基本特征分析

1、正态性检验

R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列

2、自相关性检验

随时关注您喜欢的主题

3、异方差性检验

具体检验结果如下：LM统计量为170.9818，P值接近0，故拒绝无ARCH效应的零假设，表明收益率序列存在ARCH效应。

在时间序列模型中，序列的平稳性会直接影响到模型的拟合效果，非平稳的序列容易产生谬误回归（Spurious Regression）。

4、平稳性检验

GARCH族模型的建立

GARCH(1,1)模型

EGARCH(1,1)模型

GJR-GARCH模型

APARCH模型

计算VaR

序列预测

GARCH11滚动预测

相关文章

R语言GARCH族模型：正态分布、t、GED分布EGARCH、TGARCH的VaR分析股票指数

如何构建合适的模型以恰当的方法对风险进行测量是当前金融研究领域的一个热门话题。

数据的选取

收益率的计算

基本特征分析

1、正态性检验

R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列

2、自相关性检验

随时关注您喜欢的主题

3、异方差性检验

具体检验结果如下：LM统计量为170.9818，P值接近0，故拒绝无ARCH效应的零假设，表明收益率序列存在ARCH效应。

在时间序列模型中，序列的平稳性会直接影响到模型的拟合效果，非平稳的序列容易产生谬误回归（Spurious Regression）。

4、平稳性检验

GARCH族模型的建立

GARCH(1,1)模型

EGARCH(1,1)模型

GJR-GARCH模型

APARCH模型

计算VaR

序列预测

GARCH11滚动预测

相关文章

关注有关新文章的微信公众号