虽然中国股票市场日益完善,但还不完全是弱有效市场,因此中国股票市场存在比较明显的通过技术分析达到的套利机会。

根据基金净值的要求，运用多种模型分析实现股票走势的预测。

由Yuyan Wang撰写

数据源准备

本次数据来源于天天基金网南方恒生中国企业ETF版面，数据获取采用python（版本3.6）爬虫，数据分析部分则是采用Rstudio（3.6.2）。

× 在衍生产品定价和风险管理中，对当前波动率是很感兴趣的，这是因为需要对单一金融资产或者投资组合在一个较短时间内的价值变化进行估计。同时，在对衍生产品定价时，往往需要对衍生产品整个期限内的波动率进行预测，这就需要用到波动率模型。波动率模型的一个显著特点是假设波动率不是常数，具体而言就是在某些时间段内波动率可能相对较低，而在其他时间段内可能相对较高。常用的波动率模型主要有两个，一个是自回归条件异方差模型（ARCH），另一个是广义自回归条件异方差模型（GARCH）。

由于南方恒生中国企业ETF没有分红，所以单位净值和累计净值相同，本次分析采用单位净值（数据采用从2018/2/8~2020/6/10，共556个）作为数据分析对象。

本次数据分析采用的数据模型有AR, MA,ARMA,GARCH模型。

数据预处理

将获得数据进行标准化，并作图发现数据超出了[0,1]的限制，于是我们可以初步估计数据不满足正态性。其次，我们采取箱形图法分析分析数据中可能存在的异常值，发现数据中存在三个异常值点，2020-03-18 -3.636842，2020-03-19 -4.182578，2020-03-23 -3.552882。

Yuyan Wang

✉

联系我们

最受欢迎的见解

1.用R语言模拟混合制排队随机服务排队系统

2.R语言中使用排队论预测等待时间

3.R语言中实现马尔可夫链蒙特卡罗MCMC模型

4.R语言中的马尔科夫机制转换(Markov regime switching)模型

5.python中使用马尔可夫决策过程(MDP)动态编程来解决最短路径强化学习问题

6.用R语言模拟混合制排队随机服务排队系统

7.Python基于粒子群优化的投资组合优化

8.R语言几何布朗运动 GBM模拟股票价格优化建立期权定价概率加权收益曲线可视化

9.R语言进行支持向量机回归SVR和网格搜索超参数优化

数据波动性大且不聚集。于是对数据进行二阶差分（一次差分模型拟合效果不好）。利用箱型图法进行异常值检测，发现二阶差分之后的数据异常值增多，但是从图上可以看出数据具有集群波动性，在这里初步估计数据具有garch模型的特点。

自适应网页宽度的 Bilibili 视频

视频

时间序列分析模型 ARIMA-ARCH GARCH模型分析股票价格数据

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

视频

ARIMA时间序列模型原理和R语言ARIMAX预测实现案例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

自适应网页宽度的 Bilibili 视频

视频

在Python和R语言中建立EWMA，ARIMA模型预测时间序列

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

构造

首先考察时间序列时间序列平方以及绝对值的ACF和PACF图，判断二阶差分具有一定的ARCH性质，接下来我们使用MC.LEOAD.LI方法检验我们刚才的判断。右图说明，二阶差分数据具有很强的ARCH特征。现在我们计算其峰度以及偏度，判断其厚尾性。偏度为0.2112377，峰度为2.870266，j-b检验数为171.9739 远大于kai(2)的置信度5% 时的3.84, 因此相信序列存在高阶相关性和厚尾结构。