用机器学习识别不断变化的股市状况—隐马尔可夫模型(HMM)的应用

了解不同的股市状况,改变交易策略,对股市收益有很大的影响。

由Kaizong Ye,Sherry Deng和Coin Ge撰写

最近我们被客户要求撰写关于股市预测的研究报告。弄清楚何时开始或何时止损,调整风险和资金管理技巧,都取决于股市的当前状况。

有些策略在波澜不惊的股市中表现良好,而有些策略可能适合强劲增长或长期下跌的情况。

在本文中,我们将通过使用一类强大的机器学习算法“隐马尔科夫模型”(HMM)来探索如何识别不同的股市状况。

隐马尔科夫模型

马尔科夫模型是一个概率过程,查看当前状态来预测下一个状态。 一个简单的例子就是看天气。

课程介绍视频

隐马尔科夫模型在股市中的应用课程

探索课程

假设我们有三种天气情况:下雨、多云、阳光明媚。 如果今天下雨,马尔科夫模型就会寻找每种不同天气的概率。 例如,明天可能会持续下雨的可能性较高,变得多云的可能性略低,而会变得晴朗的几率很小。

构建模型

基于以上背景, 然后我们可以用来找到不同的股市状况优化我们的交易策略。 我们使用2004年至今的上证指数(000001.ss)来构建模型。

首先,我们得到上证指数的收盘价数据,计算得到收益率数据,并建立HMM模型比较模型的预测结果。

   
 df <- data.frame(Date=index(shdata),coredata(shdata))
 
 # 创建布林带
 bbands <- BBands(shdata[,c("000001.SS.High","000001.SS.Low","000001.SS.Close")])
 
 # 连接和数据子集
 df <- subset(cbind(df, data.frame(bbands[,1:3])), Date >= "2015-02-14")
 
 #用于增长和减少的颜色列
 for (i in 1:length(df[,1])) {
   if (df$X000001.SS.Close[i] >= df$X000001.SS.Open[i]) {
     df$direction[i] = 'Increasing'
   } else {
     df$direction[i] = 'Decreasing'
   }
 }
 
 i <- list(line = list(color = '#17BECF'))
 d <- list(line = list(color = '#7F7F7F'))
 
 # 绘制烛台图
  
 
 # 绘制条形图
 pp <- df %>%
   plot_ly(x=~Date, y=~X000001.SS.Volume, type='bar', name = "000001.SS Volume",
           color = ~direction, colors = c('#17BECF','#7F7F7F')) %>%
   layout(yaxis = list(title = "Volume"))
 
 # 创建范围选择器按钮
 rs <- list(visible = TRUE, x = 0.5, y = -0.055,
            xanchor = 'center', yref = 'paper',
            font = list(size = 9),
            buttons = list(
             ...)
            ))
 
 # 具有共享x轴的子图
 p <- subplot(p, pp, heights = c(0.7,0.2), nrows=2,
              shareX = TRUE, titleY = TRUE) %>%
   layout(title = paste("000001.SS: 2004-01-01 -",Sys.Date()),
          xaxis = list(rangeselector = rs),
          legend = list(orientation = 'h', x = 0.5, y = 1,
                        xanchor = 'center', yref = 'paper',
                        font = list(size = 10),
                        bgcolor = 'transparent'))
 
 
 p
 
  

绘制上证指数的收盘价和收益率数据,我们看到2004年和2017年期间股市的波动情况。

对收益率拟合了三状态隐马尔可夫模型之后, 绘制每个状态的后验概率:

2007 – 2009年间,由于次贷危机,股市出现了惊人的波动,迅速改变了不同状态的后验概率

可以看到2008年前后状态2和状态3的概率出现了很大的变化。

股市在2010年后变得平静,因此状态2和状态3的概率处于平衡状态。

基于以上判断,我们将三种不同的状态进行定义。状态1认为是震荡市场,状态2认为是下跌市场,状态3认为是上涨市场。然后将不同状态的预测结果返回到真实的上证指数来观察是否符合客观逻辑。


R语言用隐马尔可夫模型HMM进行股票预测

阅读文章


通过真实数据拟合,我们看到状态1(紫色)震荡市场,状态2(绿色)下跌市场,状态3(红色)上涨市场符合实际的情况。

通过隐马尔科夫模型,可以深入了解不断变化的股市状况。 从而提高交易策略的性能。就从我们的简单探索来看,这个模型应当是值得花一些时间去打磨的。可改进的地方非常多。例如可以引入多因子分析,建立多元模型等。


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds