通过关联规则数据挖掘我们能从股市数据得到什么

通过关联规则数据挖掘我们能从股市数据得到什么

众所周知,在证券投资领域将涉及很多数据,因此,通过简单的处理难以有效地分析各种公司股票之间的关系,而关联规则挖掘可以很好的解决这个问题,它允许投资在大量数据中,发现企业股票的相关性,以进一步研究和分析。是股民的得力助手!

我们从2015年1月至2016年1月收集了香港部分上市公司的股票交易数据,作为分析主体,探讨其间的潜在影响。

​​

现在通过关联规则分析挖掘出,当股价上涨的时候,另一股票的价格会随着情况而上涨的情况。

首先,股票交易数据可视化,观察股价之间的关系。 在IBM SPSS Modeler软件中,我们使用网络图节点来分析上市公司股价上涨的潜在联系,并找出其间的强关联规则。

​​

线段的粗细程度由线段两端点的股票的价格同时上涨的天数决定,如果线段两端的股票的价格同时上涨的实际情况的频数越大,那么链接两只股票间的线段就越粗。如果线段两端的股票的价格同时上涨的实际情况的频数越小,那么链接两只股票间的线段就越细。从这一图中很明显的可以看出复兴医药和白云山之间有着很强的关联。

提高阈值的网络图

得到基于 Apriori 算法的关联规则的结果 :

​​

关联规则结果

​​​​

第一行规则表明, 当该白云山价格出现上涨的趋势时,股票复星医药的股价很可能也会随之上涨。原因是在股票的历史交易数据中发现股票白云山和股票复星医药 同时上涨的情况发生了 130 次,占总事件的 35%,在这些时候有 100%的时候股票白云山的价格也发生了上涨

但是预测对了就能挣钱吗? 这个就不一定。 建立的是一种数学或者统计模型,它能表现出已有数据的一些规律,但是未来的数据是否遵循这种规律,是不一定的。尤其是外在环境变量太多,甚至有人为因素。风险的控制,资金管理,自我情绪的管理这些都也很重要。技术大牛们都说系统交易到最后都是对人性的考验。


可下载资源

​非常感谢您阅读本文,如需帮助请联系我们!


关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。


随时关注您喜欢的主题

在wechat上关注我们

最新洞察

技术干货


Leave A Reply

电子邮件地址不会被公开。

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498