R中针对高频数据的添加包highfrequency，用于组织高频数据，高频数据的清理、整理，高频数据的汇总。

由Kaizong Ye，Sherry Deng撰写

使用高频数据建立相关模型 都非常方便。

但是其中数据输入的过程中，会使用到包里的函数convert()。该函数支持三类的高频数据：

 NYSE TAQ数据库中的.txt文件

 WRDS数据库中的.csv文件

 Tickdata.com的.asc文件

可下载资源

完整程序、数据和文档（word）

成为新会员获取本文分析的智能体、数据、代码、报告

加入会员群

不易获取，因此，输入数据转换成xts，然后进行时间序列分析的过程中存在困难。

时间序列（有很多包裹需要数据变成时间序列才能处理）：
zoo,xts

分析（数据分析最关键的部分）：
PerformanceAnalytics（非常强大，里面的指标计算，图形绘制非常全面，对于新手绝对够用）

数据可视化：
ggplot2
用自带包裹里的plot,boxplot,scatterplot之类的也可以
或者PerformanceAnalytics里也有很给力的绘制图

存储：
xlsx（如果要存储多个spreadsheet到一个文档里，xlsx还是很不错的）

交易记录：
blotter 记录仓位，价格，调仓情况
quantmod 加入策略回测

因此对于原始数据，我们可以整理成sample数据的格式，然后使用xts包先将其转换成xts格式。

对于时间序列数据要注意的一点是时间数据不单独作为一列，仅作为行名存在，否则在进行转换的过程中会出现colnames和列的数目不符合的错误。

因此对于数据可以先进行预处理。

对于列数据间分隔建议使用tab制表符，否则在r读取的过程中会将时间的日期时间识别为两列。

R语言HAR和HEAVY模型分析高频金融数据波动率

阅读文章 ➜

sample_tdataraw=read.table("E:\\AA_trades.txt",header=F,skip = 1,stringsAsFactors=FALSE)

其中读取时要注意跳过第一行，列名和列数不符的错误。

课程

R语言数据分析挖掘必知必会

从数据获取和清理开始，有目的的进行探索性分析与可视化。让数据从生涩的资料，摇身成为有温度的故事。

立即参加 ➜

读取后，对列名赋值

colnames(sample_tdataraw)=c(" ","SYMBOL","EX","PRICE","SIZE","COND","CORR","G127")

然后将第一列的时间数据赋给行名

row.names(sample_tdataraw)=sample_tdataraw[,1] sample_tdataraw=sample_tdataraw[,-1]

同时删去第一列。

这样就做好了可以进行转换xts格式的原始数据

library(xts)
 
Data.xts <- as.xts(sample_tdataraw， descr='my new xts object')

这样xts格式的数据便可以继续使用 highfrequency包中的其他函数进行分析了。

等间隔数据、数据同步

波动率预测

HAR-模型

最受欢迎的见解

1.HAR-RV-J与递归神经网络（RNN）混合模型预测和交易大型股票指数的高频波动率

2.R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

3.波动率的实现：ARCH模型与HAR-RV模型

4.R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测

5.GARCH（1,1），MA以及历史模拟法的VaR比较

6.R语言多元COPULA GARCH 模型时间序列预测

7.R语言基于ARMA-GARCH过程的VAR拟合和预测

8.matlab预测ARMA-GARCH 条件均值和方差模型

9.R语言对S＆P500股票指数进行ARIMA + GARCH交易策略

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

R语言highfrequency高频金融数据导入

因此对于数据可以先进行预处理。

R语言HAR和HEAVY模型分析高频金融数据波动率

读取后，对列名赋值

波动率预测

HAR-模型

相关文章

R语言highfrequency高频金融数据导入

因此对于数据可以先进行预处理。

R语言HAR和HEAVY模型分析高频金融数据波动率

读取后，对列名赋值

波动率预测

HAR-模型

相关文章

关注我们，永远不要错过任何见解。