ARIMA是可以拟合时间序列数据的模型，根据自身的过去值(即自身的滞后和滞后的预测误差)“解释” 给定的时间序列，因此可以使用方程式预测未来价值。

任何具有模式且不是随机白噪声的“非季节性”时间序列都可以使用ARIMA模型进行建模。

由Feier Li撰写

× ARIMA模型包含3个部分，即自回归（AR）、差分（I）和移动*均（MA），它们的含义分别是： AR表示自回归（Auto Regression）， I 表示单整阶数（Integration），时间序列必须是*稳的，才能建立计量模型。对时间序列进行单位根检验，如果是非*稳序列，那么需要通过差分转化为*稳序列，经过几次差分转化为*稳序列，就称为几阶单整； MA表示移动*均模型（Moving Average） ARIMA模型记作ARIMA(p，d，q)，p为自回归项数；q为滑动*均项数，d为使之成为*稳序列所做的差分次数（阶数）。“差分”是关键步骤，采用ARIMA模型预测的时序数据，必须是稳定的（*稳性），不稳定的数据，是无法捕捉到时序规律的。 ARIMA模型实际上是AR模型和MA模型的组合，ARIMA模型与ARMA模型的区别：ARMA模型是针对*稳时间序列建立的模型，而ARIMA模型是针对非*稳时间序列建立的模型。换句话说，非*稳时间序列要建立ARMA模型，首先需要经过差分转化为*稳时间序列，然后建立ARMA模型。

模型识别

ARIMA 时间序列模型全称为自回归积分滑动平均模型（Autoregressive Integrated Moving Average model）。它是一种广泛应用于时间序列分析和预测的统计模型。

ARIMA 模型由三个部分组成：自回归项（AR）、差分（I，Integrated）和滑动平均项（MA）。自回归项表示当前值与过去若干个值之间的线性关系；差分用于使非平稳的时间序列变为平稳序列；滑动平均项则反映了随机误差项的线性组合对当前值的影响。

该模型可以用于对各种时间序列数据进行建模和预测，例如股票价格、气温变化、销售数据等。通过对历史数据的分析，ARIMA 模型可以捕捉时间序列的趋势、季节性和周期性等特征，从而对未来的值进行较为准确的预测。

模型步骤

构造arima模型需要四个步骤：

平稳性检验
模型识别
参数估计
模型检验

可下载资源

完整程序、数据和文档（word）

Feier Li

✉

联系我们

成为新会员获取本文分析的智能体、数据、代码、报告

加入会员群

最受欢迎的见解

1.R语言多元Logistic逻辑回归应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归（PLSR）和主成分回归（PCR）

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归，Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI，NRI指标

平稳性检验

自适应网页宽度的 Bilibili 视频

视频

时间序列分析模型 ARIMA-ARCH GARCH模型分析股票价格数据

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

图检验

时序图

趋势特征

●周期特征

●以上均无

自相关图

单位根检验

若序列是平稳的，那么该序列的所有特征根都应该在单位圆内。若序列存在特征根在单位，上或单位圆外, 则该序列是非平稳序列。

差分平稳

差分通过从当前观察值中减去先前的观察值来执行求差。

模型识别

Python金融时间序列模型ARIMA 和GARCH 在股票市场预测应用

阅读文章 ➜

参数估计及模型检验

模型的显著性检验

若残差序列为非白噪声序列，则意味着残差序列还有残留的相关信息未被提取，说明拟合模型不够有效。

随时关注您喜欢的主题

参数的显著性检验

检验每一个参数是否显著非零，若不显著非零,即表示该参数所对应的自变量对因变量影响不明显，可将其剔除。

总结

应用场景:

对销售数据进行分析，以预测未来的销售状况
可以用于预测未来的气候变化，用于研究环境问题
可分析行业数据，以便预测行业的未来发展趋势和发展方向。

优点:

实现简单、计算量小
可以有效处理不平滑、不确定性较大的时间序列数据

缺点:

模型容易受到异常值的影响
本质上只能捕捉线性关系，而不能捕捉非线性关系。

R语言用ARIMA模型，ARIMAX模型预测冰淇淋消费时间序列数据

标准的ARIMA（移动平均自回归模型）模型允许只根据预测变量的过去值进行预测。该模型假定一个变量的未来的值线性地取决于其过去的值，以及过去（随机）影响的值。ARIMAX模型是ARIMA模型的一个扩展版本。它还包括其他独立（预测）变量。该模型也被称为向量ARIMA或动态回归模型。

ARIMAX模型类似于多变量回归模型，但允许利用回归残差中可能存在的自相关来提高预测的准确性。
本文练习提供了一个进行ARIMAX模型预测的练习。还检查了回归系数的统计学意义。

这些练习使用了冰淇淋消费数据。该数据集包含以下变量。

美国的冰淇淋消费（人均）
每周的平均家庭收入
冰淇淋的价格
平均温度。

观测数据的数量为30个。它们对应的是1951年3月18日至1953年7月11日这一时间段内的四周时间。

想了解更多关于模型定制、咨询辅导的信息？

✉

联系我们

练习1

加载数据集，并绘制变量cons（冰淇淋消费）、temp（温度）和收入。

 ggplot(df, aes(x = X, y = income)) +
  ylab("收入") +
  xlab("时间") +

grid.arrange(p1, p2, p3, ncol=1, nrow=3)

练习 2

对冰淇淋消费数据估计ARIMA模型。然后将该模型作为输入传给预测函数，得到未来6个时期的预测数据。

auto.arima(cons)

fcast_cons <- forecast(fit_cons, h = 6)

练习3

绘制得到的预测图。

练习4

找出拟合的ARIMA模型的平均绝对误差（MASE）。

accuracy

练习5

为消费数据估计一个扩展的ARIMA模型，将温度变量作为一个额外的回归因子（使用auto.arima函数）。然后对未来6个时期进行预测（注意这个预测需要对期望温度进行假设；假设未来6个时期的温度将由以下向量表示：

fcast_temp <- c(70.5, 66, 60.5, 45.5, 36, 28)）

绘制获得的预测图。

练习6

输出获得的预测摘要。找出温度变量的系数，它的标准误差，以及预测的MASE。将MASE与初始预测的MASE进行比较。

summary(fca)

温度变量的系数是0.0028

该系数的标准误差为0.0007

平均绝对比例误差为0.7354048，小于初始模型的误差（0.8200619）。

练习7

检查温度变量系数的统计意义。该系数在5%的水平上是否有统计学意义？

test(fit)

练习8

估计ARIMA模型的函数可以输入更多的附加回归因子，但只能以矩阵的形式输入。创建一个有以下几列的矩阵。

温度变量的值。
收入变量的值。
滞后一期的收入变量的值。
滞后两期的收入变量的值。
输出该矩阵。
注意：最后三列可以通过在收入变量值的向量中添加两个NA来创建，并将得到的向量作为嵌入函数的输入（维度参数等于要创建的列数）。


vars <- cbind(temp, income)
print(vars)

练习9

使用获得的矩阵来拟合三个扩展的ARIMA模型，使用以下变量作为额外的回归因子。

温度、收入。
温度、收入的滞后期为0、1。
温度，滞后期为0、1、2的收入。
检查每个模型的摘要，并找到信息准则（AIC）值最低的模型。
注意AIC不能用于比较具有不同阶数的ARIMA模型，因为观察值的数量不同。例如，非差分模型ARIMA（p，0，q）的AIC值不能与差分模型ARIMA（p，1，q）的相应值进行比较。

auto.arima(cons, xreg = var)
print(fit0$aic)

可以使用AIC，因为各模型的参数阶数相同（0）。

AIC值最低的模型是第一个模型。

它的AIC等于-113.3。

练习10

使用上一练习中发现的模型对未来6个时期进行预测，并绘制预测图。预测需要一个未来6个时期的期望温度和收入的矩阵；使用temp变量和以下期望收入值创建矩阵：91, 91, 93, 96, 96, 96。
找出该模型的平均绝对比例误差，并与本练习集中前两个模型的误差进行比较。

带有两个外部回归因子的模型具有最低的平均绝对比例误差(0.528)

可下载资源

关于作者

在此对Feier Li对本文所作的贡献表示诚挚感谢，她完成了数据科学与大数据技术学位，专注机器学习领域。擅长Python、SPSS。

非常感谢您阅读本文，如需帮助请联系我们！

【视频】ARIMA时间序列模型原理和R语言ARIMAX预测实现案例

ARIMA是可以拟合时间序列数据的模型，根据自身的过去值(即自身的滞后和滞后的预测误差)“解释” 给定的时间序列，因此可以使用方程式预测未来价值。

模型识别

模型步骤

平稳性检验

图检验

单位根检验

差分平稳

模型识别

Python金融时间序列模型ARIMA 和GARCH 在股票市场预测应用

参数估计及模型检验

模型的显著性检验

随时关注您喜欢的主题

参数的显著性检验

总结

应用场景:

优点:

缺点:

R语言用ARIMA模型，ARIMAX模型预测冰淇淋消费时间序列数据

想了解更多关于模型定制、咨询辅导的信息？

练习1

练习 2

练习3

练习4

练习5

练习6

练习7

练习8

练习9

练习10

相关文章

【视频】ARIMA时间序列模型原理和R语言ARIMAX预测实现案例

ARIMA是可以拟合时间序列数据的模型，根据自身的过去值(即自身的滞后和滞后的预测误差)“解释” 给定的时间序列，因此可以使用方程式预测未来价值。

模型识别

模型步骤

平稳性检验

图检验

单位根检验

差分平稳

模型识别

Python金融时间序列模型ARIMA 和GARCH 在股票市场预测应用

参数估计及模型检验

模型的显著性检验

随时关注您喜欢的主题

参数的显著性检验

总结

应用场景:

优点:

缺点:

R语言用ARIMA模型，ARIMAX模型预测冰淇淋消费时间序列数据

想了解更多关于模型定制、咨询辅导的信息？

练习1

练习 2

练习3

练习4

练习5

练习6

练习7

练习8

练习9

练习10

相关文章

关注我们，永远不要错过任何见解。