在大数据的趋势下，我们经常需要做预测性分析来帮助我们做决定。

由Kaizong Ye，Weilong Zhang撰写

最近我们被客户要求撰写关于时间序列的研究报告，包括一些图形和统计输出。其中一个重要的事情是根据我们过去和现在的数据来预测未来。这种方法我们通常被称为预测。

一个事件的可预测性取决于多个因素，这些因素可能涉及数据的可用性、影响因素的复杂性、历史模式的稳定性以及所采用预测方法的准确性等。在您提到的三种情况中，对未来的电力需求、呼叫中心的呼叫量以及库存需求进行预测，各自的可预测性也受不同因素的影响。

对于电力需求预测，关键因素可能包括历史电力消费数据的趋势分析、经济指标（如GDP、工业生产指数、人口增长等）的关联分析，以及政策导向（如节能减排政策）的影响。这些因素可以提供对未来电力需求的洞察，但也可能受到经济波动、政策变化以及技术进步等多种不确定性的影响。

可下载资源

完整程序、数据和文档（word）

作者

Kaizong Ye
✉ 联系我们

许多情况下都需要预测：决定是否在未来五年内再建一座发电站需要对未来的需求进行预测；安排下周呼叫中心的工作人员需要对呼叫量进行预测；储备库存需要对库存需求进行预测。一个事件的可预测性取决于几个因素，包括。

我们对造成这种情况的因素了解得如何。
有多少数据可用。
预测是否能影响我们试图预测的事物。

X是外生变量，它可以是我们感兴趣的任何变量。

它可以是随时间变化的度量，例如通货膨胀率或其他指数的价格。或分隔一周中不同日期的分类变量。对于特殊的节日，它也可以是布尔值。最后，它可以代表多种不同外部因素的组合。

这个想法是，只要我们有可用的数据，它就可以是任何其他可以影响价格的变量。

这些外部因素在我们的回归分析中称为外生变量。

ARIMA

差分整合自回归移动平均模型（ARIMA）(p,d,q)是自回归（AR）、移动平均（MA）和自回归移动平均（ARMA）模型的扩展版本。ARIMA模型是应用于时间序列问题的模型。ARIMA将三种类型的建模过程结合到一个建模框架中。

自适应网页宽度的 Bilibili 视频

视频

时间序列分析模型 ARIMA-ARCH GARCH模型分析股票价格数据

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

自适应网页宽度的 Bilibili 视频

视频

在Python和R语言中建立EWMA，ARIMA模型预测时间序列

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

I：差分是用d表示的。它告诉我们在连续的观察样本中，被差分的序列对于原始序列的变化数量。
AR：自回归用p表示，它告诉我们为适应平稳序列的AR过程所需的滞后期数。ACF和PACF帮助我们确定AR过程的最佳参数集。
MA：移动平均阶数用q表示。它告诉我们要回归的序列中的误差项的数量，以便将差分的AR过程残差减少为白噪声。

关于ARIMAX

ARIMAX或回归ARIMA是ARIMA模型的一个扩展。在预测中，这种方法也涉及自变量。ARIMAX模型表示输出时间序列由以下部分组成：自回归（AR）部分，移动平均（MA）部分，差分整合（I）部分，以及属于外生输入（X）的部分。外生部分（X）反映了将外生输入的现值和过去值包括到ARIMAX模型中。

多元回归模型公式：

其中Y是xi预测变量的因变量，ε通常被认为是一个不相关的误差项（即是白噪声）。我们考虑了诸如Durbin-Watson检验等检验方法来评估ε是否有显著的相关性。我们将在方程中用nt代替ε。误差序列被假定为遵循ARIMA模型。例如，如果 nt 遵循一个 ARIMA（1,1,1）模型，我们可以写成

其中εt是一个白噪声序列。ARIMAX模型有两个误差项，一个是回归模型的误差，我们用jt表示，另一个是ARIMA模型的误差，我们用εt表示。只有ARIMA模型的误差被认为是白噪声。

实例探究

我们将使用经济序列数据。

数据是一个五个季度的经济序列，包含以下数字变量：季度失业率、国民生产总值、消费、政府投资和私人投资。有161个观测点。

季节性成分已经从数据中去除。集中在失业率（Ut）、国民生产总值（Gt）和消费（Ct）上，首先对每个序列进行记录，然后去掉线性趋势，对数据拟合一个向量ARMA模型。也就是说，对xt=(x1t,x2t,x3t)t拟合一个向量ARMA模型，例如，x1t=log(Ut)-β0^-β1^t，其中β0^和β1^是log(Ut)对时间t的回归的最小二乘估计。对残差运行一套完整的诊断方法。

数据探索

grid.arrange(p1,p2,p3,ncol=2)

最受欢迎的见解

1.在python中使用lstm和pytorch进行时间序列预测

2.python中利用长短期记忆模型lstm进行时间序列预测分析

3.Python用RNN循环神经网络：LSTM长期记忆、GRU门循环单元、回归和ARIMA对COVID-19新冠疫情新增人数时间序列

4.Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性

5.r语言copulas和金融时间序列案例

6.R 语言用RNN循环神经网络、LSTM长短期记忆网络实现时间序列长期利率预测

7.Matlab创建向量自回归（VAR）模型分析消费者价格指数 (CPI) 和失业率时间序列

8.r语言k-shape时间序列聚类方法对股票价格时间序列聚类

9.R语言结合新冠疫情COVID-19股票价格预测：ARIMA，KNN和神经网络时间序列分析

从图中可以看出，国民生产总值和消费可以作为回归使用。我们可以用时间、国民生产总值和消费来预测失业率。

ARIMAX模型拟合

R语言ARIMA集成模型预测时间序列分析

阅读文章 ➜

summary(varma)

随时关注您喜欢的主题

plot(df,aes(t,res))+line(col=colpla\[2\]) 
acf\_pacf(res\_= acf(x, plot= F)
                        , label= "ACF")
plot(df, aes(x=res)) + 
  histogram(aes(y=..density..)