本文从实践角度讨论了季节性单位根。

由Kaizong Ye，Coin Ge撰写

我们考虑一些时间序列 X_t，例如道路上的交通流量，

可下载资源

 > plot(T,X,type="l")
> reg=lm(X~T)
> abline(reg,col="red")

时间序列有一些比较常见的特征，包括：

1、趋势性（Trend）：即在一定时间内的单调性，一般来说斜率是固定的。

2、季节性（Seasonal）：固定长度的变化，就像春夏秋冬的温度变化一样。

3、周期性（Cyclic）：与季节性很像，但是它的波动的时间频率不是固定的。

以上都是基本概念，重点是区分季节性和周期性。事物都是盛极必衰，但是跌落谷底之后又反弹，这种往复的运动，被称之为周期性。但是像日出日落、春夏秋冬、周六日放假这种节律如果能够固定下来，那么这种固定的往复变化就被成为季节性。

如果存在趋势，我们应该将其删除，然后处理残差 $Y_t=X_t-[a+bt]$

> Y=residuals(reg)
> acf(Y,lag=36,lwd=3)

我们可以看到这里有一些季节性。第一个策略可能是假设存在季节性单位根，因此我们考虑 $Z_t=(1-L^{12}$ Y_t)，我们尝试找到ARMA模型。考虑时间序列的自相关函数，

自适应网页宽度的 Bilibili 视频

视频

在Python和R语言中建立EWMA，ARIMA模型预测时间序列

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

> Z=diff(Y,12)
> acf(Z,lag=36,lwd=3)

或偏自相关函数

第一个图可能建议MA（1），而第二个图可能建议AR（1）时间序列。我们都尝试。

 arima
Coefficients:
          ma1  intercept
      -0.2367  -583.7761
s.e.   0.0916   254.8805

sigma^2 estimated as 8071255:  log likelihood = -684.1,  aic = 1374.2

最受欢迎的见解

1.用于NLP的Python：使用Keras的多标签文本LSTM神经网络分类

2.Python中利用长短期记忆模型LSTM进行时间序列预测分析 – 预测电力消耗数据

3.python在Keras中使用LSTM解决序列问题

4.Python中用PyTorch机器学习分类预测银行客户流失模型

5.R语言多元Copula GARCH 模型时间序列预测

6.在r语言中使用GAM（广义相加模型）进行电力负荷时间序列分析

7.R语言中ARMA，ARIMA（Box-Jenkins），SARIMA和ARIMAX模型用于预测时间序列数

8.R语言估计时变VAR模型时间序列的实证研究分析案例

9.用广义加性模型GAM进行时间序列分析

可以认为是白噪声（如果您不确定，请尝试 Box-Pierce或Ljung-Box 测试）。

 arima
Coefficients:
          ar1  intercept
      -0.3214  -583.0943
s.e.   0.1112   248.8735

sigma^2 estimated as 7842043:  log likelihood = -683.07,  aic = 1372.15

R语言使用ARIMA模型预测股票收益

阅读文章 ➜

也可以视为白噪声。到目前为止，我们有

对于一些白噪声 $(\varepsilon_t$ )。这表明以下的SARIMA结构 $(Y_t$ )，

 arima
Coefficients:
          ar1
      -0.2715
s.e.   0.1130

sigma^2 estimated as 8412999:  log likelihood = -685.62,  aic = 1375.25

随时关注您喜欢的主题

现在，如果我们认为我们没有季节性单位根，而在AR结构中只是一个大的自回归系数。让我们尝试类似

自然而然的猜测是该系数应该（可能）接近于1。让我们尝试一下

 arima
Coefficients:
          ar1    sar1  intercept
      -0.1629  0.9741  -684.9455
s.e.   0.1170  0.0115  3064.4040

sigma^2 estimated as 8406080:  log likelihood = -816.11,  aic = 1640.21

这与我们先前（以某种方式）获得的结果具有可比性，因此我们可以假设该模型是一个有趣的模型。我们将进一步讨论：第一个系数可能是不重要的。

这两个模型有什么区别？

从（非常）长期的角度来看，模型是完全不同的：一个模型是平稳的，因此预测将趋向于平均值，而另一个模型则是按季节的，因此置信区间将增加。

我们得到

> pre(model2,600,b=60000)

对于平稳的

> prev(model3,600,b=60000)

但是，使用这些模型进行的预测仅适用于短期范围。在这种情况下，这里的预测几乎相同，

> pre(model2,36,b=60000)

> pre(model3,36,b=60000)

现在，如果我们回到第二个模型，自回归系数可能被认为是不重要的。如果我们将其删除怎么样？

 Call:
seasonal = list(order = c(1, 0, 0)
Coefficients:
        sar1  intercept
      0.9662  -696.5661
s.e.  0.0134  3182.3017

sigma^2 estimated as 8918630:  log likelihood = -817.03,  aic = 1640.07

如果我们看一下（短期）预测，我们得到