在本文中我们对在Google趋势上的关键字“ Chocolate ”序列进行预测。

由Kaizong Ye，Weilong Zhang撰写

序列如下

可下载资源


 
> report = read.csv(url,skip=6,header=FALSE,nrows=636)
 
> plot(X,type="l")

指数平滑法对于预测来说是非常有帮助的，而且它对时间序列上面连续的值之间相关性没有要求。但是，如果你想使用指数平滑法计算出预测区间，那么预测误差必须是不相关的，而且必须是服从零均值、方差不变的正态分布。

即使指数平滑法对时间序列连续数值之间相关性没有要求，在某种情况下，我们可以通过考虑数据之间的相关性来创建更好的预测模型。自回归移动平均模型（ ARIMA）包含一个确定（explicit）的统计模型用于处理时间序列的不规则部分，它也允许不规则部分可以自相关。

每月建立一个ARIMA模型比每周建立一个容易。因此，我们将每月数据序列化，将预测与观察结果进行比较。


 
> Y = tapply(base$X,as.factor(base$AM),mean)
> Z = ts(as.numeric(Y[1:(146-24)]), start=c(2004,1),frequency=12)

自适应网页宽度的 Bilibili 视频

视频

在Python和R语言中建立EWMA，ARIMA模型预测时间序列

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

在这里转换序列的对数序列。我们观察到趋势的变化（开始时是线性的，此后相对稳定）。


 
> X=log(as.numeric(Z))
 
> trend=lm(X~T+I((T-80)*(T>80)),data=db)

这是我们要建模的序列残差，

residuals(trend)

要对该序列进行建模，我们可以先查看其自相关序列

最受欢迎的见解

1.在python中使用lstm和pytorch进行时间序列预测

2.python中利用长短期记忆模型lstm进行时间序列预测分析

3.Python用RNN循环神经网络：LSTM长期记忆、GRU门循环单元、回归和ARIMA对COVID-19新冠疫情新增人数时间序列

4.Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性

5.r语言copulas和金融时间序列案例

6.R 语言用RNN循环神经网络、LSTM长短期记忆网络实现时间序列长期利率预测

7.Matlab创建向量自回归（VAR）模型分析消费者价格指数 (CPI) 和失业率时间序列

8.r语言k-shape时间序列聚类方法对股票价格时间序列聚类

9.R语言结合新冠疫情COVID-19股票价格预测：ARIMA，KNN和神经网络时间序列分析


>  plot(acf(Y,lag=36),lwd=5)

R语言使用ARIMAX预测失业率经济时间序列数据|附代码数据

阅读文章 ➜

和偏自相关序列

> plot(pacf(Y,lag=36),lwd=5)

该序列是稳定的，但是有很强的周期性成分。

我们可以尝试AR模型或ARMA（带有AR的残差不是白噪声）。

arima(Y,order=c(12,0,12),
+ seasonal = list(order = c(0, 0, 0 , period = 12 )

这里的残差序列是白噪声

随时关注您喜欢的主题

然后，我们可以使用此模型对初始序列进行预测

 
 
> Y2=tapply(base$X,as.factor(base$AM),mean)
 
> lines(futur,obs_reel,col="blue")

我们的模型为红色，真实的观察结果为蓝色。然后，我们可以根据这24个观测值计算。

误差平方和。

> sum( (obs_reel-Xp)^2 )
[1] 190.9722

但是我们可以尝试其他模型，例如通过更改趋势或通过更改ARIMA模型（通过季节性单位根）来尝试

 
> E=residuals(model3)
> model3
 
Coefficients:
         ma1     ma2     sma1
      0.2246  0.3034  -0.9999
s.e.  0.0902  0.0925   0.3503
 
sigma^2 estimated as 0.002842:  log likelihood = 152.37,  aic = -296.75

我们检查残差序列确实是白噪声

 
	Box-Pierce test
 
data:  E
X-squared = 6.326, df = 12, p-value = 0.8988

然后，我们可以对原始系列进行预测，

 
> Yp=predict(model3,n.ahead=24) +
+   predict(trend,newdata=data.frame(T=futur) 
 
> Y2=tapply( X,as.factor( AM),mean)

误差平方和低一些

> sum( (obs_reel-Xp)^2 )
[1] 173.8138

也就是说，在过去的两年中，第二个模型比以前的模型要好，是对未来几年进行预测的好方法。

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

R语言用ARIMA模型预测巧克力的兴趣趋势时间序列

在本文中我们对在Google趋势上的关键字“ Chocolate ”序列进行预测。

R语言使用ARIMAX预测失业率经济时间序列数据|附代码数据

该序列是稳定的，但是有很强的周期性成分。

随时关注您喜欢的主题

相关文章

R语言用ARIMA模型预测巧克力的兴趣趋势时间序列

在本文中我们对在Google趋势上的关键字“ Chocolate ”序列进行预测。

R语言使用ARIMAX预测失业率经济时间序列数据|附代码数据

该序列是稳定的，但是有很强的周期性成分。

随时关注您喜欢的主题

相关文章

关注我们，永远不要错过任何见解。