R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测

电力负荷预测是电网规划的基础,其水平的高低将直接影响电网规划质量的优劣。

由Kaizong Ye,Liao Bao撰写

为了准确预测电力负荷,有必要进行建模。本文在R语言中使用分位数回归、GAM样条曲线、指数平滑和SARIMA模型对电力负荷时间序列预测并比较。

用电量

本文使用的数据是1996年至2010年之间的每周用电量数据,序列

用电量变量及其影响因素:
•星期几(离散)
•时间小时(离散或非参数)
•年(连续)

交互影响:
•日期和时间

•年份和时间

活动
•公共假期

温度对模型的影响:高温、低温和极冷温度
 

模型:
分段线性函数,
GAM模型中的样条曲线


热门课程

R语言数据分析挖掘必知必会

面对扑面而来的数据浪潮,包含Google、Facebook等国际企业,都已采用R语言进行数据分析

探索课程

数据探索

时间对电力负荷的影响

温度对电力负荷的影响,(Tt,Yt)


负荷序列(Yt)的自相关的影响,

OLS与 中位数回归
 

中位数回归通过单调变换是稳定的。

现在,中位数回归将始终有两个观察结果。

分位数回归和指数平滑

简单的指数平滑:

经典地,我们寻找使预测误差最小的α,即

我们可以考虑分位数误差

双指数平滑

我们考虑分位数误差

其中

预测

数理统计建立在对概率模型参数的估计和假设检验的基础上。
统计中的预测:当模型拟合观测值时,它会提供良好的预测。
相反,我们使用没有出现过的场景,它使我们能够评估未来的主要趋势,而不是预测极端事件的能力。

预测变量的构造
 

回归


SARIMA模型

s = 52


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!