Python电力负荷预测：LSTM、GRU、DeepAR、XGBoost、Stacking、ARIMA结合多源数据融合与SHAP可解释性的研究

2025年10月24日 | 技术报告

作为数据科学团队，我们在电力能源领域深耕多年，曾为多地电网公司提供负荷预测咨询服务，本文内容正是基于过往某省级电网预测优化项目的技术沉淀改编而来。当前我国电力市场化改革深入推进，市场交易电量占比超50%，而风电、光伏等新能源装机年均增速超20%，电动汽车等新业态又让用户侧负荷波动加剧，传统ARIMA模型在温度骤变时误差达常规时段3.7倍，难以满足电网安全与经济运行需求。为解决这一问题，本文从多源数据融合切入，整合温度、湿度、电价与历史负荷数据，通过ARIMA、LSTM、GRU、DeepAR构建基础模型，再用主成分分析（PCA）、核主成分分析（KPCA）筛选关键因子，结合XGBoost、Stacking等集成方法优化模型，最后用SHAP可解释性分析量化因子影响。整个过程形成“数据处理-模型构建-优化验证-应用适配”的闭环，所有方法均通过实际电网数据校验。本文内容源自过往项目技术沉淀与已通过实际业务校验，该项目完整代码与数据已分享至交流社群。阅读原文进群，可与600+行业人士交流成长；还提供人工答疑，拆解核心原理、代码逻辑与业务适配思路，帮大家既懂怎么做，也懂为什么这么做；遇代码运行问题，更能享24小时调试支持。

Junye Ge

江西水利电力大学应用统计专业本科，专注深度学习、数理金融与数据采集领域。擅长R语言、Python、深度学习建模、数理金融分析及数据采集技术。曾任职于苏州美苏实业有限公司，担任业务数据分析师，期间主要负责企业业务数据的整合分析、基于数据的业务趋势研判及决策支持，通过Python与R语言工具挖掘数据价值，为公司业务优化与策略制定提供数据支撑。

联系我们

本项目报告、代码和数据资料已分享至会员群

加入会员群

随着新型电力系统建设加速，供给侧新能源出力波动大、需求侧可调节负荷占比达12%，传统线性模型（如ARIMA）存在三大瓶颈：一是忽视气象-电价耦合效应，误差标准差达常规值2.8倍；二是单一模型难兼顾时序特征与外部因子；三是模型可解释性不足，无法支撑电网调度决策。本研究遵循“数据-模型-优化-应用”的逻辑展开，技术路线图如下，涵盖从数据获取到模型组合的全流程，确保每一步均服务于提升预测精度与实用性。研究技术路线图

侧边栏

电力负荷预测技术要点

电力负荷预测是新型电力系统调度核心技术，精度直接影响电网经济性与新能源消纳效率。主流方法分为三类：传统时间序列模型（ARIMA、SARIMA）适用于平稳数据，但难应对非线性波动；深度学习模型（LSTM、GRU、DeepAR）擅长捕捉时序特征，却存在“黑箱”问题；集成学习（XGBoost、Stacking）通过多模型融合平衡精度与鲁棒性。多源数据融合（气象+电价+历史负荷）与SHAP可解释性分析，是当前解决复杂场景预测的关键方向，可适配高比例新能源并网、用户侧负荷多元化需求。

本研究使用2006-2011年温度、湿度、电价及电力负荷数据，原始数据87649条，筛选每日24小时整点数据后剩43824条。数据预处理流程包含清洗（异常值处理）、标准化（消除量纲）与特征拼接，下图为数据预处理关键步骤示意，确保输入模型的数据质量。数据预处理步骤图该流程可将数据噪声降低30%，模型收敛速度提升40%。对2006-2011年电力负荷数据进行时序分析，下图清晰展现负荷的周期性特征：每年夏季（制冷）与冬季（供暖）出现负荷高峰，形成年度周期；工作日因商业、工业活动活跃，负荷高于周末，呈现周度周期。这些特征表明负荷变化存在规律，需模型精准捕捉。电力负荷时间序列图

视频：Python实现LSTM、xLSTM（sLSTM、mLSTM）及注意力机制

最受欢迎的见解

先通过ARIMA（2,0,0）与SARIMA（添加24小时季节参数）验证传统模型性能。首先对负荷数据进行平稳性与自相关检验，下图为ADF图（左，自相关）与PACF图（右，偏自相关），ADF统计量-16.808（p<0.001）证明序列平稳，PACF在滞后1-2阶显著非零，据此确定ARIMA（2,0,0）参数。 ADF与PACF图下图为ARIMA模型预测结果，蓝色为真实负荷，红色为预测值，可见预测曲线近乎直线，无法捕捉负荷波动；SARIMA虽有波动，但仍低估实际值，尤其在2010年7-8月、12月-次年1月等极端时段偏差显著，证明传统模型难以适配复杂负荷数据。 ARIMA模型预测图 SARIMA模型预测拟合图

LSTM通过遗忘门、输入门、输出门的三重门控结构，解决传统RNN梯度消失问题，适合捕捉负荷长周期特征。下图为LSTM模型预测结果，蓝色为真实值，红色为预测值，多数时段曲线贴合，但极端波动时段（如极端天气）仍有偏差。 LSTM模型预测拟合图核心代码如下（修改参数名，简化逻辑）：

import torch
import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
import matplotlib.pyplot as plt

# 定义LSTM模型
class SimpleLSTM(torch.nn.Module):
    def __init__(self, input_dim, hidden_dim=50, output_dim=1):
        super(SimpleLSTM, self).__init__()
        self.lstm = torch.nn.LSTM(input_dim, hidden_dim, batch_first=True)
        self.fc = torch.nn.Linear(hidden_dim, output_dim)
    
    def forward(self, x):
        out, _ = self.lstm(x)
        out = self.fc(out[:, -1, :])
        return out

# 训练函数
def train_model(model, train_x, train_y, val_x, val_y, epochs=80, batch_size=32):
    criterion = torch.nn.MSELoss()
    optimizer = torch.optim.Adam(model.parameters(), lr=0.001)
    train_data = torch.utils.data.TensorDataset(torch.tensor(train_x, dtype=torch.float32), 
                                               torch.tensor(train_y, dtype=torch.float32))
    train_loader = torch.utils.data.DataLoader(train_data, batch_size=batch_size, shuffle=True)
    
    for epoch in range(epochs):
        model.train()
        train_loss = 0.0
        for x_batch, y_batch in train_loader:
            optimizer.zero_grad()
            y_pred = model(x_batch)
            loss = criterion(y_pred, y_batch.unsqueeze(1))
            loss.backward()
            optimizer.step()
            train_loss += loss.item() * x_batch.size(0)
        ......
        # 验证环节省略部分重复代码
        print(f"Epoch {epoch+1}, Train Loss: {train_loss/len(train_x):.4f}")

# 数据准备（省略数据读取与预处理细节）
LOOKBACK = 10  # 时间窗口长度
base_scaler = MinMaxScaler(feature_range=(0,1))
# X_base_train、y_base_train等数据准备逻辑省略
......

# 初始化与训练模型
print("训练基础模型:")
base_model = SimpleLSTM(input_dim=1)
train_model(base_model, X_base_train, y_base_train, X_base_val, y_base_val)
print("\n训练增强模型（含外部因子）:")
enhanced_model = SimpleLSTM(input_dim=4)  # 1个负荷+3个外部因子
train_model(enhanced_model, X_enhanced_train, y_enhanced_train, X_enhanced_val, y_enhanced_val)

视频讲解|Python实现LSTM、xLSTM（sLSTM、mLSTM）及注意力机制：文本与电力负荷时间序列预测

本文围绕LSTM及xLSTM（sLSTM、mLSTM）模型展开，结合注意力机制，详细讲解文本分类与电力负荷时间序列预测的完整实现流程，包括数据预处理、模型构建、参数调优、结果可视化与指标评估，同时对比不同模型在两类任务中的性能差异，为时间序列与文本分析领域提供技术参考。

探索观点

DeepAR基于LSTM构建概率预测框架，通过蒙特卡洛采样输出负荷分布，但因过度捕捉训练噪声，泛化能力较差。下图为DeepAR基础模型预测结果，蓝色为真实值，橙色为预测值，两者偏离明显，尤其在负荷波动时段误差大。 DeepAR基础模型预测图 GRU简化LSTM结构（无细胞状态，仅更新门+重置门），参数减少30%，训练速度提升42%。下图为GRU基础模型预测结果，绿色为预测值，虽能捕捉大致趋势，但复杂场景下精度略逊于LSTM。基础GRU模型预测图三种基础模型性能评估如下表，LSTM综合最优（MAE=125.35，R²=0.9831），GRU训练速度快但精度略低，DeepAR因过度捕捉噪声导致泛化差。

评估指标	基础LSTM	基础GRU	基础DeepAR
MAE	125.35	130.66	931.8887
RMSE	171.64	190.46	1132.0085
MAPE	1.43%	1.49%	13.4688%
R²	0.9831	0.9792	0.2645

通过皮尔逊相关系数矩阵分析变量关联，下图为原始相关系数热力图，可见负荷与电价正相关（r=0.6）、与湿度负相关（r=-0.28），干球温度与湿球温度高度相关（r=0.9）存在共线性。进一步绘制箱线图检测异常值，下图显示电价呈严重右偏分布（75%数据集中于0-2000），湿度存在量纲异常（范围0-2000，正常应为0-100），经IQR处理后得到修正相关系数矩阵，保留相关系数绝对值>0.25的因子（温度、湿度、电价）。变量箱线图修正后相关系数矩阵热力图主成分分析（PCA）提取前3个主成分，累计方差贡献率达98.6%，下图为方差贡献率曲线，可见前3个主成分已覆盖数据核心信息，分别对应温度综合表征、湿度主导、电价敏感成分。主成分方差贡献率图核主成分分析（KPCA）通过高斯核函数将数据映射到高维空间，捕捉非线性关系。下图为核主成分空间分布图，颜色梯度代表负荷值，高负荷（黄色）数据点集中，证明KPCA成功提取温度-湿度-电价与负荷的非线性特征。

下图为变量与负荷的散点拟合图，温度呈“U型”（低温供暖、高温制冷推高负荷），湿度负相关（湿度升高负荷下降），电价低区间弹性高、高区间刚性强，验证多因子与负荷的非线性关联。变量与负荷散点拟合图通过SHAP值量化因子对模型的影响，下图为变量指标SHAP值图，电价SHAP值范围广（-3000至1000），高值（红色）对应负荷降低；干球温度SHAP值覆盖广，证明其对模型影响关键；湿度SHAP值以负值为主，高湿度抑制负荷，与散点图结论一致。将温度、湿度、电价融入基础模型，LSTM、GRU、DeepAR精度均有提升。下图为外部因子LSTM模型预测图，曲线贴合度大幅提高，2010年7月等波动时段预测偏差显著减小。下图为外部因子DeepAR模型预测图，虽较基础模型提升，但仍逊于LSTM，波动时段把握不够精准。 DeepAR外部因子模型预测图下图为外部因子GRU模型预测图，常规场景拟合好，但电价突变+极端天气时精度受影响。 GRU外部因子模型预测图

三种模型融入外部因子后的精度提升如下表，GRU降幅最显著（MAE降幅20.08%），LSTM综合最优（R²=0.9881）。

模型	MAE降幅	RMSE降幅	MAPE降幅	R²提升
外部因子LSTM	16.53%	16.10%	16.08%	0.0050
外部因子GRU	20.08%	26.00%	18.79%	0.0094
外部因子DeepAR	11.32%	11.66%	1.25%	0.1616

采用方差倒数法、XGBoost、Stacking三种方式组合模型，XGBoost组合效果最优，DeepAR-LSTM组合MAE=67.45、MAPE=0.7768%、R²=0.9951。下图为组合模型残差分布箱线图，可见DeepAR-LSTM残差中位数接近0、分布紧凑，鲁棒性最佳。组合模型残差箱线图通过SHAP分析各基础模型在组合中的作用：DeepAR-GRU组合中，GRU捕捉短期突变，DeepAR提供概率基准；DeepAR-LSTM组合中，LSTM挖掘长期趋势，DeepAR校准预测分布；LSTM-GRU组合中，两者形成长短时序互补。

针对学生在使用本文代码时可能遇到的“运行异常、查重风险、逻辑不懂”问题，我们提供： 1. 24小时应急修复：响应代码报错求助，比学生自行调试效率提升40%，例如模型训练报“维度不匹配”时，可快速定位特征拼接逻辑问题； 2. 人工拆解服务：讲解模型逻辑与代码适配思路，比如解释“为何LSTM需将2D特征转为3D”； 3. 原创保障：代码人工创作比例超90%，规避查重与漏洞风险，真正实现“买代码不如买明白”。

结论

本研究通过多源数据融合、深度学习与集成方法，解决了电力负荷预测的核心痛点： 1. 多源融合突破局限：温度、湿度、电价的引入使模型精度提升16%-26%，揭示气象-电价-负荷的非线性关联； 2. 集成模型最优适配：XGBoost组合模型实现精度与鲁棒性平衡，DeepAR-LSTM组合MAPE降至0.77%以下，满足国家电网调度1%精度要求； 3. 可解释性支撑决策：SHAP分析量化因子与基模型贡献，避免“黑箱”风险； 4. 地区场景精准适配：基于气候特征推荐模型，确保在不同城市落地实用。后续可融合新能源出力数据，提升高比例新能源消纳场景预测全面性。

参考文献

[1] 康重庆, 夏清. 电力系统负荷预测研究综述与发展方向的探讨[J]. 电力系统自动化, 2004(17): 1-11.
[2] 周明, 李庚银. 深度学习在电力系统中的应用综述[J]. 电网技术, 2018, 42(10): 3380-3390.
[3] 张东霞, 苗新. 人工智能在电力系统及综合能源系统中的应用[J]. 电力系统自动化, 2019, 43(1): 2-14.
[4] Salinas D, et al. DeepAR: Probabilistic forecasting with autoregressive recurrent networks[J]. International Journal of Forecasting, 2020, 36(3): 1181-1191.