基于SHAP误差补偿方法的改进可解释电价预测模型

基于SHAP的电力价格预测模型改进研究及其可解释性分析

背景与研究动机

电力市场中的价格预测模型近年来成为研究热点,尤其是考虑到电力市场波动对利益相关方的财务影响。特别是,在欧洲能源市场中,受能源危机和地缘政治影响,最近几年燃料价格急剧上升,导致电力市场的价格波动性显著增加。即使是1%的预测误差,也可能对发电公司、负荷服务实体和交易公司产生巨大的财务后果。例如,对于用电量达到1GW的公司而言,仅1%的预测改进便可带来每年约1200万美元的节省。因此,提高电力价格预测(Electricity Price Forecasting,EPF)模型的精准度对市场参与者来说至关重要。

虽然基于机器学习(Machine Learning,ML)和深度学习(Deep Learning)技术的EPF模型在预测精度方面取得了一定成效,但这些方法缺乏透明性。模型的黑箱特性使得市场参与者难以信任预测结果,尤其是在价格异常波动的情况下。近年来,可解释人工智能(Explainable AI,XAI)技术被用作解决这一问题的工具。然而,大部分研究主要将XAI方法局限于解释模型的行为或输出,却未能充分探索其在提高模型性能方面的潜力。本文填补了这一研究空白,提出了一种基于SHAP(Shapley Additive Explanations)值的误差补偿方法,不仅能提高模型性能,还能够通过简化的解释帮助非AI专业用户识别异常预测。

论文来源及作者信息

这篇论文题为“An Improved and Explainable Electricity Price Forecasting Model via SHAP-Based Error Compensation Approach”,发表于2025年1月的《IEEE Transactions on Artificial Intelligence》(Vol. 6, No. 1)。该研究由多位作者合作完成,其中包括来自Pandit Deendayal Energy University、Tallinn University of Technology、Sami Shamoon College of Engineering,以及Technion Institute of Technology等学术和研究机构的学者。论文的通信作者为Leena Heistrene。

研究过程与方法论

本文提出了一种基于SHAP的两阶段误差补偿方法。第一个阶段旨在改善基础预测模型(Base Predictor Model)的预测性能,第二个阶段则着重于通过用户友好的解释,区分正常预测和异常预测。以下为研究的详细工作流程:

第一阶段:误差量化与补偿

  1. 基础预测模型的选择与训练
    基础预测模型使用各种机器学习技术(如LSTM、CNN或XGBoost)实现并预测次日用电价格。研究中分别使用了两种电力市场(意大利电力市场和ERCOT电力市场)的历史数据,通过模型对输入特征(如历史电价、物理区域价格、邻接市场价格、辅助服务价格或系统负载)进行充分训练。

  2. SHAP解释的生成
    使用SHAP分析基础预测模型的预测结果,从而量化每个特征对模型输出的影响力,生成SHAP值(φ)。这些解释反映了各特征在单次预测实例中的贡献,具有局部解释的优势。

  3. 设计纠正模型(Corrector Model)
    利用SHAP值推导基础模型的预测误差模式。纠正模型以SHAP特征(φsum与φxtrm)为输入,学习预测误差,并生成估计的预测误差补偿值(εcomp)。误差补偿值被添加至基础预测值,从而生成更精准的最终预测结果。

第二阶段:异常预测识别

通过纠正模型生成的SHAP值,作者提出了一种新的方法来识别“正常预测”(Regular Predictions)和“异常预测”(Extreme Predictions)。具体如下:

  1. 异常预测的定义
    作者定义了一个基于z-score的标准(α值),对于偏离训练数据分布范围的预测(|α| > 3),定义其为异常预测。

  2. SHAP值分布的分析
    对比正常预测与异常预测的SHAP解释发现,异常预测的SHAP值变化显著,因此可以基于这些变化快速识别异常预测。这一特性为用户提供了简单明了的工具帮助判断模型预测的可靠性。

数据集与实验设计

该研究验证了方法在两个具有不同特性(价格波动性、市场结构及输入特征集)的实际电力市场中的效果:

  1. 意大利电力市场
    使用了意大利电力市场的Pun价格作为目标变量。实验数据来自2015-2017年的训练数据集,基于2018年的预测结果训练纠正模型,使用2019至2021年的数据进行性能验证。

  2. ERCOT市场
    ERCOT的实验对象为休斯顿地区的电价,分析包括了极端市场条件下的价格波动,例如2019年8月和2021年2月的价格异常波动。

实验采用不同模型(CNN、LSTM、XGBoost)进行基准比较,以验证提出方法的泛化能力。

实验结果与分析

性能改进与可靠性提升

通过基础预测模型与补偿后模型的对比实验,发现在不同年份和市场场景下,RMSE、MAE及MAPE均有显著改善。例如,在意大利市场的2021年数据中,MAPE从5.73%降低至3.23%(数据分布一致情况下),或从7.01%降至5.74%(数据分布漂移情况下)。

异常预测的可解释性

在意大利市场的2021年燃料价格上涨期间,和ERCOT市场的价格峰值情况下(如2019年8月),利用纠正模型的SHAP解释,成功识别出异常预测。这些异常预测的SHAP值(例如φxtrm值)远高于正常预测,且预测的特征排名显著变化,提供了直观的异常识别方法。

高效的用户友好解释

与基础模型复杂的特征解释不同,纠正模型的特征只有三个,简化的SHAP解释满足了非技术用户的需求。例如,发电商或交易平台可以基于SHAP值快速识别高风险预测,从而优化竞价策略并降低经济风险。

研究贡献与意义

  1. 科学意义
    本研究首次探索了基于XAI技术用于时间序列回归问题的模型性能提升,尤其是针对EPF场景。这为XAI的应用领域拓展提供了新方向。

  2. 实用性
    方法的通用性、模型无关性及其在实际电力市场的有效性,使得该技术能够作为价格异常监测、风险评估和策略优化的工具。

  3. 创新性
    基于SHAP值的误差补偿方法,以及用于异常预测识别的解释框架,均开创先例,为后续研究提供了模板。

未来展望

此论文指出,该方法未来还可推广至能源与电力领域的其他预测任务,例如电力负荷预测或可再生能源发电量预测,并通过在线自适应算法提高模型的动态适应能力。此外,提出的异常预测识别工具还可以用于优化自动化竞价系统,助力提高市场决策效率。