Un modèle de prévision de prix de l'électricité amélioré et explicable via une approche de compensation des erreurs basée sur SHAP
Étude sur l’amélioration et l’explicabilité d’un modèle de prévision des prix de l’électricité basé sur SHAP
Contexte et motivation de la recherche
Les modèles de prévision des prix de l’électricité dans les marchés électriques sont devenus des sujets de recherche majeurs ces dernières années, notamment en raison de l’impact financier des fluctuations de prix sur les acteurs du marché. En particulier, sur les marchés de l’énergie européens, la récente hausse spectaculaire des prix des combustibles, liée à la crise énergétique et aux tensions géopolitiques, a significativement accru la volatilité des prix de l’électricité. Même une erreur de prévision de seulement 1 % peut avoir des conséquences financières importantes pour des entreprises de production, des entités fournissant des charges ou des sociétés de commerce. Par exemple, pour une entreprise avec une consommation de 1 GW, une amélioration de 1 % de la précision des prévisions peut entraîner des économies annuelles d’environ 12 millions de dollars. Par conséquent, améliorer la précision des modèles de prévision des prix de l’électricité (EPF, “Electricity Price Forecasting”) est essentiel pour les participants au marché.
Bien que les modèles EPF basés sur l’apprentissage automatique (ML, “Machine Learning”) et l’apprentissage profond (DL, “Deep Learning”) aient apporté des avancées en matière de précision, ces méthodes manquent souvent de transparence. Le caractère opaque de ces modèles limite ainsi la confiance des utilisateurs, notamment en cas de fluctuations de prix anormales. Ces dernières années, les techniques d’intelligence artificielle explicable (XAI, “Explainable AI”) ont été introduites pour adresser ce problème, mais la plupart des travaux limitent l’utilisation des approches XAI à une simple interprétation des comportements ou résultats des modèles. Cette étude comble cette lacune en proposant une méthode novatrice, basée sur les valeurs SHAP (Shapley Additive Explanations), qui non seulement améliore les performances des modèles EPF, mais aide également les utilisateurs non experts en IA à identifier et interpréter les prédictions anormales grâce à des explications simplifiées.
Origine et auteurs de la recherche
Cet article, intitulé “An Improved and Explainable Electricity Price Forecasting Model via SHAP-Based Error Compensation Approach”, a été publié dans le numéro de janvier 2025 de IEEE Transactions on Artificial Intelligence (Vol. 6, No. 1). Il s’agit d’une collaboration entre plusieurs chercheurs provenant d’établissements académiques et de recherche prestigieux, notamment l’Université Pandit Deendayal of Energy, l’Université Technologique de Tallinn, le Sami Shamoon College of Engineering, et le Technion Institute of Technology. L’auteur correspondant de cette étude est Leena Heistrene.
Processus de recherche et méthodologie
Cet article propose une nouvelle approche en deux phases utilisant les valeurs SHAP pour compenser les erreurs et améliorer la performance des modèles EPF. La première phase cherche à améliorer les prévisions du modèle de base (Base Predictor Model), tandis que la deuxième phase se concentre sur des explications conviviales permettant de distinguer les prédictions normales des prédictions anormales. Voici les détails des étapes du processus de recherche :
Première phase : Quantification des erreurs et compensation
Choix et entraînement du modèle de base
Les modèles de base, utilisant différentes techniques d’apprentissage (comme LSTM, CNN ou XGBoost), sont conçus pour prévoir les prix de l’électricité à l’échelle de la journée suivante. Les historiques des données de deux marchés électriques (le marché italien et le marché ERCOT) ont été utilisés comme ensembles d’entraînement pour capturer des caractéristiques, telles que les prix historiques, les prix par zones physiques, les prix des marchés voisins, les prix des services auxiliaires ou encore la charge système.Génération des interprétations SHAP
En appliquant SHAP, les résultats des prédictions du modèle de base sont analysés, permettant de quantifier l’influence de chaque caractéristique sur les prédictions. Les contributions locales des caractéristiques, exprimées sous forme de valeurs SHAP (φ), illustrent leur impact spécifique sur les résultats.Conception du modèle correcteur (Corrector Model)
Les valeurs SHAP sont utilisées pour expliciter les modèles d’erreurs des prédictions du modèle de base. Le modèle correcteur apprend à partir de ces valeurs SHAP (φsum et φxtrm) pour estimer les erreurs de prédiction et fournir une compensation d’erreur estimée (εcomp). Ce correcteur ajuste alors la prédiction initiale du modèle de base, générant ainsi un résultat final plus précis.
Deuxième phase : Détection des prédictions irrégulières
Grâce aux SHAP générés par le modèle correcteur, une méthode a été développée pour identifier les “prédictions normales” (Regular Predictions) et les “prédictions irrégulières” (Extreme Predictions) :
Définition des prédictions irrégulières
Les auteurs utilisent une formulation basée sur le score-z (α) pour évaluer l’écart de prédiction par rapport à la distribution des données d’entraînement. Si |α| > 3, la prédiction est considérée comme irrégulière.Analyse des distributions des valeurs SHAP
En comparant les interprétations SHAP pour les prédictions normales et irrégulières, il a été constaté que les prédictions irrégulières avaient des valeurs SHAP significativement plus élevées. Cela permet de détecter rapidement les anomalies. Cette capacité de distinction fournit aux utilisateurs des outils intuitifs pour évaluer la fiabilité des modèles.
Ensembles de données et conception expérimentale
Cette recherche a été validée dans deux marchés électriques distincts présentant des caractéristiques différentes (volatilité des prix, structure du marché et ensembles de fonctionnalités en entrée) :
Marché italien
Les données du marché italien (prix Pun) ont été utilisées comme variable cible. L’ensemble de données d’entraînement couvre les années 2015-2017, tandis que l’année 2018 a servi à entraîner le modèle correcteur. Les performances ont été validées à l’aide des données de 2019 à 2021.Marché ERCOT
Les prix de la zone Houston du réseau ERCOT ont été utilisés comme variable analysée, y compris lors de conditions de marché extrêmes, comme les fluctuations de prix observées en août 2019 et en février 2021.
Différentes architectures de modèles (CNN, LSTM, XGBoost) ont été testées pour évaluer la généralisation de l’approche proposée.
Résultats expérimentaux et analyses
Amélioration des performances et fiabilité accrue
En comparant les modèles de base avec et sans le correcteur, il a été démontré que les métriques RMSE, MAE et MAPE s’améliorent significativement dans différents scénarios annuels et de marché. Par exemple, sur les données italiennes de 2021, le MAPE baisse de 5,73 % à 3,23 % dans des contextes de distribution de données cohérente, ou de 7,01 % à 5,74 % en présence de dérive des données.
Interprétabilité des prédictions anormales
Dans les périodes de hausse anormale des prix telles que la flambée des prix du carburant en Italie en 2021 ou les pics aux États-Unis (zone ERCOT) en août 2019, les SHAP du modèle correcteur ont permis d’identifier facilement les prédictions irrégulières. Les valeurs SHAP extrêmes (par exemple φxtrm) se démarquent fortement des prédictions normales, offrant une méthode intuitive pour détecter ces anomalies.
Explications conviviales et simplifiées
Contrairement au modèle de base, le modèle correcteur utilise uniquement trois caractéristiques, offrant ainsi des interprétations SHAP simplifiées qui répondent aux besoins des utilisateurs non techniques. Par exemple, les producteurs ou plateformes de trading peuvent utiliser ces valeurs SHAP pour anticiper efficacement les prédictions à haut risque et adapter leurs stratégies d’enchères.
Contributions et implications
Avancée scientifique
Ce travail explore, pour la première fois, l’utilisation des techniques XAI pour améliorer les performances des modèles de régression en séries temporelles dans le cadre des prévisions EPF. Cela ouvre de nouvelles opportunités pour les applications XAI.Application pratique
La généralisation et la robustesse du modèle, indépendamment des architectures ou des données utilisées, positionnent cette méthode comme un outil pour surveiller les anomalies, évaluer les risques et optimiser les stratégies de marché.Innovation méthodologique
La compensation d’erreur basée sur SHAP et le cadre d’interprétation appliqué à la détection des prédictions irrégulières établissent un précédent pour des recherches futures.
Perspectives futures
Les auteurs envisagent d’étendre cette méthode à d’autres tâches de prévision dans les domaines de l’énergie et de l’électricité, tels que la prévision de la charge électrique ou de la production d’énergie renouvelable, en intégrant des algorithmes en ligne auto-adaptatifs pour une meilleure adaptabilité dynamique. De plus, l’outil de détection des prédictions irrégulières proposé pourrait également être utilisé pour optimiser les systèmes automatisés d’enchères, améliorant ainsi l’efficience des décisions de marché.