Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

Each language version is independently generated for its own context, not a direct translation.

这篇论文提出了一种名为 "FutureBoosting"（未来助推） 的新方法，用来解决一个非常棘手的问题：如何准确预测未来的电价？

想象一下，电力市场就像是一个极度情绪化、变化无常的“股市”。电价不仅受供需影响，还会因为天气突变、突发故障等原因瞬间暴涨或暴跌（就像股票里的“黑天鹅”事件）。传统的预测方法要么太死板，要么太依赖历史数据，很难抓住这种剧烈的波动。

作者团队（来自清华大学和一家电力科技公司）想出了一个聪明的“组合拳”方案，把两种截然不同的 AI 技术结合在了一起。我们可以用**“老练的预言家”和“精明的交易员”**这两个角色来比喻：

1. 遇到的难题：两个“偏科”的选手

在电力预测领域，目前主要有两类 AI 模型，但它们都有明显的短板：

选手 A：时间序列基础模型（TSFMs，比如 Chronos, TimerXL 等）
- 角色：它是**“博学的预言家”**。它读过海量的历史数据（像读过所有历史书一样），非常擅长看穿时间的规律，能预测出“明天大概是什么天气”、“下周大概是什么趋势”。
- 缺点：它有点“书呆子气”。它虽然懂大趋势，但不懂具体的“人情世故”。比如，它可能知道明天风大（适合发电），但它不知道具体的“市场交易规则”或“突发的供需紧张”会如何瞬间把价格推高。它往往忽略了那些还没发生、但至关重要的“未来变量”。
选手 B：回归模型（Regression Models，比如 LightGBM 等）
- 角色：它是**“精明的交易员”**。它非常擅长处理具体的数字关系，比如“如果风力发电多了 10%，电价通常会跌多少”。它很懂业务逻辑，能精准计算各种因素（如天气、负荷）对价格的直接影响。
- 缺点：它有点“短视”。它只能看到现在已知的信息。如果明天有个突发情况（比如某条输电线路突然坏了），而今天还没发生，这个“交易员”就完全不知道，因为它无法预测“未知的未来”。

结果就是： 预言家懂趋势但不懂细节，交易员懂细节但看不见未来。单独用谁，在复杂的电力市场里都会“翻车”。

2. 解决方案：FutureBoosting（未来助推）

作者想出了一个绝妙的**“师徒搭档”**模式，这就是 FutureBoosting。

第一步：让“预言家”先猜一猜（特征增强）
我们先把那个“博学的预言家”（冻结的 TSFM）请出来。虽然它不能直接给出最终价格，但它能利用它庞大的知识库，预测出那些“今天还不知道、但明天会发生”的关键因素。
- 比喻：就像预言家告诉你：“根据历史规律，明天下午 3 点，风力可能会突然变大，而且系统负荷可能会因为高温而激增。”
- 这些预测出来的“未来因素”，被打包成一份**“未来情报包”**。
第二步：把“情报包”交给“交易员”（回归预测）
现在，我们把这份“未来情报包”交给那位“精明的交易员”。
- 交易员手里现在有了：
  1. 今天已知的数据（现在的负荷、天气）。
  2. 预言家提供的“未来情报”（明天的风力预测、负荷预测）。
- 交易员利用它擅长的逻辑计算能力，结合这些“未来情报”，算出最终最准确的电价。

核心思想：用“预言家”的时间洞察力来弥补“交易员”的短视，再用“交易员”的逻辑计算力来修正“预言家”的模糊感。

3. 效果如何？

作者在真实的电力市场数据（比如中国山西的电力市场）上做了测试，效果非常惊人：

更准了：相比单独使用“预言家”或单独使用“交易员”，这个组合拳把预测误差（MAE）降低了 30% 以上。
更稳了：特别是在电价暴涨或暴跌（极端情况）的时候，这个模型表现得最好。它能抓住那些突然的尖峰，而传统模型往往会漏掉。
更省了：它不需要像训练大模型那样消耗巨大的算力。它只需要让大模型“猜”一下，然后让一个小模型“算”一下，就像用大模型做“顾问”，小模型做“执行”，既聪明又省钱。

4. 总结

这篇论文就像是在说：

以前我们要么请一个全知全能的算命先生（TSFM）来猜价格，要么请一个精算师（回归模型）来算价格。结果发现，算命先生算不准具体的账，精算师又算不出未来的变数。

现在，我们让算命先生先给精算师递一张“未来情报单”，精算师拿着这张单子，结合当下的情况，算出了最精准的价格。

这种方法不仅让电力公司能更聪明地买卖电（省钱、避险），也为其他需要结合“时间规律”和“具体业务逻辑”的预测问题（比如股票、交通流量）提供了一个通用的新思路。

Each language version is independently generated for its own context, not a direct translation.

这是一篇关于电力价格预测（Electricity Price Forecasting, EPF）的学术论文，标题为《回归模型遇见基础模型：一种用于实用电力价格预测的混合 AI 方法》（Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting）。

以下是对该论文的详细技术总结：

1. 研究背景与问题定义 (Problem)

核心挑战：电力市场价格具有极端的波动性、非线性和非平稳性。市场数据呈现出重尾分布（Heavy-tailed）、非高斯分布以及频繁的极端价格事件（如价格尖峰）。
现有方法的局限性：
- 时间序列基础模型 (TSFMs)：如 Chronos, Timer-XL 等，虽然在通用时间序列基准测试中表现优异，擅长捕捉长程时间依赖，但在特定领域（如电力价格）往往未能充分利用交叉变量（Cross-variate），且对非周期性模式的处理不足。
- 传统回归模型：如 LightGBM、XGBoost 等，擅长捕捉特征间的交互作用和非线性关系，但通常仅依赖未来已知的输入变量（如天气预报、计划负荷），忽略了在预测时刻尚未发生但至关重要的历史驱动因素（如未来的供需动态趋势），导致前瞻性预测能力受限。
痛点：在真实的电力交易场景中，仅靠单一模型难以同时兼顾“时间序列的演化规律”和“多变量间的复杂交互”，导致在极端价格波动下的预测精度不足。

2. 方法论：FutureBoosting (Methodology)

作者提出了一种名为 FutureBoosting 的新型混合范式，旨在结合基础模型的时序建模能力和回归模型的特征交互能力。

核心思想

将预测问题重构为两个阶段：

利用 TSFM 生成“未来特征”：利用冻结（Frozen）的时间序列基础模型（TSFM），基于历史数据预测那些在预测时刻尚未可用或不确定的未来驱动变量（如未来的系统负荷、可再生能源发电量等）。
回归模型增强：将这些预测生成的特征（Forecasted Features）与未来已知的变量（如天气、计划计划）以及领域知识构建的特征相结合，形成一个增强特征集（Enriched Feature Set），输入到下游的轻量级回归模型中进行最终价格预测。

框架流程

阶段一（特征增强/Forecast）：
- 输入：历史目标变量（价格）和历史外生变量。
- 模型：预训练的 TSFM（如 Chronos2, TimerXL 等，采用 Zero-shot 模式）。
- 输出：对未来不可见变量（如未来负荷、新能源出力）的预测值 $\hat{X}_{forecast}$ 。
阶段二（回归/Regress）：
- 特征构建：
  - 预测特征： $\hat{X}_{forecast}$ （来自 TSFM）。
  - 未来已知变量： $Z_{D+1}$ （如气象预报、电网计划）。
  - 领域构建因子： $C_{D+1}$ （如热力拍卖空间、可再生能源渗透率等反映市场供需结构的指标）。
- 模型训练：使用树模型（如 LightGBM）在增强特征集上训练，学习复杂的交叉变量交互关系。
- 输出：最终的前一日（Day-ahead）或实时（Real-time）电价预测。

关键优势

解耦：将“时间依赖建模”交给 TSFM，将“跨变量交互建模”交给回归模型。
轻量化：TSFM 仅作为特征生成器（冻结参数），下游回归模型训练成本低，推理速度快。
可解释性：回归模型（特别是树模型）天然支持特征重要性分析（如 SHAP 值），便于理解市场驱动因素。

3. 主要贡献 (Key Contributions)

**创新范式 **(FutureBoosting)：提出了一种将 TSFM 的时序预测能力转化为回归模型增强特征的混合架构，解决了单一模型在特定领域适应性差的问题。
实用框架：构建了一个即插即用（Plug-and-play）的轻量级电力价格预测框架，支持多种 TSFM 和回归模型组合。
实证验证：在真实的中国山西电力市场数据（2025 年全年）以及国际公开基准（RealE，法国和德国）上进行了广泛评估，证明了其显著优于纯 TSFM 和纯回归基线。
可解释性与部署：通过 SHAP 值分析揭示了模型决策过程，并已在实际业务系统（Xingzhixun IoTDB）中部署，验证了其在极端价格场景下的鲁棒性。

4. 实验结果 (Results)

数据集：
- 山西电力市场（真实数据）：包含日前和实时电价，15 分钟粒度，2025 年 12 个月滚动评估。
- RealE 基准：法国（FR）和德国（DE）的小时级数据。
性能提升：
- 山西市场：
  - 相比 Zero-shot TSFM 基线，FutureBoosting 将日前预测的 MAE 降低了 32.40%，实时预测降低了 24.98%。
  - 相比仅使用外生变量的 LightGBM 回归模型，MAE 进一步降低了 4.56%（日前）和 2.97%（实时）。
  - 在极端价格波动（如价格尖峰或低谷）场景下，混合模型表现尤为出色，能有效修正 TSFM 的偏差。
- RealE 基准：
  - 在法国和德国数据集上，相比纯回归模型，MAE 提升显著（法国提升 58.24%，德国提升 63.06%）。
消融实验：
- 回归器选择：在山西市场，树模型（LightGBM）优于线性回归，表明数据中存在强非线性交互；在 RealE 数据中线性回归表现更好，说明不同市场特性需要不同的回归策略。
- 微调对比：FutureBoosting 在 MSE 指标上优于 LoRA 微调的 TSFM，且计算成本远低于微调。
效率分析：
- FutureBoosting 仅需单卡 GPU 进行 TSFM 推理（甚至可缓存至 CPU），训练回归模型仅需 CPU。
- 相比 LoRA 微调（需多卡 GPU，耗时数小时），FutureBoosting 的端到端推理时间大幅缩短（约 150 秒 vs 数小时），且显存占用极低。

5. 意义与结论 (Significance)

理论与实践结合：该研究不仅提出了新的混合 AI 架构，还深入分析了电力市场的非平稳性和重尾特性，为能源领域的 AI 应用提供了新思路。
解决“最后一公里”问题：通过引入领域知识（Domain Knowledge）和可解释性工具，使得黑盒的基础模型能够适应具体的工业场景，解决了基础模型在垂直领域落地难的问题。
经济价值：高精度的电价预测直接帮助市场参与者优化投标策略、管理风险，具有显著的经济效益。
通用性：该范式不仅适用于电力，理论上可推广至任何具有“时间序列演化”和“多变量强交互”特性的预测任务（如金融、交通等）。

总结：FutureBoosting 通过“基础模型生成未来特征 + 回归模型学习交互关系”的巧妙结合，成功克服了单一模型在复杂电力市场预测中的短板，实现了高精度、高效率且可解释的实用化预测方案。

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

1. 遇到的难题：两个“偏科”的选手

2. 解决方案：FutureBoosting（未来助推）

3. 效果如何？

4. 总结

1. 研究背景与问题定义 (Problem)

2. 方法论：FutureBoosting (Methodology)

核心思想

框架流程

关键优势

3. 主要贡献 (Key Contributions)

4. 实验结果 (Results)

5. 意义与结论 (Significance)

类似论文

Comparison of Outlier Detection Algorithms on String Data

Structure-Aware Epistemic Uncertainty Quantification for Neural Operator PDE Surrogates

Interventional Time Series Priors for Causal Foundation Models

Fingerprinting Concepts in Data Streams with Supervised and Unsupervised Meta-Information

Graph Tokenization for Bridging Graphs and Transformers