Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

本文提出了名为 FutureBoosting 的混合 AI 框架,通过将冻结的时间序列基础模型生成的预测特征融入回归模型,有效克服了单一模型在捕捉跨变量关联与历史驱动因素方面的局限,从而在电价预测任务中显著提升了预测精度与可解释性。

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

本文提出了一种名为"Safe Transformer"的模块化方法,通过在 Transformer 层间插入包含显式安全位的离散信息瓶颈,利用对比学习实现安全决策的可解释性与可控制性,仅需轻量级微调即可在保持生成能力的同时显著降低攻击成功率。

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

本文介绍了 PolyBlocks,这是一个基于 MLIR 的模块化编译器基础设施,通过组合轻量级仿射分析与启发式成本模型自动执行多级分块、融合及算子映射等优化,实现了从高层框架到特定 AI 芯片的高效代码生成,并在 NVIDIA GPU 上的实验表明其性能可媲美甚至超越 Torch Inductor 和 XLA。

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab Dutta2026-03-10🤖 cs.LG

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

该论文提出了秩分解隐式神经偏置(RIB)以替代传统的相对位置偏置,从而在超分辨率 Transformer 中启用高效的 FlashAttention 并支持更大窗口与数据集的扩展,最终在显著提升重建质量(Urban100×2 达 35.63 dB PSNR)的同时,将训练和推理时间分别缩短了 2.1 倍和 2.9 倍。

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks

该论文提出了一种基于量子隐式神经表示(QINR)的混合量子 - 经典自编码器与变分自编码器模型,通过结合经典 CNN 编码器与量子解码器,在 MNIST 等数据集上实现了比现有量子生成模型更稳定、多样性更高且细节更清晰的图像重建与生成任务。

Saadet Müzehher Eren2026-03-10⚛️ quant-ph

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

该论文提出了一种基于稀疏 QUBO 优化和混合核心集构建的多样性感知自适应配点方法,通过从候选池中筛选兼具高信息量与低冗余度的点集,有效解决了物理信息神经网络(PINNs)在训练效率与精度上的瓶颈问题。

Hadi Salloum, Maximilian Mifsud Bonici, Sinan Ibrahim, Pavel Osinenko, Alexei Kornaev2026-03-10🤖 cs.LG

Prediction of Steady-State Flow through Porous Media Using Machine Learning Models

该研究提出了一种基于机器学习的框架,通过对比卷积自编码器、U-Net 和傅里叶神经操作符(FNO)三种架构,发现 FNO 在预测多孔介质稳态流动方面表现最优,其均方误差低至 0.0017 且比传统计算流体力学方法快 1000 倍,同时具备网格不变性,为冷板拓扑优化提供了高效可扩展的替代方案。

Jinhong Wang, Matei C. Ignuta-Ciuncanu, Ricardo F. Martinez-Botas, Teng Cao2026-03-10🤖 cs.LG

Metalearning traffic assignment for network disruptions with graph convolutional neural networks

该论文提出了一种结合图卷积神经网络与元学习架构的方法,使模型能够快速适应因道路网络中断(如封闭)和出行需求变化而同时改变的图结构与 OD 矩阵,从而在未见过的极端场景下实现高精度的交通流预测(R²约 0.85)。

Serio Agriesti (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Guido Cantelmo (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Francisco Camara Pereira (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark)2026-03-10🤖 cs.LG