cs.LG 篇论文 | Gist.Science

Bi Directional Feedback Fusion for Activity Aware Forecasting of Indoor CO2 and PM2.5

该论文提出了一种双向反馈融合框架，通过联合建模室内环境演变与人类活动特征，并引入双时间尺度模块及复合损失函数，显著提升了室内二氧化碳和 PM2.5 浓度预测的准确性与可解释性。

Harshala Gammulle, Lidia Morawska, Sridha Sridharan, Clinton Fookes2026-03-10🤖 cs.LG

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

本文提出了名为 FutureBoosting 的混合 AI 框架，通过将冻结的时间序列基础模型生成的预测特征融入回归模型，有效克服了单一模型在捕捉跨变量关联与历史驱动因素方面的局限，从而在电价预测任务中显著提升了预测精度与可解释性。

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

本文提出了一种名为"Safe Transformer"的模块化方法，通过在 Transformer 层间插入包含显式安全位的离散信息瓶颈，利用对比学习实现安全决策的可解释性与可控制性，仅需轻量级微调即可在保持生成能力的同时显著降低攻击成功率。

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

Orion: Characterizing and Programming Apple's Neural Engine for LLM Training and Inference

本文介绍了 Orion，这是首个能够绕过 CoreML 直接利用苹果神经引擎（ANE）进行大语言模型训练与推理的开源端到端系统，它通过揭示并规避 ANE 的 20 项限制、实现权重热更新以将每步训练时间缩短 8.5 倍，并在 M4 Max 设备上成功实现了 GPT-2 的高效推理及 1.1 亿参数模型的稳定训练。

Ramchand Kumaresan2026-03-10🤖 cs.LG

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

该论文提出了一种结合密度不变观测编码、密度随机化训练及物理信息近距奖励塑造的强化学习方法，有效解决了密集人群导航中因分布外密度导致的泛化失效问题，在显著减少冻结现象的同时实现了零样本密度泛化与高碰撞避免率。

Jiefu Zhang, Yang Xu, Vaneet Aggarwal2026-03-10🤖 cs.LG

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

本文介绍了 PolyBlocks，这是一个基于 MLIR 的模块化编译器基础设施，通过组合轻量级仿射分析与启发式成本模型自动执行多级分块、融合及算子映射等优化，实现了从高层框架到特定 AI 芯片的高效代码生成，并在 NVIDIA GPU 上的实验表明其性能可媲美甚至超越 Torch Inductor 和 XLA。

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab Dutta2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

本文提出了“校准信用智能”（CCI）框架，通过结合贝叶斯神经网络、公平性约束梯度提升及分布偏移感知融合策略，在动态变化的信贷数据中实现了兼具高准确性、可靠校准性与群体公平性的风险评分。

Srikumar Nayak2026-03-10🤖 cs.LG

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

该论文提出了秩分解隐式神经偏置（RIB）以替代传统的相对位置偏置，从而在超分辨率 Transformer 中启用高效的 FlashAttention 并支持更大窗口与数据集的扩展，最终在显著提升重建质量（Urban100×2 达 35.63 dB PSNR）的同时，将训练和推理时间分别缩短了 2.1 倍和 2.9 倍。

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

Heterogeneous Decentralized Diffusion Models

该论文提出了一种高效且支持异构训练目标的去中心化扩散模型框架，通过结合异构训练范式、预训练检查点转换及 PixArt-alpha 架构，在显著降低计算与数据需求的同时，实现了比同质化基线更优的生成质量与多样性。

Zhiying Jiang, Raihan Seraj, Marcos Villagra, Bidhan Roy2026-03-10🤖 cs.LG

Improved Constrained Generation by Bridging Pretrained Generative Models

该论文提出了一种通过微调预训练生成模型，使其能够在保持生成质量的同时直接在复杂可行域（如道路地图）内生成样本的约束生成框架。

Xiaoxuan Liang, Saeid Naderiparizi, Yunpeng Liu, Berend Zwartsenberg, Frank Wood2026-03-10🤖 cs.LG

Stabilizing Reinforcement Learning for Diffusion Language Models

该论文针对群相对策略优化（GRPO）直接应用于扩散语言模型时因概率比估计噪声导致的奖励崩溃问题，提出了通过无条件截断和自归一化机制来打破不稳定性循环的 StableDRL 方法，并进一步将其扩展至块级扩散模型。

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

该论文提出了名为 DIRECTER 的新方法，通过结合注意力敏感性分析与基于合理性的解码循环，动态调节激活引导强度，从而在无需额外数据集的情况下有效缓解大语言模型的过度引导问题，显著提升了指令遵循能力且未牺牲生成质量。

Minjae Kang, Jaehyung Kim2026-03-10🤖 cs.LG

Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment

本文提出了 ProtAlign 框架，通过多目标偏好对齐策略微调预训练逆折叠模型，在保持结构可设计性的同时，有效平衡了蛋白质序列设计中溶解度、热稳定性等多种开发属性。

Xiaoyang Hou, Junqi Liu, Chence Shi, Xin Liu, Zhi Yang, Jian Tang2026-03-10🤖 cs.LG

Latent Autoencoder Ensemble Kalman Filter for Data assimilation

该论文提出了一种潜在自编码器集合卡尔曼滤波（LAE-EnKF）方法，通过在具有线性稳定动力学的潜在空间中重构数据同化问题，有效解决了标准集合卡尔曼滤波在处理强非线性系统时的性能瓶颈，并在保持计算效率的同时显著提升了同化精度与稳定性。

Xin T. Tong, Yanyan Wang, Liang Yan2026-03-10🤖 cs.LG

Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks

该论文提出了一种基于量子隐式神经表示（QINR）的混合量子 - 经典自编码器与变分自编码器模型，通过结合经典 CNN 编码器与量子解码器，在 MNIST 等数据集上实现了比现有量子生成模型更稳定、多样性更高且细节更清晰的图像重建与生成任务。

Saadet Müzehher Eren2026-03-10⚛️ quant-ph

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

该论文提出了一种名为 ICD3 的无偏聚类描述符方法，通过多分布粒度搜索识别不平衡概念并分别训练单类分类器，从而有效克服了主导大簇对少数小概念漂移的“掩蔽效应”，实现了可解释且鲁棒的不平衡概念漂移检测。

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG

Enhancing SHAP Explainability for Diagnostic and Prognostic ML Models in Alzheimer Disease

该论文提出了一种多层次可解释性框架，通过在 NACC 数据集上整合多种指标，验证了 SHAP 方法在阿尔茨海默病诊断与预后模型中跨任务、跨阶段及跨架构的解释具有高度的一致性与稳定性，从而增强了临床应用的可靠性。

Pablo Guillén, Enrique Frias-Martinez2026-03-10🤖 cs.LG

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

该论文提出了一种基于稀疏 QUBO 优化和混合核心集构建的多样性感知自适应配点方法，通过从候选池中筛选兼具高信息量与低冗余度的点集，有效解决了物理信息神经网络（PINNs）在训练效率与精度上的瓶颈问题。

Hadi Salloum, Maximilian Mifsud Bonici, Sinan Ibrahim, Pavel Osinenko, Alexei Kornaev2026-03-10🤖 cs.LG

Prediction of Steady-State Flow through Porous Media Using Machine Learning Models

该研究提出了一种基于机器学习的框架，通过对比卷积自编码器、U-Net 和傅里叶神经操作符（FNO）三种架构，发现 FNO 在预测多孔介质稳态流动方面表现最优，其均方误差低至 0.0017 且比传统计算流体力学方法快 1000 倍，同时具备网格不变性，为冷板拓扑优化提供了高效可扩展的替代方案。

Jinhong Wang, Matei C. Ignuta-Ciuncanu, Ricardo F. Martinez-Botas, Teng Cao2026-03-10🤖 cs.LG

Metalearning traffic assignment for network disruptions with graph convolutional neural networks

该论文提出了一种结合图卷积神经网络与元学习架构的方法，使模型能够快速适应因道路网络中断（如封闭）和出行需求变化而同时改变的图结构与 OD 矩阵，从而在未见过的极端场景下实现高精度的交通流预测（R²约 0.85）。

Serio Agriesti (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Guido Cantelmo (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Francisco Camara Pereira (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark)2026-03-10🤖 cs.LG