cs.LG 篇论文 | Gist.Science

Interpretable-by-Design Transformers via Architectural Stream Independence

该论文提出了通过架构流独立性（即保持符号结构与上下文语义在独立流中处理直至输出融合）来“按设计实现可解释性”的新范式，并通过晚融合架构（LFA）验证了该方法能有效防止信息过早纠缠、提升模型稳定性，从而将可解释性确立为一种可通过结构约束强制实现的架构设计准则。

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Pushing Bistatic Wireless Sensing toward High Accuracy at the Sub-Wavelength Scale

本文针对双基无线传感中时钟异步导致的相位偏移问题，提出了一种利用信道响应幅度从失真的跨天线信道比率中恢复理想信道特征的鲁棒框架，从而在 Wi-Fi 和 LoRa 实验中实现了亚波长级的高精度位移感知。

Wenwei Li, Jiarun Zhou, Qinxiao Quan, Fusang Zhang, Daqing Zhang2026-03-10🤖 cs.LG

Enhanced Random Subspace Local Projections for High-Dimensional Time Series Analysis

本文提出了一种增强的随机子空间局部投影（RSLP）框架，通过引入加权子空间聚合、类别感知采样、自适应子空间尺寸选择及针对依赖数据的自助法推断程序，有效解决了高维时间序列中预测变量多于观测值导致的过拟合与估计不稳定问题，显著提升了长预测 horizon 下的估计精度与推断可靠性。

Eman Khalid, Moimma Ali Khan, Zarmeena Ali, Abdullah Illyas, Muhammad Usman, Saoud Ahmed2026-03-10🤖 cs.LG

A Unified Framework for Knowledge Transfer in Bidirectional Model Scaling

本文提出了首个尺寸无关的 BoT 框架，通过将模型权重视为连续信号并利用离散小波变换（DWT）将双向模型缩放统一为信号处理中的上采样与下采样操作，从而在显著降低预训练计算成本的同时实现了 DeiT、BERT 和 GPT 等模型在 GLUE 和 SQuAD 等基准测试上的最先进性能。

Jianlu Shen, Fu Feng, Jiaze Xu, Yucheng Xie, Jiaqi Lv, Xin Geng2026-03-10🤖 cs.LG

Online Continual Learning for Anomaly Detection in IoT under Data Distribution Shifts

本文提出了名为 OCLADS 的新型通信框架，通过结合设备端智能样本选择与边缘端分布偏移检测机制，实现了在数据分布动态变化的物联网环境中高效且低更新频率的在线持续异常检测。

Matea Marinova, Shashi Raj Pandey, Junya Shiraishi, Martin Voigt Vejling, Valentin Rakovic, Petar Popovski2026-03-10🤖 cs.LG

A Unified View of Drifting and Score-Based Models

本文通过利用 Tweedie 公式，精确揭示了漂移模型（Drifting）与基于分数的扩散模型之间的内在联系，证明了高斯核漂移等价于在平滑分布上进行分数匹配，并进一步推导了通用径向核的分解形式及拉普拉斯核在低温和高维情形下的误差界，从而为理解漂移模型与分布匹配蒸馏（DMD）提供了统一的理论视角。

Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao2026-03-10🤖 cs.LG

Reinforcement learning-based dynamic cleaning scheduling framework for solar energy system

该研究提出了一种基于强化学习的框架，通过动态优化干旱地区光伏面板的清洁调度，在阿布扎比案例中证明其相比传统方法能节省高达 13% 的成本并显著提升系统效率。

Heungjo An2026-03-10🤖 cs.LG

Beyond Data Splitting: Full-Data Conformal Prediction by Differential Privacy

该论文提出了一种基于差分隐私的全数据共形预测框架，通过利用隐私机制带来的稳定性并配合保守的分位数估计，在无需数据划分的情况下实现了比现有私有基线更锐利的预测集，并在渐近意义上恢复了标称覆盖率。

Young Hyun Cho, Jordan Awan2026-03-10🤖 cs.LG

One-for-All Model Initialization with Frequency-Domain Knowledge

本文提出了一种名为 FRONT 的新型框架，该框架利用离散余弦变换（DCT）从预训练模型权重中提取低频“学习基因”，从而实现对任意规模下游模型的高效、免训练初始化，并在视觉和语言任务中显著加速收敛并降低训练成本。

Jianlu Shen, Fu Feng, Yucheng Xie, Jiaqi Lv, Xin Geng2026-03-10🤖 cs.LG

Neural Dynamics-Informed Pre-trained Framework for Personalized Brain Functional Network Construction

该论文提出了一种神经动力学先验的预训练框架，通过提取异质场景下的个性化神经活动表征来指导脑区划分与相关性估计，从而克服了传统方法依赖固定图谱和线性假设的局限，显著提升了个性化脑功能网络构建的准确性与泛化能力。

Hongjie Jiang, Yifei Tang, Shuqiang Wang2026-03-10🤖 cs.LG

Generative prediction of laser-induced rocket ignition with dynamic latent space representations

该论文提出了一种结合卷积自编码器与神经常微分方程的数据驱动代理建模方法，通过构建动态潜在空间表示，将激光点火火箭发动机的多物理场湍流模拟成本降低数个数量级，从而实现了对复杂燃烧系统的高效时空预测与不确定性量化。

Tony Zahtila, Ettore Saetta, Murray Cutforth, Davy Brouzet, Diego Rossinelli, Gianluca Iaccarino2026-03-10🤖 cs.LG

Obliviator Reveals the Cost of Nonlinear Guardedness in Concept Erasure

本文提出了名为 Obliviator 的后期概念擦除方法，通过迭代优化核函数组合来有效捕捉非线性统计依赖，从而在抵御非线性攻击的同时，量化并优化了属性保护与任务效用之间的权衡。

Ramin Akbari, Milad Afshari, Vishnu Naresh Boddeti2026-03-10🤖 cs.LG

DreamSAC: Learning Hamiltonian World Models via Symmetry Exploration

DreamSAC 提出了一种结合基于哈密顿量的对称性探索策略与自监督对比学习的框架，通过主动收集符合物理守恒律的数据并从中学习不变性，显著提升了世界模型在物理模拟中面对新物理属性时的外推泛化能力。

Jinzhou Tang, Fan Feng, Minghao Fu, Wenjun Lin, Biwei Huang, Keze Wang2026-03-10🤖 cs.LG

COOL-MC: Verifying and Explaining RL Policies for Multi-bridge Network Maintenance

本文提出了 COOL-MC 工具，通过概率模型检查和可解释性分析，对基于强化学习的多桥梁网络维护策略进行了形式化验证与解释，揭示了其安全违规概率及决策偏差。

Dennis Gross2026-03-10🤖 cs.LG

ECG Classification on PTB-XL: A Data-Centric Approach with Simplified CNN-VAE

该论文提出了一种以数据为中心的简化 CNN-VAE 模型，通过精细的数据预处理和类别平衡策略，在 PTB-XL 数据集上以极少的参数量实现了具有竞争力的心电图分类性能，强调了数据质量优于架构复杂性的重要性。

Naqcho Ali Mehdi, Amir Ali2026-03-10🤖 cs.LG

GRD-Net: Generative-Reconstructive-Discriminative Anomaly Detection with Region of Interest Attention Module

本文提出了一种名为 GRD-Net 的新型异常检测架构，该架构结合基于残差自编码器的生成对抗网络与区域兴趣（ROI）注意力模块，通过利用正常样本及合成缺陷数据进行训练，实现了无需复杂后处理算法即可精准定位工业表面缺陷（如药瓶铝盖）的异常检测。

Niccolò Ferrari, Michele Fraccaroli, Evelina Lamma2026-03-10🤖 cs.LG

Revisiting the LiRA Membership Inference Attack Under Realistic Assumptions

该论文通过引入抗过拟合、迁移学习、基于影子模型的阈值校准及非平衡先验等现实假设，重新评估了成员推断攻击（LiRA），发现其在实际生产环境下的攻击效果显著低于以往研究结论，并强调了可复现性在隐私审计中的重要性。

Najeeb Jebreel, Mona Khalil, David Sánchez, Josep Domingo-Ferrer2026-03-10🤖 cs.LG

Constraints Matrix Diffusion based Generative Neural Solver for Vehicle Routing Problems

本文提出了一种基于约束矩阵扩散的生成式神经求解器，通过利用离散噪声图扩散模型学习车辆路径问题的约束并生成约束分配矩阵，将其自适应地融入自回归求解器的特征学习与决策过程，从而在 CVRPlib 数据集的广泛测试中实现了兼顾全局视野与局部特征整合的卓越性能。

Zhenwei Wang, Tiehua Zhang, Ning Xue, Ender Ozcan, Ling Wang, Ruibin Bai2026-03-10🤖 cs.LG

A Systematic Comparison of Training Objectives for Out-of-Distribution Detection in Image Classification

该论文在 OpenOOD 标准协议下，系统比较了交叉熵、原型、三元组及平均精度四种训练目标在图像分类中的分布外检测性能，发现交叉熵损失在保持分布内精度的同时，能提供最为稳健的近域与远域分布外检测效果。

Furkan Genç, Onat Özdemir, Emre Akbas2026-03-10🤖 cs.LG

TS-MLLM: A Multi-Modal Large Language Model-based Framework for Industrial Time-Series Big Data Analysis

本文提出了 TS-MLLM 框架，通过结合工业时序补丁建模、谱感知视觉语言模型适配以及时序中心多模态注意力融合机制，实现了对工业时序数据中时间信号、频域图像和文本知识的统一多模态建模，从而在工业设备健康管理任务中显著提升了预测的准确性、鲁棒性和泛化能力。

Haiteng Wang, Yikang Li, Yunfei Zhu, Jingheng Yan, Lei Ren, Laurence T. Yang2026-03-10🤖 cs.LG