cs.LG 篇论文 | Gist.Science

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

该论文提出了名为 RAD 的新型对齐框架，通过引入基于最优传输的一阶随机占优约束替代传统的期望成本约束，实现了对尾部风险和谱风险测度的普适性控制，从而在提升模型无害性的同时增强了其对分布外场景的鲁棒性。

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

该论文针对质谱分子结构识别中的高误报风险，提出了一种基于风险 - 覆盖率权衡的筛选预测框架，通过评估不同不确定性量化策略，证明利用计算成本较低的一阶置信度及检索级偶然不确定性，结合分布外风险控制方法，可在保证高概率满足预设错误率约束的前提下，有效筛选出可信的分子结构注释。

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

该论文正式化了测试时扩展下的密集基准排名问题，推出了开源库 Scorio 以实施多种统计排名方法，并通过在多个数学基准上的实验验证了这些方法在不同预算下对贝叶斯金标准的可靠性。

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

该论文提出了一种基于生物启发式自监督学习的新方法，通过引入受运动控制子运动理论启发的“运动片段”标记策略，利用 Transformer 对腕部 IMU 信号进行掩码重建预训练，从而在数据稀缺场景下显著提升了人类活动识别的鲁棒性与效率。

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

该论文提出了一种名为 Pointy 的轻量级 Transformer 点云架构，仅通过 3.9 万个点云样本的训练，便在性能上超越了依赖大规模跨模态监督或更多数据的基础模型，并通过统一的复现研究证明了精心设计的架构与训练策略在无需复杂 Tokenizer 的情况下即可实现卓越效果。

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

本文介绍了 TOSSS（基于 CVE 的双选项安全片段选择）基准，旨在通过让大语言模型在安全与易受攻击的代码片段间进行选择来评估其软件安全能力，该基准具有可扩展性，并在 14 个主流模型上进行了 C/C++ 和 Java 代码的测试。

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

本文提出了一种名为 FRIEND 的联邦学习框架，通过在 B5G 多 RIS 辅助的无蜂窝毫米波网络中利用边缘设备协同训练深度卷积神经网络来检测窃听者，从而在保护数据隐私的同时将保密速率提升了约 30%。

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

该论文研究了基于联邦学习的低轨 6G 非地面网络波束管理，通过利用高空平台站将轨道面作为分布式学习节点，并对比评估了多层感知机与图神经网络模型，结果表明图神经网络在低仰角等动态传播条件下具有更优的波束预测精度与稳定性。

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

该论文揭示了 Transformer 模型中的 MLP 层实际上执行的是连续信号的二值路由机制，即通过特定的“共识 - 异常”神经元架构决定哪些 token 需要非线性处理，从而解释了为何多项式平滑近似失效，并表明这种二值路由结构在功能上比连续激活更能准确捕捉计算路径的选择。

Peter Balogh2026-03-12🤖 cs.LG

MCMC Informed Neural Emulators for Uncertainty Quantification in Dynamical Systems

该论文提出了一种将马尔可夫链蒙特卡洛（MCMC）生成的模型参数分布作为输入融入神经网络训练的新方法，从而在避免无效采样和降低计算成本的同时，实现了与原始物理模型相当的参数不确定性量化能力。

Heikki Haario, Zhi-Song Liu, Martin Simon, Hendrik Weichel2026-03-12🤖 cs.LG

ForwardFlow: Simulation only statistical inference using deep learning

该论文提出了一种名为 ForwardFlow 的基于深度学习的纯模拟统计推断框架，通过训练一个包含坍缩层的分支神经网络，直接从模拟数据中求解参数估计的逆问题，从而在无需解析似然函数的情况下实现有限样本精确性、对数据污染的鲁棒性以及算法近似能力。

Stefan Böhringer2026-03-12📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

该论文提出了一种统一的贝叶斯优化框架，利用高斯过程回归及多种扩展技术（如最优传输、变分正则化和自适应信任半径），通过单一六步代理循环高效加速势能面上极小值点、单点及双端鞍点的搜索，并辅以 Rust 代码实现以验证其在高维系统中的可扩展性与实用性。

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)2026-03-12📊 stat

Factorized Neural Implicit DMD for Parametric Dynamics

本文提出了一种基于因子化神经隐式场的参数化动态建模方法，通过解耦空间模态与时间演化来学习 Koopman 算子的谱分解，从而在无需显式物理方程的情况下实现对复杂物理系统长期演化、参数泛化及谱分析的精准预测。

Siyuan Chen, Zhecheng Wang, Yixin Chen, Yue Chang, Peter Yichen Chen, Eitan Grinspun, Jonathan Panuelos2026-03-12🤖 cs.LG

Cross-Species Transfer Learning for Electrophysiology-to-Transcriptomics Mapping in Cortical GABAergic Interneurons

该研究利用来自小鼠和人类皮层的公开 Patch-seq 数据集，通过注意力机制 BiLSTM 模型实现了从电生理特征到转录组亚型（GABA 能中间神经元）的跨物种映射，并证实了在小鼠数据上预训练后微调至人类数据能显著提升人类神经元亚型预测的准确性。

Theo Schwider, Ramin Ramezani2026-03-12🧬 q-bio

Leech Lattice Vector Quantization for Efficient LLM Compression

该论文提出了一种名为 Leech 格向量量化（LLVQ）的新方法，通过扩展基于扩展 Golay 码的搜索算法以实现无需显式码本的索引、角搜索及全并行反量化，从而在无需昂贵查找机制的情况下，利用 24 维 Leech 格的最优球堆积特性实现了优于 Quip#、QTIP 和 PVQ 等现有方法的 LLM 压缩性能。

Tycho F. A. van der Ouderaa, Mart van Baalen, Paul Whatmough, Markus Nagel2026-03-12🤖 cs.LG

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

本文提出了 V2M-Zero，一种无需成对数据即可实现视频与音乐时间对齐生成的零样本方法，其核心在于利用跨模态共享的时序变化结构（通过模态内事件曲线捕捉），仅需微调文本转音乐模型并在推理阶段替换为视频事件曲线，即可在音频质量、语义对齐及时间同步性上显著超越现有基线。

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

本文提出了名为 NeFTY 的可微分物理框架，通过将三维扩散率场参数化为连续神经场并结合严格的数值求解器，实现了从瞬态表面温度测量中对材料属性及亚表面缺陷的高精度定量三维重建。

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

XConv: Low-memory stochastic backpropagation for convolutional layers

XConv 是一种无需修改架构或代码即可无缝集成的卷积层替代方案，它通过存储高度压缩的激活值并利用多通道随机迹估计来近似权重梯度，在显著降低显存占用（减少两倍以上）的同时保持了与精确梯度方法相当的训练性能。

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. Herrmann2026-03-11🤖 cs.LG

A Survey on Decentralized Federated Learning

这篇论文系统回顾了截至 2026 年初的去中心化联邦学习方法，将其划分为传统分布式与基于区块链两大架构，提出了以核心瓶颈为导向的统一分类体系，总结了评估现状与局限，并指出了未来在拓扑感知威胁模型、去中心化隐私定义、抗操纵激励机制及目标模型界定等方向的研究重点。

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele Tolomei2026-03-11🤖 cs.LG

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

该论文通过利用多维随机子集和问题在随机依赖情形下的最新进展，首次证明了在多项式过参数化的卷积神经网络中存在能够近似任意较小网络的“结构化强彩票票”，从而为结构化剪枝场景下的强彩票票假设提供了首个次指数级上界。

Arthur da Cunha, Francesco d'Amore, Emanuele Natale2026-03-11🤖 cs.LG