cs.LG 篇论文 | Gist.Science

BeyondBench: Contamination-Resistant Evaluation of Reasoning in Language Models

本文提出了 BeyondBench 框架，通过算法化动态生成数学上可验证的难题来消除训练数据污染，对 101 个语言模型进行了涵盖不同难度与规模的抗污染推理能力评估，揭示了当前模型在复杂算法问题上的显著推理缺陷。

Gaurav Srivastava, Aafiya Hussain, Zhenyu Bi + 5 more2026-03-06💻 cs

Hyperspherical Latents Improve Continuous-Token Autoregressive Generation

该论文提出了 SphereAR，一种通过利用超球面 VAE 将自回归生成过程中的输入输出约束在固定半径超球面上，从而解决潜在变量方差异质性问题并消除方差崩溃的图像生成方法，其在 ImageNet 上实现了超越扩散模型和掩码生成模型的自回归新纪录。

Guolin Ke, Hui Xue2026-03-06💻 cs

Quantitative convergence of trained single layer neural networks to Gaussian processes

本文提供了浅层神经网络在梯度下降训练过程中向高斯过程收敛的定量界限，通过显式上界证明了网络输出与高斯近似之间的二次 Wasserstein 距离随网络宽度呈多项式衰减，并量化了架构参数与训练动态对收敛误差的影响。

Eloy Mosig, Andrea Agazzi, Dario Trevisan2026-03-06🔢 math

Pretraining Large Language Models with NVFP4

该论文提出了一种结合随机哈达玛变换、二维量化、随机舍入及选择性高精度层的 NVFP4 训练方法，成功在 10 万亿 token 上预训练了 120 亿参数模型，实现了与 FP8 基线相当的性能，为大规模语言模型的低精度高效训练开辟了新路径。

NVIDIA, Felix Abecassis, Anjulie Agrusa + 87 more2026-03-06💻 cs

OPPO: Accelerating PPO-based RLHF via Pipeline Overlap

本文提出了 OPPO，一种轻量级且模型无关的 PPO 强化学习框架，通过引入步内流式处理与步间自适应预提交两项重叠流水线技术，有效解决了多模型依赖和长尾响应导致的效率瓶颈，在无需牺牲收敛性的前提下将训练速度提升了 1.8 至 2.8 倍。

Kaizhuo Yan, Yingjie Yu, Yifan Yu + 2 more2026-03-06💻 cs

VidGuard-R1: AI-Generated Video Detection and Explanation via Reasoning MLLMs and RL

本文提出了 VidGuard-R1，这是首个利用组相对策略优化（GRPO）强化学习框架，通过激励模型探索推理路径并引入物理一致性奖励，从而在零样本设置下实现高精度检测与可解释性归因的 AI 生成视频检测系统。

Kyoungjun Park, Yifan Yang, Juheon Yi + 6 more2026-03-06💻 cs

Non-Asymptotic Analysis of Efficiency in Conformalized Regression

本文针对基于 SGD 训练的共形化分位数和中位数回归，在温和假设下建立了预测集长度与最优区间长度偏差的非渐近界，揭示了效率对训练集大小、校准集大小及误覆盖率的联合依赖关系，并识别了不同覆盖率区间下的收敛率相变现象，从而为数据分配提供了理论指导。

Yunzhen Yao, Lie He, Michael Gastpar2026-03-06💻 cs

Do We Really Need Permutations? Impact of Model Width on Linear Mode Connectivity

本文通过引入层指数加权连通性（LEWC）理论并配合 softmax 温度校准，首次实证表明无需参数重排，仅通过增加模型宽度即可显著实现线性模式连通性（LMC）。

Akira Ito, Masanori Yamada, Daiki Chijiwa + 1 more2026-03-06💻 cs

True Self-Supervised Novel View Synthesis is Transferable

本文提出了首个无需 3D 归纳偏置或显式多视图几何概念的自监督新视角合成模型 XFactor，通过结合成对姿态估计与简单的输入输出增强方案，成功实现了姿态表示在不同场景间的可迁移性，从而确立了可迁移性作为衡量真正新视角合成能力的关键标准。

Thomas W. Mitchel, Hyunwoo Ryu, Vincent Sitzmann2026-03-06💻 cs

CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

本文提出了 CBF-RL 框架，通过在训练阶段将控制障碍函数（CBF）安全过滤机制内化到强化学习策略中，使智能体在无需运行时安全过滤器的情况下即可实现安全探索、快速收敛及在真实机器人上的鲁棒安全部署。

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs

Bayesian Inference for PDE-based Inverse Problems using the Optimization of a Discrete Loss

本文提出了一种名为 B-ODIL 的贝叶斯框架，通过将离散损失优化（ODIL）中的偏微分方程损失作为先验知识并结合数据似然，实现了对 PDE 基逆问题的求解及不确定性量化，并在多维合成基准及脑肿瘤 MRI 成像等实际应用中验证了其有效性。

Lucas Amoudruz, Sergey Litvinov, Costas Papadimitriou + 1 more2026-03-06🔬 physics

Schrödinger Bridge Mamba for One-Step Speech Enhancement

本文提出了将薛定谔桥训练范式与 Mamba 架构相结合的 Schrödinger Bridge Mamba（SBM）模型，该模型仅需单步推理即可在联合去噪和去混响任务中超越现有强基线方法，同时保持适合流式处理的实时性。

Jing Yang, Sirui Wang, Chao Wu + 2 more2026-03-06💻 cs

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

该论文揭示了现有针对多智能体系统控制流劫持的防御机制存在根本性缺陷，并提出并评估了受控制流完整性与最小权限原则启发的新防御方案 ControlValve，通过生成许可控制流图并强制执行上下文规则来有效阻断此类攻击。

Rishi Jha, Harold Triedman, Justin Wagle, Vitaly Shmatikov2026-03-06🔒 cs.CR

Generalization Below the Edge of Stability: The Role of Data Geometry

本文通过理论分析揭示了数据几何在过参数化 ReLU 神经网络泛化中的核心作用，证明了当数据难以被 ReLU 激活阈值“打散”时，梯度下降倾向于学习共享模式从而实现良好泛化，而数据若易被打散（如集中在球面上）则会导致过拟合。

Tongtong Liang, Alexander Cloninger, Rahul Parhi + 1 more2026-03-06💻 cs

Testing Most Influential Sets

该论文针对线性最小二乘模型提出了一种严谨的统计推断框架，通过推导精确的影响力公式并识别最大影响力的极值分布（弗雷歇分布或甘贝尔分布），实现了对异常高影响力数据子集的假设检验，从而取代了以往依赖启发式方法的做法。

Lucas Darius Konrad, Nikolas Kuschnig2026-03-06🔢 math

LLEMA: Evolutionary Search with LLMs for Multi-Objective Materials Discovery

本文提出了 LLEMA 框架，通过结合大语言模型的领域知识、化学约束进化规则及基于记忆的优化机制，在满足多目标性能要求的同时高效发现化学合理且热力学稳定的新材料，显著提升了材料发现的命中率与帕累托前沿质量。

Nikhil Abhyankar, Sanchit Kabra, Saaketh Desai + 1 more2026-03-06🔬 cond-mat.mtrl-sci

Auto-Adaptive PINNs with Applications to Phase Transitions

本文提出了一种基于任意问题启发式（可依赖网络及其梯度）的自适应采样方法，用于训练物理信息神经网络，并在 Allen-Cahn 方程的相变问题中成功实现了对界面区域的精确解析，其效果优于传统的残差自适应框架。

Kevin Buck, Woojeong Kim2026-03-06🔢 math

FMint-SDE: A Multimodal Foundation Model for Accelerating Numerical Simulation of SDEs via Error Correction

本文提出了名为 FMint-SDE 的多模态基础模型，该模型基于解码器 Transformer 架构，通过利用数值和文本模态学习通用误差校正方案，仅需训练一次即可实现对随机微分方程（SDE）的高效、高精度模拟，从而在分子动力学、金融等多个领域超越了传统求解器在精度与效率上的权衡。

Jiaxin Yuan, Haizhao Yang, Maria Cameron2026-03-06🔢 math

MotionStream: Real-Time Video Generation with Interactive Motion Controls

MotionStream 通过自强制分布匹配蒸馏将双向教师模型转化为因果学生模型，并结合滑动窗口因果注意力与 KV 缓存滚动机制，实现了在单 GPU 上以亚秒级延迟和高达 29 FPS 的速度进行无限时长的实时交互式视频生成。

Joonghyuk Shin, Zhengqi Li, Richard Zhang + 4 more2026-03-06💻 cs

CytoNet: A Foundation Model for the Human Cerebral Cortex at Cellular Resolution

本文提出了 CytoNet，这是一种基于 4000 多张组织切片中 10 个死后人脑的 100 万个无标签图像块训练的基础模型，能够通过自监督学习将复杂的细胞模式编码为具有解剖学意义的特征表示，从而实现对人脑皮层微结构的可扩展分析，并建立细胞架构与宏观功能组织之间的联系。

Christian Schiffer, Zeynep Boztoprak, Jan-Oliver Kropp + 5 more2026-03-06💻 cs