cs.LG 篇论文 | Gist.Science

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

本文提出了一种基于全连接残差神经网络的代理模型，通过训练有限元模拟数据，实现了对高温超导磁体电流分布的快速准确预测，从而显著提升了大型 REBCO 螺线管磁体的智能设计效率。

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing Qu2026-03-11🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

本文提出并评估了多种基于排斥性节点（如行列式点过程和排斥过程）的蒙特卡洛积分方法以计算高维球面上的切片 Wasserstein 距离，并通过方差分析揭示了 UnifOrtho 估计量在大维数下的优势，最终建议在小维数场景使用随机拟蒙特卡洛法，而在大维数场景使用 UnifOrtho 方法。

Vladimir Petrovic, Rémi Bardenet, Agnès Desolneux2026-03-11🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

本文介绍了机器人控制堆栈（RCS），这是一个专为支持大规模通用策略（如 VLA）研究而设计的轻量级生态系统，它通过模块化分层架构统一了仿真与物理机器人接口，有效解决了传统框架在机器人学习工作流中的瓶颈问题，并验证了其在提升策略性能及促进虚实迁移方面的有效性。

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian Walter2026-03-11🤖 cs.LG

Kuramoto Orientation Diffusion Models

该论文提出了一种名为“Kuramoto 取向扩散模型”的生成方法，通过利用生物启发的 Kuramoto 同步动力学在周期性域上构建分数模型，有效解决了指纹和纹理等富含方向性信息的图像生成难题，显著提升了此类数据的生成质量。

Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Reinforced Generation of Combinatorial Structures: Hardness of Approximation

该论文展示了利用 AlphaEvolve（一种大语言模型代码变异代理）在复杂性理论中取得的新进展，包括改进随机正则图上的认证算法界限、发现新的归约装置以提升 MAX-CUT 和 TSP 等组合优化问题的不可近似性下界，并通过 AI 辅助优化验证过程来克服构造验证的计算成本。

Ansh Nagda, Prabhakar Raghavan, Abhradeep Thakurta2026-03-11🤖 cs.AI

VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment

本文提出了 VLCE 框架，通过融合 ConceptNet 和 WordNet 等外部语义知识来增强视觉语言模型，显著提升了其在灾后卫星和无人机图像描述中的专业词汇准确性、信息丰富度及事实一致性。

Md. Mahfuzur Rahman, Kishor Datta Gupta, Marufa Kamal + 5 more2026-03-11🤖 cs.LG

ZeroSiam: An Efficient Asymmetry for Test-Time Entropy Optimization without Collapse

本文提出了 ZeroSiam，一种基于非对称孪生架构的高效方法，通过非对称散度对齐机制在无需额外开销的情况下有效防止测试时熵最小化过程中的模型坍塌，从而在视觉适应和大语言模型推理任务中实现更稳定且优越的性能。

Guohao Chen, Shuaicheng Niu, Deyu Chen, Jiahao Yang, Zitian Zhang, Mingkui Tan, Pengcheng Wu, Zhiqi Shen2026-03-11🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

该论文提出了一种名为通用策略组合（GPC）的免训练方法，通过凸组合多个预训练扩散或流匹配策略的分布分数，在无需额外模型训练的情况下显著提升了机器人控制性能与适应性。

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. Luo2026-03-11🤖 cs.LG

Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking

本文提出了一种结合深度强化学习与有界极值搜索的混合控制方法，利用前者处理多参数系统的高效学习能力与后者应对时变不确定性的鲁棒性，显著提升了非线性时变系统的控制性能。

Shaifalee Saxena, Alan Williams, Rafael Fierro, Alexander Scheinker2026-03-11🤖 cs.LG

Latent Speech-Text Transformer

该论文提出了潜语音 - 文本 Transformer（LST），通过将离散语音令牌聚合为更高阶的潜语音补丁，解决了语音与文本模态间的序列长度不平衡问题，从而在提升计算效率的同时显著增强了跨模态对齐能力，并在语音理解、生成及下游任务中实现了性能与效率的双重优化。

Yen-Ju Lu, Yashesh Gaur, Wei Zhou, Benjamin Muller, Jesus Villalba, Najim Dehak, Luke Zettlemoyer, Gargi Ghosh, Mike Lewis, Srinivasan Iyer, Duc Le2026-03-11🤖 cs.AI

AlphaApollo: A System for Deep Agentic Reasoning

本文介绍了 AlphaApollo 系统，该系统通过多轮智能体推理、多轮智能体学习（结合工具使用强化学习）以及多轮智能体进化（提出 - 判断 - 更新循环）三大核心组件，有效解决了基础模型在复杂长程推理中的能力瓶颈及测试时演进的不可靠问题，并在多个数学基准测试中显著提升了不同规模模型的性能。

Zhanke Zhou, Chentao Cao, Xiao Feng, Xuan Li, Zongze Li, Xiangyu Lu, Jiangchao Yao, Weikai Huang, Tian Cheng, Jianghangfan Zhang, Tangyu Jiang, Linrui Xu, Yiming Zheng, Brando Miranda, Tongliang Liu, Sanmi Koyejo, Masashi Sugiyama, Bo Han2026-03-11🤖 cs.AI

Exploring Single Domain Generalization of LiDAR-based Semantic Segmentation under Imperfect Labels

该论文针对 LiDAR 语义分割中标签噪声与域泛化双重挑战，首次建立了相关基准并提出了名为 DuNe 的双视图一致性框架，在多个数据集的含噪标签域泛化任务中取得了最先进性能。

Weitong Kong, Zichao Zeng, Di Wen, Jiale Wei, Kunyu Peng, June Moh Goo, Jan Boehm, Rainer Stiefelhagen2026-03-11🤖 cs.LG

RECODE: Reasoning Through Code Generation for Visual Question Answering

该论文提出了名为 RECODE 的代理框架，通过将结构化视觉逆向工程为可执行代码并进行迭代验证与优化，显著提升了多模态大语言模型在图表和几何等视觉推理任务中的精确性与可验证性。

Junhong Shen, Mu Cai, Bo Hu, Ameet Talwalkar, David A Ross, Cordelia Schmid, Alireza Fathi2026-03-11🤖 cs.AI

REAP the Experts: Why Pruning Prevails for One-Shot MoE compression

该论文提出了一种名为 REAP 的基于路由器门控值与专家激活范数的剪枝方法，证明在生成式任务中，相较于专家合并，剪枝策略能避免路由控制丢失带来的不可约误差，从而在大规模稀疏混合专家（SMoE）模型压缩中实现更优甚至无损的性能。

Mike Lasby, Ivan Lazarevich, Nish Sinnadurai, Sean Lie, Yani Ioannou, Vithursan Thangarasa2026-03-11🤖 cs.AI

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

本文提出了名为 RL-100 的实世界机器人强化学习框架，该框架基于扩散视觉运动策略，通过统一模仿学习与强化学习并结合一致性蒸馏技术，在八个多样化的真实机器人任务中实现了 100% 的成功率，展现出卓越的零样本泛化能力、抗扰动鲁棒性及与人类专家相当甚至更优的操作效率。

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe Xu2026-03-11🤖 cs.AI

Bradley-Terry Policy Optimization for Generative Preference Modeling

该论文针对将思维链推理引入基于人类偏好的生成式建模时面临的优化挑战，提出了一种名为 Bradley-Terry 策略优化（BTPO）的新方法，通过推导一致的蒙特卡洛梯度估计器，实现了在不可验证任务中稳定且高效的模型训练，并在多个基准测试中优于现有启发式方法。

Shengyu Feng, Yun He, Shuang Ma, Beibin Li, Yuanhao Xiong, Songlin Li, Karishma Mandyam, Julian Katz-Samuels, Shengjie Bi, Licheng Yu, Hejia Zhang, Karthik Abinav Sankararaman, Han Fang, Yiming Yang, Manaal Faruqui2026-03-11🤖 cs.LG

Personalized Collaborative Learning with Affinity-Based Variance Reduction

该论文提出了一种名为 AffPCL 的新型个性化协同学习框架，通过精心设计的偏差校正与重要性校正机制，在无需预先知晓系统异质性水平的情况下，实现了从同质环境下的线性加速到异质环境下的独立学习基线之间的自适应平滑过渡，并揭示了即使在高度异质条件下协作仍能获得线性加速的新见解。

Chenyu Zhang, Navid Azizan2026-03-11🤖 cs.LG

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

本文提出了名为 FALCON 的新范式，通过利用空间基础模型从 RGB 图像中提取丰富的 3D 几何先验并注入动作头，有效弥补了现有视觉 - 语言 - 动作模型在空间推理上的不足，从而在仿真和真实世界任务中实现了超越基线的状态-of-the-art 性能。

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan Zhou2026-03-11🤖 cs.AI

GraphKeeper: Graph Domain-Incremental Learning via Knowledge Disentanglement and Preservation

本文提出了 GraphKeeper，一种通过知识解耦与保留机制解决图领域增量学习中嵌入偏移和决策边界偏差问题的新方法，在实现 negligible 遗忘的同时显著提升了现有图基础模型在多领域场景下的性能。

Zihao Guo, Qingyun Sun, Ziwei Zhang, Haonan Yuan, Huiping Zhuang, Xingcheng Fu, Jianxin Li2026-03-11🤖 cs.AI

Structured Matrix Scaling for Multi-Class Calibration

该论文提出了一种基于结构化正则化、鲁棒预处理和高效优化的多类校准方法，通过扩展逻辑回归参数化重校准函数，有效解决了复杂模型在有限校准数据下的过拟合问题，从而显著提升了校准性能并提供了开源实现。

Eugène Berta, David Holzmüller, Michael I. Jordan, Francis Bach2026-03-11🤖 cs.AI