cs.LG 篇论文 | Gist.Science

Efficient Generative Modeling with Unitary Matrix Product States Using Riemannian Optimization

本文提出了一种基于黎曼优化的单位矩阵乘积态（Unitary MPS）生成建模方法，通过引入流形约束和空间解耦算法，有效解决了传统梯度下降训练中的效率与歧义问题，并在多个数据集上实现了快速适应、稳定更新及优异的性能表现。

Haotong Duan, Zhongming Chen, Ngai Wong2026-03-13🤖 cs.LG

AGMARL-DKS: An Adaptive Graph-Enhanced Multi-Agent Reinforcement Learning for Dynamic Kubernetes Scheduling

本文提出了 AGMARL-DKS，一种结合图神经网络与多智能体强化学习的自适应 Kubernetes 调度器，通过去中心化协作、全局状态感知及压力感知的词典序策略，显著提升了大规模异构集群在容错性、资源利用率和成本方面的调度性能。

Hamed Hamzeh2026-03-13🤖 cs.LG

Frequentist Consistency of Prior-Data Fitted Networks for Causal Inference

该论文指出先验数据拟合网络（PFN）作为因果推断估计量时存在先验诱导的偏差导致其缺乏频率学派一致性，并提出了一种基于一步后验校正（OSPC）和鞅后验的校准方法，成功恢复了估计量的频率学派一致性并实现了与经典半参数有效估计量渐近等价的分布收敛。

Valentyn Melnychuk, Vahid Balazadeh, Stefan Feuerriegel, Rahul G. Krishnan2026-03-13🤖 cs.LG

Slow-Fast Inference: Training-Free Inference Acceleration via Within-Sentence Support Stability

该论文提出了一种无需训练的“慢 - 快”推理框架（SFI），利用句子内注意力支持稳定性的观察，通过交替执行低成本的快速解码步和触发于语义边界的慢速重算步，在保持生成质量的同时显著提升了长上下文及长思维链场景下的推理吞吐量。

Xingyu Xie, Zhaochen Yu, Yue Liao, Tao Wang, Kim-Chuan Toh, Shuicheng Yan2026-03-13🤖 cs.LG

Continual Learning with Vision-Language Models via Semantic-Geometry Preservation

该论文针对预训练视觉语言模型在持续学习中因跨模态语义几何失真导致的灾难性遗忘问题，提出了一种无需示例的 SeGP-CL 方法，通过构建对抗锚点探测漂移区域、实施锚点引导的几何蒸馏及文本语义正则化，有效保持了模型的语义几何结构并实现了最先进的性能。

Chiyuan He, Zihuan Qiu, Fanman Meng, Runtong Zhang, Linfeng Xu, Qingbo Wu, Hongliang Li2026-03-13🤖 cs.LG

Chemical Reaction Networks Learn Better than Spiking Neural Networks

该论文通过数学证明和数值实验表明，无隐藏层的化学反应网络在分类任务（如手写数字识别）上比需要隐藏层的脉冲神经网络具有更高的学习效率和准确性，并提供了相应的理论界限分析。

Sophie Jaffard, Ivo F. Sbalzarini2026-03-13📊 stat

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

该论文提出了一种基于时序卷积网络（TCN）的多标签深度学习框架，通过同时预测多个转录因子在 DNA 序列上的结合位点，有效捕捉了转录因子间的协同调控机制并揭示了具有生物学意义的共结合模式。

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

Cross-Domain Policy Optimization via Bellman Consistency and Hybrid Critics

该论文针对跨域强化学习中状态/动作空间不匹配及迁移性难以预判的两大挑战，提出了基于跨域贝尔曼一致性和混合评论家的 $Q$ Avatar 方法，通过自适应融合源域与目标域的 Q 函数，实现了无需超参数调节的可靠知识迁移，并在多种机器人任务中验证了其优越性。

Ming-Hong Chen, Kuan-Chen Pan, You-De Huang, Xi Liu, Ping-Chun Hsieh2026-03-13🤖 cs.LG

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

该论文提出了一种基于大语言模型（LLM）的闭环迭代神经架构搜索（NAS）方法，通过引入包含诊断三元组的反馈记忆机制和双模型分工策略，在单张消费级 GPU 上无需微调 LLM 即可高效搜索出适用于边缘部署的紧凑图像分类模型。

Xiaojie Gu, Dmitry Ignatov, Radu Timofte2026-03-13🤖 cs.LG

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

本文提出了一种基于 Wasserstein 梯度流的新型批量贝叶斯最优实验设计方法，通过将优化问题提升至概率测度空间并引入熵正则化，利用粒子算法有效解决了高维非凸批量设计中的优化难题。

Louis Sharrock2026-03-13📊 stat

Taming the Adversary: Stable Minimax Deep Deterministic Policy Gradient via Fractional Objectives

本文提出了一种名为 MMDDPG 的框架，通过引入平衡任务性能与干扰强度的分数目标函数，将训练过程构建为用户策略与对抗干扰策略之间的极小极大优化问题，从而在 MuJoCo 连续控制任务中实现了对外部扰动和模型不确定性的显著鲁棒性提升。

Taeho Lee, Donghwan Lee2026-03-13🤖 cs.LG

Cornserve: A Distributed Serving System for Any-to-Any Multimodal Models

Cornserve 是一个基于 Kubernetes 的分布式服务系统，旨在通过灵活的任务抽象、组件解耦及高效的记录与重放执行模型，解决 Any-to-Any 多模态模型在服务中因路径差异和扩展特性不同而面临的挑战，从而显著提升吞吐量并降低尾延迟。

Jae-Won Chung, Jeff J. Ma, Jisang Ahn, Yizhuo Liang, Akshay Jajoo, Myungjin Lee, Mosharaf Chowdhury2026-03-13🤖 cs.LG

Hoi3DGen: Generating High-Quality Human-Object-Interactions in 3D

该论文提出了 Hoi3DGen 框架，通过利用多模态大语言模型构建高质量交互数据并建立完整的文本到 3D 生成流程，实现了在严格遵循文本描述的同时生成高保真、无 Janus 问题的人 - 物交互 3D 纹理网格，其文本一致性和模型质量显著优于现有基线方法。

Agniv Sharma, Xianghui Xie, Tom Fischer, Eddy Ilg, Gerard Pons-Moll2026-03-13🤖 cs.LG

Automatic Generation of High-Performance RL Environments

该论文提出了一套包含通用提示模板、分层验证和迭代修复的自动化方法，能够以极低的计算成本将复杂的强化学习环境高效转化为高性能实现，并在多个案例中实现了显著的速度提升与语义等价性验证。

Seth Karten, Rahul Dev Appapogu, Chi Jin2026-03-13🤖 cs.LG

FlashMotion: Few-Step Controllable Video Generation with Trajectory Guidance

FlashMotion 提出了一种结合轨迹适配器预训练、生成器蒸馏及混合策略微调的新框架，旨在解决现有轨迹可控视频生成方法在加速至少步生成时质量与精度下降的问题，并显著提升了生成视频的视觉质量与轨迹一致性。

Quanhao Li, Zhen Xing, Rui Wang, Haidong Cao, Qi Dai, Daoguo Dong, Zuxuan Wu2026-03-13🤖 cs.LG

IsoCompute Playbook: Optimally Scaling Sampling Compute for LLM RL

该论文研究了大语言模型强化学习后训练中采样算力的最优分配策略，发现并行rollout数量随算力预算增加而饱和，且针对难易问题分别通过“解锐化”和“覆盖扩展”机制发挥作用，从而为高效RL训练提供了可操作的算力分配规则。

Zhoujun Cheng, Yutao Xie, Yuxiao Qu, Amrith Setlur, Shibo Hao, Varad Pimpalkhute, Tongtong Liang, Feng Yao, Zhengzhong Liu, Eric Xing, Virginia Smith, Ruslan Salakhutdinov, Zhiting Hu, Taylor Killian, Aviral Kumar2026-03-13🤖 cs.LG

A Quantitative Characterization of Forgetting in Post-Training

该论文基于双模态混合抽象，从理论上量化了生成模型持续后训练中的遗忘现象，揭示了前向与反向 KL 散度在质量遗忘和旧分量漂移上的不同机制，并阐明了重放策略及现有近于策略方法如何受散度方向、几何重叠度及采样机制的影响。

Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan2026-03-13📊 stat

Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials

该论文提出了“可携带证明材料”（PCM）框架，通过对抗性证伪、统计置信包络和形式化验证，解决了机器学习势函数在材料筛选中可靠性缺失的问题，显著提升了稳定材料的发现率并实现了跨架构的失效预测。

Abhinaba Basu, Pavan Chakraborty2026-03-13🔬 cond-mat.mtrl-sci

IndexCache: Accelerating Sparse Attention via Cross-Layer Index Reuse

该论文提出了 IndexCache 方法，通过跨层复用稀疏注意力索引来消除 DeepSeek 稀疏注意力（DSA）中索引器的冗余计算，在无需训练或轻量级蒸馏的情况下，成功在 30B 模型上减少了 75% 的索引计算量并显著提升了推理速度，同时保持了模型质量。

Yushi Bai, Qian Dong, Ting Jiang, Xin Lv, Zhengxiao Du, Aohan Zeng, Jie Tang, Juanzi Li2026-03-13💬 cs.CL

HiAP: A Multi-Granular Stochastic Auto-Pruning Framework for Vision Transformers

本文提出了 HiAP 框架，通过引入多粒度的随机门控机制，在单次端到端训练中自动发现兼顾计算与内存效率的 Vision Transformer 最优子网络，从而在无需复杂多阶段流程或人工启发式规则的情况下，实现了精度与效率的卓越平衡。

Andy Li, Aiden Durrant, Milan Markovic, Georgios Leontidis2026-03-13🤖 cs.LG