Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

该论文针对现实环境中普遍存在的对称性破缺问题,提出了部分群不变 MDP(PI-MDP)框架及相应的部分等变强化学习算法(PE-DQN 和 PE-SAC),通过根据对称性是否成立选择性地应用等变或标准贝尔曼备份,有效抑制了局部对称性破缺导致的误差传播,从而显著提升了强化学习的样本效率与泛化能力。

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG

A scalable and real-time neural decoder for topological quantum codes

该论文介绍了 AlphaQubit 2,这是一种基于神经网络的解码器,能够在商用加速器上实现微秒级实时解码,并在大规模下为表面码和色码提供近最优的逻辑错误率,从而显著提升了色码的解码速度并确立了通往高容错量子计算的可行路径。

Andrew W. Senior, Thomas Edlich, Francisco J. H. Heras, Lei M. Zhang, Oscar Higgott, James S. Spencer, Taylor Applebaum, Sam Blackwell, Justin Ledford, Akvil\.e Žemgulyt\.e, Augustin Žídek, Noah Shutty, Andrew Cowie, Yin Li, George Holland, Peter Brooks, Charlie Beattie, Michael Newman, Alex Davies, Cody Jones, Sergio Boixo, Hartmut Neven, Pushmeet Kohli, Johannes Bausch2026-03-12⚛️ quant-ph

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

本文提出了名为 Trio 的分子生成框架,通过整合片段式分子语言模型、强化学习与蒙特卡洛树搜索,实现了兼具可解释性、合成可行性与高结合亲和力的闭环靶向分子设计,显著优于现有最先进方法并大幅拓展了化学空间多样性。

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI

Pretrained battery transformer (PBT): A foundation model for universal battery life prediction

该论文提出了首个电池寿命预测基础模型“预训练电池 Transformer(PBT)”,它通过融合电池知识的混合专家层从异构数据中学习可迁移表征,在涵盖多种离子电池和老化条件的广泛测试中显著超越了现有最先进方法,为数据稀缺领域的通用寿命预测系统提供了可扩展的解决方案。

Ruifeng Tan, Weixiang Hong, Jia Li, Jiaqiang Huang, Tong-Yi Zhang2026-03-12🤖 cs.LG

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

该研究提出了一种名为 PanSubNet 的可解释深度学习框架,能够直接从常规 H&E 染色病理切片中准确预测胰腺导管腺癌的临床相关分子亚型,从而克服了传统基因检测成本高、耗时长等局限,为精准医疗提供了快速且可部署的解决方案。

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan Niazi2026-03-12⚡ eess

Sampling via Stochastic Interpolants by Langevin-based Velocity and Initialization Estimation in Flow ODEs

该论文提出了一种基于线性随机插值的概率流常微分方程的采样新方法,通过利用朗之万采样器高效生成中间分布样本并构建速度场估计器,实现了对未归一化玻尔兹曼分布的有效采样,并在理论上证明了收敛性,在数值实验中展现了处理高维多模态分布及贝叶斯推断任务的高效性。

Chenguang Duan, Yuling Jiao, Gabriele Steidl, Christian Wald, Jerry Zhijian Yang, Ruizhe Zhang2026-03-12📊 stat