Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models

该论文指出大推理模型在强化学习后训练中出现了探索崩溃现象,并提出了无需额外训练或参数的“潜在探索解码”(LED)方法,通过聚合中间层后验分布并选择熵最大的深度配置,有效提升了模型在多个推理基准上的准确率。

Wenhui Tan, Fiorenzo Parascandolo, Enver Sangineto, Jianzhong Ju, Zhenbo Luo, Qian Cao, Rita Cucchiara, Ruihua Song, Jian Luan2026-03-09🤖 cs.LG

Validating Interpretability in siRNA Efficacy Prediction: A Perturbation-Based, Dataset-Aware Protocol

该论文提出了一种基于扰动和数据集感知的验证协议,用于在 siRNA 疗效预测中评估可解释性(显著性图)的可靠性,揭示了现有模型在跨数据集部署时可能存在的“忠实但错误”或“显著性倒置”等失效模式,并引入生物先验正则化(BioPrior)以增强显著性图的忠实度,从而为解释引导的治疗设计确立了必要的预部署验证实践。

Zahra Khodagholi, Niloofar Yousefi2026-03-09🤖 cs.LG

Towards Autonomous Mathematics Research

本文介绍了名为 Aletheia 的自主数学研究智能体,它通过结合先进推理模型、推理时扩展定律及工具使用能力,实现了从奥林匹克竞赛题到生成无人类干预研究论文、证明新定理及解决开放问题等里程碑式的 AI 辅助数学研究突破。

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

本文介绍了 MiDAS,这是一个开源且与平台无关的多模态数据采集系统,它能够在无需专有机器人接口的情况下,通过非侵入式方式实现手术机器人(如 Raven-II 和 da Vinci Xi)的时间同步多模态数据采集,并发布了包含疝修补缝合任务的首个多模态数据集。

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

GaiaFlow 是一个创新的语义引导扩散微调框架,它通过结合检索引导的朗之万动力学、硬件无关性能建模、自适应早退机制及精度感知量化推理,在保持检索精度的同时显著降低了大规模神经搜索系统的碳足迹,实现了效果与能效的卓越平衡。

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon Fong2026-03-09🤖 cs.LG

MolCrystalFlow: Molecular Crystal Structure Prediction via Flow Matching

本文提出了 MolCrystalFlow,这是一种基于流匹配的生成模型,通过将分子视为刚体并在黎曼流形上联合学习晶格、取向和质心位置,成功解决了分子晶体结构预测中分子内复杂性与分子间堆积的解耦难题,为数据驱动的分子晶体发现开辟了新途径。

Cheng Zeng, Harry W. Sullivan, Thomas Egg, Maya M. Martirossyan, Philipp Höllmer, Jirui Jin, Richard G. Hennig, Adrian Roitberg, Stefano Martiniani, Ellad B. Tadmor, Mingjie Liu2026-03-09🔬 cond-mat.mtrl-sci

The Limits of Long-Context Reasoning in Automated Bug Fixing

该论文通过系统性评估发现,尽管大语言模型在智能体工作流中表现出较强的代码修复能力,但这主要源于任务分解而非真正的长上下文推理,当面对 64k 真实长上下文时,模型性能显著下降并出现系统性错误,揭示了当前模型名义上下文长度与实际可用推理能力之间存在巨大差距。

Ravi Raju, Mengmeng Ji, Shubhangi Upasani, Bo Li, Urmish Thakker2026-03-09🤖 cs.LG

Conditionally Site-Independent Neural Evolution of Antibody Sequences

本文提出了 CoSiNE 模型,通过结合深度神经网络的表达能力与连续时间马尔可夫链的进化动力学,有效捕捉抗体序列中的上位效应并解耦选择与体细胞高频突变,从而在零样本变异效应预测及针对特定抗原的亲和力优化任务中超越了现有语言模型。

Stephen Zhewen Lu, Aakarsh Vermani, Kohei Sanno, Jiarui Lu, Frederick A Matsen, Milind Jagota, Yun S. Song2026-03-09🤖 cs.LG

What Topological and Geometric Structure Do Biological Foundation Models Learn? Evidence from 141 Hypotheses

该研究通过 AI 驱动的自主大规模假设筛选,证实了生物基础模型(如 scGPT 和 Geneformer)在单细胞基因表达数据中确实学习到了具有生物学意义的非平凡几何与拓扑结构,且这种结构在不同独立训练的模型间表现出全局一致性,但在不同组织类型中的信号强度存在显著差异。

Ihor Kendiukhov2026-03-09🤖 cs.LG