cs.LG 篇论文 | Gist.Science

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

该论文提出了 FireScope 框架及 FireScope-Bench 基准，通过结合视觉监督与强化学习的思维链推理机制，实现了跨大陆的高分辨率野火风险预测，显著提升了模型的泛化能力与可解释性。

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

EgoCogNav: Cognition-aware Human Egocentric Navigation

该论文提出了名为 EgoCogNav 的多模态第一人称导航框架，通过引入感知路径不确定性作为潜在状态来融合场景特征与感官线索，并发布了包含真实世界导航行为的 CEN 数据集，从而实现了对人类扫描、犹豫及回溯等认知行为的高度拟真预测。

Zhiwen Qiu, Ziang Liu, Wenqian Niu, Tapomayukh Bhattacharjee, Saleh Kalantari2026-03-09🤖 cs.LG

SPINE: Token-Selective Test-Time Reinforcement Learning with Entropy-Band Regularization

本文提出了 SPINE，一种无需标签的测试时强化学习框架，它通过仅更新决定推理分支的关键高熵令牌并施加熵带正则化，有效解决了现有方法在测试时因分布偏移导致的响应缩短和性能下降问题，从而在多种大模型上实现了更稳定且高效的推理能力。

Jianghao Wu, Yasmeen George, Jin Ye, Yicheng Wu, Daniel F. Schmidt, Jianfei Cai2026-03-09🤖 cs.LG

DAISI: Data Assimilation with Inverse Sampling using Stochastic Interpolants

本文提出了 DAISI，一种基于流生成模型的可扩展数据同化算法，它通过结合新颖的逆采样步骤与基于引导的条件采样，利用数据驱动的先验在无需重训练的情况下有效处理非线性、稀疏且含噪的观测数据，从而克服了传统高维数据同化方法对高斯近似的依赖。

Martin Andrae, Erik Larsson, So Takao, Tomas Landelius, Fredrik Lindsten2026-03-09🤖 cs.LG

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

该论文提出了软 Q 函数重参数化策略梯度扩散微调（SQDF）方法，通过引入折扣因子、一致性模型集成及离线回放缓冲区等创新，有效解决了扩散模型微调中的奖励过优化问题，在提升目标奖励的同时保持了样本的多样性与自然性。

Hyeongyu Kang, Jaewoo Lee, Woocheol Shin, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.AI

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

该论文指出强化学习导致大语言模型推理多样性下降的根源在于其隐式优化了“零强制”反向 KL 散度，并提出了一种基于 $\alpha$ -散度族的新方法，通过显式构建目标分布并调节精度与多样性的权衡，在 Lean 定理证明基准上实现了覆盖率和精度的最优平衡。

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

该论文提出了 A-3PO 方法，通过用简单插值替代显式计算来近似异步强化学习训练中的近端策略，从而在保持性能的同时消除了额外前向传播开销，使大语言模型训练速度提升了 1.8 倍。

Xiaocan Li, Shiliang Wu, Zheng Shen2026-03-09🤖 cs.AI

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

本文提出了 DFIR-DETR，一种通过动态内容特征聚合（DCFA）、动态特征金字塔网络（DFPN）和频域迭代细化模块（FIRC3）来分别解决注意力分配不均、上采样细节丢失及高频边缘平滑问题的 Transformer 检测器，在 NEU-DET 和 VisDrone 数据集上以轻量级架构实现了显著的小目标检测性能提升。

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

Two-dimensional RMSD projections for reaction path visualization and validation

该论文提出了一种基于置换校正均方根偏差（RMSD）的二维投影方法，结合高斯过程能量插值，将高维反应路径映射为可视化的能量曲面，从而克服了传统一维轨迹分析的局限性，实现了对不同优化历史及复杂反应路径的有效比较与验证。

Rohit Goswami2026-03-09🔬 cond-mat.mtrl-sci

Uncertainty-Aware Subset Selection for Robust Visual Explainability under Distribution Shifts

该论文针对现有基于子集选择的视觉解释方法在分布外（OOD）场景下可靠性下降的问题，提出了一种结合子模优化与不确定性估计的无训练框架，通过自适应权重扰动引导子集选择，显著提升了模型在分布偏移下的鲁棒性与解释忠实度。

Madhav Gupta, Vishak Prasad C, Ganesh Ramakrishnan2026-03-09🤖 cs.LG

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

本文提出了一种基于个体条件期望（ICE）曲线的全局敏感性分析方法，通过计算 ICE 曲线的期望特征重要性及其标准差来有效捕捉输入变量间的交互作用，克服了传统偏依赖图（PDP）在强交互场景下因平均化效应而掩盖交互信息的局限，并通过数学证明和多个工程算例验证了该方法在揭示数据驱动模型特征重要性方面的优越性。

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

A Novel Patch-Based TDA Approach for Computed Tomography Imaging

本文提出了一种针对 CT 影像的新型基于补丁的拓扑数据分析（TDA）方法，通过构建持久同调特征，在分类性能（如准确率、AUC 等指标平均提升 2.7% 至 8.0%）和计算效率上均显著优于传统的 3D 立方复形算法及放射组学特征，并发布了配套的 Python 工具包 Patch-TDA。

Dashti A. Ali, Aras T. Asaad, Jacob J. Peoples, Mohammad Hamghalam, Natalie Gangai, Richard K. G. Do, Alice C. Wei, Amber L. Simpson2026-03-09🤖 cs.LG

Understanding and Improving Hyperbolic Deep Reinforcement Learning

该论文通过深入分析双曲几何中梯度优化失败的根本原因，提出了包含特征正则化、分类价值损失及优化友好型网络层的新算法 Hyper++，从而在 ProcGen 和 Atari-5 等基准测试中实现了比现有双曲及欧几里得方法更稳定、高效且性能更优的强化学习训练。

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

本文提出了 CARE（对比锚定反思）框架，通过结合锚定对比目标与反思引导重采样技术，将多模态推理中的失败案例转化为有效监督信号，从而在无需测试时反思的情况下显著提升模型准确率与训练稳定性。

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

该论文提出了首个针对动态图时序模式分析的LLM基准LLMTM，并设计了一种结合工具增强智能体与结构感知调度器的框架，在显著降低计算成本的同时实现了高精度的时序模式分析。

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Bayesian Monocular Depth Refinement via Neural Radiance Fields

本文提出了名为 MDENeRF 的迭代框架，通过贝叶斯融合将单目深度估计的全局结构与基于神经辐射场（NeRF）的体渲染不确定性所提取的高频几何细节相结合，从而有效提升了室内场景的深度图精细度。

Arun Muthukkumar2026-03-09🤖 cs.LG

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

该论文提出了一种无需显式噪声掩码的端到端音频 - 视觉语音识别框架，通过基于 Conformer 的瓶颈融合模块利用视觉线索隐式增强含噪音频特征，从而在保留语音语义完整性的同时提升了噪声环境下的识别鲁棒性。

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI

Beyond Mapping : Domain-Invariant Representations via Spectral Embedding of Optimal Transport Plans

该论文提出了一种通过谱嵌入将平滑的最优传输计划解释为二分图邻接矩阵的方法，以学习域不变表示，从而有效解决分布偏移问题，并在音乐识别与电缆缺陷检测等多个任务中取得了优异性能。

Abdel Djalil Sad Saoud, Fred Maurice Ngolè Mboula, Hanane Slimani2026-03-09🤖 cs.LG

Laser interferometry as a robust neuromorphic platform for machine learning

该论文提出了一种仅利用线性光学资源（场位移和干涉）实现光学神经网络的鲁棒方法，通过将非线性编码至输入相位中简化了实验实现，并支持基于参数移位或物理反向传播的在位训练，同时展现出对光子损耗的高度鲁棒性。

Amanuel Anteneh, Kyungeun Kim, J. M. Schwarz, Israel Klich, Olivier Pfister2026-03-09🔬 physics.optics

Neural Signals Generate Clinical Notes in the Wild

该论文提出了首个临床脑电到语言的基础模型 CELM，利用包含近万份报告的大规模数据集，实现了从长时程、变长脑电记录到多维度临床报告的端到端自动生成，并在标准生成指标上取得了显著性能提升。

Jathurshan Pradeepkumar, Zheng Chen, Jimeng Sun2026-03-09🤖 cs.AI