FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

该论文提出了 FireScope 框架及 FireScope-Bench 基准,通过结合视觉监督与强化学习的思维链推理机制,实现了跨大陆的高分辨率野火风险预测,显著提升了模型的泛化能力与可解释性。

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

SPINE: Token-Selective Test-Time Reinforcement Learning with Entropy-Band Regularization

本文提出了 SPINE,一种无需标签的测试时强化学习框架,它通过仅更新决定推理分支的关键高熵令牌并施加熵带正则化,有效解决了现有方法在测试时因分布偏移导致的响应缩短和性能下降问题,从而在多种大模型上实现了更稳定且高效的推理能力。

Jianghao Wu, Yasmeen George, Jin Ye, Yicheng Wu, Daniel F. Schmidt, Jianfei Cai2026-03-09🤖 cs.LG

DAISI: Data Assimilation with Inverse Sampling using Stochastic Interpolants

本文提出了 DAISI,一种基于流生成模型的可扩展数据同化算法,它通过结合新颖的逆采样步骤与基于引导的条件采样,利用数据驱动的先验在无需重训练的情况下有效处理非线性、稀疏且含噪的观测数据,从而克服了传统高维数据同化方法对高斯近似的依赖。

Martin Andrae, Erik Larsson, So Takao, Tomas Landelius, Fredrik Lindsten2026-03-09🤖 cs.LG

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

该论文指出强化学习导致大语言模型推理多样性下降的根源在于其隐式优化了“零强制”反向 KL 散度,并提出了一种基于α\alpha-散度族的新方法,通过显式构建目标分布并调节精度与多样性的权衡,在 Lean 定理证明基准上实现了覆盖率和精度的最优平衡。

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

本文提出了 DFIR-DETR,一种通过动态内容特征聚合(DCFA)、动态特征金字塔网络(DFPN)和频域迭代细化模块(FIRC3)来分别解决注意力分配不均、上采样细节丢失及高频边缘平滑问题的 Transformer 检测器,在 NEU-DET 和 VisDrone 数据集上以轻量级架构实现了显著的小目标检测性能提升。

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

本文提出了一种基于个体条件期望(ICE)曲线的全局敏感性分析方法,通过计算 ICE 曲线的期望特征重要性及其标准差来有效捕捉输入变量间的交互作用,克服了传统偏依赖图(PDP)在强交互场景下因平均化效应而掩盖交互信息的局限,并通过数学证明和多个工程算例验证了该方法在揭示数据驱动模型特征重要性方面的优越性。

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

A Novel Patch-Based TDA Approach for Computed Tomography Imaging

本文提出了一种针对 CT 影像的新型基于补丁的拓扑数据分析(TDA)方法,通过构建持久同调特征,在分类性能(如准确率、AUC 等指标平均提升 2.7% 至 8.0%)和计算效率上均显著优于传统的 3D 立方复形算法及放射组学特征,并发布了配套的 Python 工具包 Patch-TDA。

Dashti A. Ali, Aras T. Asaad, Jacob J. Peoples, Mohammad Hamghalam, Natalie Gangai, Richard K. G. Do, Alice C. Wei, Amber L. Simpson2026-03-09🤖 cs.LG

Understanding and Improving Hyperbolic Deep Reinforcement Learning

该论文通过深入分析双曲几何中梯度优化失败的根本原因,提出了包含特征正则化、分类价值损失及优化友好型网络层的新算法 Hyper++,从而在 ProcGen 和 Atari-5 等基准测试中实现了比现有双曲及欧几里得方法更稳定、高效且性能更优的强化学习训练。

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

该论文提出了一种无需显式噪声掩码的端到端音频 - 视觉语音识别框架,通过基于 Conformer 的瓶颈融合模块利用视觉线索隐式增强含噪音频特征,从而在保留语音语义完整性的同时提升了噪声环境下的识别鲁棒性。

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI