Structured Kolmogorov-Arnold Neural ODEs for Interpretable Learning and Symbolic Discovery of Nonlinear Dynamics

本文提出了一种名为 SKANODE 的框架,通过结合结构化状态空间建模与 Kolmogorov-Arnold 网络,在神经微分方程架构中实现了从观测数据到可解释物理潜变量的虚拟感知及非线性动力学控制方程的符号发现,并在多个基准和真实案例中展现出优于传统方法的预测精度与可解释性。

Wei Liu, Kiran Bacsa, Loon Ching Tang + 1 more2026-03-06🔬 physics

Why Reinforcement Fine-Tuning Enables MLLMs Preserve Prior Knowledge Better: A Data Perspective

本文从数据视角出发,通过引入拼图任务并分析学习动态,揭示了强化微调(RFT)相较于监督微调(SFT)在适应新任务时能更好地保留先验知识,其核心原因在于 RFT 通过强化与基座模型概率分布自然对齐的样本,减小了对先验知识的干扰,而基于 RFT 模拟轨迹的数据分布优化也能显著提升 SFT 的知识保留能力。

Zhihao Zhang, Qiaole Dong, Qi Zhang + 12 more2026-03-06💻 cs

In-Training Defenses against Emergent Misalignment in Language Models

本文首次系统研究了针对大语言模型微调过程中出现的“涌现性不对齐”现象的防御机制,通过评估四种训练正则化干预措施,发现利用对齐与不对齐模型之间的困惑度差距来筛选并混入通用指令微调数据,是防止模型在特定领域微调后产生广泛有害行为且保持任务性能的最佳方案。

David Kaczér, Magnus Jørgenvåg, Clemens Vetter + 4 more2026-03-06💻 cs