Type-Aware Retrieval-Augmented Generation with Dependency Closure for Solver-Executable Industrial Optimization Modeling

本文提出了一种结合类型感知检索增强生成与依赖闭包机制的新方法,通过构建包含数学依赖关系的领域知识图谱,确保大语言模型能够准确生成可执行的工业优化代码,从而有效解决了传统方法因类型不一致和依赖缺失导致的模型不可编译问题。

Y. Zhong, R. Huang, M. Wang + 4 more2026-03-04💬 cs.CL

Learning When to Act or Refuse: Guarding Agentic Reasoning Models for Safe Multi-Step Tool Use

本文提出了名为 MOSAIC 的后训练框架,通过引入显式的安全推理与拒绝机制,并利用基于偏好的强化学习进行优化,有效解决了代理语言模型在多步工具使用场景下的安全风险,在显著降低有害行为、提升对注入攻击的拒绝率及防止隐私泄露的同时,保持了良性任务的性能。

Aradhye Agarwal, Gurdit Siyan, Yash Pandya + 3 more2026-03-04💬 cs.CL

Polynomial, trigonometric, and tropical activations

本文提出了一种基于正交基(包括埃尔米特多项式、傅里叶三角函数及热带化多项式)的激活函数族,通过简单的方差保持初始化成功解决了深度模型中的激活与梯度爆炸/消失问题,实现了在 GPT-2 和 ConvNeXt 等大规模任务上的有效训练,并揭示了多项式激活网络的代数结构及其在微调任务中通过埃尔米特插值逼近经典激活函数的潜力。

Ismail Khalfaoui-Hassani, Stefan Kesselheim2026-03-03💬 cs.CL