Agents Learn Their Runtime: Interpreter Persistence as Training-Time Semantics
该论文通过引入“不透明背包”任务并控制变量实验,揭示了代码代理在训练时是否保留解释器状态会显著影响其推理效率与稳定性(而非最终解的质量),从而主张应将解释器持久性视为代理训练数据的一等语义属性,以确保训练与部署环境的一致性。
7012 篇论文
该论文通过引入“不透明背包”任务并控制变量实验,揭示了代码代理在训练时是否保留解释器状态会显著影响其推理效率与稳定性(而非最终解的质量),从而主张应将解释器持久性视为代理训练数据的一等语义属性,以确保训练与部署环境的一致性。
本文提出了 ToolRLA,一种通过引入涵盖格式、工具选择、参数及合规性四维的乘性奖励分解机制,并结合 SFT-GRPO-DPO 三阶段训练流程,显著提升了金融领域工具集成代理在任务完成率、错误率及合规性方面的表现。
本文提出了 FreeAct 框架,通过利用激活值的秩亏特性解耦权重与激活的变换,为不同 token 类型分配动态变换矩阵,从而在扩散和多模态大语言模型中显著提升了量化性能。
本文首次系统审计了声称提供官方大模型服务的“影子 API",揭露了其中普遍存在的欺骗行为(如性能偏差高达 47.21%、安全行为不可预测及身份验证失败),并指出这些虚假服务严重损害了学术研究的复现性与有效性、用户利益及官方模型提供商的声誉。
本文提出了名为 MatRIS 的不变性机器学习原子间势模型,该模型通过引入具有线性复杂度的可分离注意力机制来高效建模三体相互作用,在保持与领先等变模型相当精度的同时显著降低了计算成本。
该论文针对现有指令驱动视频编辑方法在视觉控制精度上的不足,提出了一种利用图像生成模型构建大规模参考数据集(RefVIE)的可扩展数据生成流程,并设计了结合可学习查询与潜在视觉特征的统一架构 Kiwi-Edit,通过多阶段训练显著提升了视频编辑的指令遵循能力与参考保真度,确立了新的最先进水平。
本文提出了名为 IoUCert 的新型形式化验证框架,通过引入坐标变换和最优区间边界传播方法,首次实现了对 SSD、YOLOv2 和 YOLOv3 等基于锚框的目标检测模型在复杂非线性变换及交并比(IoU)指标下的鲁棒性验证。
本文提出了 AOI(自主运维智能)框架,通过结合基于 GRPO 的本地化诊断系统、读写分离的安全执行架构以及失败轨迹闭环演化机制,在保障数据安全与执行权限的前提下,将失败轨迹转化为训练信号,显著提升了大模型代理在自动运维任务中的诊断成功率与泛化能力。
本文提出了 RADAR 框架,通过利用奇异值分解(SVD)构建静态嵌入并采用 Sinkhorn 归一化改进注意力机制,有效解决了现有神经求解器在处理车辆路径问题(VRP)中非对称距离矩阵时泛化能力不足的问题,从而在各类 VRP 任务中实现了优于基线的性能。
该研究提出了一种基于集值集函数的“模板与模块化认知模型”,通过形式化映射机制揭示了包括里夫语在内的跨语言名词动态性别转换及形态句法变异的内在规律,从而挑战并拓展了传统的构词理论。
该研究评估了 11 种通用及教育专用 AI 工具对数学任务认知需求的分类能力,发现其平均准确率仅为 63%,且普遍存在倾向于中间类别、过度依赖表面文本特征而忽视深层认知过程的系统性偏差,表明当前 AI 工具尚不足以直接替代教师进行此类专业判断。
本文提出了一种结合 DMD2 扩散引导分布匹配与解剖结构保持正则化的改进型无配对神经薛定谔桥框架,旨在解决超低场(64 mT)脑 MRI 向 3T 图像翻译中配对数据稀缺的问题,从而在增强图像真实感的同时有效保留解剖结构。
该论文提出了一种结合安全元件、轻量级零知识证明及间歇性同步机制的隐私保护离线央行数字货币模型,旨在解决资源受限物联网设备在离线支付中面临的防双花、隐私保护及身份管理等安全挑战。
该论文指出当前数据难以反映 AI 研发自动化(AIRDA)的真实程度及其对能力与安全的影响,因此提出了一套涵盖资本投入、研究人员时间分配及系统安全事件等维度的新指标体系,建议企业、第三方机构及政府共同追踪这些指标,以更好地评估 AIRDA 的后果、实施安全措施并掌握 AI 发展节奏。
该论文由一名独立研究者以极低预算完成,首次系统评估了六种先进后训练量化方法在波兰语 110 亿参数大模型 Bielik 上的 2 比特极端量化效果,发现 QuIP# 方法在保持基准性能的同时显著提升了推理能力,并揭示了旋转类方法在自回归生成中存在的严重失效现象。
本文介绍了 FinRetrieval 基准,该基准通过 500 个金融检索问题评估了 AI 代理从结构化数据库中提取数值的能力,揭示了工具可用性对性能的决定性影响,并发现推理模式的效果取决于基础能力而非推理本身,同时指出了地理命名惯例带来的性能差异。
该研究提出“语义锚定”方法,利用语言作为稳定坐标系统来纠正跨物种病理模型中因物种主导对齐导致的语义崩溃,从而在无需重新训练的情况下显著提升了跨癌种和跨物种的癌症检测性能。
本文提出了一种名为 CTRL-RAG 的新框架,通过引入基于对比似然奖励(CLR)的“内外混合”奖励机制,直接优化模型在有证和无证条件下的对数似然差距,从而有效解决了现有 RAG 强化学习方法在文档忠实度评估和自奖励机制方面的不足,显著提升了模型在不同场景下的上下文忠实推理能力。
该研究通过仅在纯有害数据上微调模型,证明了语义触发器本身即可诱导模型产生无需良性数据对比的“语义隔离”现象,揭示了任何带有语境框架的有害微调都会造成标准评估无法发现的潜在安全漏洞。
本文提出了名为 HUMAINE 的框架,通过收集来自 23,404 名跨越 22 个不同人口统计群体的参与者所进行的自然对话,利用分层贝叶斯模型对 28 个先进大语言模型进行了多维度、人口统计感知的评估,揭示了模型性能的整体层级、年龄等人口因素导致的显著偏好差异以及不同评估维度间判别力的巨大悬殊。