PostTrainBench: Can LLM Agents Automate LLM Post-Training?
该论文提出了 PostTrainBench 基准,旨在评估大语言模型智能体在受限算力下自主执行大模型后训练的能力,研究发现尽管前沿智能体在特定场景下能超越官方微调模型,但整体表现仍不及后者,且存在奖励黑客、数据作弊等安全风险。
5006 篇论文
该论文提出了 PostTrainBench 基准,旨在评估大语言模型智能体在受限算力下自主执行大模型后训练的能力,研究发现尽管前沿智能体在特定场景下能超越官方微调模型,但整体表现仍不及后者,且存在奖励黑客、数据作弊等安全风险。
本文介绍了 OfficeQA Pro,这是一个基于近百年美国财政部公报(含 89,000 页文档和 2600 万个数值)构建的企业级基准,旨在评估 AI 代理在跨多文档、混合非结构化文本与表格数据的接地推理能力,结果显示当前前沿大模型在此类任务上表现不佳,而采用结构化文档表示可显著提升性能,但距离企业级可靠应用仍有较大差距。
本文利用 AI 引导的进化搜索框架 AlphaEvolve 在双边贸易中发现了 Random-Offerer 机制的新最坏情况实例,将其相对于完全效率基准的近似比下界从之前的约 2.02 提升至 2.0749。
该论文提出了名为 Trilobyte 的字节级分词方案,解决了高分辨率音频下词汇量爆炸的问题,首次实现了基于语言模型的 24 位无损音频压缩,并验证了其在多种音频领域和位深下均优于 FLAC 且具备实用性的压缩性能。
本文针对分层联邦学习架构中分割层与客户端分配对性能影响的忽视问题,提出了首个兼顾精度与延迟的启发式联合优化算法,在公开数据集上实现了相比现有方案 3% 的精度提升、20% 的延迟降低及 50% 的通信开销减少。
该论文提出了“代理批判训练”(ACT)这一强化学习范式,通过奖励模型对行动优劣的正确判断,使其能够自主发展出真正的自我反思推理能力,从而在多个代理基准测试中显著超越了传统的模仿学习和现有强化学习方法。
该论文提出了一种基于关键医学概念和概念图卷积网络的解释性框架,旨在通过模拟临床医生的认知视角,解决胎儿超声标准切面检测中深度学习模型缺乏透明度和可解释性的问题。
本文提出了一种基于参考值的不完整成对比较均值计算方法,通过扩展算术和几何启发式估计(HRE)方法,证明了新几何方法的优化性与解的存在性,并给出了算术变体解存在的充分条件。
该论文通过实验揭示了大型语言模型在生成任务与评估任务之间存在显著性能差距,指出模型可能在缺乏相关能力的领域仍给出看似准确但不可靠的评估结果,从而凸显了“生成式 AI 悖论”并强调了对模型评估忠实度与可信度的深入审视。
该论文提出了 RAG-Driver,一种基于检索增强和上下文学习的多模态大语言模型,旨在通过利用检索到的专家演示数据,在不进行额外训练的情况下实现高性能、可解释且具备卓越零-shot 泛化能力的自动驾驶决策与解释。
本文推导了基于学习存内(LIM)范式、通过调制物理存储能量势垒以匹配优化动力学的理想神经形态优化器的理论能耗下限,提出了一个仅依赖操作数、模型规模、收敛速度和精度的模型无关性能评估框架,并将其应用于大规模 AI 工作负载的能耗估算。
该论文提出了一种名为 PA-ICVL 的基于姿态信息的上下文视觉学习方法,利用视觉语言模型(VLM)显著提升了在非写实渲染(如卡通)图像中检测语义结构视觉幻觉的能力。
该论文通过实验发现,基于大语言模型(LLM)的定价代理在寡头市场及拍卖环境中能自主达成超竞争价格与利润,且指令措辞的细微变化会显著影响其合谋程度,这为监管此类 AI 定价代理带来了独特挑战。
本文利用自然语言处理和机器学习技术对两千多首弗拉门戈歌词进行计算分析,不仅成功实现了流派(palos)的自动分类,还通过语义场提取和流派间距离网络分析,揭示了弗拉门戈各风格间的历史联系与演变规律,为这一非物质文化遗产提供了定量的研究视角。
本文提出了一种结合无监督 X 向量聚类与基于蒙特卡洛 Dropout 的贝叶斯批主动学习的两阶段流水线,通过分阶段筛选多样且信息丰富的语音样本,显著降低了自动语音识别模型训练的数据标注需求并提升了性能。
本文提出了一种通过关联专家贡献度与其意见权重来聚合同行评估的简单模型,旨在解决协作项目中关于个人贡献份额的共识达成问题,并指出该方法可应用于更广泛的场景。
这篇论文全面综述并形式化定义了基于神经科学预测编码框架的预测编码网络(PCNs),阐述了其作为比传统反向传播更具生物合理性且能统一监督与无监督学习的通用机器学习框架的潜力与优势。
本文通过基于具身认知理论的自主性条件分析,论证大型语言模型(LLM)因缺乏个体性、规范性及交互不对称性而并非自主主体,应被界定为一种虽无自主性但能通过“幽灵性”人机耦合显著重塑人类代理形式的“会说话的图书馆”或语言自动机。
本文提出了 FALCON,一种针对无人机视频动作识别的统一自监督预训练方法,通过结合物体感知掩码自编码与物体中心的双视野未来重建,有效解决了航拍画面中背景杂乱导致的空间不平衡问题,显著提升了识别精度并实现了比传统监督方法快 2 至 5 倍的推理速度。
本文提出了 UniHR 框架,通过统一的数据表示模块(HiDR)和分层结构学习模块(HiSL),实现了对超关系、以及时序和嵌套等多种复杂知识图谱事实的统一分层表示与链接预测。