Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software
本文提出了特征 - 安全表(FSTab)框架,通过仅利用前端特征和源模型知识即可预测后端漏洞的黑盒攻击方法,以及量化模型在不同场景下漏洞复现一致性的评估机制,揭示了大语言模型生成软件中普遍存在且可跨领域迁移的重复性漏洞风险。
3372 篇论文
本文提出了特征 - 安全表(FSTab)框架,通过仅利用前端特征和源模型知识即可预测后端漏洞的黑盒攻击方法,以及量化模型在不同场景下漏洞复现一致性的评估机制,揭示了大语言模型生成软件中普遍存在且可跨领域迁移的重复性漏洞风险。
该论文介绍了针对从 arXiv 等来源提取的 920 万条数学定理构建的大规模语义检索系统,通过系统分析表示上下文、语言模型及提示策略等因素,在专业数学家构建的评估集上显著提升了定理级和论文级的检索效果,证明了在 Web 规模下实现有效语义定理搜索的可行性。
该论文提出了 LMMRec 框架,利用大语言模型通过思维链提示从文本中提取细粒度动机,并结合双编码器架构与对比学习策略,有效融合了异构文本信息与交互数据以提升多模态推荐性能。
本文提出了一种基于 Doob h-变换和鞅理论的随机分析方法,通过在不修改预训练得分网络的情况下引入显式漂移修正,为扩散模型建立了满足概率为一的硬约束的生成框架,并设计了两种利用预训练轨迹进行离线学习的算法以提供非渐近收敛保证。
本文提出了 NAAMSE 框架,通过进化式反馈优化机制,利用自主智能体进行遗传提示变异和分层语料探索,实现了对 AI 代理在动态对抗环境下更全面、可扩展的安全评估,有效弥补了传统静态基准测试的不足。
该论文提出了一种统一的扩散引导预训练框架,通过利用扩散模型指导结构感知的掩码与丢弃策略以及拓扑感知的全局重建,有效解决了现有脑图基础模型在预训练中破坏语义连接模式及缺乏全局结构信息的局限,并在大规模神经影像数据上验证了其性能优势。
该论文提出了一种名为 CoCoA 的免训练解码算法,通过利用大语言模型中间层表征的不一致性信号来识别并抑制幻觉,从而在不重新训练模型的情况下显著提升其在问答、摘要、推理及代码生成等任务中的事实准确性。
本文提出了 SToRM 框架,通过重要性预测、辅助路径监督训练及锚点 - 上下文合并模块,在显著降低多模态大模型计算成本的同时,实现了端到端自动驾驶任务中视觉 Token 的高效缩减且保持全 Token 性能。
本文提出了“智能体引导策略搜索(AGPS)”框架,通过利用多模态智能体替代人类监督者,将人类修正转化为精确的语义引导,从而显著提升了机器人强化学习的样本效率并实现了可扩展的自动化训练。
该论文通过名为 M2RL 的研究,系统对比并分析了大语言模型在多领域强化学习验证奖励(RLVR)任务中“混合多任务训练”与“分域训练后模型融合”两种范式的表现,发现跨领域 RLVR 干扰极小且推理密集型领域存在协同增益,并从权重空间几何等角度揭示了其内在机制。
本文提出了 SkillsBench 基准,通过 86 个跨领域任务评估发现,精心策划的 Agent 技能能显著提升大语言模型的平均通过率(+16.2%),且小模型借助技能可媲美无技能的大模型,但模型自主生成的技能往往无效,且技能效果在不同领域间存在显著差异。
该论文提出了一种基于嵌入空间几何特征的大语言模型幻觉分类法,将幻觉划分为不忠实、虚构和事实错误三类,并据此开发了相应的检测指标,同时揭示了现有基准测试中因标注风格混淆而导致的事实错误检测理论局限。
TrasMuon 通过结合全局均方根校准与基于能量的信任区域截断,在保留 Muon 优化器近等距几何特性的同时有效稳定了更新幅度,从而在无需预热阶段的情况下实现了比基线更快的收敛速度和更强的鲁棒性。
该论文提出并验证了一个针对最新大语言模型优化的轻量级自动化 AI 流水线,证明其能够生成并解决包括国际数学竞赛级及未发表研究级在内的复杂数学问题,且部分成果已通过团队验证并开源。
本文提出了一种名为均值流策略(MVP)的新型生成策略,通过引入瞬时速度约束(IVC)作为关键边界条件,在确保高表达性的同时实现了单步动作生成,并在多个机器人操作任务中取得了优于现有流基策略的采样速度与成功率。
本文提出了 Pawsterior,一种基于变分流匹配的模拟推理框架,通过引入端点诱导的仿射几何约束和变分参数化,有效解决了传统方法在处理有界物理参数及离散 - 连续混合变量等结构化后验分布时的效率与兼容性问题。
该论文提出了可解释的 Token 级噪声过滤框架 XTF,通过将数据贡献分解为推理重要性、知识新颖性和任务相关性三个属性来识别并掩蔽噪声 Token 的梯度,从而在多个下游任务中显著提升了大语言模型微调后的性能。
本文提出了 LongAudio-RAG 框架,通过将多小时长音频转换为结构化事件记录并利用 SQL 数据库进行检索,使大语言模型能够基于精确的时间定位证据回答自然语言问题,从而在混合边缘 - 云架构下有效解决了长音频问答中的上下文限制与幻觉问题。
CogitoRAG 是一种受人类情景记忆启发的检索增强生成框架,通过构建多维知识图谱、提取语义主旨、执行实体扩散检索及引入 CogniRank 重排序算法,有效解决了传统方法中的语义完整性丢失问题,在复杂知识整合与推理任务中显著优于现有方法。
该论文提出了首个针对条件性生物医学问答的基准 CondMedQA 以及一种名为条件门控推理(CGR)的新框架,通过构建条件感知知识图谱并基于查询条件动态激活或剪枝推理路径,有效解决了现有系统忽视患者特异性因素(如并发症和禁忌症)导致推理不准确的问题。