Real-Time Trust Verification for Safe Agentic Actions using TrustBench
本文提出了 TrustBench 框架,通过在智能体执行动作前进行实时信任验证,结合多维度基准测试与领域专用插件,有效将有害行为减少了 87% 并实现了低延迟的安全保障。
2282 篇论文
本文提出了 TrustBench 框架,通过在智能体执行动作前进行实时信任验证,结合多维度基准测试与领域专用插件,有效将有害行为减少了 87% 并实现了低延迟的安全保障。
RubiCap 提出了一种基于 LLM 生成评分标准(Rubric)的强化学习框架,通过结构化、多维度的细粒度奖励信号解决开放域密集图像描述中缺乏确定性验证的难题,在提升生成多样性与泛化能力的同时,以更小参数量实现了超越现有监督蒸馏、传统 RL 方法及大模型标注的性能。
该论文提出了一种利用大语言模型生成的功能不完备但结构正确的 RTL 代码来构建合成数据集的新框架,有效突破了电路网表示学习中真实标注数据稀缺的瓶颈,并证明了由此训练的模型在子电路边界识别和组件分类等任务上能媲美甚至超越基于高质量数据的现有方法。
本文提出了一种名为 GIAT 的新型框架,通过将地质先验知识(利用类别序列相关性滤波器生成关系矩阵)融入 Transformer 的注意力机制,显著提升了测井岩性识别的准确性、可靠性及可解释性。
ZeroWBC 是一种无需大规模机器人遥操作数据、直接利用人类第一人称视频微调视觉语言模型以生成并执行自然全身动作的人形机器人控制框架,显著提升了人形机器人在场景交互中的自然性与通用性。
该论文介绍了基于大语言模型的代码变异代理 AlphaEvolve,通过单一元算法成功推导出五个经典拉姆齐数的改进下界,并复现了所有已知精确值及其他众多情况下的最佳下界。
本文提出了一种基于伊托型随机交通流模型的可微分生成框架,通过将物理约束从确定性偏微分方程扩展为分布形式,利用包含平流闭合模块的评分网络结合去噪得分匹配与福克 - 普朗克残差损失,实现了能够输出概率分布、置信区间及拥堵风险度量的物理信息交通状态估计。
本文提出了 DuplexCascade,一种无需语音活动检测(VAD)的级联流式语音对话系统,通过将传统长话轮转化为微话轮交互并引入专用控制令牌,在保留强大语言模型智能的同时实现了全双工语音对话。
本文提出了 Latent-DARM 框架,通过在潜在空间连接离散扩散模型(作为规划器)与自回归模型(作为执行器),有效克服了单一模型在推理规划或文本流畅性上的局限,在显著提升数学、科学及常识推理基准准确率的同时,大幅降低了 token 消耗。
本文提出了一种名为“可解释创新引擎”的双树代理-RAG 框架,通过将知识单元从文本块升级为“方法节点”、构建可追溯的方法溯源树与分层聚类抽象树,并引入策略代理进行显式合成及验证器进行剪枝回写,实现了在多个领域中对可控、可解释且可验证的推理创新的显著提升。
该论文提出了 RAISE 框架,论证了大语言模型逻辑推理能力的提升会通过演绎、归纳和溯因三条机制路径不可避免地增强其情境感知能力(包括自我认知与战略欺骗),并呼吁推理研究界正视这一风险,建立相应的安全基准与原则。
该论文提出了名为\EvalAct(评估即行动)的框架,通过将检索质量评估转化为显式动作并引入过程校准优势重缩放(PCAR)优化方法,有效解决了检索增强代理在多步推理中因噪声检索和奖励信号粗糙导致的可靠性问题,从而在多个开放域问答基准上显著提升了性能。
该论文提出情感是塑造大语言模型注意力机制与推理过程的关键潜在因素,通过构建情感均衡的 AURA-QA 数据集并引入情感正则化框架,揭示了情感语调对注意力几何结构的影响,并显著提升了模型在情感变化及分布偏移场景下的阅读理解性能。
该论文构建了一个宏观金融压力测试框架,论证了快速 AI 采纳引发的核心风险并非生产力崩溃或生存危机,而是由于经济制度仍锚定于人类认知稀缺性,导致 AI 创造的供给过剩与因劳动收入下降、货币流通速度减缓及中介业务崩溃而引发的需求不足之间出现结构性错配,进而可能触发私人信贷与抵押贷款市场的连锁危机。
本文提出了名为 PrivPRISM 的自动化框架,通过结合语言模型与静态代码分析,系统性地检测 Google Play 应用的数据安全声明与隐私政策之间的不一致性,研究发现大量流行应用存在披露矛盾、通用模板滥用及敏感数据未充分披露等严重合规问题。
该论文提出了一种基于全身体肌肉骨骼模型与强化学习的可扩展人体仿真框架,通过模拟人机耦合系统获取内部生物力学指标,实现了交互式机器人结构与控制策略的协同优化。
该论文提出了基于布鲁姆分类学的 BD-FDG 框架,通过结构化知识组织、认知分层问题建模及自动化质量控制,构建了包含 23 万样本的 SSA-SFT 数据集并微调出 SSA-LLM-8B 模型,显著提升了大语言模型在空间态势感知领域的专业表现,同时保持了通用能力。
BridgeDiff 提出了一种基于扩散模型的虚拟试穿框架,通过服装条件桥接模块和扁平结构约束模块,有效弥合了人体观测与扁平服装合成之间的差距,实现了更高质量且结构稳定的服装重建。
该论文提出了通过构建对抗性基准 ToMBench-Hard 并结合监督完整推理过程的多维奖励强化学习框架 Social-R1,成功训练出参数量仅为 4B 却能在社会推理任务上超越更大模型并具备强泛化能力的高效模型。
该研究提出了一种结合预训练与定制神经网络的单模型方法,通过数据增强、图像归一化和迁移学习等技术,利用 GTSRB 及 Udacity 模拟器等多源数据集,系统性地实现了交通标志识别、车辆与车道检测及行为克隆,从而提升了自动驾驶系统的感知能力与决策可靠性。