AriadneMem: Threading the Maze of Lifelong Memory for LLM Agents
AriadneMem 提出了一种面向长程 LLM 代理的双阶段结构化记忆系统,通过离线熵感知过滤与冲突感知粗化、以及在线算法化桥接发现与拓扑感知合成,在显著降低运行成本和上下文消耗的同时,有效解决了长时对话中证据断裂与状态更新冲突的难题。
154 篇论文
AriadneMem 提出了一种面向长程 LLM 代理的双阶段结构化记忆系统,通过离线熵感知过滤与冲突感知粗化、以及在线算法化桥接发现与拓扑感知合成,在显著降低运行成本和上下文消耗的同时,有效解决了长时对话中证据断裂与状态更新冲突的难题。
本文提出了 MA-RAG 框架,通过构建多轮智能体检索增强生成循环,将候选回答间的语义冲突转化为主动检索信号并优化推理历史,从而在无需微调的情况下显著提升大模型在复杂医疗问答任务中的推理准确性与一致性。
本文提出了 PlugMem,这是一种通用的插件式记忆模块,它受认知科学启发,将原始经验转化为紧凑的知识中心记忆图,从而在无需针对特定任务重新设计的情况下,显著提升了 LLM 智能体在复杂环境中的长期记忆检索与推理能力。
本文提出了一种结合多智能体架构与开放权重视觉语言模型的检索增强生成(RAG)框架,旨在通过整合文本与图表知识、实现迭代式质量评估,来解决州交通部门在知识管理与 workforce 培训中面临的专家经验流失及信息检索低效等挑战。
该研究提出了一种融合 VARK 认知风格与大型语言模型技术的混合框架,通过语义增强、动态图谱构建及自适应界面设计,有效解决了推荐系统中用户与物品冷启动的数据稀缺难题,实现了基于心理建模的个性化推荐。
本文提出了 MemSifter 框架,通过利用小型代理模型进行结果驱动的推理来卸载大语言模型的长时记忆检索任务,并结合基于任务成果的强化学习训练策略,在显著降低计算成本的同时实现了检索精度与任务完成度的双重提升。
本文提出了图 Hopfield 网络,通过将联想记忆检索与图拉普拉斯平滑耦合至统一能量函数,利用梯度下降迭代更新实现了在稀疏引文网络和异质图节点分类任务中兼具高性能与强鲁棒性的分类方法。
本文针对基于大语言模型的对话推荐系统中存在的个性化安全约束被忽视的问题,提出了包含 SafeRec 基准数据集和 SafeCRS 安全感知训练框架的解决方案,该框架通过联合优化推荐质量与个性化安全对齐,在保持推荐效果的同时显著降低了安全违规率。
本文提出了 AgentSelect,首个将智能体选择重构为基于叙事查询的推荐基准,通过整合海量异构数据揭示流行度方法的局限性并验证内容感知匹配的有效性,为构建可复现的智能体生态系统奠定了统一的数据与评估基础。
本文针对推荐系统预排序阶段训练样本异质性导致的梯度冲突与计算资源浪费问题,提出了 HAP 框架,通过冲突感知采样与自适应计算预算分配机制,在 Toutiao 生产环境中实现了零额外成本下的用户时长与活跃度显著提升。
该论文针对共享账户序列推荐中现有方法难以自适应推断潜在用户数量的问题,提出了 DisenReason 模型,通过频域行为解耦构建统一账户表征,进而分阶段推理潜在用户数量与兴趣,在多个基准数据集上显著提升了推荐性能。
本文介绍了 LabelBuddy,这是一款开源的协作式音频标注工具,它通过容器化后端解耦界面与推理,支持用户集成自定义模型进行 AI 辅助预标注,从而弥合人类意图与机器理解之间的差距。
该论文提出了-Knowledge基准(特别是-Banking领域),旨在评估 conversational agents 在长时程交互中协调非结构化知识库与工具执行以完成复杂任务的能力,并发现即使前沿模型在此类真实场景下的表现依然有限。
本文利用自然语言处理技术分析了 YouTube 上 200 万条视频的数据,发现尽管联盟营销普遍存在,但创作者的 FTC 合规披露率极低,而平台提供的标准化披露功能能显著提升合规性,因此建议监管机构与平台合作以增强信任。