TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size
本文提出了 TeamHOI 框架,通过结合基于 Transformer 的局部观测策略与掩码对抗运动先验技术,实现了单一去中心化策略在任意团队规模下生成物理真实且协调的多智能体人机交互行为。
118 篇论文
本文提出了 TeamHOI 框架,通过结合基于 Transformer 的局部观测策略与掩码对抗运动先验技术,实现了单一去中心化策略在任意团队规模下生成物理真实且协调的多智能体人机交互行为。
该研究通过多智能体模型分析表明,尽管气候变化对塞内加尔手工渔业影响有限,但维持当前捕捞强度将导致渔业崩溃和大规模移民,而降低捕捞强度则能实现可持续的渔业平衡。
该论文提出了一种基于表征简约性的零通信三维追捕策略,通过精简观测接口和引入贡献门控信用分配机制,在复杂遮挡环境中实现了比全观测方法更鲁棒、抗干扰能力更强的多智能体协作追捕。
本文介绍了 IronEngine,这是一个围绕统一编排核心构建的通用 AI 助手平台,通过创新的三阶段流水线、分层记忆架构及自适应模型管理,实现了高效的任务规划与执行,并在文件操作基准测试中展现出卓越的性能。
本文提出并实验了基于自然语言的大规模多模态神经网络“社会”(NLSOMs),通过让多个智能体以自然语言进行“头脑风暴”协作,有效解决了视觉问答、图像生成及具身 AI 等多种任务,并探讨了此类异构智能体社会的未来社会结构与治理机制。
该论文针对现有逆博弈方法在推断智能体目标时假设“完全共享知识”的局限性,提出了一种能够推断智能体彼此对对方目标估计的“二级逆博弈”框架,并通过理论证明与实验验证了其在处理去中心化场景中目标认知偏差方面的有效性。
本文针对零样本协调(ZSC)任务中现有基准 Hanabi 因算法表现趋近完美而难以区分进展的局限,提出了一个要求智能体在模糊线索下动态跟踪信念并推断共享知识的开源多智能体基准“妖怪学习环境”(YLE),并证明在该环境中主流 ZSC 方法存在显著的跨种子性能差距,表明单一基准的评估结果可能无法泛化。
该论文将因果博弈扩展至序贯场景并证明其计算复杂性,但实证结果表明,在理性最佳响应假设下,序贯因果均衡并未带来比经典斯塔克尔伯格均衡更高的社会福利,从而揭示了基于理性选择的标准博弈框架与因果推理优势之间的根本性不兼容。
本文提出了 ThunderAgent,一种简单、快速且具备程序感知能力的智能体推理系统,它通过将智能体工作流抽象为 LLM 程序来统一调度异构资源,从而显著提升了 KV 缓存命中率、缓解了内存不平衡问题,并在吞吐量、RL rollout 效率及磁盘内存节省方面大幅超越了现有最先进系统。
这篇论文从计算机体系结构视角出发,将多智能体记忆建模为包含共享与分布式范式及三层分级的架构问题,并指出跨智能体缓存共享、结构化访问控制以及最关键的记忆一致性是当前构建可靠可扩展多智能体系统面临的核心挑战。
KernelSkill 是一个采用双层级记忆架构的多智能体框架,通过利用知识驱动且感知任务轨迹的专家优化技能替代传统大模型中的隐式启发式方法,显著提升了 GPU 内核的生成效率与可解释性,并在 KernelBench 基准测试中实现了远超现有基线的加速效果。
本文介绍了 GRACE,这是一个统一的二维多机器人路径规划模拟器与基准测试平台,它通过在网格、路线图和连续环境等多个抽象层级上实例化相同任务,实现了不同建模选择间的透明、可复现比较,从而推动了多机器人规划研究向实际应用的转化。
本文提出了 LLMGreenRec,这是一种基于大语言模型的多智能体推荐系统框架,旨在通过精准推断用户绿色意图来推荐可持续商品,同时减少数字碳足迹,从而弥合绿色意愿与行动之间的差距并推动负责任的数字经济发展。
该论文提出了一种名为"COMIC"的全自动 AI 系统,通过模拟真实制作团队的智能体协作机制,并结合基于 YouTube 喜剧视频语料库训练的 LLM 批评家进行迭代优化,成功生成了质量接近专业水准的短喜剧视频。
本文提出了一种名为 OA-Bug 的嗅觉 - 听觉增强型 Bug 算法,旨在解决 denied 环境下群机器人无法依赖 GNSS、建图及数据共享的难题,通过模拟动物利用嗅觉和听觉信号进行协作,显著提升了搜索覆盖率并经由仿真与实物实验验证了其有效性。
该论文针对复合 AI 系统因组件间不可微交互及系统级偏好难以转化为组件级偏好而导致的对齐难题,提出了一种基于有向无环图建模并扩展直接偏好优化(DPO)的系统级对齐框架 SysDPO,有效实现了多组件系统的联合偏好对齐。
本文提出了 KramaBench,一个包含 104 个真实数据湖挑战的基准测试,旨在评估 AI 系统在端到端数据洞察流程中的能力,研究发现尽管现有大模型能识别部分任务,但在生成可运行的完整端到端管道方面表现仍十分有限。
本文提出了一种基于多模态大语言模型的多智能体系统,通过协同专用工具与网络服务,显著提升了从化学文献中提取复杂多模态反应信息的准确率与通用性,为构建高质量化学数据库及推动 AI 驱动的化学研究奠定了坚实基础。
该论文提出了名为 MARLIN 的去中心化水库管理框架,该框架通过融合受椋鸟群聚启发的多智能体强化学习与大语言模型引导,有效解决了气候变化背景下互联水库网络中的级联不确定性问题,显著提升了洪水响应速度与计算效率。
该论文提出了一种名为 WNumMPC 的分层多智能体导航方法,通过结合强化学习规划器生成的拓扑不变量(绕数)策略与模型预测控制,有效解决了无显式通信场景下因对称性导致的死锁问题,并在密集交互环境中实现了鲁棒的仿真到现实迁移。