cs.MA 篇论文 | Gist.Science

TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size

本文提出了 TeamHOI 框架，通过结合基于 Transformer 的局部观测策略与掩码对抗运动先验技术，实现了单一去中心化策略在任意团队规模下生成物理真实且协调的多智能体人机交互行为。

Stefan Lionar, Gim Hee LeeTue, 10 Ma💻 cs

Modeling the Senegalese artisanal fisheries migrations

该研究通过多智能体模型分析表明，尽管气候变化对塞内加尔手工渔业影响有限，但维持当前捕捞强度将导致渔业崩溃和大规模移民，而降低捕捞强度则能实现可持续的渔业平衡。

Alassane Bah (ESP, UMMISCO), Timothée Brochier (UMMISCO, IRD [Ile-de-France])Tue, 10 Ma💻 cs

Less is More: Robust Zero-Communication 3D Pursuit-Evasion via Representational Parsimony

该论文提出了一种基于表征简约性的零通信三维追捕策略，通过精简观测接口和引入贡献门控信用分配机制，在复杂遮挡环境中实现了比全观测方法更鲁棒、抗干扰能力更强的多智能体协作追捕。

Jialin Ying, Zhihao Li, Zicheng Dong, Guohua Wu, Yihuan LiaoTue, 10 Ma💻 cs

IronEngine: Towards General AI Assistant

本文介绍了 IronEngine，这是一个围绕统一编排核心构建的通用 AI 助手平台，通过创新的三阶段流水线、分层记忆架构及自适应模型管理，实现了高效的任务规划与执行，并在文件操作基准测试中展现出卓越的性能。

Xi MoTue, 10 Ma🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

本文提出并实验了基于自然语言的大规模多模态神经网络“社会”（NLSOMs），通过让多个智能体以自然语言进行“头脑风暴”协作，有效解决了视觉问答、图像生成及具身 AI 等多种任务，并探讨了此类异构智能体社会的未来社会结构与治理机制。

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen SchmidhuberThu, 12 Ma💬 cs.CL

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

该论文针对现有逆博弈方法在推断智能体目标时假设“完全共享知识”的局限性，提出了一种能够推断智能体彼此对对方目标估计的“二级逆博弈”框架，并通过理论证明与实验验证了其在处理去中心化场景中目标认知偏差方面的有效性。

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

本文针对零样本协调（ZSC）任务中现有基准 Hanabi 因算法表现趋近完美而难以区分进展的局限，提出了一个要求智能体在模糊线索下动态跟踪信念并推断共享知识的开源多智能体基准“妖怪学习环境”（YLE），并证明在该环境中主流 ZSC 方法存在显著的跨种子性能差距，表明单一基准的评估结果可能无法泛化。

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas BullingThu, 12 Ma🤖 cs.AI

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

该论文将因果博弈扩展至序贯场景并证明其计算复杂性，但实证结果表明，在理性最佳响应假设下，序贯因果均衡并未带来比经典斯塔克尔伯格均衡更高的社会福利，从而揭示了基于理性选择的标准博弈框架与因果推理优势之间的根本性不兼容。

Dennis ThummThu, 12 Ma📊 stat

ThunderAgent: A Simple, Fast and Program-Aware Agentic Inference System

本文提出了 ThunderAgent，一种简单、快速且具备程序感知能力的智能体推理系统，它通过将智能体工作流抽象为 LLM 程序来统一调度异构资源，从而显著提升了 KV 缓存命中率、缓解了内存不平衡问题，并在吞吐量、RL rollout 效率及磁盘内存节省方面大幅超越了现有最先进系统。

Hao Kang, Ziyang Li, Xinyu Yang, Weili Xu, Yinfang Chen, Junxiong Wang, Beidi Chen, Tushar Krishna, Chenfeng Xu, Simran AroraThu, 12 Ma💻 cs

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

这篇论文从计算机体系结构视角出发，将多智能体记忆建模为包含共享与分布式范式及三层分级的架构问题，并指出跨智能体缓存共享、结构化访问控制以及最关键的记忆一致性是当前构建可靠可扩展多智能体系统面临的核心挑战。

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen ZhaoThu, 12 Ma🤖 cs.AI

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

KernelSkill 是一个采用双层级记忆架构的多智能体框架，通过利用知识驱动且感知任务轨迹的专家优化技能替代传统大模型中的隐式启发式方法，显著提升了 GPU 内核的生成效率与可解释性，并在 KernelBench 基准测试中实现了远超现有基线的加速效果。

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang LiuThu, 12 Ma🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

本文介绍了 GRACE，这是一个统一的二维多机器人路径规划模拟器与基准测试平台，它通过在网格、路线图和连续环境等多个抽象层级上实例化相同任务，实现了不同建模选择间的透明、可复现比较，从而推动了多机器人规划研究向实际应用的转化。

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang HönigThu, 12 Ma🤖 cs.AI

LLMGreenRec: LLM-Based Multi-Agent Recommender System for Sustainable E-Commerce

本文提出了 LLMGreenRec，这是一种基于大语言模型的多智能体推荐系统框架，旨在通过精准推断用户绿色意图来推荐可持续商品，同时减少数字碳足迹，从而弥合绿色意愿与行动之间的差距并推动负责任的数字经济发展。

Hao N. Nguyen, Hieu M. Nguyen, Son Van Nguyen, Nguyen Thi HanhThu, 12 Ma💻 cs

COMIC: Agentic Sketch Comedy Generation

该论文提出了一种名为"COMIC"的全自动 AI 系统，通过模拟真实制作团队的智能体协作机制，并结合基于 YouTube 喜剧视频语料库训练的 LLM 批评家进行迭代优化，成功生成了质量接近专业水准的短喜剧视频。

Susung Hong, Brian Curless, Ira Kemelmacher-Shlizerman, Steve SeitzThu, 12 Ma💬 cs.CL

OA-Bug: An Olfactory-Auditory Augmented Bug Algorithm for Swarm Robots in a Denied Environment

本文提出了一种名为 OA-Bug 的嗅觉 - 听觉增强型 Bug 算法，旨在解决 denied 环境下群机器人无法依赖 GNSS、建图及数据共享的难题，通过模拟动物利用嗅觉和听觉信号进行协作，显著提升了搜索覆盖率并经由仿真与实物实验验证了其有效性。

Siqi Tan, Xiaoya Zhang, Jingyao Li, Ruitao Jing, Mufan Zhao, Yang Liu, Quan QuanMon, 09 Ma💻 cs

Aligning Compound AI Systems via System-level DPO

该论文针对复合 AI 系统因组件间不可微交互及系统级偏好难以转化为组件级偏好而导致的对齐难题，提出了一种基于有向无环图建模并扩展直接偏好优化（DPO）的系统级对齐框架 SysDPO，有效实现了多组件系统的联合偏好对齐。

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi KoyejoMon, 09 Ma🤖 cs.AI

KramaBench: A Benchmark for AI Systems on Data-to-Insight Pipelines over Data Lakes

本文提出了 KramaBench，一个包含 104 个真实数据湖挑战的基准测试，旨在评估 AI 系统在端到端数据洞察流程中的能力，研究发现尽管现有大模型能识别部分任务，但在生成可运行的完整端到端管道方面表现仍十分有限。

Eugenie Lai, Gerardo Vitagliano, Ziyu Zhang, Om Chabra, Sivaprasad Sudhir, Anna Zeng, Anton A. Zabreyko, Chenning Li, Ferdi Kossmann, Jialin Ding, Jun Chen, Markos Markakis, Matthew Russo, Weiyang Wang, Ziniu Wu, Michael J. Cafarella, Lei Cao, Samuel Madden, Tim KraskaMon, 09 Ma🤖 cs.AI

cs.MA