cs.MA 篇论文 | Gist.Science

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

该论文提出从提示工程演进为包含上下文工程、意图工程和规格工程的四层成熟度模型，旨在通过系统化设计信息环境、组织目标及机器可读规范，解决企业多智能体系统在规模化部署中面临的复杂性与控制难题。

FetalAgents: A Multi-Agent System for Fetal Ultrasound Image and Video Analysis

本文提出了 FetalAgents，这是首个用于胎儿超声图像和视频分析的多智能体系统，它通过轻量级协调框架动态调度专业视觉模型，实现了从多平面关键帧识别、结构化测量到生成可审计临床报告的全流程自动化，并在多项临床任务中展现出超越专用模型和多模态大语言模型的鲁棒性与准确性。

Xiaotian Hu, Junwei Huang, Mingxuan Liu, Kasidit Anmahapong, Yifei Chen, Yitong Luo, Yiming Huang, Xuguang Bai, Zihan Li, Yi Liao, Haibo Qu, Qiyuan TianWed, 11 Ma💻 cs

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

该论文提出了一种名为“能力一致性系统”（CCS）的新框架，通过将内存一致性模型（如 MESI）映射到身份授权场景，证明了基于发布一致性（RCC）的撤销策略在高速代理执行环境中能将未授权操作数量从时间依赖的线性增长降低至与代理速度无关的常数级，从而在根本上解决了传统基于时间窗口的访问控制机制在大规模并发下的安全性失效问题。

Vladyslav ParakhinWed, 11 Ma💻 cs

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

该论文提出了一种无需训练的参数化提示框架，通过将提示视为基于智能体状态动态构建的“动作”，成功实现了对大语言模型多智能体对话行为（如反驳、证据使用及立场转变）的有效引导，为社交模拟方向的多智能体系统研究提供了新思路。

Hongbo Bo, Jingyu Hu, Weiru LiuWed, 11 Ma🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

该研究通过将情感效价和唤醒度作为调节因子扩展“蜜蜂方程”，构建了一个基于智能体的群体决策模型，揭示了情感动态如何通过改变招募与抑制机制来影响群体共识的形成速度、结果偏差及非线性放大效应。

David Freire-ObregónWed, 11 Ma🤖 cs.AI

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

本文综述了基于效用理论的认知建模在机器人领域的应用，探讨了从行为基机器人到价值系统的演进、其在单/多智能体及人机交互中的作用，并提出了未来的研究方向与开放性问题。

Qin YangTue, 10 Ma💻 cs

The Illusion of Collusion

该论文研究了在无直接竞争信息的情况下，基于多臂老虎机的算法代理如何在重复囚徒困境中通过行动同步性自发形成“朴素合谋”，并发现这种合谋现象的发生与否高度依赖于所采用的行为策略（确定性算法必然导致合谋，而持续随机算法则能避免）。

Connor Douglas, Foster Provost, Arun SundararajanTue, 10 Ma💻 cs

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

该论文揭示了多模态大语言模型（MLLM）作为验证器时普遍存在的“同意偏差”问题，并提出了一种名为自我 grounded 验证（SGV）的两步生成方法，通过先独立生成行为先验再评估轨迹，显著提升了验证准确性及智能体在网页导航、计算机操作和机器人等领域的任务完成表现。

Moises Andrade, Joonhyuk Cha, Brandon Ho, Vriksha Srihari, Karmesh Yadav, Zsolt KiraTue, 10 Ma🤖 cs.LG

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

该研究通过大规模实验揭示了行为推断中的根本不对称性：动机推断准确率高达 98-100%，而信念系统推断受限于架构和信息理论瓶颈（LSTM 仅 24%，Transformer 最高 49%），导致在复杂行为序列中难以准确区分代理的内在信念。

Jason Starace, Terence SouleTue, 10 Ma🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

本文提出了名为 SelfOrg 的框架，通过让大语言模型多智能体基于响应条件动态评估贡献并构建有向无环图来自组织通信结构，从而在无需额外监督或训练的情况下显著提升协作效率，特别是在弱模型场景下表现优异。

Nurbek Tastan, Samuel Horvath, Karthik NandakumarTue, 10 Ma🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

本文提出了 FOR-Prompting 协议，通过让“辩护者”提出答案、由“辩论者”仅提出质疑而不直接修正的不对称提示机制，在不依赖模型训练或内部访问的情况下，有效提升了各类大语言模型（尤其是小模型）在数学推理及开放任务中的自我修正能力与输出质量。

He Zhang, Anzhou Zhang, Jian DaiTue, 10 Ma💬 cs.CL

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

本文提出了 CRAwDAD 框架，通过让两个推理语言模型在因果推断任务中进行结构化辩论与相互说服，显著提升了包括 DeepSeek-R1 和 Qwen3 在内的模型在 CLadder 基准测试中的准确率，特别是大幅改善了反事实推理的表现。

Finn G. Vamosi, Nils D. ForkertTue, 10 Ma🤖 cs.LG

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

该论文提出了名为 MAS-Orchestra 的训练框架，通过将多智能体编排建模为函数调用强化学习问题来实现全局系统推理，并引入 MASBENCH 基准从五个维度严格评估任务特性，从而揭示了多智能体系统的收益取决于任务结构而非普遍适用，最终在数学推理等任务中实现了显著的性能提升与效率优化。

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq JotyTue, 10 Ma💬 cs.CL

cs.MA

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

FetalAgents: A Multi-Agent System for Fetal Ultrasound Image and Video Analysis

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Emotional Modulation in Swarm Decision Dynamics

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

The Illusion of Collusion

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

Stochastic Self-Organization in Multi-Agent Systems

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

LatentMem: Customizing Latent Memory for Multi-Agent Systems

Characterizing MARL for Energy Control: A Multi-KPI Benchmark on the CityLearn Environment

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

Evaluating Multi-Agent LLM Architectures for Rare Disease Diagnosis

Randomise Alone, Reach as a Team

NarrativeLoom: Enhancing Creative Storytelling through Multi-Persona Collaborative Improvisation

Learning When to Cooperate Under Heterogeneous Goals