Module checking of pushdown multi-agent systems
本文研究了推多代理系统(PMS)的模块检查问题,证明了针对 ATL 规范的检查是 2EXPTIME 完全的,而针对 ATL* 规范的检查则是 4EXPTIME 完全的,后者比前两者在计算复杂度上高出指数级,是少数具有初等但超过三重指数时间复杂度的自然判定问题之一。
123 篇论文
本文研究了推多代理系统(PMS)的模块检查问题,证明了针对 ATL 规范的检查是 2EXPTIME 完全的,而针对 ATL* 规范的检查则是 4EXPTIME 完全的,后者比前两者在计算复杂度上高出指数级,是少数具有初等但超过三重指数时间复杂度的自然判定问题之一。
本文提出了一种基于智能体(Agent)的防空系统决策模型,利用信念 - 愿望 - 意图(BDI)架构和元级规划推理,实现了无需人工干预的自动化目标探测、威胁评估及武器分配,从而提升了网络中心战环境下的指挥控制自主性。
本文提出了一种用于计算非退化三人及以上多人博弈中所有进化稳定策略的算法。
本文针对传统 BDI 模型在实时约束下反应迟缓的局限性,提出了一种受实时系统算法启发的新模型,通过显式管理目标、计划与行动的时间及资源约束,实现了智能体在实时领域(如资源收集游戏)中的有效应用与验证。
本文提出了 Foam-Agent,这是一个利用大语言模型和检索增强生成技术、通过多智能体协作实现从网格生成到后处理全流程自动化的计算流体力学(CFD)框架,在无需专家干预的情况下将 110 个模拟任务的执行成功率提升至 88.2%。
该论文提出将冲突搜索(CBS)作为一种通用协议,通过定义标准化的单智能体运动规划接口,实现了由不同制造商、采用多样化算法(如启发式搜索、采样、优化、扩散及强化学习等)的异构智能体在共享环境中高效协同完成独立任务。
本文提出了一种名为 GRAND 的混合调度算法,通过结合强化学习训练的策略网络进行全局引导、最小成本流进行区域重平衡以及局部任务分配,在满足实时计算约束的同时显著提升了大规模多智能体仓储物流系统的吞吐量。
本文提出了 EmboTeam 框架,通过结合大语言模型的语义解析能力、PDDL 经典规划器的搜索能力以及行为树的反应式控制机制,实现了异构多机器人团队在复杂长程任务中的高效协作,并在 MACE-THOR 基准测试中显著提升了任务成功率与目标条件召回率。
本研究评估了一种基于神经网络的模拟推断框架在劳动力市场代理模型参数估计中的应用,结果表明该方法相比传统贝叶斯方法能更高效地恢复原始参数,且优于依赖人工统计摘要的传统方法。
该论文提出了一种结合动态认知情感模型与临床风险本体的自动化红队测试框架,通过大规模模拟实验揭示了当前大语言模型在心理健康支持中存在验证患者妄想及未能有效干预自杀风险等严重安全隐患,并验证了该框架在帮助多方利益相关者审计 AI 心理治疗“黑箱”方面的有效性。
本文建立了一个图论框架,通过将 Transformer 交叉熵对数几率映射到符号拉普拉斯矩阵,利用结构平衡理论和弦图拓扑约束,解决了多智能体 LLM 系统中因不可观测潜在状态引发的共识不稳定问题,并提出了确保推理收敛的算法与实证验证。
本文提出了 TritonDFT,这是一个通过专家工作流设计、帕累托感知参数推断及多源知识增强来实现密度泛函理论(DFT)全流程自动化、适应性与成本效益优化的多智能体框架,并配套发布了用于评估其多维能力的 DFTBench 基准测试。
本文提出了一种面向混合交通瓶颈场景的双交互感知协同控制策略(DIACC),通过结合多智能体强化学习框架下的去中心化交互自适应决策、集中式交互增强评估器及软最小值奖励设计,有效提升了网联自动驾驶车辆在复杂人机混行环境下的交通效率与适应性。
该研究通过对比实验证明,在临床诊断中采用混合厂商(如 o4-mini、Gemini-2.5-Pro 和 Claude-4.5-Sonnet)的多智能体大语言模型系统,能够通过整合互补的归纳偏置来克服单一厂商团队的共性偏差,从而显著提升诊断的召回率与准确率。
本文提出了一种结合深度强化学习的拍卖机制,用于在多小区网络中动态分配可重构智能表面(RIS),通过智能体学习优化出价策略并引入可调参数,实现了网络性能与成本之间的灵活权衡。
本文提出了 SkillNet,一个旨在通过统一本体论从异构来源创建、评估和组织 AI 技能的大规模基础设施,其包含的 20 万 + 技能库及评估体系显著提升了智能体在多项任务中的表现,使其平均奖励提高 40% 并减少 30% 的执行步骤。
本文提出了名为 SysName 的框架,通过重构跨代理语义流并引入执行感知的 Supervisor LLM 分析,将多智能体系统的防御范式从静态输入过滤转变为动态行为轨迹监控,从而有效检测包括间接提示注入在内的多种复杂攻击。
本文针对大语言模型多智能体系统中因迭代导致的小误差演变为系统性错误共识的问题,提出了一种基于传播动力学模型的早期风险识别方法,并设计了无需修改协作架构的谱系图治理插件,成功将防御成功率从 0.32 提升至 0.89 以上,有效抑制了误差的级联放大。
本文提出了自适应记忆准入控制(A-MAC)框架,通过将记忆价值分解为五个可解释因素并结合轻量级规则与 LLM 辅助评估,实现了可审计且高效的长时记忆管理,在 LoCoMo 基准测试中显著提升了精度 - 召回平衡并降低了延迟。
本文提出了一种包含异质性领导者和非跟随者代理的三级斯塔克尔伯格博弈框架,以解决传统拥堵耦合市场模型忽视非直接竞争参与者对均衡预测产生系统性偏差的问题,并通过电动汽车充电基础设施案例展示了该模型如何更准确地刻画基础设施决策、市场竞争与均衡拥堵之间的双向耦合机制。