Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

本文提出了一种包含异质性领导者和非跟随者代理的三级斯塔克尔伯格博弈框架,以解决传统拥堵耦合市场模型忽视非直接竞争参与者对均衡预测产生系统性偏差的问题,并通过电动汽车充电基础设施案例展示了该模型如何更准确地刻画基础设施决策、市场竞争与均衡拥堵之间的双向耦合机制。

Niloofar Aminikalibar, Farzaneh Farhadi, Maria Chli2026-03-06💻 cs

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

本文提出了一种多智能体强化学习框架,通过整合离散选择理论使乘客分配和竞争内生演化,利用真实城市数据证明了在自主出行服务(AMoD)市场中,竞争环境会促使运营商学习出更低的价格和独特的车队调度策略,且该学习方法在面对竞争不确定性时仍具有鲁棒性。

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

本文介绍了 RepoLaunch,这是首个能够自动解析依赖、编译代码并提取测试结果的智能体,它支持任意编程语言和操作系统,并通过仅需人工设计任务的自动化流程,实现了软件工程数据集的规模化构建,从而推动了编码智能体与大型语言模型的基准测试与训练。

Kenan Li, Rongzhi Li, Linghao Zhang + 17 more2026-03-06🤖 cs.LG

VideoChat-M1: Collaborative Policy Planning for Video Understanding via Multi-Agent Reinforcement Learning

本文提出了 VideoChat-M1,一种基于多智能体强化学习的视频理解框架,通过创新的协作策略规划(CPP)机制,使多个智能体能够动态生成、执行并相互沟通优化工具调用策略,从而在多个基准测试中实现了超越现有最先进模型(如 Gemini 2.5 Pro 和 GPT-4o)的卓越性能。

Boyu Chen, Zikang Wang, Zhengrong Yue + 9 more2026-03-05💻 cs