Fair and Efficient Balanced Allocation for Indivisible Goods
该论文证明了在每位代理人获得相同数量物品的平衡约束下,当代理人具有个性化双值估值或最多两种估值类型时,同时满足 envy-freeness up to one good (EF1) 公平性和 fractional Pareto optimality (fPO) 效率的分配不仅存在,且可通过基于二分图最大权匹配和对偶理论的多项式时间算法计算得出。
63 篇论文
该论文证明了在每位代理人获得相同数量物品的平衡约束下,当代理人具有个性化双值估值或最多两种估值类型时,同时满足 envy-freeness up to one good (EF1) 公平性和 fractional Pareto optimality (fPO) 效率的分配不仅存在,且可通过基于二分图最大权匹配和对偶理论的多项式时间算法计算得出。
本文提出了一种基于非合作博弈论的分布式方法,通过联合优化线性 MIMO 收发器,在干扰信道环境下有效解决了语义通信中的多设备逻辑失配与多用户干扰问题,并实现了语义对齐与任务性能之间的平衡。
本文通过扩展 Bilo 等人的时序网络创建博弈模型,允许代理在购买边时灵活决定其时间标签,并针对多种可达性模型和成本函数,证明了纳什均衡的存在性,同时给出了无政府代价与稳定代价的上下界。
该论文利用网络博弈方法构建了多代理人委托代理模型,指出在存在外部性的团队项目中,最优激励分配需使各代理人的“个人生产力、组织中心度与对货币激励的响应度”三者乘积相等。
本文对在线社交网络中的信任建模研究进行了全面综述,涵盖了从心理学理论基础到基于算法的分类、实现指南以及当前面临的挑战。
该论文通过引入新的变量变换,在经典 SI 流行病动力学框架下显式构建了社会距离博弈的纳什均衡,证明在特定条件下唯一的最优策略是“先观望后封锁”的 bang-bang 策略,且该策略在受限策略空间中构成演化稳定策略并与最优公共政策完全一致。
本文提出了一种用于计算非退化三人及以上多人博弈中所有进化稳定策略的算法。
该论文通过引入伪格性质(pseudo-lattice property)并推广单调比较静态定理及塔斯基不动点定理,成功打破了传统理论对格结构的依赖,首次实现了对混合策略纳什均衡和颤抖手完美均衡的单调比较静态分析。
本文综述了利用深度学习近似解决机制设计中多目标冲突问题的技术细节与关键成果,并通过车联网能效管理、移动网络资源分配及农业投入品采购拍卖三个案例展示了该方法的有效性。
该论文通过引入“局部源”概念并构造反例,证伪了复制动态吸引子与博弈中汇均衡存在一一对应关系的猜想,同时提出了“伪凸性”作为两玩家博弈中确立这种对应关系的充分条件。
本文研究了在智能体效用未知的多智能体博弈中,基于最佳响应和量化响应两种反馈机制的偏好学习问题,证明了量化响应反馈能以对数样本复杂度识别效用函数,而最佳响应反馈仅能识别更大的效用集合,并设计了在两种机制下均具有低遗憾的在线推荐算法。
本文提出了一种基于广义双线性偏好模型的正则化在线强化学习人类反馈框架,通过利用强凸性和偏好矩阵的反对称性,证明了贪婪策略的间隙误差界,并设计了两种算法分别实现了与正则化强度无关的多对数遗憾界以及在高维场景下首个统计高效的遗憾界。
本文提出了一种将大语言模型作为智能代理应用于异构网络重复频谱拍卖的分布式框架,通过让终端设备基于历史交互进行推理与策略适应,显著提升了其信道接入频率和预算利用效率。
本文提出了一种包含异质性领导者和非跟随者代理的三级斯塔克尔伯格博弈框架,以解决传统拥堵耦合市场模型忽视非直接竞争参与者对均衡预测产生系统性偏差的问题,并通过电动汽车充电基础设施案例展示了该模型如何更准确地刻画基础设施决策、市场竞争与均衡拥堵之间的双向耦合机制。
本文研究了在信念与混合策略均由非加性测度(容量)表示的非合作博弈中,基于 max-plus 积分的两种均衡概念(容量混合策略纳什均衡与 Dow-Werlang 不确定性均衡)的存在性,并借助抽象凸性技术和 Kakutani 不动点定理证明了在紧策略空间与连续支付条件下的均衡存在结果。
本文针对去中心化交易所中因转移摩擦产生的成本,通过公理化方法刻画了稳健线性分配机制与稳健条件均值分配机制,并将其与去中心化风险分担文献建立了联系。
本文提出了名为-IPOMDP 的计算框架,通过结合反事实异常检测与离策略策略,使具备有限嵌套对手模型的智能体能够识别并威慑更深层递归能力的欺骗行为,从而在博弈中实现更公平的结局。
本文扩展了现有变分不等式跟踪理论,不仅为非单调函数和周期性非次线性路径情形提供了跟踪界,还深入研究了周期性时变变分不等式离散动力系统的收敛行为与轨迹,揭示了其可能呈现的混沌特性或收敛至解的现象。
本文提出了一种针对混合整数纳什均衡问题(包括标准型与广义型)的分支切割算法,该算法通过利用 Nikaido-Isoda 函数将博弈重构为双层优化问题,并结合特定的割平面策略,在有限步内计算出纯纳什均衡或判定其不存在。
本文提出了一种结合大语言模型(LLM)与贝叶斯说服理论的新框架,通过形式化语言框架对接收者先验信念的影响,并辅以迭代提示优化与解析求解器,实现了在自然语言框架空间中对信息设计策略的有效联合优化。