On the Impact of the Utility in Semivalue-based Data Valuation

이 논문은 시미밸류 기반 데이터 가치 평가의 유틸리티 선택에 따른 민감도 문제를 해결하기 위해 데이터 포인트를 저차원 공간에 매핑하는 '공간 서명' 개념을 도입하고, 이를 통해 유틸리티 변경에 따른 평가 결과의 강건성을 정량적으로 측정하는 실용적인 방법론을 제시합니다.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

이 논문은 협력적 다중 에이전트 강화학습의 신용 할당 문제를 해결하기 위해 협력 게임 이론의 코어 (core) 개념을 도입하여 연합별 기여도를 평가하고 할당하는 CORA 알고리즘을 제안하며, 이를 통해 에이전트 간 조율된 최적 행동을 유도하고 기존 방법들보다 우수한 성능을 입증합니다.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Two-Stage Stochastic Capacity Expansion in Stable Matching under Truthful or Strategic Preference Uncertainty

이 논문은 학교 선택 시장과 같은 다대일 매칭 시장에서 학생의 선호가 확정되기 전에 이루어지는 용량 확장 문제를 다루며, 학생이 진실된 선호를 밝히거나 전략적으로 보고하는 경우를 모두 고려한 2 단계 확률적 모형을 제안하고 샘플 평균 근사법 (SAA) 기반의 휴리스틱을 통해 최적의 용량 결정 전략을 모색합니다.

Maria Bazotte, Margarida Carvalho, Thibaut VidalWed, 11 Ma🔢 math

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

이 논문은 유권자 선호 분포 시나리오를 기반으로 다양한 선거 제도를 시뮬레이션하고 비교하는 오픈 소스 파이썬 프레임워크인 `electoral_sim`을 소개하며, 기존 제도부터 볼츠만 소프트맥스 커널을 활용한 새로운 가상의 메커니즘까지 다양한 방식의 선거 결과와 유권자 분포의 기하학적 중앙값 간 거리를 분석합니다.

Sumit MukherjeeWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

이 논문은 대규모 상태 공간에서 일반합 마르코프 게임의 균형 계산을 위해 선형 함수 근사를 활용한 'RQRE-OVI' 알고리즘을 제안하며, 합리성과 위험 민감도 매개변수 간의 균형을 통해 나시 균형 대비 계산적 효율성과 강건성을 동시에 확보하는 이론적·실증적 성과를 입증합니다.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

이 논문은 카라시 - 쿠 - 터커 조건을 기반으로 스택버그 게임을 적용하여 Platooning as a Service(PlaaS) 플랫폼의 최적 가격 정책과 서비스 계약을 도출하고, 정부 보조금 및 다양한 운영 변수가 플레이어의 효용과 탄소 배출에 미치는 영향을 분석하여 지속 가능한 교통 체계를 제시합니다.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand AbrahambWed, 11 Ma💻 cs

The 802.11 MAC protocol leads to inefficient equilibria

이 논문은 비협력적 환경에서 802.11 MAC 프로토콜이 개별 노드의 비합리적 전략으로 인해 시스템 전체의 비효율적 균형에 도달하게 된다는 것을 게임 이론과 시뮬레이션으로 증명하고, 공유 채널 자원 할당과 개별 전송 전략을 분리하는 이상적인 프로토콜을 통해 모든 노드가 더 높은 처리량을 달성할 수 있음을 제시합니다.

Godfrey Tan, John GuttagWed, 11 Ma💻 cs

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

이 논문은 2026 년 포뮬러 1 의 새로운 에너지 규정 하에서 경쟁 차량의 숨겨진 상태를 추정하는 30 상태 은닉 마르코프 모델 (HMM) 과 이를 기반으로 에너지 전략을 결정하는 심층 Q-네트워크 (DQN) 로 구성된 2 층 프레임워크를 제시하여, 경쟁자의 의도적 기만 전술을 탐지하고 최적의 에너지 배분 정책을 수립할 수 있음을 보여줍니다.

Kalliopi KleisarchakiTue, 10 Ma🤖 cs.LG

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

이 논문은 분산이 무한한 중꼬리 분포를 가진 거래자 평가 하에서 컨텍스트 양자 거래 문제를 연구하여, 유계 밀도 조건 하의 자기-경계 성질을 확장하고 절단된 평균 추정법을 결합해 최적의 최소최대 후회율을 도출하고 이를 하한과 일치시킴으로써 p=2p=2의 고전적 비모수율과 p1+p \to 1^+의 선형율 사이의 정확한 수렴 속도를 규명했습니다.

Hangyi ZhaoTue, 10 Ma🤖 cs.LG

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

이 논문은 일반합 게임 환경에서 근사 나시 균형을 계산하기 위해 플레이어 독립적인 잠재 함수를 학습하여 협력적 게임의 균형을 원본 게임의 균형으로 근사시키는 새로운 MARL 파이프라인인 NePPO(Near-Potential Policy Optimization) 를 제안하고, 이를 통해 기존 기법들보다 우수한 성능을 입증합니다.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay MaheshwariTue, 10 Ma🤖 cs.LG