cs.GT 편의 논문 | Gist.Science

Characterizations of voting rules based on majority margins

이 논문은 투표 규칙이 승패 마진에 의해서만 결정되는 '마진 기반 규칙'인 것과, 유권자들의 선호가 동등하게 대우된다는 '선호 평등'을 포함한 명백한 규범적 공리들을 만족하는 것이 동치임을 증명합니다.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

On the Impact of the Utility in Semivalue-based Data Valuation

이 논문은 시미밸류 기반 데이터 가치 평가의 유틸리티 선택에 따른 민감도 문제를 해결하기 위해 데이터 포인트를 저차원 공간에 매핑하는 '공간 서명' 개념을 도입하고, 이를 통해 유틸리티 변경에 따른 평가 결과의 강건성을 정량적으로 측정하는 실용적인 방법론을 제시합니다.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

이 논문은 협력적 다중 에이전트 강화학습의 신용 할당 문제를 해결하기 위해 협력 게임 이론의 코어 (core) 개념을 도입하여 연합별 기여도를 평가하고 할당하는 CORA 알고리즘을 제안하며, 이를 통해 에이전트 간 조율된 최적 행동을 유도하고 기존 방법들보다 우수한 성능을 입증합니다.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Two-Stage Stochastic Capacity Expansion in Stable Matching under Truthful or Strategic Preference Uncertainty

이 논문은 학교 선택 시장과 같은 다대일 매칭 시장에서 학생의 선호가 확정되기 전에 이루어지는 용량 확장 문제를 다루며, 학생이 진실된 선호를 밝히거나 전략적으로 보고하는 경우를 모두 고려한 2 단계 확률적 모형을 제안하고 샘플 평균 근사법 (SAA) 기반의 휴리스틱을 통해 최적의 용량 결정 전략을 모색합니다.

Maria Bazotte, Margarida Carvalho, Thibaut VidalWed, 11 Ma🔢 math

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

이 논문은 학습 시간 제약 하에서 사전 훈련된 정책과 적응 규칙을 결합한 메타 게임 설계를 통해 합리적 선택 하에 알고리즘적 담합이 발생할 수 있는지와 다양한 전략의 효과를 반복 가격 결정 게임에서 평가합니다.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

이 논문은 유권자 선호 분포 시나리오를 기반으로 다양한 선거 제도를 시뮬레이션하고 비교하는 오픈 소스 파이썬 프레임워크인 `electoral_sim`을 소개하며, 기존 제도부터 볼츠만 소프트맥스 커널을 활용한 새로운 가상의 메커니즘까지 다양한 방식의 선거 결과와 유권자 분포의 기하학적 중앙값 간 거리를 분석합니다.

Sumit MukherjeeWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

이 논문은 대규모 상태 공간에서 일반합 마르코프 게임의 균형 계산을 위해 선형 함수 근사를 활용한 'RQRE-OVI' 알고리즘을 제안하며, 합리성과 위험 민감도 매개변수 간의 균형을 통해 나시 균형 대비 계산적 효율성과 강건성을 동시에 확보하는 이론적·실증적 성과를 입증합니다.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

이 논문은 카라시 - 쿠 - 터커 조건을 기반으로 스택버그 게임을 적용하여 Platooning as a Service(PlaaS) 플랫폼의 최적 가격 정책과 서비스 계약을 도출하고, 정부 보조금 및 다양한 운영 변수가 플레이어의 효용과 탄소 배출에 미치는 영향을 분석하여 지속 가능한 교통 체계를 제시합니다.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand AbrahambWed, 11 Ma💻 cs

Game-Theoretic Modeling of Stealthy Intrusion Defense against MDP-Based Attackers

이 논문은 공격자가 MDP 기반으로 행동하는 고급 지속 위협 (APT) 에 대응하여, 공격자의 정보 수준 (Stackelberg, 무지, 확률적 신념) 에 따라 공격 그래프 상에서의 은밀한 침입을 방어하기 위한 게임 이론적 최적 방어 전략을 제시합니다.

Willie Kouam, Stefan RassWed, 11 Ma💻 cs

Proportionality Degree in Participatory Budgeting

이 논문은 참여 예산 배분에서 '동등 분배법 (MES)'과 '프라그멘의 순차적 규칙'의 비례성 정도를 이론적으로 분석하고 실험적으로 검증하여, 공리적 보장이 더 강한 MES 도 두 규칙이 정량적 관점에서는 동일한 비례성 정도를 가진다는 사실을 규명했습니다.

Aris Filos-Ratsikas, Sreedurga Gogulapati, Georgios KalantzisWed, 11 Ma💻 cs

The 802.11 MAC protocol leads to inefficient equilibria

이 논문은 비협력적 환경에서 802.11 MAC 프로토콜이 개별 노드의 비합리적 전략으로 인해 시스템 전체의 비효율적 균형에 도달하게 된다는 것을 게임 이론과 시뮬레이션으로 증명하고, 공유 채널 자원 할당과 개별 전송 전략을 분리하는 이상적인 프로토콜을 통해 모든 노드가 더 높은 처리량을 달성할 수 있음을 제시합니다.

Godfrey Tan, John GuttagWed, 11 Ma💻 cs

A Robust Multi-Item Auction Design with Statistical Learning

이 논문은 역사적 데이터를 기반으로 한 비모수 밀도 추정과 신뢰구간을 활용하여 다중 품목 경매의 실행 비용을 줄이면서도 공정성과 인센티브 호환성을 보장하는 새로운 통계적 학습 전략을 제안하고, 이를 통해 수익 극대화와 비용 절감을 동시에 달성함을 입증합니다.

Jiale Han, Xiaowu DaiTue, 10 Ma💻 cs

The Illusion of Collusion

이 논문은 경쟁자가 서로의 상태나 행동을 알지 못하는 상황에서도 다중-팔 밴딧 알고리즘이 동기화된 행동을 통해 '순진한 담합'을 학습할 수 있음을 보여주며, 이는 탐험과 확정을 어떻게 균형시키는지에 따라 발생 여부가 결정된다고 주장합니다.

Connor Douglas, Foster Provost, Arun SundararajanTue, 10 Ma💻 cs

Feedback Control for Small Budget Pacing

이 논문은 동적 경매 환경에서 소액 광고 캠페인의 예산 조절을 위해 히스테리시스와 비례 피드백을 결합한 제어 이론 기반의 안정적이고 적응적인 pacing 알고리즘을 제안하며, 이를 통해 기존 방법 대비 pacing 오차를 13%, $\lambda$ -변동성을 54% 감소시키는 효과를 입증했습니다.

Sreeja Apparaju, Yichuan Niu, Xixi QiTue, 10 Ma🤖 cs.LG

Informal and Privatized Transit: Incentives, Efficiency and Coordination

이 논문은 비공식 및 사유화된 교통 서비스의 효율성 저하 문제를 게임 이론적 모델로 분석하고, 중앙 통제와 보조금 등 다양한 개입 메커니즘을 통해 시스템 성능을 개선할 수 있음을 제시합니다.

Devansh Jalota, Matthew TsaoTue, 10 Ma🔢 math

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

이 논문은 2026 년 포뮬러 1 의 새로운 에너지 규정 하에서 경쟁 차량의 숨겨진 상태를 추정하는 30 상태 은닉 마르코프 모델 (HMM) 과 이를 기반으로 에너지 전략을 결정하는 심층 Q-네트워크 (DQN) 로 구성된 2 층 프레임워크를 제시하여, 경쟁자의 의도적 기만 전술을 탐지하고 최적의 에너지 배분 정책을 수립할 수 있음을 보여줍니다.

Kalliopi KleisarchakiTue, 10 Ma🤖 cs.LG

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

이 논문은 분산이 무한한 중꼬리 분포를 가진 거래자 평가 하에서 컨텍스트 양자 거래 문제를 연구하여, 유계 밀도 조건 하의 자기-경계 성질을 확장하고 절단된 평균 추정법을 결합해 최적의 최소최대 후회율을 도출하고 이를 하한과 일치시킴으로써 $p=2$ 의 고전적 비모수율과 $p \to 1^+$ 의 선형율 사이의 정확한 수렴 속도를 규명했습니다.

Hangyi ZhaoTue, 10 Ma🤖 cs.LG

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

이 논문은 일반합 게임 환경에서 근사 나시 균형을 계산하기 위해 플레이어 독립적인 잠재 함수를 학습하여 협력적 게임의 균형을 원본 게임의 균형으로 근사시키는 새로운 MARL 파이프라인인 NePPO(Near-Potential Policy Optimization) 를 제안하고, 이를 통해 기존 기법들보다 우수한 성능을 입증합니다.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay MaheshwariTue, 10 Ma🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

이 논문은 평균 치료 효과 (ATE) 가 0 인 상태에서도 최적화 과정에서 숨겨진 인과적 편향이 발생할 수 있음을 '인과적 가림' 문제로 규명하고, 이를 탐지하기 어렵기 때문에 공정성 규제를 개별 결정이 아닌 모델 수준에서 수행해야 함을 주장합니다.

Zou Yang, Sophia Xiao, Bijan MazaheriTue, 10 Ma🤖 cs.LG

Randomise Alone, Reach as a Team

이 논문은 플레이어 간 공유된 무작위성이 없는 분산 무작위화 환경에서 협력하는 동시 그래프 게임의 임계값 및 거의 확실한 도달 문제를 연구하여 메모리 없는 전략의 충분성, 계산 복잡도 결과, 그리고 이를 위한 새로운 논리 IRATL 과 솔버를 제시합니다.

Léonard Brice, Thomas A. Henzinger, Alipasha Montaseri, Ali Shafiee, K. S. ThejaswiniTue, 10 Ma💻 cs