A Lightweight MPC Bidding Framework for Brand Auction Ads

이 논문은 브랜드 광고의 고유한 특성을 활용하여 복잡한 머신러닝 모델 없이도 온라인 등분위 회귀를 통해 단조로운 입찰 - 지출 및 입찰 - 전환 모델을 구축하는 경량 예측 제어 (MPC) 프레임을 제안하며, 이를 통해 실시간 입찰 환경에서 지출 효율성과 비용 통제력을 크게 향상시킨다고 설명합니다.

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan WangTue, 10 Ma🤖 cs.LG

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

이 논문은 기존 1 단계 역게임 이론의 한계를 극복하기 위해, 다중 에이전트 간 상호작용에서 각 에이전트가 상대방의 목표에 대해 어떻게 추론하는지를 파악하는 2 단계 역게임 추론 프레임워크를 제안하고, 이를 통해 실제 시나리오에서 발생하는 목표 불일치를 효과적으로 규명합니다.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

이 논문은 분산형 에너지 자원의 복잡한 선호도를 반영하면서도 프로슈머의 인지적 부담을 줄이기 위해, 기계 학습을 활용한 조합 시계 교환 방식을 도입하여 지역 에너지 시장의 선호도 수집을 간소화하고 효율적인 가격 수렴을 달성하는 새로운 시장 메커니즘을 제안합니다.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

이 논문은 리더 - 팔로워 상호작용에 Pearl 의 인과 계층을 도입한 순차적 인과적 다중 에이전트 시스템 (S-CMAS) 을 제안하고 이론적 분석을 수행했으나, 50 회 이상의 시뮬레이션과 합성 예시를 통해 합리적 최선 대응을 전제로 한 역산 (backward induction) 하에서는 고전적 스택버그 균형 대비 후생 개선 효과가 전혀 나타나지 않는다는 부정적 결론을 도출하여, 합리적 선택에 기반한 고전적 게임 이론 프레임워크가 인과적 추론의 이점을 포착하는 데 근본적인 한계가 있음을 시사합니다.

Dennis ThummThu, 12 Ma📊 stat

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

이 논문은 이론적 근거가 부족한 기존 ToM 벤치마크의 한계를 극복하기 위해 양자적 반응 균형 (QRE) 을 기반으로 한 게임 이론적 평가 프레임워크를 제안하고, 이를 통해 다양한 대규모 언어 모델의 전략적 추론 능력을 인간 데이터에 기반한 연속적 척도로 정량화하고 검증했습니다.

Mateo Pechon-Elkins, Jon ChunThu, 12 Ma💻 cs

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

이 논문은 블랙박스 신경망 정책의 해석 불가능성을 해결하기 위해 대규모 언어 모델을 활용해 인간이 읽을 수 있는 코드로 직접 정책을 생성하는 '코드-스페이스 응답 오라클 (CSRO)' 프레임워크를 제안하며, 이를 통해 경쟁력 있는 성능과 함께 설명 가능한 다양한 다중 에이전트 전략을 도출할 수 있음을 보여줍니다.

Daniel Hennes, Zun Li, John Schultz, Marc LanctotThu, 12 Ma🤖 cs.AI

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

이 논문은 그래프 기반 메트릭 선호도 환경에서 즉각 결선투표 (IRV) 의 배제 구역 (exclusion zone) 문제와 왜곡 (distortion) 을 연구하여, 일반 그래프에서는 NP-난해하지만 트리 구조에서는 다항 시간 내에 해결 가능함을 증명하고, 특정 조건을 만족하는 모든 순위 기반 탈락 규칙에 대해 해당 문제의 계산적 한계를 규명했습니다.

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

Algorithmic Collusion by Large Language Models

이 논문은 대규모 언어 모델 (LLM) 기반 가격 책정 에이전트가 과점 시장에서 자율적으로 초경쟁적 가격을 형성하며, 프롬프트의 사소한 변화가 가격 수준에 큰 영향을 미치고 경매 상황으로도 확장된다는 점을 실험을 통해 규명하여 AI 기반 가격 결정의 규제에 새로운 도전을 제기한다고 요약할 수 있습니다.

Sara Fish, Yannai A. Gonczarowski, Ran I. ShorrerMon, 09 Ma🤖 cs.AI

On the Existence of Fair Allocations for Goods and Chores under Dissimilar Preferences

이 논문은 고란틀라 (Gorantla) 등이 제기한 미해결 문제를 해결하여, 동일한 선호도를 가진 dd개 그룹과 tt종류의 재화 (또는 채무) 에 대해 공정한 할당이 존재하도록 하는 각 재화 유형의 최소 개수 μ\mu에 대한 명시적 상한을 유도하고, 이를 구성적 증명과 케이크 나누기 등 관련 영역으로 확장하는 새로운 기법을 제시합니다.

Egor Gagushin, Marios Mertzanidis, Alexandros PsomasMon, 09 Ma💻 cs

Test-then-Punish: A Statistical Approach to Repeated Games

이 논문은 불완전 감시 하의 반복 게임에서 가설 검정을 기반으로 한 '테스트 후 처벌' 전략을 제시하여, 협력적 혼합 행동 프로필을 관찰된 순수 행동의 실현을 통해 통계적으로 검증하고 편차 증거가 축적되면 영구적으로 처벌로 전환함으로써 불완전 감시 조건에서도 Folk 정리를 성립시키는 방법을 연구합니다.

Aymeric Capitaine, Antoine Scheid, Etienne Boursier, Alain Durmus, Michael I. JordanMon, 09 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

이 논문은 다중 에이전트 협력의 질을 평가할 때 기존 성과 기반 지표가 시간적 구조를 간과하여 협력 실패를 놓칠 수 있음을 지적하고, 이를 해결하기 위해 '완벽한 교대 (Perfect Alternation)'를 기준으로 한 새로운 시간 민감성 지표 (ALT) 를 제안하며, 이를 통해 학습된 정책이 전통적 지표에서는 높은 점수를 받지만 무작위 정책보다 협력 성능이 현저히 낮을 수 있음을 실증합니다.

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG