cs.GT articles | Gist.Science

Offer of a reward does not always promote trust in spatial games

Cette étude démontre que, dans les jeux de confiance spatiaux, l'offre de récompenses n'encourage pas systématiquement la confiance, car des récompenses excessives ou mal calibrées peuvent paradoxalement stimuler des stratégies de non-remboursement et freiner l'évolution de la confiance.

Haidong Zhang, Chaoqian Wang, Shuo Liu, Charo I. del Genio, Stefano Boccaletti, Xin LuTue, 10 Ma💻 cs

A symmetric recursive algorithm for mean-payoff games

Ce papier propose un nouvel algorithme récursif symétrique et déterministe pour résoudre les jeux à moyenne de gain.

Pierre OhlmannTue, 10 Ma💻 cs

Coordination Games on Multiplex Networks: Consensus, Convergence, and Stability of Opinion Dynamics

Cet article étudie la dynamique des opinions dans les réseaux multiplex en modélisant les mises à jour comme un jeu de coordination, démontrant que les interactions inter-couches peuvent soit accélérer, soit perturber le consensus global selon les mécanismes de couplage et les perturbations du réseau.

Ruey-An Shiu, Parinaz NaghizadehTue, 10 Ma💻 cs

Deep Incentive Design with Differentiable Equilibrium Blocks

Cet article propose un cadre d'incitation profonde (DID) utilisant des blocs d'équilibre différentiels (DEB) pour résoudre automatiquement et de manière unifiée divers problèmes de conception d'incitations, tels que la conception de contrats et l'ordonnancement de machines, en entraînant un seul réseau neuronal capable de gérer une large gamme de jeux et d'échelles.

Vinzenz Thoma, Georgios Piliouras, Luke MarrisTue, 10 Ma🤖 cs.LG

Rigidity in LLM Bandits with Implications for Human-AI Dyads

Cette étude démontre que les grands modèles de langage (LLM) présentent des biais de décision rigides dans des tâches de bandits à deux bras, caractérisés par une faible capacité d'apprentissage et une exploitation excessive qui amplifient les biais de position et pourraient influencer négativement les interactions humain-AI.

Haomiaomiao Wang, Tomás E Ward, Lili ZhangTue, 10 Ma💻 cs

A Lightweight MPC Bidding Framework for Brand Auction Ads

Cet article propose un cadre léger de commande prédictive (MPC) pour les enchères publicitaires de marque, utilisant une régression isotonique en ligne pour optimiser l'efficacité des dépenses et le contrôle des coûts sans recourir à des modèles d'apprentissage automatique complexes.

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan WangTue, 10 Ma🤖 cs.LG

Leaderboard Incentives: Model Rankings under Strategic Post-Training

Cette étude démontre que les benchmarks actuels créent des incitations stratégiques menant à l'absence d'équilibre de Nash, mais prouve qu'un protocole d'évaluation « tune-before-test » permet d'établir un équilibre unique classant les modèles selon leur qualité réelle.

Yatong Chen, Guanhua Zhang, Moritz HardtTue, 10 Ma🤖 cs.LG

The biased interaction game: Its dynamics and application in modelling social systems

Ce papier présente le jeu d'interaction biaisé comme un outil de modélisation des systèmes sociaux, démontrant comment les biais liés à la rareté et au pouvoir génèrent des hiérarchies émergentes et des comportements non linéaires, tout en validant son applicabilité pour analyser des philosophies de redistribution de la richesse comme l'État-providence et le revenu universel de base.

Phil Mercy, Martin NeilTue, 10 Ma💻 cs

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

En utilisant le cadre de recherche évolutionnaire guidée par l'IA nommé AlphaEvolve, cette étude établit une nouvelle borne inférieure de 2,0749 pour le rapport entre l'efficacité optimale et celle du mécanisme de l'offreur aléatoire dans le commerce bilatéral, démontrant ainsi un écart d'efficacité plus large que prévu.

Yang Cai, Vineet Gupta, Zun Li, Aranyak MehtaTue, 10 Ma🤖 cs.LG

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Cet article propose un cadre d'inférence de niveau 2 pour déduire les estimations que les agents ont des objectifs des autres, surmontant ainsi les limites des approches de niveau 1 qui supposent une connaissance complète et partagée des intentions dans les interactions stratégiques décentralisées.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

Ce papier propose un mécanisme de marché local d'énergie combinant l'échange en horloge combinatoire et l'apprentissage automatique pour simplifier l'expression des préférences complexes des prosumers et accélérer la découverte des prix grâce à un format intuitif et transparent.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Bien que l'extension théorique des jeux normaux causaux aux interactions séquentielles (S-CMAS) soit élégante et prouvée PSPACE-complète, les simulations empiriques démontrent qu'elle n'apporte aucune amélioration du bien-être par rapport à l'équilibre de Stackelberg classique, révélant ainsi l'incompatibilité fondamentale entre les extensions de la théorie des jeux rationnelle et les avantages du raisonnement causal pour les agents IA.

Dennis ThummThu, 12 Ma📊 stat

Deciding winning strategies in Yu-Gi-Oh! TCG is hard

Cet article démontre que la décision de l'existence d'une stratégie gagnante dans le jeu de cartes Yu-Gi-Oh! TCG est un problème indécidable et $\Pi^1_1$ -complet, en réduisant le problème de l'arrêt et l'ensemble des ordres bien fondés dénombrables à ce problème via des decks légaux.

Orazio Nicolosi, Federico Pisciotta, Lorenzo BresolinThu, 12 Ma🔢 math

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Cet article propose un cadre d'évaluation théorique des grands modèles de langage basé sur l'équilibre de réponse quantale, permettant de mesurer leur sophistication stratégique sur une échelle continue calibrée sur des données humaines et révélant à la fois la validité de cette approche et sa sensibilité aux variations de formulation des prompts.

Mateo Pechon-Elkins, Jon ChunThu, 12 Ma💻 cs

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

Cet article présente CSRO, un cadre novateur qui remplace les oracles d'apprentissage par renforcement par des modèles de langage pour générer des politiques multi-agents interprétables sous forme de code, tout en maintenant des performances compétitives.

Daniel Hennes, Zun Li, John Schultz, Marc LanctotThu, 12 Ma🤖 cs.AI

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

Cet article étudie la complexité computationnelle et la distorsion utilitaire du vote par élimination instantanée (IRV) sur des graphes, démontrant que la vérification et le calcul des zones d'exclusion sont polynomiaux sur les arbres mais NP-difficiles sur les graphes généraux, tout en établissant des bornes de distorsion pour divers scénarios.

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

Algorithmic Collusion by Large Language Models

Cette étude démontre que des agents de tarification autonomes basés sur des modèles de langage (LLM) peuvent rapidement converger vers des prix supracompetitifs dans des contextes d'oligopole et d'enchères, un phénomène sensible aux variations de leurs instructions et qui soulève de nouveaux défis pour la régulation future.

Sara Fish, Yannai A. Gonczarowski, Ran I. ShorrerMon, 09 Ma🤖 cs.AI

On the Existence of Fair Allocations for Goods and Chores under Dissimilar Preferences

Cet article résout une question ouverte majeure en établissant des bornes supérieures explicites pour l'existence d'allocations équitables de biens et de corvées indivisibles entre plusieurs groupes d'agents aux préférences similaires, grâce à une nouvelle technique constructive applicable également au partage de gâteaux.

Egor Gagushin, Marios Mertzanidis, Alexandros PsomasMon, 09 Ma💻 cs

Test-then-Punish: A Statistical Approach to Repeated Games

Cet article propose une approche statistique fondée sur des tests d'hypothèses pour soutenir la coopération dans les jeux répétés à information imparfaite, en introduisant une stratégie « tester puis punir » qui permet d'atteindre un théorème folk sous des conditions d'inférence adaptées.

Aymeric Capitaine, Antoine Scheid, Etienne Boursier, Alain Durmus, Michael I. JordanMon, 09 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Cet article introduit de nouvelles métriques d'alternation temporelles pour révéler que, dans le jeu de la Bataille des Exes multi-agents, les politiques apprises par Q-learning peuvent présenter des scores de justice élevés selon les mesures traditionnelles tout en échouant gravement à coordonner leurs actions dans le temps par rapport à des politiques aléatoires.

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG

← Précédent Suivant →