Deep Incentive Design with Differentiable Equilibrium Blocks

Cet article propose un cadre d'incitation profonde (DID) utilisant des blocs d'équilibre différentiels (DEB) pour résoudre automatiquement et de manière unifiée divers problèmes de conception d'incitations, tels que la conception de contrats et l'ordonnancement de machines, en entraînant un seul réseau neuronal capable de gérer une large gamme de jeux et d'échelles.

Vinzenz Thoma, Georgios Piliouras, Luke MarrisTue, 10 Ma🤖 cs.LG

The biased interaction game: Its dynamics and application in modelling social systems

Ce papier présente le jeu d'interaction biaisé comme un outil de modélisation des systèmes sociaux, démontrant comment les biais liés à la rareté et au pouvoir génèrent des hiérarchies émergentes et des comportements non linéaires, tout en validant son applicabilité pour analyser des philosophies de redistribution de la richesse comme l'État-providence et le revenu universel de base.

Phil Mercy, Martin NeilTue, 10 Ma💻 cs

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

En utilisant le cadre de recherche évolutionnaire guidée par l'IA nommé AlphaEvolve, cette étude établit une nouvelle borne inférieure de 2,0749 pour le rapport entre l'efficacité optimale et celle du mécanisme de l'offreur aléatoire dans le commerce bilatéral, démontrant ainsi un écart d'efficacité plus large que prévu.

Yang Cai, Vineet Gupta, Zun Li, Aranyak MehtaTue, 10 Ma🤖 cs.LG

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Bien que l'extension théorique des jeux normaux causaux aux interactions séquentielles (S-CMAS) soit élégante et prouvée PSPACE-complète, les simulations empiriques démontrent qu'elle n'apporte aucune amélioration du bien-être par rapport à l'équilibre de Stackelberg classique, révélant ainsi l'incompatibilité fondamentale entre les extensions de la théorie des jeux rationnelle et les avantages du raisonnement causal pour les agents IA.

Dennis ThummThu, 12 Ma📊 stat

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Cet article propose un cadre d'évaluation théorique des grands modèles de langage basé sur l'équilibre de réponse quantale, permettant de mesurer leur sophistication stratégique sur une échelle continue calibrée sur des données humaines et révélant à la fois la validité de cette approche et sa sensibilité aux variations de formulation des prompts.

Mateo Pechon-Elkins, Jon ChunThu, 12 Ma💻 cs

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

Cet article étudie la complexité computationnelle et la distorsion utilitaire du vote par élimination instantanée (IRV) sur des graphes, démontrant que la vérification et le calcul des zones d'exclusion sont polynomiaux sur les arbres mais NP-difficiles sur les graphes généraux, tout en établissant des bornes de distorsion pour divers scénarios.

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Cet article introduit de nouvelles métriques d'alternation temporelles pour révéler que, dans le jeu de la Bataille des Exes multi-agents, les politiques apprises par Q-learning peuvent présenter des scores de justice élevés selon les mesures traditionnelles tout en échouant gravement à coordonner leurs actions dans le temps par rapport à des politiques aléatoires.

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG