cs.GT articles | Gist.Science

Characterizations of voting rules based on majority margins

Cet article établit que les règles de vote basées sur les marges majoritaires sont caractérisées par un ensemble d'axiomes à contenu normatif clair, notamment le principe d'égalité préférentielle qui garantit un traitement équitable des préférences individuelles entre candidats.

Yifeng Ding, Wesley H. Holliday, Eric PacuitWed, 11 Ma📈 econ

On the Impact of the Utility in Semivalue-based Data Valuation

Cet article propose une méthodologie pratique basée sur la notion de « signature spatiale » d'un ensemble de données pour évaluer et garantir la robustesse des évaluations de données par semi-valeurs face aux variations du choix de l'utilité.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Cette présentation propose CORA, une méthode d'attribution de crédit pour l'apprentissage par renforcement multi-agent coopératif qui utilise l'allocation du noyau de la théorie des jeux coopératifs et l'échantillonnage aléatoire de coalitions pour optimiser l'apprentissage des politiques en attribuant les avantages globaux aux stratégies de coalition.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Two-Stage Stochastic Capacity Expansion in Stable Matching under Truthful or Strategic Preference Uncertainty

Cet article propose une approche d'expansion de capacité en deux étapes pour les marchés d'appariement stables, modélisant l'incertitude des préférences (exogène ou stratégique) via une approximation par moyenne d'échantillons et des heuristiques pour optimiser les décisions de capacité avant l'appariement.

Maria Bazotte, Margarida Carvalho, Thibaut VidalWed, 11 Ma🔢 math

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Cet article propose un méta-jeu conçu pour évaluer l'émergence de la collusion algorithmique lors de la phase de test, en modélisant des agents avec des politiques préentraînées et des règles d'adaptation pour analyser leurs interactions stratégiques dans des jeux de prix répétés.

Yuhong Luo, Daniel Schoepflin, Xintong WangWed, 11 Ma💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Cet article présente \texttt{electoral\_sim}, un cadre open-source en Python qui simule et compare la performance de divers systèmes électoraux, y compris un mécanisme hypothétique basé sur un noyau softmax de Boltzmann, en mesurant leur capacité à se rapprocher de la médiane géométrique des électeurs à travers des distributions de préférences variées.

Sumit MukherjeeWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Cet article propose l'algorithme \texttt{RQRE-OVI}, une méthode d'apprentissage par renforcement multi-agent avec approximation linéaire qui calcule un équilibre de réponse quantale sensible au risque, offrant ainsi une solution unique, stable et robuste avec des garanties de convergence et un compromis contrôlé entre performance et résilience.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

Cet article propose le cadre « Platooning as a Service » (PlaaS), modélisé comme un jeu de Stackelberg, pour optimiser la tarification et les contrats de services de pelotonnage de véhicules connectés et autonomes afin de réduire les émissions de carbone et d'améliorer l'efficacité du transport, tout en analysant l'impact des subventions gouvernementales et des paramètres opérationnels sur la durabilité.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand AbrahambWed, 11 Ma💻 cs

Game-Theoretic Modeling of Stealthy Intrusion Defense against MDP-Based Attackers

Cette étude modélise la défense contre les menaces persistantes avancées (APT) comme un jeu stratégique entre un attaquant et un défenseur sur un graphe d'attaque, en dérivant des stratégies défensives optimales sous trois régimes d'information distincts : Stackelberg, aveugle et basé sur les croyances.

Willie Kouam, Stefan RassWed, 11 Ma💻 cs

Proportionality Degree in Participatory Budgeting

Cette étude initie l'analyse du degré de proportionnalité dans le budget participatif en démontrant que, malgré des garanties axiomatiques différentes, les règles de la Méthode des Parts Égales et de Phragmen offrent un degré de proportionnalité quantitativement équivalent, une conclusion validée par des expérimentations sur des données réelles.

Aris Filos-Ratsikas, Sreedurga Gogulapati, Georgios KalantzisWed, 11 Ma💻 cs

The 802.11 MAC protocol leads to inefficient equilibria

Cette étude démontre, à l'aide d'une modélisation théorique des jeux et de simulations, que le protocole MAC 802.11 actuel conduit des nœuds non coopératifs à des équilibres de Nash inefficaces, et propose qu'un protocole idéal dissociant l'allocation des ressources des stratégies de transmission permettrait d'atteindre des équilibres offrant un débit supérieur à tous les nœuds.

Godfrey Tan, John GuttagWed, 11 Ma💻 cs

A Robust Multi-Item Auction Design with Statistical Learning

Cet article propose une nouvelle méthode d'apprentissage statistique pour les enchères multi-objets utilisant des intervalles de crédibilité afin de réduire les coûts d'implémentation tout en garantissant, avec une forte probabilité, l'équité, la compatibilité incitative et la rationalité individuelle.

Jiale Han, Xiaowu DaiTue, 10 Ma💻 cs

The Illusion of Collusion

Cette étude démontre que des agents algorithmiques apprenant sans modèle préalable peuvent développer une « collusion naïve » dans des jeux répétés, un phénomène dont l'émergence dépend crucialement de la synchronisation des actions et du type de politique d'apprentissage utilisée, allant de l'absence totale de collusion avec des algorithmes persistamment aléatoires à une collusion systématique avec des algorithmes déterministes comme UCB.

Connor Douglas, Foster Provost, Arun SundararajanTue, 10 Ma💻 cs

Feedback Control for Small Budget Pacing

Cet article propose une méthode de contrôle par rétroaction combinant l'hystérésis et la proportionnalité pour stabiliser et optimiser le pacing des budgets publicitaires, en particulier pour les petites campagnes, réduisant ainsi significativement les erreurs de déploiement et la volatilité par rapport aux approches existantes.

Sreeja Apparaju, Yichuan Niu, Xixi QiTue, 10 Ma🤖 cs.LG

Informal and Privatized Transit: Incentives, Efficiency and Coordination

Cet article propose un cadre théorique et des mécanismes d'intervention, tels que le routage de type Stackelberg et la subvention croisée, pour optimiser l'efficacité des systèmes de transit informels et privatisés en alignant les incitations des opérateurs privés sur les objectifs de mobilité publique, comme le démontrent des simulations basées sur un cas réel en Inde.

Devansh Jalota, Matthew TsaoTue, 10 Ma🔢 math

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

Cet article propose un cadre hybride combinant un modèle de Markov caché et un réseau de neurones profond pour inférer les états cachés des rivaux et optimiser la stratégie énergétique en Formule 1 2026, permettant ainsi de détecter des tactiques de contre-récolte dans un environnement partiellement observable.

Kalliopi KleisarchakiTue, 10 Ma🤖 cs.LG

Bilateral Trade Under Heavy-Tailed Valuations: Minimax Regret with Infinite Variance

Cet article établit le taux de regret minimax optimal pour le commerce bilatéral contextuel avec des valorisations à variance infinie, en démontrant qu'un algorithme basé sur l'estimation de moyenne tronquée atteint ce taux en interpolant entre les régimes de moments finis et infinis.

Hangyi ZhaoTue, 10 Ma🤖 cs.LG

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

Ce papier propose NePPO, une nouvelle méthode d'optimisation de politique pour l'apprentissage par renforcement multi-agent dans des jeux à somme générale, qui apprend une fonction de potentiel commune pour approximer un équilibre de Nash et surpasse les approches existantes comme MAPPO et MADDPG.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay MaheshwariTue, 10 Ma🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

Cet article démontre que la régulation de l'équité basée uniquement sur l'absence d'effet moyen de traitement (ATE) peut masquer des inégalités causales significatives via un problème d'optimisation linéaire, soulignant la nécessité de passer d'une régulation au niveau des décisions à une régulation au niveau des modèles pour détecter ces biais cachés.

Zou Yang, Sophia Xiao, Bijan MazaheriTue, 10 Ma🤖 cs.LG

Randomise Alone, Reach as a Team

Cet article étudie les jeux graphiques concurrents où une équipe de joueurs coopère avec des sources de randomisation privées et indépendantes pour atteindre un état cible, démontrant que le problème de seuil se situe dans la théorie existentielle des réels et est NP-difficile, tandis que la quasi-certitude est NP-complète, et introduisant la logique IRATL pour formaliser ces scénarios.

Léonard Brice, Thomas A. Henzinger, Alipasha Montaseri, Ali Shafiee, K. S. ThejaswiniTue, 10 Ma💻 cs