Incentive Design with Spillovers

Ce papier développe une généralisation multi-agent de l'approche du premier ordre pour l'optimisation des contrats, démontrant que l'allocation optimale des incitations doit égaliser le produit de la productivité individuelle, de la centralité organisationnelle et de la sensibilité aux incitations monétaires, tout en explorant les implications de ces résultats sur la rémunération de l'habileté versus la collaborativité et la dispersion des salaires.

Krishna Dasaratha, Benjamin Golub, Anant ShahFri, 13 Ma📈 econ

Regularized Online RLHF with Generalized Bilinear Preferences

Cet article propose une méthode d'apprentissage par renforcement à partir de préférences humaines en ligne régularisée, fondée sur un modèle de préférences bilinéaires généralisées, qui établit pour la première fois des garanties d'efficacité statistique en haute dimension avec des bornes de regret indépendantes de la dimension ou de la force de régularisation.

Junghyun Lee, Minju Hong, Kwang-Sung Jun + 2 more2026-03-06💻 cs

Large Language Models as Bidding Agents in Repeated HetNet Auction

Cette étude propose un cadre d'enchères distribué pour les réseaux hétérogènes où des agents basés sur des modèles de langage (LLM) permettent aux équipements utilisateurs de prendre des décisions d'enchères stratégiques et adaptatives sur le long terme, surpassant ainsi les politiques traditionnelles en termes d'accès aux canaux et d'efficacité budgétaire.

Ismail Lotfi, Ali Ghrayeb, Samson Lasaulce + 1 more2026-03-06💻 cs

Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

Cet article propose un cadre de jeu de Stackelberg à trois niveaux intégrant des agents non-suiveurs et des leaders hétérogènes pour mieux modéliser les interactions stratégiques dans les systèmes congestionnés, en démontrant que négliger les agents non participants fausse les prédictions d'équilibre, comme illustré par le cas de l'infrastructure de recharge des véhicules électriques.

Niloofar Aminikalibar, Farzaneh Farhadi, Maria Chli2026-03-06💻 cs

\aleph-IPOMDP: Mitigating Deception in a Cognitive Hierarchy with Off-Policy Counterfactual Anomaly Detection

Le papier propose le cadre \aleph-IPOMDP, qui intègre une détection d'anomalies et une politique hors-belief aux agents d'apprentissage par renforcement pour leur permettre de détecter et de contrer la manipulation par des agents aux capacités de modélisation récursive supérieures, améliorant ainsi la sécurité et l'équité dans les interactions stratégiques.

Nitay Alon, Joseph M. Barnby, Stefan Sarkadi + 3 more2026-03-05💻 cs