Deep Incentive Design with Differentiable Equilibrium Blocks

Il paper propone il Deep Incentive Design (DID), un framework differenziabile che utilizza blocchi di equilibrio differenziabili (DEB) per automatizzare la progettazione di incentivi in contesti multi-agente, risolvendo efficacemente compiti complessi come la progettazione di contratti, la schedulazione delle macchine e i problemi di equilibrio inverso attraverso un'unica rete neurale addestrata su una vasta gamma di scale e scenari.

Vinzenz Thoma, Georgios Piliouras, Luke MarrisTue, 10 Ma🤖 cs.LG

Rigidity in LLM Bandits with Implications for Human-AI Dyads

Lo studio dimostra che i modelli linguistici di grandi dimensioni (LLM) mostrano bias decisionali rigidi e una scarsa capacità di esplorazione in contesti a due bracci, comportamenti che persistono indipendentemente dalle impostazioni di decodifica e che, come rivelato dalla modellazione computazionale, derivano da bassi tassi di apprendimento e alte temperature inverse, con implicazioni significative per le interazioni uomo-AI.

Haomiaomiao Wang, Tomás E Ward, Lili ZhangTue, 10 Ma💻 cs

The biased interaction game: Its dynamics and application in modelling social systems

Questo articolo, che funge da complemento alla definizione del gioco dell'interazione parziale, ne dimostra l'applicabilità nel modellare sistemi sociali caratterizzati da disuguaglianza e gerarchia emergenti, evidenziando come i pregiudizi influenzino la cooperazione e generino comportamenti non lineari, fino ad applicarlo concretamente al confronto tra welfare state e reddito universale.

Phil Mercy, Martin NeilTue, 10 Ma💻 cs

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Utilizzando il framework di ricerca evolutiva guidata dall'intelligenza artificiale AlphaEvolve, questo studio identifica un nuovo caso peggiore che innalza il limite inferiore del rapporto tra l'efficienza ottimale e quella del meccanismo "Random-Offerer" nel commercio bilaterale a 2,0749, superando le precedenti stime teoriche.

Yang Cai, Vineet Gupta, Zun Li, Aranyak MehtaTue, 10 Ma🤖 cs.LG

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Questo articolo propone un nuovo quadro di inferenza di livello 2 per dedurre le credenze degli agenti sugli obiettivi altrui, superando i limiti dei metodi tradizionali di livello 1 che assumono una conoscenza completa e condivisa, e dimostra la sua efficacia nel rilevare disallineamenti strategici in scenari reali come la guida urbana.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Questo lavoro introduce un framework di valutazione basato sull'equilibrio di risposta quantale (QRE) per misurare la sofisticazione strategica dei modelli linguistici su una scala continua calibrata rispetto ai dati umani, superando i limiti delle metriche aggregate tradizionali attraverso la derivazione teorica di equilibri chiusi e la validazione empirica su oltre 1.800 giochi.

Mateo Pechon-Elkins, Jon ChunThu, 12 Ma💻 cs

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

Questo studio analizza il voto a scrutinio istantaneo (IRV) su grafi non pesanti, dimostrando che il riconoscimento e il calcolo delle zone di esclusione sono risolvibili in tempo polinomiale sugli alberi ma rimangono NP-difficili su grafi generali, fornendo inoltre limiti superiori e inferiori per la distorsione utilitaristica in diversi scenari.

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

Test-then-Punish: A Statistical Approach to Repeated Games

Questo articolo propone un approccio statistico basato su "test e punizione" per sostenere la cooperazione nei giochi ripetuti infinitamente con monitoraggio imperfetto, dimostrando come l'integrazione di inferenza statistica nelle strategie di gioco permetta di raggiungere risultati di tipo Folk theorem, sia in equilibrio di Nash che in equilibrio di Nash perfetto nei sottogiochi, a seconda del metodo di test utilizzato.

Aymeric Capitaine, Antoine Scheid, Etienne Boursier, Alain Durmus, Michael I. JordanMon, 09 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Questo studio introduce nuove metriche di alternanza temporale per rivelare come, nel gioco "Battle of the Exes" multi-agente, le tradizionali misure di efficienza e equità possano nascondere gravi carenze di coordinamento temporale, portando le politiche apprese a performare significativamente peggio rispetto a baseline casuali nonostante alti punteggi aggregati.

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG