cs.GT articoli | Gist.Science

Offer of a reward does not always promote trust in spatial games

Lo studio dimostra che, nei giochi di fiducia spaziali, l'offerta di ricompense non promuove sempre la fiducia, poiché ricompense eccessive possono stimolare strategie di non-ritorno che la sopprimono, mentre costi moderati ma non trascurabili sono più efficaci nel consolidare la cooperazione.

Haidong Zhang, Chaoqian Wang, Shuo Liu, Charo I. del Genio, Stefano Boccaletti, Xin LuTue, 10 Ma💻 cs

A symmetric recursive algorithm for mean-payoff games

Il paper propone un nuovo algoritmo deterministico e simmetrico basato sulla ricorsione per la risoluzione dei giochi a pagamento medio.

Pierre OhlmannTue, 10 Ma💻 cs

Coordination Games on Multiplex Networks: Consensus, Convergence, and Stability of Opinion Dynamics

Questo studio analizza la dinamica delle opinioni su reti multiplex, dimostrando come l'interazione tra più strati possa indurre o accelerare il consenso globale attraverso modelli di aggregazione e commutazione, pur potendo talvolta destabilizzare accordi locali.

Ruey-An Shiu, Parinaz NaghizadehTue, 10 Ma💻 cs

Deep Incentive Design with Differentiable Equilibrium Blocks

Il paper propone il Deep Incentive Design (DID), un framework differenziabile che utilizza blocchi di equilibrio differenziabili (DEB) per automatizzare la progettazione di incentivi in contesti multi-agente, risolvendo efficacemente compiti complessi come la progettazione di contratti, la schedulazione delle macchine e i problemi di equilibrio inverso attraverso un'unica rete neurale addestrata su una vasta gamma di scale e scenari.

Vinzenz Thoma, Georgios Piliouras, Luke MarrisTue, 10 Ma🤖 cs.LG

Rigidity in LLM Bandits with Implications for Human-AI Dyads

Lo studio dimostra che i modelli linguistici di grandi dimensioni (LLM) mostrano bias decisionali rigidi e una scarsa capacità di esplorazione in contesti a due bracci, comportamenti che persistono indipendentemente dalle impostazioni di decodifica e che, come rivelato dalla modellazione computazionale, derivano da bassi tassi di apprendimento e alte temperature inverse, con implicazioni significative per le interazioni uomo-AI.

Haomiaomiao Wang, Tomás E Ward, Lili ZhangTue, 10 Ma💻 cs

A Lightweight MPC Bidding Framework for Brand Auction Ads

Questo articolo propone un framework leggero basato sul controllo predittivo del modello (MPC) per le aste pubblicitarie di brand, che utilizza la regressione isotonica online per costruire modelli monotoni direttamente dai dati in streaming, migliorando l'efficienza della spesa e il controllo dei costi senza la necessità di complessi modelli di machine learning.

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan WangTue, 10 Ma🤖 cs.LG

Leaderboard Incentives: Model Rankings under Strategic Post-Training

Questo studio analizza come i benchmark attuali creino incentivi distorti che portano all'assenza di un equilibrio di Nash, dimostrando tuttavia che il protocollo "tune-before-test" può garantire un'unica soluzione che classifica correttamente i modelli in base alla loro qualità intrinseca.

Yatong Chen, Guanhua Zhang, Moritz HardtTue, 10 Ma🤖 cs.LG

The biased interaction game: Its dynamics and application in modelling social systems

Questo articolo, che funge da complemento alla definizione del gioco dell'interazione parziale, ne dimostra l'applicabilità nel modellare sistemi sociali caratterizzati da disuguaglianza e gerarchia emergenti, evidenziando come i pregiudizi influenzino la cooperazione e generino comportamenti non lineari, fino ad applicarlo concretamente al confronto tra welfare state e reddito universale.

Phil Mercy, Martin NeilTue, 10 Ma💻 cs

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Utilizzando il framework di ricerca evolutiva guidata dall'intelligenza artificiale AlphaEvolve, questo studio identifica un nuovo caso peggiore che innalza il limite inferiore del rapporto tra l'efficienza ottimale e quella del meccanismo "Random-Offerer" nel commercio bilaterale a 2,0749, superando le precedenti stime teoriche.

Yang Cai, Vineet Gupta, Zun Li, Aranyak MehtaTue, 10 Ma🤖 cs.LG

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Questo articolo propone un nuovo quadro di inferenza di livello 2 per dedurre le credenze degli agenti sugli obiettivi altrui, superando i limiti dei metodi tradizionali di livello 1 che assumono una conoscenza completa e condivisa, e dimostra la sua efficacia nel rilevare disallineamenti strategici in scenari reali come la guida urbana.

Hamzah I. Khan, Jingqi Li, David Fridovich-KeilThu, 12 Ma💻 cs

Simplifying Preference Elicitation in Local Energy Markets: Combinatorial Clock Exchange

Questo paper propone un mercato energetico locale basato su un meccanismo di scambio a orologio combinatorio potenziato dall'apprendimento automatico, che semplifica l'espressione delle preferenze complesse dei prosumer eliminando la necessità di previsioni di prezzo e garantendo una rapida convergenza verso prezzi di clearing trasparenti.

Shobhit Singhal, Lesia MitridatiThu, 12 Ma⚡ eess

Sequential Causal Normal Form Games: Theory, Computation, and Strategic Signaling

Il documento estende i giochi causali a scenari sequenziali per modellare agenti AI, dimostrando teoricamente la complessità computazionale ma rivelando empiricamente che tale approccio non offre alcun vantaggio di benessere rispetto all'equilibrio di Stackelberg classico, suggerendo così la necessità di nuovi framework teorici oltre la razionalità standard.

Dennis ThummThu, 12 Ma📊 stat

Deciding winning strategies in Yu-Gi-Oh! TCG is hard

Il paper dimostra che il problema di determinare se una strategia calcolabile garantisce la vittoria in una data situazione del gioco di carte Yu-Gi-Oh! TCG è indecidibile e, più precisamente, completo per la classe $\Pi^1_1$ , estendendo tale risultato a tutte le strategie tramite una riduzione agli ordini ben fondati contabili.

Orazio Nicolosi, Federico Pisciotta, Lorenzo BresolinThu, 12 Ma🔢 math

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Questo lavoro introduce un framework di valutazione basato sull'equilibrio di risposta quantale (QRE) per misurare la sofisticazione strategica dei modelli linguistici su una scala continua calibrata rispetto ai dati umani, superando i limiti delle metriche aggregate tradizionali attraverso la derivazione teorica di equilibri chiusi e la validazione empirica su oltre 1.800 giochi.

Mateo Pechon-Elkins, Jon ChunThu, 12 Ma💻 cs

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

Il paper introduce CSRO, un nuovo framework che sostituisce gli oracoli di apprendimento per rinforzo con modelli linguistici di grandi dimensioni per generare politiche multi-agente interpretabili sotto forma di codice, superando così il problema delle "scatole nere" tipico dei metodi tradizionali.

Daniel Hennes, Zun Li, John Schultz, Marc LanctotThu, 12 Ma🤖 cs.AI

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

Questo studio analizza il voto a scrutinio istantaneo (IRV) su grafi non pesanti, dimostrando che il riconoscimento e il calcolo delle zone di esclusione sono risolvibili in tempo polinomiale sugli alberi ma rimangono NP-difficili su grafi generali, fornendo inoltre limiti superiori e inferiori per la distorsione utilitaristica in diversi scenari.

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul SpirakisThu, 12 Ma💻 cs

Algorithmic Collusion by Large Language Models

Lo studio dimostra che gli agenti di pricing basati su modelli linguistici di grandi dimensioni (LLM) possono autonomamente raggiungere prezzi e profitti supracompetitivi in contesti oligopolistici, influenzati significativamente dalle istruzioni (prompt) e presentando nuove sfide per la regolamentazione futura.

Sara Fish, Yannai A. Gonczarowski, Ran I. ShorrerMon, 09 Ma🤖 cs.AI

On the Existence of Fair Allocations for Goods and Chores under Dissimilar Preferences

Questo lavoro risolve una questione aperta fornendo limiti superiori espliciti per l'esistenza di allocazioni eque di beni e faccende tra gruppi con preferenze identiche, introducendo una tecnica costruttiva che si estende anche alla divisione di torte.

Egor Gagushin, Marios Mertzanidis, Alexandros PsomasMon, 09 Ma💻 cs

Test-then-Punish: A Statistical Approach to Repeated Games

Questo articolo propone un approccio statistico basato su "test e punizione" per sostenere la cooperazione nei giochi ripetuti infinitamente con monitoraggio imperfetto, dimostrando come l'integrazione di inferenza statistica nelle strategie di gioco permetta di raggiungere risultati di tipo Folk theorem, sia in equilibrio di Nash che in equilibrio di Nash perfetto nei sottogiochi, a seconda del metodo di test utilizzato.

Aymeric Capitaine, Antoine Scheid, Etienne Boursier, Alain Durmus, Michael I. JordanMon, 09 Ma💻 cs

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Questo studio introduce nuove metriche di alternanza temporale per rivelare come, nel gioco "Battle of the Exes" multi-agente, le tradizionali misure di efficienza e equità possano nascondere gravi carenze di coordinamento temporale, portando le politiche apprese a performare significativamente peggio rispetto a baseline casuali nonostante alti punteggi aggregati.

Nikolaos Al. Papadopoulos, Konstantinos PsannisMon, 09 Ma🤖 cs.LG

← Precedente Successivo →