Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Il lavoro propone CORA, un metodo di assegnazione del credito per l'apprendimento per rinforzo multi-agente cooperativo che utilizza il nucleo della teoria dei giochi cooperativi e il campionamento casuale delle coalizioni per allocare in modo più efficace i vantaggi globali e promuovere comportamenti coordinati ottimali.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Two-Stage Stochastic Capacity Expansion in Stable Matching under Truthful or Strategic Preference Uncertainty

Questo articolo introduce un problema di espansione stocastica della capacità in due stadi per il matching stabile, analizzando come l'incertezza sulle preferenze degli studenti, sia esogena (veridiche) che endogena (strategiche), influenzi le decisioni di pianificazione delle capacità e proponendo approcci basati sull'approssimazione della media campionaria e euristiche per ottimizzare i risultati di assegnazione.

Maria Bazotte, Margarida Carvalho, Thibaut VidalWed, 11 Ma🔢 math

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Il paper presenta \texttt{electoral\_sim}, un framework open-source in Python che simula e confronta diversi sistemi elettorali in scenari di distribuzione degli elettori, valutandoli in base alla loro capacità di avvicinarsi alla mediana geometrica della distribuzione e includendo un meccanismo ipotetico basato su un kernel softmax di Boltzmann come limite teorico superiore.

Sumit MukherjeeWed, 11 Ma💻 cs

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Il paper propone \texttt{RQRE-OVI}, un algoritmo di iterazione dei valori ottimistico basato su approssimazione lineare che calcola l'Equilibrio di Risposta Quantale Sensibile al Rischio (RQRE) in giochi di Markov a somma generale, offrendo un compromesso controllabile tra prestazioni ottimali e robustezza rispetto agli errori di approssimazione e alla molteplicità degli equilibri.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. RatliffWed, 11 Ma🤖 cs.LG

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

Questo articolo presenta "Platooning as a Service" (PlaaS), un framework decisionale basato su un gioco di Stackelberg che ottimizza la tariffazione e l'adesione al convoglio per veicoli autonomi connessi, dimostrando come le politiche di prezzo e i sussidi governativi possano massimizzare i profitti del fornitore e ridurre le emissioni di CO₂, sebbene i benefici sul consumo di carburante siano ottimali solo a velocità moderate.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand AbrahambWed, 11 Ma💻 cs

The Illusion of Collusion

Lo studio dimostra che agenti algoritmici privi di informazioni dirette sui concorrenti possono sviluppare una "collusione ingenua" nei giochi ripetuti, la cui probabilità di emergere dipende criticamente dalla sincronizzazione delle azioni e dal tipo di politica di apprendimento utilizzata, variando da impossibile a certa a seconda che gli algoritmi siano persistentemente casuali, asintoticamente deterministici o puramente deterministici.

Connor Douglas, Foster Provost, Arun SundararajanTue, 10 Ma💻 cs

Informal and Privatized Transit: Incentives, Efficiency and Coordination

Questo studio sviluppa un modello teorico e propone meccanismi di intervento, come il routing gerarchico e la cross-sussidiazione, per ottimizzare l'efficienza e coordinare i sistemi di trasporto informale e privatizzato, i quali, pur essendo essenziali per la mobilità urbana, operano spesso in modo decentralizzato con conseguenti perdite di rendimento che possono essere mitigate attraverso politiche pubbliche mirate.

Devansh Jalota, Matthew TsaoTue, 10 Ma🔢 math

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

Questo lavoro presenta un framework ibrido HMM-POMDP per la strategia energetica della Formula 1 del 2026, che combina un modello a stati nascosti per inferire lo stato dei rivali da dati parzialmente osservabili con una rete neurale profonda per ottimizzare le decisioni di deployment energetico e rilevare strategie ingannevoli come la "counter-harvest trap".

Kalliopi KleisarchakiTue, 10 Ma🤖 cs.LG