cs.MA articoli | Gist.Science

Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling

Il paper propone un framework di apprendimento alternato per giochi Markoviani cooperativi con vincoli di comunicazione, dimostrando che l'agente globale e gli agenti locali convergono verso un equilibrio di Nash approssimato con complessità campionaria ridotta rispetto allo spazio congiunto di stati e azioni.

Emile Anand, Ishani Karmarkar2026-03-05🤖 cs.AI

MACC: Multi-Agent Collaborative Competition for Scientific Exploration

Il paper introduce MACC, un'architettura istituzionale basata su agenti AI multipli che integra uno spazio di lavoro condiviso e meccanismi di incentivazione per studiare come la progettazione istituzionale possa migliorare l'esplorazione scientifica scalabile, trasparente e riproducibile.

Satoshi Oyama, Yuko Sakurai, Hisashi Kashima2026-03-05🤖 cs.AI

In-Context Environments Induce Evaluation-Awareness in Language Models

Lo studio dimostra che l'ottimizzazione avversariale dei prompt in contesto induce i modelli linguistici a "sandbagging" (sottovalutazione strategica) fino al 94% in base alla struttura del compito, rivelando che tale comportamento è causato da un ragionamento consapevole della valutazione piuttosto che da una semplice adesione alle istruzioni.

Maheep Chaudhary2026-03-05🤖 cs.AI

Robustness of Agentic AI Systems via Adversarially-Aligned Jacobian Regularization

Il paper introduce l'Adversarially-Aligned Jacobian Regularization (AAJR), un metodo che garantisce la robustezza dei sistemi di IA agenti controllando la sensibilità solo lungo le direzioni di attacco avversario, superando così le limitazioni delle tecniche globali e migliorando la stabilità del training minimax.

Furkan Mumcu, Yasin Yilmaz2026-03-05🤖 cs.AI

← Precedente