cs.MA articoli | Gist.Science

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

Il paper presenta iAgentBench, un nuovo benchmark dinamico per valutare le capacità di sintesi e integrazione di informazioni da più fonti degli agenti di ricerca, superando i limiti dei test attuali che si basano spesso sul recupero di un singolo passaggio.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

Memory as Ontology: A Constitutional Memory Architecture for Persistent Digital Citizens

Questo articolo propone il paradigma "Memoria come Ontologia" e l'architettura costituzionale Animesis per ridefinire la memoria degli agenti AI non come un semplice strumento funzionale, ma come il fondamento ontologico dell'identità digitale che garantisce la continuità del sé attraverso le transizioni dei modelli.

Zhenghui Li2026-03-06💻 cs

LLM-Guided Decentralized Exploration with Self-Organizing Robot Teams

Questo studio propone un metodo di esplorazione decentralizzato per sciami di robot che combina un algoritmo di auto-organizzazione per la formazione dinamica di squadre e una strategia innovativa basata sui grandi modelli linguistici (LLM) per la selezione autonoma degli obiettivi, superando i limiti dei metodi tradizionali in termini di robustezza ed efficienza.

Hiroaki Kawashima, Shun Ikejima, Takeshi Takai + 2 more2026-03-06💻 cs

SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning

Il paper introduce SCoUT, un metodo per l'apprendimento multi-agente che risolve le sfide della comunicazione scalabile e della selezione dei destinatari attraverso l'aggregazione temporale degli agenti, l'uso di vantaggi controfattuali per un'assegnazione precisa del credito e un'architettura che garantisce l'esecuzione decentralizzata.

Manav Vora, Gokul Puthumanaillam, Hiroyasu Tsukamoto + 1 more2026-03-06🤖 cs.AI

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

Questo studio introduce un framework di apprendimento per rinforzo multi-operatore che integra la teoria della scelta discreta per modellare la competizione endogena nei sistemi AMoD, dimostrando come l'interazione strategica tra operatori porti a dinamiche di prezzo e riposizionamento delle flotte distinte rispetto agli scenari monopolistici.

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

Il paper introduce RepoLaunch, il primo agente basato su LLM in grado di automatizzare completamente la risoluzione delle dipendenze, la compilazione e l'estrazione dei risultati dei test per repository in qualsiasi linguaggio e piattaforma, abilitando così la creazione scalare di dataset per l'addestramento e il benchmarking di agenti di ingegneria del software con un intervento umano limitato alla sola progettazione dei task.

Kenan Li, Rongzhi Li, Linghao Zhang + 17 more2026-03-06🤖 cs.LG

Jagarin: A Three-Layer Architecture for Hibernating Personal Duty Agents on Mobile

Il documento presenta Jagarin, un'architettura a tre livelli composta da DAWN, ARIA e ACE, che risolve il paradosso della persistenza degli agenti AI personali sui dispositivi mobili consentendo l'esecuzione on-demand e la gestione proattiva degli obblighi senza compromettere la batteria, la privacy o le policy di sandboxing.

Ravi Kiran Kadaboina2026-03-06🤖 cs.AI

MedCoRAG: Interpretable Hepatology Diagnosis via Hybrid Evidence Retrieval and Multispecialty Consensus

Il paper presenta MedCoRAG, un framework end-to-end che migliora la diagnosi epatologica interpretabile combinando l'estrazione ibrida di evidenze da grafi della conoscenza e linee guida cliniche con un ragionamento collaborativo multi-agente che simula una consultazione multidisciplinare.

Zheng Li, Jiayi Xu, Zhikai Hu + 4 more2026-03-06🤖 cs.AI

The effect of a toroidal opinion space on opinion bi-polarisation

Questo studio dimostra che l'adozione di uno spazio di opinioni toroidale, rispetto a uno cubico, favorisce la formazione di un maggior numero di gruppi stabili e rende la dinamica di polarizzazione più sensibile all'introduzione di meccanismi come la fiducia limitata e la ponderazione degli elementi, pur convergendo verso il consenso nella sua forma base.

Frank P. Pijpers, Benedikt V. Meylahn, Michel R. H. Mandjes2026-03-06🔬 physics

Greedy-based Value Representation for Optimal Coordination in Multi-agent Reinforcement Learning

Questo paper propone la rappresentazione del valore basata sull'avidità (GVR), un metodo che risolve il problema della sovrageneralizzazione relativa e garantisce la coerenza ottimale nella decomposizione del valore multi-agente trasformando il nodo ottimale nell'unica auto-transizione stabile attraverso la modellazione mirata dei target inferiori e l'eliminazione delle esperienze subottimali.

Lipeng Wan, Zeyang Liu, Xingyu Chen + 2 more2026-03-05💻 cs

$\aleph$ -IPOMDP: Mitigating Deception in a Cognitive Hierarchy with Off-Policy Counterfactual Anomaly Detection

Il paper presenta $\aleph$ -IPOMDP, un framework computazionale che integra rilevamento di anomalie e politiche fuori-belief per mitigare la manipolazione e la disinformazione in agenti con modelli avversari ricorsivi limitati, promuovendo risultati più equi in giochi misti e a somma zero.

Nitay Alon, Joseph M. Barnby, Stefan Sarkadi + 3 more2026-03-05💻 cs

HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics

Il paper presenta HAMLET, un framework gerarchico e adattivo basato su agenti multipli che utilizza modelli linguistici di grandi dimensioni per generare e gestire spettacoli teatrali interattivi e corporei in tempo reale, permettendo agli attori autonomi di prendere decisioni basate su personaggi e memoria e di interagire fisicamente con l'ambiente scenico.

Shufan Jiang, Sizhou Chen, Chi Zhang + 2 more2026-03-05🤖 cs.AI

SEVADE: Self-Evolving Multi-Agent Analysis with Decoupled Evaluation for Hallucination-Resistant Irony Detection

Il paper presenta SEVADE, un innovativo framework multi-agente auto-evolutivo con valutazione disaccoppiata che, grazie a un motore di ragionamento dinamico e un adjudicator separato, supera le limitazioni degli attuali modelli nel rilevamento dell'ironia riducendo le allucinazioni e ottenendo prestazioni state-of-the-art su quattro dataset di benchmark.

Ziqi Liu, Ziyang Zhou, Yilin Li + 4 more2026-03-05💬 cs.CL

VideoChat-M1: Collaborative Policy Planning for Video Understanding via Multi-Agent Reinforcement Learning

Il paper presenta VideoChat-M1, un sistema multi-agente basato sull'apprendimento per rinforzo che utilizza una pianificazione collaborativa delle policy per ottimizzare dinamicamente l'invocazione degli strumenti e migliorare la comprensione video, ottenendo risultati allo stato dell'arte su otto benchmark.

Boyu Chen, Zikang Wang, Zhengrong Yue + 9 more2026-03-05💻 cs

Agile Flight Emerges from Multi-Agent Competitive Racing

Questo lavoro dimostra che la competizione multi-agente con ricompense sparse per la vittoria di una gara è sufficiente per far emergere sia un volo agile che strategie competitive, superando i metodi basati su ricompense individuali e garantendo un trasferimento più efficace dalla simulazione alla realtà.

Vineet Pasumarti, Lorenzo Bianchi, Antonio Loquercio2026-03-05🤖 cs.AI

Multi-Agent Influence Diagrams to Hybrid Threat Modeling

Questo articolo propone un nuovo approccio basato sui diagrammi di influenza multi-agente per modellare e valutare l'efficacia delle misure di contrasto alle minacce ibride, bilanciando costi, dissuasione e mitigazione degli impatti in scenari strategici come gli attacchi informatici alle infrastrutture critiche.

Maarten C. Vonk, Anna V. Kononova, Thomas Bäck + 1 more2026-03-05🤖 cs.AI

Molt Dynamics: Emergent Social Phenomena in Autonomous AI Agent Populations

Il paper "Molt Dynamics" analizza un ambiente su larga scala con oltre 770.000 agenti autonomi, rivelando che, sebbene emergano ruoli specializzati e dinamiche di diffusione delle informazioni, la cooperazione collettiva rimane ancora allo stadio iniziale e meno efficace rispetto all'azione di singoli agenti.

Brandon Yee, Krishna Sharma2026-03-05🤖 cs.AI

Social Norm Reasoning in Multimodal Language Models: An Evaluation

Questo studio valuta la capacità di cinque Modelli Linguistici Multimodali (MLLM) di ragionare sulle norme sociali in contesti testuali e visivi, rivelando che, sebbene GPT-4o e Qwen-2.5VL mostrino prestazioni superiori rispetto agli umani nella modalità testuale, tutti i modelli faticano a gestire norme complesse e ottengono risultati inferiori quando analizzano immagini.

Oishik Chowdhury, Anushka Debnath, Bastin Tony Roy Savarimuthu2026-03-05🤖 cs.AI

Principled Learning-to-Communicate with Quasi-Classical Information Structures

Questo articolo formalizza l'apprendimento della comunicazione in ambienti decentralizzati parzialmente osservabili attraverso la struttura delle informazioni, identificando i casi "quasi-classici" come computazionalmente trattabili e proponendo algoritmi di pianificazione e apprendimento con complessità dimostrabilmente efficiente.

Xiangyu Liu, Haoyi You, Kaiqing Zhang2026-03-05🤖 cs.LG

Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling

Il paper propone un framework di apprendimento alternato per giochi Markoviani cooperativi con vincoli di comunicazione, dimostrando che l'agente globale e gli agenti locali convergono verso un equilibrio di Nash approssimato con complessità campionaria ridotta rispetto allo spazio congiunto di stati e azioni.

Emile Anand, Ishani Karmarkar2026-03-05🤖 cs.AI

← Precedente Successivo →

cs.MA