R1-Code-Interpreter: LLMs Reason with Code via Supervised and Multi-stage Reinforcement Learning

Il paper presenta R1-Code-Interpreter, un modello LLM potenziato da un approccio di apprendimento curricolare multi-fase che combina fine-tuning supervisionato e rinforzato, permettendo di generare codice autonomamente e raggiungendo prestazioni superiori rispetto a GPT-4o su una vasta gamma di compiti di ragionamento e pianificazione.

Yongchao Chen, Yueying Liu, Junwei Zhou + 5 more2026-03-05🤖 cs.AI

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Il paper propone la Calibrazione Supervisionata (SC), un nuovo framework basato sulla minimizzazione della perdita che supera i limiti delle tecniche di calibrazione esistenti per l'Apprendimento in Contesto (ICL) nei LLM, permettendo di modificare l'orientamento dei confini decisionali e integrando regolarizzatori per migliorare la stabilità e le prestazioni su diversi modelli e dataset.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

From Ambiguity to Accuracy: The Transformative Effect of Coreference Resolution on Retrieval-Augmented Generation systems

Questo studio dimostra che l'applicazione della risoluzione delle coreferenze nei sistemi Retrieval-Augmented Generation (RAG) migliora significativamente l'efficacia del recupero e la qualità delle risposte, in particolare per i modelli di dimensioni ridotte, mitigando l'ambiguità referenziale che ostacola l'apprendimento contestuale.

Youngjoon Jang, Seongtae Hong, Junyoung Son + 3 more2026-03-05🤖 cs.AI

HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics

Il paper presenta HAMLET, un framework gerarchico e adattivo basato su agenti multipli che utilizza modelli linguistici di grandi dimensioni per generare e gestire spettacoli teatrali interattivi e corporei in tempo reale, permettendo agli attori autonomi di prendere decisioni basate su personaggi e memoria e di interagire fisicamente con l'ambiente scenico.

Shufan Jiang, Sizhou Chen, Chi Zhang + 2 more2026-03-05🤖 cs.AI

From Privacy to Trust in the Agentic Era: A Taxonomy of Challenges in Trustworthy Federated Learning Through the Lens of Trust Report 2.0

Il documento propone una tassonomia delle sfide e un piano di coordinamento per il Federated Learning affidabile nell'era degli agenti autonomi, introducendo il "Trust Report 2.0" come artefatto leggero per garantire la fiducia attraverso evidenze decisionali nel rispetto della privacy, con una validazione applicata al settore sanitario oncologico.

Nuria Rodríguez-Barroso, Mario García-Márquez, M. Victoria Luzón + 1 more2026-03-05🤖 cs.AI

Self-Supervised Inductive Logic Programming

Il paper presenta Poker, un nuovo sistema di Programmazione Logica Induttiva (ILP) auto-supervisionato che, in assenza di esempi negativi e di una teoria di fondo specifica, apprende programmi logici ricorsivi generando automaticamente nuovi esempi e utilizzando una teoria di fondo di secondo ordine standardizzata, superando così le limitazioni di generalizzazione eccessiva riscontrate in sistemi esistenti come Louise.

Stassa Patsantzis2026-03-05🤖 cs.AI

When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Serendipitous Recommendation

Questo articolo propone il metodo Co-Evolutionary Alignment (CoEA), che combina il modulo Dual-Stable Interest Exploration (DSIE) per modellare sia le identità di gruppo a lungo termine che gli interessi individuali a breve termine, e il meccanismo Periodic Collaborative Optimization (PCO) per un'ottimizzazione dinamica a ciclo chiuso, al fine di migliorare la serendipità nei sistemi di raccomandazione superando i limiti dei modelli tradizionali e delle attuali architetture basate su LLM.

Hongxiang Lin, Hao Guo, Zeshun Li + 6 more2026-03-05🤖 cs.AI