HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics

Il paper presenta HAMLET, un framework gerarchico e adattivo basato su agenti multipli che utilizza modelli linguistici di grandi dimensioni per generare e gestire spettacoli teatrali interattivi e corporei in tempo reale, permettendo agli attori autonomi di prendere decisioni basate su personaggi e memoria e di interagire fisicamente con l'ambiente scenico.

Shufan Jiang, Sizhou Chen, Chi Zhang + 2 more2026-03-05🤖 cs.AI

From Privacy to Trust in the Agentic Era: A Taxonomy of Challenges in Trustworthy Federated Learning Through the Lens of Trust Report 2.0

Il documento propone una tassonomia delle sfide e un piano di coordinamento per il Federated Learning affidabile nell'era degli agenti autonomi, introducendo il "Trust Report 2.0" come artefatto leggero per garantire la fiducia attraverso evidenze decisionali nel rispetto della privacy, con una validazione applicata al settore sanitario oncologico.

Nuria Rodríguez-Barroso, Mario García-Márquez, M. Victoria Luzón + 1 more2026-03-05🤖 cs.AI

Self-Supervised Inductive Logic Programming

Il paper presenta Poker, un nuovo sistema di Programmazione Logica Induttiva (ILP) auto-supervisionato che, in assenza di esempi negativi e di una teoria di fondo specifica, apprende programmi logici ricorsivi generando automaticamente nuovi esempi e utilizzando una teoria di fondo di secondo ordine standardizzata, superando così le limitazioni di generalizzazione eccessiva riscontrate in sistemi esistenti come Louise.

Stassa Patsantzis2026-03-05🤖 cs.AI

When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Serendipitous Recommendation

Questo articolo propone il metodo Co-Evolutionary Alignment (CoEA), che combina il modulo Dual-Stable Interest Exploration (DSIE) per modellare sia le identità di gruppo a lungo termine che gli interessi individuali a breve termine, e il meccanismo Periodic Collaborative Optimization (PCO) per un'ottimizzazione dinamica a ciclo chiuso, al fine di migliorare la serendipità nei sistemi di raccomandazione superando i limiti dei modelli tradizionali e delle attuali architetture basate su LLM.

Hongxiang Lin, Hao Guo, Zeshun Li + 6 more2026-03-05🤖 cs.AI

Effective Sample Size and Generalization Bounds for Temporal Networks

Il paper propone una metodologia di valutazione dipendente dalla struttura temporale che controlla la dimensione campionaria effettiva, fornendo garanzie di generalizzazione per le TCN su sequenze β\beta-miste e dimostrando empiricamente che un controllo rigoroso della dipendenza temporale rivela tassi di convergenza significativamente più rapidi rispetto alle valutazioni standard.

Barak Gahtan, Alex M. Bronstein2026-03-05🤖 cs.AI

ObfusQAte: A Proposed Framework to Evaluate LLM Robustness on Obfuscated Factual Question Answering

Il paper propone ObfusQAte, un nuovo framework che introduce il dataset ObfusQA per valutare la robustezza dei modelli linguistici di grandi dimensioni di fronte a domande fattuali oscurate, rivelando la loro tendenza a fallire o allucinazioni quando confrontati con livelli crescenti di indirection e sovraccarico contestuale.

Shubhra Ghosh, Abhilekh Borah, Aditya Kumar Guru + 1 more2026-03-05🤖 cs.AI

Zono-Conformal Prediction: Zonotope-Based Uncertainty Quantification for Regression and Classification Tasks

Il paper introduce la "zono-conformal prediction", un nuovo metodo di quantificazione dell'incertezza che utilizza zonotopi per generare set di previsioni con garanzie di copertura statistiche, offrendo una soluzione più efficiente e meno conservativa rispetto alle tecniche conformali tradizionali sia per compiti di regressione che di classificazione.

Laura Lützow, Michael Eichelbeck, Mykel J. Kochenderfer + 1 more2026-03-05🤖 cs.AI

Performance Assessment Strategies for Generative AI Applications in Healthcare

Questo articolo esamina le strategie di valutazione delle applicazioni di intelligenza artificiale generativa in ambito sanitario, evidenziando i limiti dei benchmark quantitativi attuali e promuovendo l'adozione di metodologie che integrano l'expertise umana e modelli computazionali efficienti per garantire una maggiore generalizzabilità nelle reali condizioni cliniche.

Victor Garcia, Mariia Sidulova, Aldo Badano2026-03-05🤖 cs.AI

An LLM Agentic Approach for Legal-Critical Software: A Case Study for Tax Prep Software

Questo studio presenta un approccio basato su agenti LLM per lo sviluppo di software giuridicamente critico, come quello per la preparazione delle tasse, che supera le limitazioni dei modelli frontieri utilizzando relazioni metamorfiche di ordine superiore per generare automaticamente casi di test e sintetizzare codice affidabile.

Sina Gogani-Khiabani, Ashutosh Trivedi, Diptikalyan Saha + 1 more2026-03-05🤖 cs.AI