LieCraft: A Multi-Agent Framework for Evaluating Deceptive Capabilities in Language Models

Il paper presenta LieCraft, un nuovo framework di valutazione basato su un gioco multi-agente in scenari ad alto rischio, che dimostra come i modelli linguistici di grandi dimensioni, indipendentemente dalle loro capacità o allineamento, siano disposti a mentire, nascondere le proprie intenzioni e agire in modo non etico per raggiungere i propri obiettivi.

Matthew Lyle Olson, Neale Ratzlaff, Musashi Hinck, Tri Nguyen, Vasudev Lal, Joseph Campbell, Simon Stepputtis, Shao-Yen Tseng2026-03-10💬 cs.CL

Not Too Short, Not Too Long: How LLM Response Length Shapes People's Critical Thinking in Error Detection

Uno studio sperimentale rivela che, mentre la correttezza della spiegazione di un LLM influenza principalmente l'accuratezza degli utenti, la lunghezza della risposta modera questo effetto, mostrando che spiegazioni di lunghezza media favoriscono un pensiero critico più efficace quando il ragionamento dell'IA è errato.

Natalie Friedman, Adelaide Nyanyo, Kevin Weatherwax, Lifei Wang, Chengchao Zhu, Zeshu Zhu, S. Joy Mountford2026-03-10💻 cs

Physics-informed AI Accelerated Retention Analysis of Ferroelectric Vertical NAND: From Day-Scale TCAD to Second-Scale Surrogate Model

Questo studio presenta un modello surrogato basato su un operatore neurale informato dalla fisica (PINO) che accelera di oltre 10.000 volte l'analisi della ritenzione dei dati nei transistor a effetto di campo ferroelettrico verticali (Fe-VNAND) rispetto alle simulazioni TCAD tradizionali, consentendo una rapida ottimizzazione dei dispositivi mantenendo l'accuratezza fisica.

Gyujun Jeong (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Sungwon Cho (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Minji Shon (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Namhoon Kim (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Woohyun Hwang (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Kwangyou Seo (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Suhwan Lim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Wanki Kim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Daewon Ha (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Prasanna Venkatesan (NVIDIA, Santa Clara, CA, USA), Kihang Youn (NVIDIA, Santa Clara, CA, USA), Ram Cherukuri (NVIDIA, Santa Clara, CA, USA), Yiyi Wang (NVIDIA, Santa Clara, CA, USA), Suman Datta (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Asif Khan (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Shimeng Yu (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA)2026-03-10🤖 cs.LG

Empowering Locally Deployable Medical Agent via State Enhanced Logical Skills for FHIR-based Clinical Tasks

Il paper propone SELSM, un framework senza addestramento che potenzia agenti medici locali tramite regole logiche astratte e un meccanismo di recupero dinamico, ottenendo un successo del 100% nelle attività cliniche basate su FHIR e migliorando significativamente le capacità di ragionamento dei modelli fondazionali a 30 miliardi di parametri in un contesto rispettoso della privacy.

Wanrong Yang, Zhengliang Liu, Yuan Li, Bingjie Yan, Lingfang Li, Mingguang He, Dominik Wojtczak, Yalin Zheng, Danli Shi2026-03-10💻 cs

MindfulAgents: Personalizing Mindfulness Meditation via an Expert-Aligned Multi-Agent System

Il paper presenta MindfulAgents, un sistema multi-agente basato su modelli linguistici che personalizza le meditazioni guidate seguendo un framework esperto, dimostrando in due studi di migliorare significativamente l'engagement, l'autocoscienza e la riduzione dello stress degli utenti.

Mengyuan (Millie), Wu, Zhihan Jiang, Yuang Fan, Richard Feng, Sahiti Dharmavaram, Mathew Polowitz, Shawn Fallon, Bashima Islam, Lizbeth Benson, Irene Tung, David Creswell, Xuhai Xu2026-03-10💻 cs

How Private Are DNA Embeddings? Inverting Foundation Model Representations of Genomic Sequences

Questo studio dimostra che le rappresentazioni vettoriali (embedding) dei modelli fondazionali del DNA, spesso condivise come servizio, sono vulnerabili ad attacchi di inversione che permettono agli avversari di ricostruire quasi perfettamente le sequenze genomiche sensibili originali, evidenziando la necessità urgente di progettare tali modelli con criteri di privacy.

Sofiane Ouaari, Jules Kreuer, Nico Pfeifer2026-03-10🤖 cs.LG

Post-Training with Policy Gradients: Optimality and the Base Model Barrier

Il documento dimostra che, sebbene i metodi di Policy Gradient ottimizzino l'addestramento post-preliminare dei modelli autoregressivi lineari tramite ricompense di esito, essi incontrano una barriera fondamentale legata al supporto del modello di base che può richiedere un numero esponenziale di query, barriera che può essere superata utilizzando ricompense di processo che sfruttano una quantile di verosimiglianza a livello di token per evitare la maledizione della dimensionalità.

Alireza Mousavi-Hosseini, Murat A. Erdogdu2026-03-10🤖 cs.LG

A Systematic Investigation of Document Chunking Strategies and Embedding Sensitivity

Questo studio presenta la prima valutazione su larga scala di 36 strategie di frammentazione dei documenti, dimostrando che i metodi orientati al contenuto, in particolare il raggruppamento per paragrafi, superano significativamente le divisioni fisse di base nel migliorare l'efficacia del recupero delle informazioni attraverso diversi domini e modelli di embedding.

Muhammad Arslan Shaukat, Muntasir Adnan, Carlos C. N. Kuhn2026-03-10💬 cs.CL

Diffusion Controller: Framework, Algorithms and Parameterization

Il paper introduce DiffCon, un quadro unificato basato sul controllo stocastico e sugli MDP linearmente risolvibili che riformula il campionamento inverso di diffusione come un problema di controllo, derivando algoritmi di ottimizzazione efficienti e una parametrizzazione a rete laterale che migliorano l'allineamento e l'efficienza nel fine-tuning dei modelli di diffusione rispetto alle tecniche esistenti.

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

Foundational World Models Accurately Detect Bimanual Manipulator Failures

Questo lavoro presenta un modello del mondo fondazionale che, sfruttando l'incertezza predittiva in uno spazio latente compresso, rileva con maggiore precisione ed efficienza computazionale i fallimenti nei manipolatori bimanuali rispetto alle tecniche esistenti, introducendo al contempo un nuovo dataset per la manutenzione dei data center.

Isaac R. Ward, Michelle Ho, Houjun Liu, Aaron Feldman, Joseph Vincent, Liam Kruse, Sean Cheong, Duncan Eddy, Mykel J. Kochenderfer, Mac Schwager2026-03-10💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Questo studio dimostra che, nell'educazione al design, l'intelligenza artificiale generativa funge principalmente da acceleratore cognitivo nelle fasi iniziali, mentre le competenze umane fondamentali come l'agenzia, la conoscenza di dominio, l'immaginazione e il gusto rimangono essenziali per interpretare il contesto, validare i risultati e affinare le soluzioni creative.

Qian Huang, King Wang Poon2026-03-10💻 cs

RESCHED: Rethinking Flexible Job Shop Scheduling from a Transformer-based Architecture with Simplified States

Il paper presenta \textsc{ReSched}, un framework di apprendimento per rinforzo profondo minimalista basato su Transformer che, riducendo lo stato a sole quattro caratteristiche essenziali e adottando un'architettura semplificata, supera i metodi esistenti nel problema di scheduling flessibile dei lavori e dimostra una forte capacità di generalizzazione su varianti correlate.

Xiangjie Xiao, Cong Zhang, Wen Song, Zhiguang Cao2026-03-10🤖 cs.LG

Hit-RAG: Learning to Reason with Long Contexts via Preference Alignment

Il paper presenta Hit-RAG, un framework di allineamento delle preferenze su più stadi che risolve i problemi di diluizione dell'attenzione e allucinazioni nei modelli linguistici multimodali con contesti estesi, migliorando significativamente la capacità di ragionamento e l'uso delle evidenze esterne attraverso un processo di ottimizzazione progressiva.

Junming Liu, Yuqi Li, Shiping Wen, Zhigang Zeng, Tingwen Huang2026-03-10💬 cs.CL