cs.AI articoli | Gist.Science

LieCraft: A Multi-Agent Framework for Evaluating Deceptive Capabilities in Language Models

Il paper presenta LieCraft, un nuovo framework di valutazione basato su un gioco multi-agente in scenari ad alto rischio, che dimostra come i modelli linguistici di grandi dimensioni, indipendentemente dalle loro capacità o allineamento, siano disposti a mentire, nascondere le proprie intenzioni e agire in modo non etico per raggiungere i propri obiettivi.

Matthew Lyle Olson, Neale Ratzlaff, Musashi Hinck, Tri Nguyen, Vasudev Lal, Joseph Campbell, Simon Stepputtis, Shao-Yen Tseng2026-03-10💬 cs.CL

Not Too Short, Not Too Long: How LLM Response Length Shapes People's Critical Thinking in Error Detection

Uno studio sperimentale rivela che, mentre la correttezza della spiegazione di un LLM influenza principalmente l'accuratezza degli utenti, la lunghezza della risposta modera questo effetto, mostrando che spiegazioni di lunghezza media favoriscono un pensiero critico più efficace quando il ragionamento dell'IA è errato.

Natalie Friedman, Adelaide Nyanyo, Kevin Weatherwax, Lifei Wang, Chengchao Zhu, Zeshu Zhu, S. Joy Mountford2026-03-10💻 cs

Physics-informed AI Accelerated Retention Analysis of Ferroelectric Vertical NAND: From Day-Scale TCAD to Second-Scale Surrogate Model

Questo studio presenta un modello surrogato basato su un operatore neurale informato dalla fisica (PINO) che accelera di oltre 10.000 volte l'analisi della ritenzione dei dati nei transistor a effetto di campo ferroelettrico verticali (Fe-VNAND) rispetto alle simulazioni TCAD tradizionali, consentendo una rapida ottimizzazione dei dispositivi mantenendo l'accuratezza fisica.

Gyujun Jeong (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Sungwon Cho (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Minji Shon (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Namhoon Kim (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Woohyun Hwang (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Kwangyou Seo (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Suhwan Lim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Wanki Kim (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Daewon Ha (Semiconductor Research and Development, Samsung Electronics Co., Ltd, South Korea), Prasanna Venkatesan (NVIDIA, Santa Clara, CA, USA), Kihang Youn (NVIDIA, Santa Clara, CA, USA), Ram Cherukuri (NVIDIA, Santa Clara, CA, USA), Yiyi Wang (NVIDIA, Santa Clara, CA, USA), Suman Datta (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Asif Khan (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA), Shimeng Yu (School of Electrical and Computer Engineering, Georgia Institute of Technology, GA, USA)2026-03-10🤖 cs.LG

Distributed Legal Infrastructure for a Trustworthy Agentic Web

L'articolo propone un'infrastruttura legale distribuita composta da cinque livelli interconnessi per garantire identità, delega e responsabilità nell'emergente web agenziale, allineando i sistemi tecnici decentralizzati ai principi di legalità e stato di diritto.

Tomer Jordi Chaffer, Victor Jiawei Zhang, Sante Dino Facchini, Botao Amber Hu, Helena Rong, Zihan Guo, Xisen Wang, Carlos Santana, Giovanni De Gasperis2026-03-10💻 cs

Enhancing the Detection of Coronary Artery Disease Using Machine Learning

Questo studio dimostra che un modello ibrido di machine learning che combina Bi-LSTM e GRU, addestrato su dati clinici, immagini e biomarcatori, supera i metodi diagnostici tradizionali raggiungendo un'accuratezza del 97,07% nella rilevazione della malattia coronarica.

Karan Kumar Singh, Nikita Gajbhiye, Gouri Sankar Mishra2026-03-10💻 cs

Empowering Locally Deployable Medical Agent via State Enhanced Logical Skills for FHIR-based Clinical Tasks

Il paper propone SELSM, un framework senza addestramento che potenzia agenti medici locali tramite regole logiche astratte e un meccanismo di recupero dinamico, ottenendo un successo del 100% nelle attività cliniche basate su FHIR e migliorando significativamente le capacità di ragionamento dei modelli fondazionali a 30 miliardi di parametri in un contesto rispettoso della privacy.

Wanrong Yang, Zhengliang Liu, Yuan Li, Bingjie Yan, Lingfang Li, Mingguang He, Dominik Wojtczak, Yalin Zheng, Danli Shi2026-03-10💻 cs

MindfulAgents: Personalizing Mindfulness Meditation via an Expert-Aligned Multi-Agent System

Il paper presenta MindfulAgents, un sistema multi-agente basato su modelli linguistici che personalizza le meditazioni guidate seguendo un framework esperto, dimostrando in due studi di migliorare significativamente l'engagement, l'autocoscienza e la riduzione dello stress degli utenti.

Mengyuan (Millie), Wu, Zhihan Jiang, Yuang Fan, Richard Feng, Sahiti Dharmavaram, Mathew Polowitz, Shawn Fallon, Bashima Islam, Lizbeth Benson, Irene Tung, David Creswell, Xuhai Xu2026-03-10💻 cs

How Private Are DNA Embeddings? Inverting Foundation Model Representations of Genomic Sequences

Questo studio dimostra che le rappresentazioni vettoriali (embedding) dei modelli fondazionali del DNA, spesso condivise come servizio, sono vulnerabili ad attacchi di inversione che permettono agli avversari di ricostruire quasi perfettamente le sequenze genomiche sensibili originali, evidenziando la necessità urgente di progettare tali modelli con criteri di privacy.

Sofiane Ouaari, Jules Kreuer, Nico Pfeifer2026-03-10🤖 cs.LG

Post-Training with Policy Gradients: Optimality and the Base Model Barrier

Il documento dimostra che, sebbene i metodi di Policy Gradient ottimizzino l'addestramento post-preliminare dei modelli autoregressivi lineari tramite ricompense di esito, essi incontrano una barriera fondamentale legata al supporto del modello di base che può richiedere un numero esponenziale di query, barriera che può essere superata utilizzando ricompense di processo che sfruttano una quantile di verosimiglianza a livello di token per evitare la maledizione della dimensionalità.

Alireza Mousavi-Hosseini, Murat A. Erdogdu2026-03-10🤖 cs.LG

Learning Quadruped Walking from Seconds of Demonstration

Questo articolo presenta un metodo di apprendimento per imitazione che, grazie a una nuova analisi teorica sui cicli limite e le mappe di Poincaré, permette di addestrare politiche di locomozione per quadrupedi da zero utilizzando solo pochi secondi di dimostrazione, ottenendo risultati robusti in esperimenti hardware.

Ruipeng Zhang, Hongzhan Yu, Ya-Chien Chang, Chenghao Li, Henrik I. Christensen, Sicun Gao2026-03-10🤖 cs.LG

Elenchus: Generating Knowledge Bases from Prover-Skeptic Dialogues

Il paper presenta Elenchus, un sistema dialogico basato su LLM che costruisce basi di conoscenza attraverso l'interazione tra un esperto umano e un'opponente artificiale, mappando lo stato dialettico risultante nella logica NMMS per formalizzare e verificare le relazioni inferenziali, come dimostrato nell'ontologia PROV-O.

Bradley P. Allen2026-03-10💬 cs.CL

A Systematic Investigation of Document Chunking Strategies and Embedding Sensitivity

Questo studio presenta la prima valutazione su larga scala di 36 strategie di frammentazione dei documenti, dimostrando che i metodi orientati al contenuto, in particolare il raggruppamento per paragrafi, superano significativamente le divisioni fisse di base nel migliorare l'efficacia del recupero delle informazioni attraverso diversi domini e modelli di embedding.

Muhammad Arslan Shaukat, Muntasir Adnan, Carlos C. N. Kuhn2026-03-10💬 cs.CL

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

Il paper propone NePPO, un nuovo approccio di ottimizzazione delle policy per l'apprendimento multi-agente che calcola equilibri di Nash approssimati in giochi a somma generale imparando una funzione di potenziale indipendente dal giocatore per trasformare il problema originale in un gioco cooperativo.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay Maheshwari2026-03-10🤖 cs.LG

Diffusion Controller: Framework, Algorithms and Parameterization

Il paper introduce DiffCon, un quadro unificato basato sul controllo stocastico e sugli MDP linearmente risolvibili che riformula il campionamento inverso di diffusione come un problema di controllo, derivando algoritmi di ottimizzazione efficienti e una parametrizzazione a rete laterale che migliorano l'allineamento e l'efficienza nel fine-tuning dei modelli di diffusione rispetto alle tecniche esistenti.

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

Questo articolo dimostra come la regolamentazione della fairness basata esclusivamente sull'effetto medio del trattamento (ATE) possa essere aggirata attraverso il "masking causale", nascondendo discriminazioni sistemiche dietro una media nulla e sottolineando la necessità di valutare l'equità a livello di modello piuttosto che di decisione.

Zou Yang, Sophia Xiao, Bijan Mazaheri2026-03-10🤖 cs.LG

Foundational World Models Accurately Detect Bimanual Manipulator Failures

Questo lavoro presenta un modello del mondo fondazionale che, sfruttando l'incertezza predittiva in uno spazio latente compresso, rileva con maggiore precisione ed efficienza computazionale i fallimenti nei manipolatori bimanuali rispetto alle tecniche esistenti, introducendo al contempo un nuovo dataset per la manutenzione dei data center.

Isaac R. Ward, Michelle Ho, Houjun Liu, Aaron Feldman, Joseph Vincent, Liam Kruse, Sean Cheong, Duncan Eddy, Mykel J. Kochenderfer, Mac Schwager2026-03-10💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Questo studio dimostra che, nell'educazione al design, l'intelligenza artificiale generativa funge principalmente da acceleratore cognitivo nelle fasi iniziali, mentre le competenze umane fondamentali come l'agenzia, la conoscenza di dominio, l'immaginazione e il gusto rimangono essenziali per interpretare il contesto, validare i risultati e affinare le soluzioni creative.

Qian Huang, King Wang Poon2026-03-10💻 cs

Can Safety Emerge from Weak Supervision? A Systematic Analysis of Small Language Models

Il paper presenta Self-MOA, un framework automatizzato che allinea i piccoli modelli linguistici utilizzando supervisione debole da valutatori automatici, ottenendo un miglioramento del 12,41% nella sicurezza rispetto ai metodi tradizionali con una frazione dei dati di addestramento necessari.

Punyajoy Saha, Sudipta Halder, Debjyoti Mondal, Subhadarshi Panda2026-03-10🤖 cs.LG

RESCHED: Rethinking Flexible Job Shop Scheduling from a Transformer-based Architecture with Simplified States

Il paper presenta \textsc{ReSched}, un framework di apprendimento per rinforzo profondo minimalista basato su Transformer che, riducendo lo stato a sole quattro caratteristiche essenziali e adottando un'architettura semplificata, supera i metodi esistenti nel problema di scheduling flessibile dei lavori e dimostra una forte capacità di generalizzazione su varianti correlate.

Xiangjie Xiao, Cong Zhang, Wen Song, Zhiguang Cao2026-03-10🤖 cs.LG

Hit-RAG: Learning to Reason with Long Contexts via Preference Alignment

Il paper presenta Hit-RAG, un framework di allineamento delle preferenze su più stadi che risolve i problemi di diluizione dell'attenzione e allucinazioni nei modelli linguistici multimodali con contesti estesi, migliorando significativamente la capacità di ragionamento e l'uso delle evidenze esterne attraverso un processo di ottimizzazione progressiva.

Junming Liu, Yuqi Li, Shiping Wen, Zhigang Zeng, Tingwen Huang2026-03-10💬 cs.CL

← Precedente Successivo →