Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Il paper propone RAD, un nuovo framework di allineamento per l'apprendimento per rinforzo sicuro che sostituisce i vincoli di costo atteso con vincoli di dominanza stocastica di primo ordine, permettendo un controllo universale dei rischi di coda e delle prestazioni su distribuzioni fuori dal dominio attraverso un'ottimizzazione differenziabile basata sul trasporto ottimo.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

Il paper propone CCGE, un metodo di esplorazione guidato dalla copertura dei contatti che, incentivando la scoperta di nuovi pattern di interazione tra dita e oggetti, migliora significativamente l'efficienza dell'addestramento e il successo nei compiti di manipolazione destriosa, permettendo un trasferimento efficace verso sistemi robotici reali.

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

GroundCount: Grounding Vision-Language Models with Object Detection for Mitigating Counting Hallucinations

Il paper presenta GroundCount, un framework che integra modelli di rilevamento oggetti (ODM) con modelli visione-linguaggio (VLM) per fornire un ancoraggio spaziale esplicito, riducendo significativamente le allucinazioni nel conteggio e migliorando l'accuratezza attraverso strategie di prompting che superano la fusione implicita delle feature.

Boyuan Chen, Minghao Shao, Siddharth Garg, Ramesh Karri, Muhammad Shafique2026-03-12🤖 cs.AI

Artificial Intelligence as a Catalyst for Innovation in Software Engineering

Questo articolo esamina come l'intelligenza artificiale, in particolare attraverso l'apprendimento automatico e l'elaborazione del linguaggio naturale, agisca da catalizzatore per l'innovazione nell'ingegneria del software, ottimizzando le pratiche Agile e automatizzando compiti ripetitivi per migliorare qualità, velocità e adattabilità.

Carlos Alberto Fernández-y-Fernández, Jorge R. Aguilar-Cisneros2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

Questo articolo analizza le sfide metodologiche e le soluzioni pratiche per gli studi di miglioramento umano condotti con l'IA di frontiera, evidenziando come la rapida evoluzione di questi sistemi comprometta le assunzioni di validità degli studi controllati randomizzati (RCT) e offra indicazioni per un utilizzo appropriato di tali evidenze nelle decisioni ad alto rischio.

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

Attraverso una collaborazione interdisciplinare tra informatici e storici dell'arte, questo studio analizza i meccanismi con cui i modelli linguistici-visivi riconoscono lo stile artistico, rivelando che la maggior parte dei concetti da essi utilizzati per le previsioni è considerata coerente e rilevante dagli esperti umani.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

Instruction set for the representation of graphs

Il paper presenta IsalGraph, un metodo che codifica la struttura di qualsiasi grafo finito e semplice in una stringa compatta e isomorfismo-invariante tramite un alfabeto di nove istruzioni, dimostrando che la distanza di Levenshtein tra queste stringhe si correla fortemente con la distanza di modifica dei grafi (GED) e rendendole adatte a ricerche di similarità, generazione e modellazione linguistica.

Ezequiel Lopez-Rubio, Mario Pascual-Gonzalez2026-03-12💬 cs.CL

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

Il paper presenta NeFTY, un framework di fisica differenziabile che utilizza campi neurali per ricostruire con precisione le proprietà materiali 3D e localizzare difetti sotterranei analizzando misurazioni termiche superficiali transitorie, superando i limiti dei metodi tradizionali e delle PINN a vincoli morbidi.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

Il paper propone CoHet, un algoritmo di apprendimento per rinforzo multi-agente decentralizzato che utilizza una ricompensa intrinseca basata su Reti Neurali su Grafi per migliorare la cooperazione tra agenti eterogenei in ambienti con osservabilità parziale e segnali di reward radi, ottenendo prestazioni superiori rispetto allo stato dell'arte.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek Khan2026-03-11🤖 cs.AI