Resource-constrained Amazons chess decision framework integrating large language models and graph attention

Questo lavoro propone un framework ibrido leggero per il gioco delle Amazzoni che integra un autoencoder con attenzione su grafi e modelli linguistici di grandi dimensioni per generare dati sintetici e ottimizzare la ricerca ad albero, dimostrando come tale approccio superi sia i metodi tradizionali che il modello teacher stesso in ambienti con risorse computazionali limitate.

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

Il paper introduce IH-Challenge, un dataset di addestramento basato sul reinforcement learning che migliora significativamente la gerarchia delle istruzioni e la robustezza contro gli attacchi nei modelli linguistici avanzati, riducendo al contempo i comportamenti insicuri senza comprometterne l'utilità.

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

Prompting with the human-touch: evaluating model-sensitivity of foundation models for musculoskeletal CT segmentation

Lo studio valuta la sensibilità di 11 modelli fondazionali promptabili per la segmentazione di CT muscoloscheletriche, rivelando che le prestazioni variano significativamente in base alla strategia di prompting e alla complessità anatomica, e che l'uso di prompt umani reali porta a un calo delle prestazioni rispetto ai prompt ideali, rendendo complessa la selezione del modello ottimale per scenari clinici guidati dall'uomo.

Caroline Magg, Maaike A. ter Wee, Johannes G. G. Dobbe, Geert J. Streekstra, Leendert Blankevoort, Clara I. Sánchez, Hoel Kervadec2026-03-12🤖 cs.AI

Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues

Questo lavoro presenta un nuovo framework guidato dal linguaggio per l'analisi cognitiva dei difetti nei materiali compositi CFRP tramite termografia a infrarossi attiva, che utilizza modelli visione-linguaggio preaddestrati e un adattatore specializzato per abilitare il rilevamento e la localizzazione dei difetti in modalità zero-shot senza la necessità di costosi dataset di addestramento.

Mohammed Salah, Eman Ouda, Giuseppe Dell'Avvocato, Fabrizio Sarasini, Ester D'Accardi, Jorge Dias, Davor Svetinovic, Stefano Sfarra, Yusra Abdulrahman2026-03-12⚡ eess

Adaptive RAN Slicing Control via Reward-Free Self-Finetuning Agents

Questo articolo propone un nuovo framework di auto-affinamento senza ricompensa che utilizza un meccanismo di riflessione bi-perspettiva per permettere ad agenti basati su modelli generativi di internalizzare l'esperienza e ottimizzare il controllo dinamico dello slicing delle reti RAN, superando le limitazioni dei metodi di apprendimento per rinforzo tradizionali e degli agenti LLM esistenti in termini di efficienza, stabilità e ottimizzazione multi-obiettivo.

Yuanhao Li, Haozhe Wang, Geyong Min, Nektarios Georgalas, Wang Miao2026-03-12🤖 cs.AI

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

Il paper "CUAAudit" valuta l'efficacia dei modelli visione-linguaggio come auditor autonomi per agenti di uso computer, rivelando che, nonostante buone prestazioni generali, questi modelli mostrano limitazioni significative in ambienti complessi e un'alta variabilità nei giudizi, sottolineando la necessità di considerare l'affidabilità e l'incertezza degli evaluatori nel deployment reale.

Marta Sumyk, Oleksandr Kosovan2026-03-12🤖 cs.AI

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

Contrariamente all'ipotesi che l'allineamento dei modelli linguistici richieda algoritmi orientati alla diversità, questo studio empirico dimostra che i metodi di massimizzazione della ricompensa (RLVR) sono ugualmente efficaci per il ragionamento morale, poiché le risposte ad alto valore in questo dominio tendono a concentrarsi in uno spazio semantico ristretto piuttosto che distribuirsi diversamente come nel ragionamento matematico.

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Questo lavoro introduce il framework "Gradient Flow Drifting", che stabilisce l'equivalenza tra il modello Drifting e il flusso di gradiente di Wasserstein della divergenza KL forward approssimata tramite KDE, estendendo il metodo a una famiglia più ampia di generatori basati su divergenze miste e varietà Riemanniane per prevenire collasso e sfocatura delle modalità.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Recover to Predict: Progressive Retrospective Learning for Variable-Length Trajectory Prediction

Il paper propone il Framework di Apprendimento Retrospectivo Progressivo (PRF), un metodo modulare che affronta la previsione di traiettorie a lunghezza variabile nel contesto della guida autonoma allineando gradualmente le caratteristiche delle osservazioni incomplete a quelle complete tramite unità di distillazione e recupero, migliorando così l'accuratezza e l'efficienza dei dati.

Hao Zhou, Lu Qi, Jason Li, Jie Zhang, Yi Liu, Xu Yang, Mingyu Fan, Fei Luo2026-03-12🤖 cs.AI

Emulating Clinician Cognition via Self-Evolving Deep Clinical Research

Il documento presenta DxEvolve, un agente diagnostico auto-evolutivo che emula il processo cognitivo dei clinici attraverso un flusso di lavoro di ricerca clinica interattivo, ottenendo su diverse coorti prestazioni superiori rispetto ai modelli tradizionali e paragonabili a quelle degli esperti umani.

Ruiyang Ren, Yuhao Wang, Yunsen Liang, Lan Luo, Jing Liu, Haifeng Wang, Cong Feng, Yinan Zhang, Chunyan Miao, Ji-Rong Wen, Wayne Xin Zhao2026-03-12🤖 cs.AI

A Platform-Agnostic Multimodal Digital Human Modelling Framework: Neurophysiological Sensing in Game-Based Interaction

Questo articolo presenta un framework di modellazione digitale umana (DHM) indipendente dalla piattaforma che integra il sensore multimodale OpenBCI Galea e l'ambiente di gioco SuperTux per fornire dati fisiologici strutturati e sincronizzati, facilitando ricerche future sull'interazione AI e l'inclusività senza incorporare modelli di inferenza specifici.

Daniel J. Buxton, Mufti Mahmud, Jordan J. Bird, Thomas Hughes-Roberts, David J. Brown2026-03-12🤖 cs.AI