cs.AI articoli | Gist.Science

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

Questo lavoro propone un framework ibrido leggero per il gioco delle Amazzoni che integra un autoencoder con attenzione su grafi e modelli linguistici di grandi dimensioni per generare dati sintetici e ottimizzare la ricerca ad albero, dimostrando come tale approccio superi sia i metodi tradizionali che il modello teacher stesso in ambienti con risorse computazionali limitate.

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

Il paper introduce IH-Challenge, un dataset di addestramento basato sul reinforcement learning che migliora significativamente la gerarchia delle istruzioni e la robustezza contro gli attacchi nei modelli linguistici avanzati, riducendo al contempo i comportamenti insicuri senza comprometterne l'utilità.

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

Questo articolo presenta un framework di apprendimento per rinforzo multi-agente basato su PPO per coordinare flotte di droni nella consegna di forniture mediche critiche, dimostrando attraverso dati reali che l'approccio classico supera le strategie asincrone nel gestire scenari dinamici e incerti.

Islam Guven, Mehmet Parlak2026-03-12🤖 cs.LG

Prompting with the human-touch: evaluating model-sensitivity of foundation models for musculoskeletal CT segmentation

Lo studio valuta la sensibilità di 11 modelli fondazionali promptabili per la segmentazione di CT muscoloscheletriche, rivelando che le prestazioni variano significativamente in base alla strategia di prompting e alla complessità anatomica, e che l'uso di prompt umani reali porta a un calo delle prestazioni rispetto ai prompt ideali, rendendo complessa la selezione del modello ottimale per scenari clinici guidati dall'uomo.

Caroline Magg, Maaike A. ter Wee, Johannes G. G. Dobbe, Geert J. Streekstra, Leendert Blankevoort, Clara I. Sánchez, Hoel Kervadec2026-03-12🤖 cs.AI

SCORE: Replacing Layer Stacking with Contractive Recurrent Depth

Il paper introduce SCORE, un'architettura ricorrente discreta che sostituisce l'impilamento classico dei livelli con aggiornamenti contrattivi ispirati alle equazioni differenziali ordinarie, condividendo i pesi per ridurre i parametri e accelerare l'addestramento in diverse tipologie di reti neurali.

Guillaume Godin2026-03-12✓ Author reviewed ⓘ🤖 cs.LG

Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues

Questo lavoro presenta un nuovo framework guidato dal linguaggio per l'analisi cognitiva dei difetti nei materiali compositi CFRP tramite termografia a infrarossi attiva, che utilizza modelli visione-linguaggio preaddestrati e un adattatore specializzato per abilitare il rilevamento e la localizzazione dei difetti in modalità zero-shot senza la necessità di costosi dataset di addestramento.

Mohammed Salah, Eman Ouda, Giuseppe Dell'Avvocato, Fabrizio Sarasini, Ester D'Accardi, Jorge Dias, Davor Svetinovic, Stefano Sfarra, Yusra Abdulrahman2026-03-12⚡ eess

Adaptive RAN Slicing Control via Reward-Free Self-Finetuning Agents

Questo articolo propone un nuovo framework di auto-affinamento senza ricompensa che utilizza un meccanismo di riflessione bi-perspettiva per permettere ad agenti basati su modelli generativi di internalizzare l'esperienza e ottimizzare il controllo dinamico dello slicing delle reti RAN, superando le limitazioni dei metodi di apprendimento per rinforzo tradizionali e degli agenti LLM esistenti in termini di efficienza, stabilità e ottimizzazione multi-obiettivo.

Yuanhao Li, Haozhe Wang, Geyong Min, Nektarios Georgalas, Wang Miao2026-03-12🤖 cs.AI

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

Il paper "CUAAudit" valuta l'efficacia dei modelli visione-linguaggio come auditor autonomi per agenti di uso computer, rivelando che, nonostante buone prestazioni generali, questi modelli mostrano limitazioni significative in ambienti complessi e un'alta variabilità nei giudizi, sottolineando la necessità di considerare l'affidabilità e l'incertezza degli evaluatori nel deployment reale.

Marta Sumyk, Oleksandr Kosovan2026-03-12🤖 cs.AI

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

Contrariamente all'ipotesi che l'allineamento dei modelli linguistici richieda algoritmi orientati alla diversità, questo studio empirico dimostra che i metodi di massimizzazione della ricompensa (RLVR) sono ugualmente efficaci per il ragionamento morale, poiché le risposte ad alto valore in questo dominio tendono a concentrarsi in uno spazio semantico ristretto piuttosto che distribuirsi diversamente come nel ragionamento matematico.

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Questo lavoro introduce il framework "Gradient Flow Drifting", che stabilisce l'equivalenza tra il modello Drifting e il flusso di gradiente di Wasserstein della divergenza KL forward approssimata tramite KDE, estendendo il metodo a una famiglia più ampia di generatori basati su divergenze miste e varietà Riemanniane per prevenire collasso e sfocatura delle modalità.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Recover to Predict: Progressive Retrospective Learning for Variable-Length Trajectory Prediction

Il paper propone il Framework di Apprendimento Retrospectivo Progressivo (PRF), un metodo modulare che affronta la previsione di traiettorie a lunghezza variabile nel contesto della guida autonoma allineando gradualmente le caratteristiche delle osservazioni incomplete a quelle complete tramite unità di distillazione e recupero, migliorando così l'accuratezza e l'efficienza dei dati.

Hao Zhou, Lu Qi, Jason Li, Jie Zhang, Yi Liu, Xu Yang, Mingyu Fan, Fei Luo2026-03-12🤖 cs.AI

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Il paper presenta un nuovo framework per agenti basati su LLM che estrae automaticamente lezioni dalle traiettorie di esecuzione e le utilizza come memoria contestuale per migliorare le prestazioni future, ottenendo significativi aumenti nel completamento di compiti complessi.

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi Thomas2026-03-12🤖 cs.AI

Reinforcement Learning with Conditional Expectation Reward

Il paper propone la Ricompensa di Aspettativa Condizionata (CER), un nuovo metodo di apprendimento per rinforzo che utilizza il modello linguistico stesso come verificatore implicito per fornire segnali di ricompensa graduali e adattabili a domini generali, superando così i limiti delle regole di verifica rigide e basate su dominio.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Questo articolo presenta un approccio innovativo e spiegabile per rilevare ed eliminare i backdoor nelle reti neurali, basandosi sull'analisi dei percorsi attivi e validato attraverso esperimenti su un sistema di rilevamento delle intrusioni.

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

Interleaving Scheduling and Motion Planning with Incremental Learning of Symbolic Space-Time Motion Abstractions

Questo articolo propone un nuovo framework che intercala schedulazione e pianificazione del movimento in un ciclo di apprendimento incrementale, utilizzando feedback simbolico per generare piani di navigazione multi-oggetto validi ed efficienti in spazi condivisi complessi.

Elisa Tosello, Arthur Bit-Monnot, Davide Lusuardi, Alessandro Valentini, Andrea Micheli2026-03-12🤖 cs.AI

Are Video Reasoning Models Ready to Go Outside?

Il paper propone ROVA, un nuovo framework di addestramento che migliora la robustezza dei modelli di ragionamento video contro perturbazioni del mondo reale attraverso una ricompensa di coerenza consapevole della robustezza e una strategia di addestramento adattiva, validata dal nuovo benchmark PVRBench.

Yangfan He, Changgyu Boo, Jaehong Yoon2026-03-12🤖 cs.AI

FAME: Formal Abstract Minimal Explanation for Neural Networks

Il paper presenta FAME, un nuovo metodo di spiegazione abductiva basato sull'interpretazione astratta che scala a grandi reti neurali riducendo le dimensioni delle spiegazioni attraverso domini di perturbazione dedicati e limiti LiRPA, garantendo al contempo qualità formale e prestazioni superiori rispetto a VERIX+.

Ryma Boumazouza, Raya Elsaleh, Melanie Ducoffe, Shahaf Bassan, Guy Katz2026-03-12🤖 cs.AI

Emulating Clinician Cognition via Self-Evolving Deep Clinical Research

Il documento presenta DxEvolve, un agente diagnostico auto-evolutivo che emula il processo cognitivo dei clinici attraverso un flusso di lavoro di ricerca clinica interattivo, ottenendo su diverse coorti prestazioni superiori rispetto ai modelli tradizionali e paragonabili a quelle degli esperti umani.

Ruiyang Ren, Yuhao Wang, Yunsen Liang, Lan Luo, Jing Liu, Haifeng Wang, Cong Feng, Yinan Zhang, Chunyan Miao, Ji-Rong Wen, Wayne Xin Zhao2026-03-12🤖 cs.AI

A Platform-Agnostic Multimodal Digital Human Modelling Framework: Neurophysiological Sensing in Game-Based Interaction

Questo articolo presenta un framework di modellazione digitale umana (DHM) indipendente dalla piattaforma che integra il sensore multimodale OpenBCI Galea e l'ambiente di gioco SuperTux per fornire dati fisiologici strutturati e sincronizzati, facilitando ricerche future sull'interazione AI e l'inclusività senza incorporare modelli di inferenza specifici.

Daniel J. Buxton, Mufti Mahmud, Jordan J. Bird, Thomas Hughes-Roberts, David J. Brown2026-03-12🤖 cs.AI

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

Il paper propone "Contract And Conquer" (CAC), un metodo black-box che garantisce la generazione provabile di esempi avversari per reti neurali attraverso la distillazione della conoscenza su un dataset in espansione e la contrazione precisa dello spazio di ricerca, dimostrando prestazioni superiori rispetto agli stati dell'arte su ImageNet.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

← Precedente Successivo →