Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Questo lavoro introduce un framework di valutazione basato sull'equilibrio di risposta quantale (QRE) per misurare la sofisticazione strategica dei modelli linguistici su una scala continua calibrata rispetto ai dati umani, superando i limiti delle metriche aggregate tradizionali attraverso la derivazione teorica di equilibri chiusi e la validazione empirica su oltre 1.800 giochi.

Mateo Pechon-Elkins, Jon Chun2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Questo studio valuta la capacità di generalizzazione di agenti di attacco informatico autonomi di fronte a cambiamenti imprevisti negli indirizzi IP, rivelando che, sebbene gli agenti basati su LLM ottenano i migliori risultati di adattamento, lo fanno a scapito di costi computazionali elevati, ridotta trasparenza e nuove vulnerabilità operative.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

Il paper presenta OmniGuide, un framework universale che migliora le prestazioni dei modelli generalisti robotici (VLA) su compiti complessi integrando diverse fonti di guida come modelli fondazionali 3D e VLM semantici tramite funzioni di energia differenziabili che influenzano l'azione del robot.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Model-Free Co-Optimization of Manufacturable Sensor Layouts and Deformation Proprioception

Questo lavoro presenta una pipeline computazionale basata sui dati che ottimizza in modo congiunto e senza modelli la disposizione dei sensori flessibili e i parametri di una rete neurale, migliorando significativamente l'accuratezza della previsione delle deformazioni in robotica soft e dispositivi indossabili rispettando al contempo i vincoli di fabbricabilità.

Yingjun Tian, Guoxin Fang, Aoran Lyu, Xilong Wang, Zikang Shi, Yuhu Guo, Weiming Wang, Charlie C. L. Wang2026-03-12💻 cs

Decision-Aware Uncertainty Evaluation of Vision-Language Model-Based Early Action Anticipation for Human-Robot Interaction

Questo lavoro presenta la prima valutazione sistematica dell'incertezza nei modelli visione-linguaggio per l'anticipazione delle azioni umane in contesti di interazione uomo-robot, introducendo nuovi protocolli e metriche per garantire previsioni affidabili e sicure anche in presenza di osservazioni parziali e ambigue.

Zhaoda Du, Michael Bowman, Qiaojie Zheng, Xiaoli Zhang2026-03-12💻 cs

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

Il paper presenta FLA³, una piattaforma di apprendimento federato che integra meccanismi di autenticazione, autorizzazione e contabilità (AAA) conformi a XACML per garantire la sovranità dei dati e la conformità normativa, dimostrando attraverso studi reali e simulati che tale approccio governativo permette di ottenere prestazioni predittive paragonabili all'addestramento centralizzato nel contesto della ricerca sanitaria globale.

Fan Zhang, Daniel Kreuter, Javier Fernandez-Marques, BloodCounts Consortium, Gregory Verghese, Bernard Butler, Nicholas Lane, Suthesh Sivapalaratnam, Joseph Taylor, Norbert C. J. de Wit, Nicholas S. Gleadall, Carola-Bibiane Schönlieb, Michael Roberts2026-03-12💻 cs

Pooling Engram Conditional Memory in Large Language Models using CXL

Questo articolo propone l'utilizzo di un pool di memoria CXL per archiviare la memoria engramma condizionale nei grandi modelli linguistici, integrandolo in SGLang per ottenere prestazioni end-to-end vicine a quelle della DRAM e offrire una soluzione di storage scalabile ed economica senza compromettere l'inferenza.

Ruiyang Ma, Teng Ma, Zhiyuan Su, Hantian Zha, Xinpeng Zhao, Xuchun Shang, Xingrui Yi, Zheng Liu, Zhu Cao, An Wu, Zhichong Dou, Ziqian Liu, Daikang Kuang, Guojie Luo2026-03-12💻 cs

HG-Lane: High-Fidelity Generation of Lane Scenes under Adverse Weather and Lighting Conditions without Re-annotation

Il paper presenta HG-Lane, un framework di generazione ad alta fedeltà che crea scenari di rilevamento delle corsie in condizioni meteorologiche e di illuminazione avverse senza necessità di nuova annotazione, migliorando significativamente le prestazioni dei modelli esistenti e fornendo un nuovo benchmark di 30.000 immagini.

Daichao Zhao, Qiupu Chen, Feng He, Xin Ning, Qiankun Li2026-03-12💻 cs

Cross-Hand Latent Representation for Vision-Language-Action Models

Il paper introduce XL-VLA, un framework visione-linguaggio-azione che utilizza uno spazio latente unificato e invariante all'effettivo per abilitare un apprendimento scalabile e cross-embodiment per la manipolazione dattile, superando le limitazioni dei modelli basati su spazi articolari grezzi.

Guangqi Jiang, Yutong Liang, Jianglong Ye, Jia-Yang Huang, Changwei Jing, Rocky Duan, Pieter Abbeel, Xiaolong Wang, Xueyan Zou2026-03-12💻 cs

Characterizing Healthy & Post-Stroke Neuromotor Behavior During 6D Upper-Limb Isometric Gaming: Implications for Design of End-Effector Rehabilitation Robot Interfaces

Utilizzando il dataset OpenRobotRehab 1.0, questo studio analizza le differenze comportamentali neuromotorie tra utenti sani e post-ictus durante compiti isometrici a 6 gradi di libertà su un robot a effetto terminale, dimostrando che le specifiche del compito influenzano il comportamento, che le caratteristiche patologiche sono rilevabili nei dati di forza e che un modello nascosto di Markov basato su segnali sEMG classifica più efficacemente le dinamiche neuromotorie rispetto alle decomposizioni basate sulla sinergia, fornendo così indicazioni cruciali per la progettazione di interfacce robotiche riabilitative adattive.

Ajay Anand, Gabriel Parra, Chad A. Berghoff, Laura A. Hallock2026-03-12💻 cs

Autonomous Search for Sparsely Distributed Visual Phenomena through Environmental Context Modeling

Questo studio propone un metodo per veicoli subacquei autonomi che utilizza l'ambiente visivo circostante, rilevato tramite embedding DINOv2, per guidare la ricerca efficiente di specie coralline rare, permettendo di campionare fino al 75% degli obiettivi in metà del tempo necessario per una copertura esaustiva.

Eric Chen, Travis Manderson, Nare Karapetyan, Peter Edmunds, Nicholas Roy, Yogesh Girdhar2026-03-12💻 cs

K-Join: Combining Vertex Covers for Parallel Joins

Il paper presenta K-Join, un nuovo algoritmo semplice per l'elaborazione di join in ambienti di calcolo parallelo massivo che, combinando partizionamento dei dati e il primitivo HyperCube attraverso una scelta innovativa delle quote basata su coperture dei vertici, raggiunge un carico di lavoro ottimale pari a n/p1/κn/p^{1/\kappa}, dove κ\kappa è una nuova misura teorica chiamata "reduced quasi vertex-cover".

Simon Frisk, Austen Fan, Paraschos Koutris2026-03-12💻 cs