Cross-Hand Latent Representation for Vision-Language-Action Models

Il paper introduce XL-VLA, un framework visione-linguaggio-azione che utilizza uno spazio latente unificato e invariante all'effettivo per abilitare un apprendimento scalabile e cross-embodiment per la manipolazione dattile, superando le limitazioni dei modelli basati su spazi articolari grezzi.

Guangqi Jiang, Yutong Liang, Jianglong Ye, Jia-Yang Huang, Changwei Jing, Rocky Duan, Pieter Abbeel, Xiaolong Wang, Xueyan Zou2026-03-12💻 cs

Characterizing Healthy & Post-Stroke Neuromotor Behavior During 6D Upper-Limb Isometric Gaming: Implications for Design of End-Effector Rehabilitation Robot Interfaces

Utilizzando il dataset OpenRobotRehab 1.0, questo studio analizza le differenze comportamentali neuromotorie tra utenti sani e post-ictus durante compiti isometrici a 6 gradi di libertà su un robot a effetto terminale, dimostrando che le specifiche del compito influenzano il comportamento, che le caratteristiche patologiche sono rilevabili nei dati di forza e che un modello nascosto di Markov basato su segnali sEMG classifica più efficacemente le dinamiche neuromotorie rispetto alle decomposizioni basate sulla sinergia, fornendo così indicazioni cruciali per la progettazione di interfacce robotiche riabilitative adattive.

Ajay Anand, Gabriel Parra, Chad A. Berghoff, Laura A. Hallock2026-03-12💻 cs

Autonomous Search for Sparsely Distributed Visual Phenomena through Environmental Context Modeling

Questo studio propone un metodo per veicoli subacquei autonomi che utilizza l'ambiente visivo circostante, rilevato tramite embedding DINOv2, per guidare la ricerca efficiente di specie coralline rare, permettendo di campionare fino al 75% degli obiettivi in metà del tempo necessario per una copertura esaustiva.

Eric Chen, Travis Manderson, Nare Karapetyan, Peter Edmunds, Nicholas Roy, Yogesh Girdhar2026-03-12💻 cs

K-Join: Combining Vertex Covers for Parallel Joins

Il paper presenta K-Join, un nuovo algoritmo semplice per l'elaborazione di join in ambienti di calcolo parallelo massivo che, combinando partizionamento dei dati e il primitivo HyperCube attraverso una scelta innovativa delle quote basata su coperture dei vertici, raggiunge un carico di lavoro ottimale pari a n/p1/κn/p^{1/\kappa}, dove κ\kappa è una nuova misura teorica chiamata "reduced quasi vertex-cover".

Simon Frisk, Austen Fan, Paraschos Koutris2026-03-12💻 cs

Octopus-inspired Distributed Control for Soft Robotic Arms: A Graph Neural Network-Based Attention Policy with Environmental Interaction

Il documento presenta SoftGM, un'architettura di controllo distribuito ispirata al polpo che utilizza una rete neurale grafica con meccanismo di attenzione per guidare bracci robotici morbidi segmentati verso obiettivi in ambienti complessi, dimostrando una superiore resilienza e capacità di adattamento rispetto ai metodi di apprendimento per rinforzo multi-agente esistenti.

Linxin Hou, Qirui Wu, Zhihang Qin, Yongxin Guo, Cecilia Laschi2026-03-12💻 cs

An Automated Radiomics Framework for Postoperative Survival Prediction in Colorectal Liver Metastases using Preoperative MRI

Questo studio presenta un framework automatizzato basato sull'intelligenza artificiale che combina segmentazione anatomica avanzata e radiomica su risonanza magnetica preoperatoria per prevedere la sopravvivenza postoperatoria nei pazienti con metastasi epatiche da carcinoma del colon-retto.

Muhammad Alberb, Jianan Chen, Hossam El-rewaidy, Paul Karanicolas, Arun Seth, Yutaka Amemiya, Anne Martel, Helen Cheung2026-03-12💻 cs

Perceptive Hierarchical-Task MPC for Sequential Mobile Manipulation in Unstructured Semi-Static Environments

Questo lavoro propone un nuovo framework di controllo predittico gerarchico basato su percezione (HTMPC) che, integrando l'inferenza bayesiana per modellare i cambiamenti ambientali, permette ai robot mobili manipolatori di eseguire compiti sequenziali in modo efficiente e reattivo in ambienti semi-statici non strutturati senza fare affidamento su mappe predefinite.

Xintong Du, Jingxing Qian, Siqi Zhou, Angela P. Schoellig2026-03-12💻 cs

Paladin: A Policy Framework for Securing Cloud APIs by Combining Application Context with Generative AI

Il paper presenta Paladin, un framework di sicurezza che utilizza modelli linguistici generativi per estrarre il significato semantico delle richieste API e permettere agli amministratori di definire e applicare facilmente politiche di sicurezza specifiche per il contesto applicativo, prevenendo così vulnerabilità come l'accesso non autorizzato e il consumo illimitato di risorse.

Shriti Priya, Julian James Stephen, Arjun Natarajan2026-03-12💻 cs

Hierarchical Task Model Predictive Control for Sequential Mobile Manipulation Tasks

Questo lavoro propone un nuovo framework di controllo predittivo basato su modelli per compiti gerarchici che, sfruttando la ridondanza del robot e l'ottimizzazione lessicografica non lineare, migliora significativamente le prestazioni di tracciamento e l'efficienza temporale rispetto agli stati dell'arte durante l'esecuzione di compiti di manipolazione mobile sequenziali.

Xintong Du, Siqi Zhou, Angela P. Schoellig2026-03-12💻 cs

ID-LoRA: Identity-Driven Audio-Video Personalization with In-Context LoRA

Il paper presenta ID-LoRA, un modello generativo unico che personalizza simultaneamente l'aspetto visivo e la voce di un soggetto in un singolo passaggio, superando le limitazioni dei metodi attuali che trattano audio e video separatamente e ottenendo risultati superiori rispetto a Kling 2.6 Pro in termini di somiglianza vocale e stile di parlato.

Aviad Dahan, Moran Yanuka, Noa Kraicer, Lior Wolf, Raja Giryes2026-03-12💻 cs