VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

Il paper presenta VocSegMRI, un framework multimodale che integra segnali video, audio e fonologici tramite fusione cross-attention e apprendimento contrastivo per ottenere una segmentazione precisa e robusta delle strutture articolatorie nella risonanza magnetica in tempo reale, raggiungendo prestazioni state-of-the-art sul dataset USC-75.

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-Toro2026-03-11💻 cs

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

Questo lavoro propone un approccio decentralizzato per il trasporto cooperativo di oggetti non agganciabili da parte di squadre di robot quadrupedi, utilizzando una politica gerarchica e una formulazione ricompensa innovativa che permette il coordinamento tramite forze di contatto senza comunicazione né vincoli meccanici rigidi, garantendo robustezza e scalabilità fino a dieci robot.

Bikram Pandit, Aayam Kumar Shrestha, Alan Fern2026-03-11💻 cs

Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS)

Il documento presenta il CSLICS, un sistema di imaging automatizzato a basso costo che utilizza tecniche di visione artificiale per contare con precisione le uova di corallo e le larve, riducendo drasticamente il lavoro manuale e facilitando il ripristino delle barriere coralline.

Dorian Tsai, Christopher A. Brunner, Riki Lamont, F. Mikaela Nordborg, Andrea Severati, Java Terry, Karen Jackel, Matthew Dunbabin, Tobias Fischer, Scarlett Raine2026-03-11💻 cs

Connectivity Maintenance and Recovery for Multi-Robot Motion Planning

Il paper propone un algoritmo di pianificazione del movimento in tempo reale basato su curve di Bézier (MPC-CLF-CBF) che garantisce la connettività e la capacità di recupero di flotte robotiche in ambienti ostacolati, superando i limiti dei controllori reattivi e validando l'approccio tramite simulazioni e esperimenti fisici con otto quadricotteri Crazyflie.

Yutong Wang, Lishuo Pan, Yichun Qu, Tengxiang Wang, Nora Ayanian2026-03-11💻 cs

LARA-Gen: Enabling Continuous Emotion Control for Music Generation Models via Latent Affective Representation Alignment

Il paper presenta LARA-Gen, un framework che abilita un controllo continuo e fine-granulare delle emozioni nella generazione musicale allineando le rappresentazioni latenti a un modello di comprensione esterna e disaccoppiando gli attributi emotivi dal contenuto testuale, superando così i limiti dei prompt testuali e ottenendo risultati superiori rispetto alle basi di confronto.

Jiahao Mei, Xuenan Xu, Zeyu Xie, Zihao Zheng, Ye Tao, Yue Ding, Mengyue Wu2026-03-11💻 cs

BanaServe: Unified KV Cache and Dynamic Module Migration for Balancing Disaggregated LLM Serving in AI Infrastructure

Il paper presenta BanaServe, un framework di orchestrazione dinamica che bilancia le risorse computazionali e di memoria nei sistemi LLM disaggregati attraverso la migrazione dinamica dei pesi e della cache KV, risolvendo gli squilibri di carico e le limitazioni delle strategie di routing basate sulla cache per migliorare significativamente throughput e latenza rispetto alle soluzioni esistenti.

Yiyuan He, Minxian Xu, Jingfeng Wu + 7 more2026-03-11💻 cs

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

Questo articolo dimostra che il ri-pianificazione incrementale in ambienti dinamici può essere risolta più efficientemente trattando ogni richiesta come un problema indipendente utilizzando algoritmi di pianificazione quasi-sicuramente asintoticamente ottimali (ASAO), come EIT* e AORRTC, che trovano percorsi globali coerenti senza la necessità di aggiornare esplicitamente i piani esistenti.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. Gammell2026-03-11💻 cs

Proper Body Landmark Subset Enables More Accurate and 5X Faster Recognition of Isolated Signs in LIBRAS

Questo studio dimostra che la selezione di un sottoinsieme appropriato di punti di riferimento corporei, combinata con tecniche di imputazione basate su spline, consente un riconoscimento dei segni isolati in LIBRAS con un'accuratezza pari o superiore agli stati dell'arte e con una velocità di elaborazione cinque volte superiore rispetto ai metodi precedenti.

Daniele L. V. dos Santos, Thiago B. Pereira, Carlos Eduardo G. R. Alves, Richard J. M. G. Tello, Francisco de A. Boldt, Thiago M. Paixão2026-03-11💻 cs