BanaServe: Unified KV Cache and Dynamic Module Migration for Balancing Disaggregated LLM Serving in AI Infrastructure

Il paper presenta BanaServe, un framework di orchestrazione dinamica che bilancia le risorse computazionali e di memoria nei sistemi LLM disaggregati attraverso la migrazione dinamica dei pesi e della cache KV, risolvendo gli squilibri di carico e le limitazioni delle strategie di routing basate sulla cache per migliorare significativamente throughput e latenza rispetto alle soluzioni esistenti.

Yiyuan He, Minxian Xu, Jingfeng Wu + 7 more2026-03-11💻 cs

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

Questo articolo dimostra che il ri-pianificazione incrementale in ambienti dinamici può essere risolta più efficientemente trattando ogni richiesta come un problema indipendente utilizzando algoritmi di pianificazione quasi-sicuramente asintoticamente ottimali (ASAO), come EIT* e AORRTC, che trovano percorsi globali coerenti senza la necessità di aggiornare esplicitamente i piani esistenti.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. Gammell2026-03-11💻 cs

Proper Body Landmark Subset Enables More Accurate and 5X Faster Recognition of Isolated Signs in LIBRAS

Questo studio dimostra che la selezione di un sottoinsieme appropriato di punti di riferimento corporei, combinata con tecniche di imputazione basate su spline, consente un riconoscimento dei segni isolati in LIBRAS con un'accuratezza pari o superiore agli stati dell'arte e con una velocità di elaborazione cinque volte superiore rispetto ai metodi precedenti.

Daniele L. V. dos Santos, Thiago B. Pereira, Carlos Eduardo G. R. Alves, Richard J. M. G. Tello, Francisco de A. Boldt, Thiago M. Paixão2026-03-11💻 cs

Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning

Il paper introduce AFRO, un framework auto-supervisionato che apprende rappresentazioni 3D consapevoli della dinamica robotica senza supervisione sulle azioni o sulla ricostruzione geometrica, migliorando significativamente il successo nelle attività di manipolazione rispetto ai metodi di pre-addestramento esistenti.

Qiwei Liang, Boyang Cai, Minghao Lai, Sitong Zhuang, Tao Lin, Yan Qin, Yixuan Ye, Jiaming Liang, Renjing Xu2026-03-11💻 cs

AVGGT: Rethinking Global Attention for Accelerating VGGT

Il paper AVGGT propone uno schema di accelerazione senza addestramento per i modelli VGGT e π3\pi^3, basato su un'analisi dei ruoli dei livelli di attenzione globale che permette di ottenere un significativo aumento della velocità di inferenza (fino a 10 volte) mantenendo o migliorando la precisione in scenari multi-vista densi.

Xianbing Sun, Zhikai Zhu, Zhengyu Lou, Bo Yang, Jinyang Tang, Liqing Zhang, He Wang, Jianfu Zhang2026-03-11💻 cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

Il paper presenta UniBYD, un framework unificato che supera i limiti dell'imitazione umana nelle manipolazioni robotiche combinando una rappresentazione morfologica unificata e un algoritmo di reinforcement learning dinamico per adattare le politiche di controllo alle diverse morfologie robotiche, ottenendo un miglioramento significativo delle prestazioni rispetto allo stato dell'arte.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao Wang2026-03-11💻 cs

Multimodal Skeleton-Based Action Representation Learning via Decomposition and Composition

Il paper propone un framework di apprendimento auto-supervisionato chiamato "Decomposition and Composition" che risolve il compromesso tra efficienza e prestazioni nell'analisi delle azioni umane multimodali basate sullo scheletro, decomponendo e ricomponendo le caratteristiche per allineare i dati unimodali e migliorare la rappresentazione multimodale senza eccessivo costo computazionale.

Hongsong Wang, Heng Fei, Bingxuan Dai + 1 more2026-03-11💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

Questo lavoro introduce il benchmark DivGenBench per quantificare il collasso delle modalità di preferenza nei modelli di diffusione e propone D²-Align, un nuovo framework di allineamento che mitiga tale fenomeno correggendo direzionalmente il segnale di ricompensa per preservare la diversità generativa.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu Li2026-03-11💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

Il paper presenta Preguss, un framework modulare che combina analisi statica e modelli linguistici per generare e raffinare specifiche formali, permettendo la verifica automatizzata di programmi su larga scala (oltre 1000 righe di codice) con una riduzione dell'80,6%-88,9% dello sforzo umano necessario.

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei Yin2026-03-11💻 cs