cs articoli | Gist.Science

BanaServe: Unified KV Cache and Dynamic Module Migration for Balancing Disaggregated LLM Serving in AI Infrastructure

Il paper presenta BanaServe, un framework di orchestrazione dinamica che bilancia le risorse computazionali e di memoria nei sistemi LLM disaggregati attraverso la migrazione dinamica dei pesi e della cache KV, risolvendo gli squilibri di carico e le limitazioni delle strategie di routing basate sulla cache per migliorare significativamente throughput e latenza rispetto alle soluzioni esistenti.

Yiyuan He, Minxian Xu, Jingfeng Wu + 7 more2026-03-11💻 cs

Real-Time Neural Video Compression with Unified Intra and Inter Coding

Il paper presenta un nuovo framework di compressione video neurale in tempo reale che unifica la codifica intra e inter in un unico modello, risolvendo problemi come la disocclusione e la propagazione degli errori e ottenendo una riduzione del 12,1% del tasso BD rispetto a DCVC-RT.

Hui Xiang, Yifan Bian, Li Li, Jingran Wu, Xianguo Zhang, Dong Liu2026-03-11💻 cs

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

Questo articolo presenta PULL, un algoritmo completo e polinomiale che risolve in modo efficiente il problema della ricerca di percorsi multi-agente sconnessi e connessi (CUMAPF) per sciami robotici, superando i limiti di scalabilità delle formulazioni di programmazione lineare intera.

Takahiro Suzuki, Keisuke Okumura2026-03-11💻 cs

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

Questo articolo dimostra che il ri-pianificazione incrementale in ambienti dinamici può essere risolta più efficientemente trattando ogni richiesta come un problema indipendente utilizzando algoritmi di pianificazione quasi-sicuramente asintoticamente ottimali (ASAO), come EIT* e AORRTC, che trovano percorsi globali coerenti senza la necessità di aggiornare esplicitamente i piani esistenti.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. Gammell2026-03-11💻 cs

Proper Body Landmark Subset Enables More Accurate and 5X Faster Recognition of Isolated Signs in LIBRAS

Questo studio dimostra che la selezione di un sottoinsieme appropriato di punti di riferimento corporei, combinata con tecniche di imputazione basate su spline, consente un riconoscimento dei segni isolati in LIBRAS con un'accuratezza pari o superiore agli stati dell'arte e con una velocità di elaborazione cinque volte superiore rispetto ai metodi precedenti.

Daniele L. V. dos Santos, Thiago B. Pereira, Carlos Eduardo G. R. Alves, Richard J. M. G. Tello, Francisco de A. Boldt, Thiago M. Paixão2026-03-11💻 cs

Who Made This? Fake Detection and Source Attribution with Diffusion Features

Il paper presenta FRIDA, un framework leggero ed efficiente che utilizza le caratteristiche di un modello Stable Diffusion pre-addestrato per rilevare e attribuire le immagini generate dall'IA, ottenendo prestazioni all'avanguardia nella rilevazione cross-generatori e nell'identificazione della fonte.

Simone Bonechi, Paolo Andreini, Barbara Toniella Corradini2026-03-11💻 cs

EgoMI: Learning Active Vision and Whole-Body Manipulation from Egocentric Human Demonstrations

Il paper presenta EgoMI, un framework che colma il divario di incarnazione tra umani e robot semi-umanoidi apprendendo la manipolazione attiva e la coordinazione testa-mano da dimostrazioni umane in prima persona, utilizzando una politica potenziata da memoria per gestire i cambiamenti dinamici del punto di vista.

Justin Yu, Yide Shentu, Di Wu, Pieter Abbeel, Ken Goldberg, Philipp Wu2026-03-11💻 cs

SPAN: Spatial-Projection Alignment for Monocular 3D Object Detection

Il paper propone SPAN, un metodo innovativo per la rilevazione 3D da monoculare che migliora la coerenza geometrica e le prestazioni integrando allineamento spaziale e di proiezione 3D-2D con una strategia di apprendimento gerarchico per correggere le limitazioni dei paradigmi di predizione disaccoppiati.

Yifan Wang, Yian Zhao, Fanqi Pu, Xiaochen Yang, Yang Tang, Xi Chen, Wenming Yang2026-03-11💻 cs

V-Attack: Targeting Disentangled Value Features for Controllable Adversarial Attacks on LVLMs

Il paper presenta V-Attack, un nuovo metodo di attacco avversario per i Large Vision-Language Models che supera i limiti delle tecniche esistenti agendo direttamente sulle caratteristiche "value" disaccoppiate per ottenere un controllo semantico locale preciso e significativo.

Sen Nie, Jie Zhang, Jianxin Yan, Shiguang Shan, Xilin Chen2026-03-11💻 cs

Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning

Il paper introduce AFRO, un framework auto-supervisionato che apprende rappresentazioni 3D consapevoli della dinamica robotica senza supervisione sulle azioni o sulla ricostruzione geometrica, migliorando significativamente il successo nelle attività di manipolazione rispetto ai metodi di pre-addestramento esistenti.

Qiwei Liang, Boyang Cai, Minghao Lai, Sitong Zhuang, Tao Lin, Yan Qin, Yixuan Ye, Jiaming Liang, Renjing Xu2026-03-11💻 cs

Audio-Visual World Models: Towards Multisensory Imagination in Sight and Sound

Questo lavoro introduce il primo quadro formale per i modelli di mondo audiovisivi, presentando il dataset AVW-4k e il modello AV-CDiT per simulare dinamiche ambientali sincronizzate in audio e video, dimostrando miglioramenti significativi nelle prestazioni di navigazione continua.

Jiahua Wang, Leqi Zheng, Jialong Wu, Yaoxin Mao2026-03-11💻 cs

Beware of the Classical Benchmark Instances for the Traveling Salesman Problem with Time Windows

Il paper dimostra che un metodo semplice ed esatto risolve istantaneamente le istanze di riferimento classiche del problema del commesso viaggiatore con finestre temporali, rivelando che queste non sono più rappresentative per valutare l'efficacia degli algoritmi e richiedendo cautela nella creazione di set di addestramento per il machine learning.

Francisco J. Soulignac2026-03-11💻 cs

AVGGT: Rethinking Global Attention for Accelerating VGGT

Il paper AVGGT propone uno schema di accelerazione senza addestramento per i modelli VGGT e $\pi^3$ , basato su un'analisi dei ruoli dei livelli di attenzione globale che permette di ottenere un significativo aumento della velocità di inferenza (fino a 10 volte) mantenendo o migliorando la precisione in scenari multi-vista densi.

Xianbing Sun, Zhikai Zhu, Zhengyu Lou, Bo Yang, Jinyang Tang, Liqing Zhang, He Wang, Jianfu Zhang2026-03-11💻 cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

Il paper presenta UniBYD, un framework unificato che supera i limiti dell'imitazione umana nelle manipolazioni robotiche combinando una rappresentazione morfologica unificata e un algoritmo di reinforcement learning dinamico per adattare le politiche di controllo alle diverse morfologie robotiche, ottenendo un miglioramento significativo delle prestazioni rispetto allo stato dell'arte.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao Wang2026-03-11💻 cs

Multimodal Skeleton-Based Action Representation Learning via Decomposition and Composition

Il paper propone un framework di apprendimento auto-supervisionato chiamato "Decomposition and Composition" che risolve il compromesso tra efficienza e prestazioni nell'analisi delle azioni umane multimodali basate sullo scheletro, decomponendo e ricomponendo le caratteristiche per allineare i dati unimodali e migliorare la rappresentazione multimodale senza eccessivo costo computazionale.

Hongsong Wang, Heng Fei, Bingxuan Dai + 1 more2026-03-11💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

Questo lavoro introduce il benchmark DivGenBench per quantificare il collasso delle modalità di preferenza nei modelli di diffusione e propone D²-Align, un nuovo framework di allineamento che mitiga tale fenomeno correggendo direzionalmente il segnale di ricompensa per preservare la diversità generativa.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu Li2026-03-11💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

Il paper presenta Preguss, un framework modulare che combina analisi statica e modelli linguistici per generare e raffinare specifiche formali, permettendo la verifica automatizzata di programmi su larga scala (oltre 1000 righe di codice) con una riduzione dell'80,6%-88,9% dello sforzo umano necessario.

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei Yin2026-03-11💻 cs

Secure Digital Semantic Communications: Fundamentals, Challenges, and Opportunities

Questo articolo offre una revisione strutturata delle fondamenta, delle sfide di sicurezza e delle opportunità della comunicazione semantica digitale, evidenziando le sue vulnerabilità specifiche rispetto alla variante analogica e delineando possibili difese e direzioni di ricerca future.

Weixuan Chen, Qianqian Yang, Yuanyuan Jia + 5 more2026-03-11💻 cs

Low-rank Orthogonal Subspace Intervention for Generalizable Face Forgery Detection

Il paper propone SeLop, un metodo di intervento ortogonale a basso rango che, rimuovendo le correlazioni spurie irrilevanti dallo spazio delle rappresentazioni, risolve il problema della generalizzazione nella rilevazione di falsificazioni facciali ottenendo prestazioni all'avanguardia con un numero ridotto di parametri.

Chi Wang, Xinjue Hu, Boyu Wang, Ziwen He, Zhangjie Fu2026-03-11💻 cs

Towards a Goal-Centric Assessment of Requirements Engineering Methods for Privacy by Design

Questo studio propone un approccio centrato sugli obiettivi per valutare i metodi di ingegneria dei requisiti per la Privacy by Design, suggerendo che la loro selezione dovrebbe basarsi sul raggiungimento degli scopi organizzativi piuttosto che sulle sole caratteristiche di processo.

Oleksandr Kosenkov, Ehsan Zabardast, Jannik Fischbach, Tony Gorschek, Daniel Mendez2026-03-11💻 cs

← Precedente Successivo →