The Orthogonal Vulnerabilities of Generative AI Watermarks: A Comparative Empirical Benchmark of Spatial and Latent Provenance

Questo studio dimostra empiricamente che i filigrane digitali attuali, operanti esclusivamente nei domini spaziali o latenti, possiedono vulnerabilità ortogonali e mutuamente esclusive che le rendono inefficaci contro gli strumenti di editing generativo moderno, evidenziando così la necessità urgente di architetture crittografiche multi-dominio per garantire una provenienza digitale robusta.

Jesse Yu, Nicholas Wei2026-03-12💻 cs

Fuel Gauge: Estimating Chain-of-Thought Length Ahead of Time in Large Multimodal Models

Il paper presenta "Fuel Gauge", un metodo innovativo che stima in anticipo la lunghezza del ragionamento a catena di pensiero (CoT) nei Modelli Multimodali su larga scala (LMM) analizzando un parametro nascosto, consentendo così un'allocazione più efficiente della memoria e una regolazione ottimale della lunghezza del ragionamento per migliorare le prestazioni e ridurre gli sprechi computazionali.

Yuedong Yang, Xiwen Wei, Mustafa Munir, Radu Marculescu2026-03-12💻 cs

AgentServe: Algorithm-System Co-Design for Efficient Agentic AI Serving on a Consumer-Grade GPU

Il paper presenta AgentServe, un sistema di serving per AI agenti su GPU consumer che, attraverso la co-progettazione algoritmo-sistema e l'isolamento delle fasi di prefill e decode, garantisce un'esecuzione multi-agente stabile con riduzioni fino a 2,8 volte nel tempo di primo token e 2,7 volte nel tempo per token rispetto alle soluzioni attuali.

Yuning Zhang, Yan Yan, Nan Yang, Dong Yuan2026-03-12💻 cs

Adaptive Manipulation Potential and Haptic Estimation for Tool-Mediated Interaction

Questo paper introduce un quadro unificato basato su un Manifold di Equilibrio parametrizzato e una strategia di "haptic SLAM" che integra stima aptica, pianificazione online e controllo di impedenza adattivo per raggiungere una destrezza simile a quella umana nella manipolazione mediata da strumenti, come dimostrato da oltre 260 prove reali di allentamento di viti.

Lin Yang, Anirvan Dutta, Yuan Ji, Yanxin Zhou, Shilin Shan, Lv Chen, Etienne Burdet, Domenico Campolo2026-03-12💻 cs

StyleGallery: Training-free and Semantic-aware Personalized Style Transfer from Arbitrary Image References

Il paper introduce StyleGallery, un framework di trasferimento di stile personalizzato e privo di addestramento che, attraverso segmentazione semantica, corrispondenza di regioni e ottimizzazione guidata, risolve le limitazioni delle metodologie esistenti garantendo una migliore preservazione del contenuto e una maggiore adattabilità a riferimenti stilistici arbitrari.

Boyu He (College of Computer Science and Technology, National University of Defense Technology), Yunfan Ye (School of Design, Hunan University), Chang Liu (College of Computer Science and Technology, National University of Defense Technology), Weishang Wu (College of Computer Science and Technology, National University of Defense Technology), Fang Liu (School of Design, Hunan University), Zhiping Cai (College of Computer Science and Technology, National University of Defense Technology)2026-03-12💻 cs

GeoSense: Internalizing Geometric Necessity Perception for Multimodal Reasoning

Il paper "GeoSense" presenta un nuovo framework per i modelli linguistici multimodali che, invece di iniettare rigidamente informazioni geometriche in ogni input, li dota della capacità di riconoscere autonomamente l'insufficienza dei segnali visivi 2D e di attivare dinamicamente canali geometrici solo quando necessario, migliorando così il ragionamento spaziale senza compromettere le prestazioni generali.

Ruiheng Liu, Haihong Hao, Mingfei Han, Xin Gu, Kecheng Zhang, Changlin Li, Xiaojun Chang2026-03-12💻 cs

Shape Control of a Planar Hyper-Redundant Robot via Hybrid Kinematics-Informed and Learning-based Approach

Il paper propone SpatioCoupledNet, un metodo di controllo ibrido che combina conoscenze cinematiche e apprendimento automatico per gestire l'instabilità e migliorare la precisione nella forma di un robot iper-redundante planare flessibile, superando le prestazioni dei modelli puramente analitici o basati sui dati.

Yuli Song, Wenbo Li, Wenci Xin, Zhiqiang Tang, Daniela Rus, Cecilia Laschi2026-03-12💻 cs