A Robust Deep Learning Framework for Bangla License Plate Recognition Using YOLO and Vision-Language OCR

Questo articolo presenta un framework di deep learning robusto per il riconoscimento delle targhe bengalesi, che combina un modello di rilevamento YOLOv8 ottimizzato con una strategia di addestramento adattiva e un sistema OCR basato su ViT e BanglaBERT, ottenendo un'accuratezza del 97,83% e dimostrando elevata resilienza in scenari reali complessi.

Nayeb Hasin, Md. Arafath Rahman Nishat, Mainul Islam, Khandakar Shakib Al Hasan, Asif Newaz2026-03-12💻 cs

Post-Quantum Entropy as a Service for Embedded Systems

Questo lavoro presenta un sistema QEaaS che fornisce entropia quantistica sicura a dispositivi embedded tramite canali post-quantistici, dimostrando che l'autenticazione e lo scambio di chiavi post-quantistici su hardware ESP32 sono non solo fattibili, ma significativamente più veloci delle controparti classiche.

Javier Blanco-Romero, Yuri Melissa Garcia-Niño, Florina Almenares Mendoza, Daniel Díaz-Sánchez, Carlos García-Rubio, Celeste Campo2026-03-12💻 cs

Update-Free On-Policy Steering via Verifiers

Il paper propone UF-OPS, un metodo di steering on-policy senza aggiornamenti dei parametri che utilizza funzioni verificatrici addestrate su dati di rollout per guidare politiche di base come i modelli diffusion verso azioni più probabili, migliorando significativamente il successo nelle manipolazioni robotiche sia in simulazione che nel mondo reale.

Maria Attarian, Ian Vyse, Claas Voelcker, Jasper Gerigk, Evgenii Opryshko, Anas Almasri, Sumeet Singh, Yilun Du, Igor Gilitschenski2026-03-12💻 cs

Instant Runoff Voting on Graphs: Exclusion Zones and Distortion

Questo studio analizza il voto a scrutinio istantaneo (IRV) su grafi non pesanti, dimostrando che il riconoscimento e il calcolo delle zone di esclusione sono risolvibili in tempo polinomiale sugli alberi ma rimangono NP-difficili su grafi generali, fornendo inoltre limiti superiori e inferiori per la distorsione utilitaristica in diversi scenari.

Georgios Birmpas, Georgios Chionas, Efthyvoulos Drousiotis, Soodeh Habibi, Marios Mavronicolas, Paul Spirakis2026-03-12💻 cs

From Imitation to Intuition: Intrinsic Reasoning for Open-Instance Video Classification

Il paper introduce DeepIntuit, un framework che supera i limiti della semplice imitazione nei modelli di classificazione video trasformando l'approccio in un ragionamento intrinco basato su allineamento supervisionato, ottimizzazione tramite GRPO e calibrazione intuitiva per gestire efficacemente le sfide delle istanze aperte.

Ke Zhang, Xiangchen Zhao, Yunjie Tian, Jiayu Zheng, Vishal M. Patel, Di Fu2026-03-12💻 cs

SteadyTray: Learning Object Balancing Tasks in Humanoid Tray Transport via Residual Reinforcement Learning

Il paper introduce ReST-RL, un'architettura di apprendimento per rinforzo gerarchico che, integrando un modulo residuo per la stabilizzazione del carico su una politica di locomozione robusta, risolve con successo il trasporto di carichi su vassoio da parte di umanoidi, garantendo un'eccellente generalizzazione zero-shot dalla simulazione alla realtà su hardware Unitree G1.

Anlun Huang, Zhenyu Wu, Soofiyan Atar, Yuheng Zhi, Michael Yip2026-03-12💻 cs

Towards Modeling Situational Awareness Through Visual Attention in Clinical Simulations

Questo studio preliminare applica l'Analisi delle Reti di Transizione (TNA) ai dati di tracciamento oculare raccolti durante simulazioni di arresto cardiaco in realtà virtuale per dimostrare come l'attenzione visiva dei membri del team clinico si ridistribuisca dinamicamente in base ai ruoli e alle fasi dello scenario, offrendo un metodo promettente per valutare la consapevolezza situazionale e migliorare la formazione.

Haoting Gao, Kapotaksha Das, Mohamed Abouelenien, Michael Cole, James Cooke, Vitaliy Popov2026-03-12💻 cs

The Orthogonal Vulnerabilities of Generative AI Watermarks: A Comparative Empirical Benchmark of Spatial and Latent Provenance

Questo studio dimostra empiricamente che i filigrane digitali attuali, operanti esclusivamente nei domini spaziali o latenti, possiedono vulnerabilità ortogonali e mutuamente esclusive che le rendono inefficaci contro gli strumenti di editing generativo moderno, evidenziando così la necessità urgente di architetture crittografiche multi-dominio per garantire una provenienza digitale robusta.

Jesse Yu, Nicholas Wei2026-03-12💻 cs

Fuel Gauge: Estimating Chain-of-Thought Length Ahead of Time in Large Multimodal Models

Il paper presenta "Fuel Gauge", un metodo innovativo che stima in anticipo la lunghezza del ragionamento a catena di pensiero (CoT) nei Modelli Multimodali su larga scala (LMM) analizzando un parametro nascosto, consentendo così un'allocazione più efficiente della memoria e una regolazione ottimale della lunghezza del ragionamento per migliorare le prestazioni e ridurre gli sprechi computazionali.

Yuedong Yang, Xiwen Wei, Mustafa Munir, Radu Marculescu2026-03-12💻 cs

AgentServe: Algorithm-System Co-Design for Efficient Agentic AI Serving on a Consumer-Grade GPU

Il paper presenta AgentServe, un sistema di serving per AI agenti su GPU consumer che, attraverso la co-progettazione algoritmo-sistema e l'isolamento delle fasi di prefill e decode, garantisce un'esecuzione multi-agente stabile con riduzioni fino a 2,8 volte nel tempo di primo token e 2,7 volte nel tempo per token rispetto alle soluzioni attuali.

Yuning Zhang, Yan Yan, Nan Yang, Dong Yuan2026-03-12💻 cs

Adaptive Manipulation Potential and Haptic Estimation for Tool-Mediated Interaction

Questo paper introduce un quadro unificato basato su un Manifold di Equilibrio parametrizzato e una strategia di "haptic SLAM" che integra stima aptica, pianificazione online e controllo di impedenza adattivo per raggiungere una destrezza simile a quella umana nella manipolazione mediata da strumenti, come dimostrato da oltre 260 prove reali di allentamento di viti.

Lin Yang, Anirvan Dutta, Yuan Ji, Yanxin Zhou, Shilin Shan, Lv Chen, Etienne Burdet, Domenico Campolo2026-03-12💻 cs

StyleGallery: Training-free and Semantic-aware Personalized Style Transfer from Arbitrary Image References

Il paper introduce StyleGallery, un framework di trasferimento di stile personalizzato e privo di addestramento che, attraverso segmentazione semantica, corrispondenza di regioni e ottimizzazione guidata, risolve le limitazioni delle metodologie esistenti garantendo una migliore preservazione del contenuto e una maggiore adattabilità a riferimenti stilistici arbitrari.

Boyu He (College of Computer Science and Technology, National University of Defense Technology), Yunfan Ye (School of Design, Hunan University), Chang Liu (College of Computer Science and Technology, National University of Defense Technology), Weishang Wu (College of Computer Science and Technology, National University of Defense Technology), Fang Liu (School of Design, Hunan University), Zhiping Cai (College of Computer Science and Technology, National University of Defense Technology)2026-03-12💻 cs