Seeing Through Uncertainty: A Free-Energy Approach for Real-Time Perceptual Adaptation in Robust Visual Navigation

Il paper presenta FEP-Nav, un framework ispirato al Principio dell'Energia Libera che garantisce una navigazione visiva robusta e adattiva in tempo reale minimizzando l'energia variazionale attraverso un meccanismo duale di decodifica top-down e normalizzazione adattiva, permettendo così ai sistemi autonomi di mantenere prestazioni elevate anche in presenza di corruzioni sensoriali.

Maytus Piriyajitakonkij, Rishabh Dev Yadav, Mingfei Sun + 2 more2026-03-06💻 cs

PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing

Il paper presenta PhysLLM, un innovativo framework collaborativo che integra i Large Language Models con componenti specifici per la rPPG, utilizzando strategie come la Text Prototype Guidance e l'algoritmo Dual-Domain Stationary per superare le limitazioni legate all'illuminazione e al movimento, ottenendo così prestazioni all'avanguardia nel rilevamento remoto dei segnali fisiologici.

Yiping Xie, Bo Zhao, Mingtong Dai + 6 more2026-03-06💻 cs

RESAR-BEV: An Explainable Progressive Residual Autoregressive Approach for Camera-Radar Fusion in BEV Segmentation

Il paper presenta RESAR-BEV, un approccio autoregressivo residuo progressivo ed esplicabile per la fusione camera-radar nella segmentazione BEV, che combina un'architettura a cascata di trasformatori, una rappresentazione robusta dei voxel e una supervisione disaccoppiata per raggiungere prestazioni all'avanguardia (54,0% mIoU) e tempi di esecuzione in tempo reale (14,6 FPS) su scenari di guida complessi.

Zhiwen Zeng, Yunfei Yin, Zheng Yuan + 2 more2026-03-06💻 cs

EDITOR: Effective and Interpretable Prompt Inversion for Text-to-Image Diffusion Models

Il paper propone EDITOR, un metodo efficace e interpretabile per l'inversione di prompt nei modelli di diffusione testo-immagine che, combinando modelli di descrizione di immagini, ottimizzazione nello spazio latente e conversione embedding-testo, supera le tecniche esistenti in termini di somiglianza visiva, allineamento testuale e generalizzabilità, abilitando nuove applicazioni come la manipolazione concettuale e la segmentazione non supervisionata.

Mingzhe Li, Kejing Xia, Gehao Zhang + 5 more2026-03-06💻 cs

HypeVPR: Exploring Hyperbolic Space for Perspective to Equirectangular Visual Place Recognition

Il paper introduce HypeVPR, un framework di embedding gerarchico nello spazio iperbolico progettato per migliorare il riconoscimento dei luoghi da prospettive a equirettangolari, sfruttando la capacità di tale spazio di rappresentare strutture gerarchiche per ottenere prestazioni competitive con una maggiore efficienza di ricerca e riduzione dello storage.

Suhan Woo, Seongwon Lee, Jinwoo Jang + 1 more2026-03-06💻 cs