VL-Nav: A Neuro-Symbolic Approach for Reasoning-based Vision-Language Navigation

Il paper presenta VL-Nav, un sistema di navigazione visione-linguaggio neuro-simbolico che combina ragionamento neurale e guida simbolica per decomporre compiti complessi e ottimizzare l'esplorazione, ottenendo risultati di successo superiori nell'83,4% dei casi in ambienti indoor e nell'86,3% in esperimenti reali.

Yi Du, Taimeng Fu, Zhipeng Zhao, Shaoshu Su, Zitong Zhan, Zhuoqun Chen, Bowen Li, Chen Wang2026-03-10💻 cs

Prompt-SID: Learning Structural Representation Prompt via Latent Diffusion for Single-Image Denoising

Il paper introduce Prompt-SID, un framework di denoising per immagini singole basato sull'apprendimento di prompt strutturali generati tramite un processo di diffusione latente e integrati in un denoiser transformer, che addestrato in modo auto-supervisionato preserva efficacemente i dettagli strutturali superando i limiti delle metodologie esistenti.

Huaqiu Li, Wang Zhang, Xiaowan Hu, Tao Jiang, Zikang Chen, Haoqian Wang2026-03-10💻 cs

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

Il paper propone un modello di apprendimento profondo geometrico basato su transformer che, integrando punti di riferimento anatomici in mesh tetraedriche derivanti da risonanza magnetica strutturale, migliora la diagnosi dell'Alzheimer e la previsione della positività all'amiloide cerebrale, riducendo la necessità di scansioni PET costose e invasive.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin Wang2026-03-10💻 cs

Snapmoji: Instant Generation of Animatable Dual-Stylized Avatars

Il paper introduce Snapmoji, un sistema che genera istantaneamente avatar 3D animabili e personalizzabili su dispositivi mobili a 30-40 FPS, trasformando un selfie in uno stile principale tramite l'adattamento del dominio Gaussiano (GDA) e applicando successivamente uno stile secondario pur preservando l'identità dell'utente.

Eric M. Chen, Di Liu, Sizhuo Ma, Michael Vasilkovsky, Bing Zhou, Qiang Gao, Wenzhou Wang, Jiahao Luo, Dimitris N. Metaxas, Vincent Sitzmann, Jian Wang2026-03-10💻 cs

SceneEval: Evaluating Semantic Coherence in Text-Conditioned 3D Indoor Scene Synthesis

Il paper presenta SceneEval, un nuovo framework di valutazione e un benchmark di 500 campioni (SceneEval-500) progettati per misurare in modo completo e interpretabile la coerenza semantica e il rispetto delle specifiche testuali nella sintesi di scene 3D interne, evidenziando le lacune attuali nei metodi di generazione esistenti.

Hou In Ivan Tam, Hou In Derek Pun, Austin T. Wang, Angel X. Chang, Manolis Savva2026-03-10💻 cs

From 2D Alignment to 3D Plausibility: Unifying Heterogeneous 2D Priors and Penetration-Free Diffusion for Occlusion-Robust Two-Hand Reconstruction

Questo lavoro propone un metodo unificato per la ricostruzione robusta di due mani da immagini monoculare, che combina un codificatore di fusione per allineare eterogenee priorità 2D da modelli fondazionali con un modello di diffusione privo di penetrazione per garantire interazioni 3D fisicamente plausibili e coerenti.

Gaoge Han, Yongkang Cheng, Zhe Chen, Shaoli Huang, Tongliang Liu2026-03-10💻 cs

LEL: Lipschitz Continuity Constrained Ensemble Learning for Efficient EEG-Based Intra-subject Emotion Recognition

Il documento presenta LEL, un innovativo framework di apprendimento ensemble vincolato dalla continuità di Lipschitz che migliora stabilità, accuratezza e robustezza nel riconoscimento delle emozioni basato su segnali EEG intra-soggetto, ottenendo risultati superiori su tre dataset pubblici.

Shengyu Gong, Yueyang Li, Zijian Kang, Bo Chai, Weiming Zeng, Hongjie Yan, Zhiguo Zhang, Wai Ting Siok, Nizhuan Wang2026-03-10💻 cs