This Looks Distinctly Like That: Grounding Interpretable Recognition in Stiefel Geometry against Neural Collapse

Il paper propone Adaptive Manifold Prototypes (AMP), un framework che utilizza l'ottimizzazione Riemanniana sulla varietà di Stiefel per rappresentare i prototipi di classe come basi ortonormali, prevenendo così il collasso dei prototipi e migliorando significativamente l'interpretabilità e la fedeltà causale nei modelli di riconoscimento.

Junhao Jia, Jiaqi Wang, Yunyou Liu, Haodong Jing, Yueyi Wu, Xian Wu, Yefeng Zheng2026-03-10💻 cs

Rectified flow-based prediction of post-treatment brain MRI from pre-radiotherapy priors for patients with glioma

Questo studio presenta un modello di flusso rettificato basato sull'intelligenza artificiale che genera realisticamente immagini MRI cerebrali post-trattamento per pazienti con glioma, utilizzando dati pre-terapia e mappe di dose radioterapica per ottimizzare la pianificazione terapeutica adattiva.

Selena Huisman, Nordin Belkacemi, Vera Keil, Joost Verhoeff, Szabolcs David2026-03-10💻 cs

AULLM++: Structural Reasoning with Large Language Models for Micro-Expression Recognition

Il paper presenta AULLM++, un framework innovativo che sfrutta i Large Language Models per il riconoscimento delle microespressioni, integrando evidenze visive multigranulari e relazioni strutturali tra le Action Units attraverso un processo di ragionamento a tre stadi per superare i limiti dei metodi precedenti e ottenere prestazioni all'avanguardia.

Zhishu Liu, Kaishen Yuan, Bo Zhao, Hui Ma, Zitong Yu2026-03-10💻 cs

SPIRAL: A Closed-Loop Framework for Self-Improving Action World Models via Reflective Planning Agents

Il paper introduce SPIRAL, un framework a ciclo chiuso che utilizza agenti di pianificazione e riflessione per migliorare la generazione video a lungo termine attraverso un processo iterativo di pianificazione, azione e valutazione, superando i limiti dei modelli open-loop esistenti.

Yu Yang, Yue Liao, Jianbiao Mei, Baisen Wang, Xuemeng Yang, Licheng Wen, Jiangning Zhang, Xiangtai Li, Hanlin Chen, Botian Shi, Yong Liu, Shuicheng Yan, Gim Hee Lee2026-03-10💻 cs

Information Maximization for Long-Tailed Semi-Supervised Domain Generalization

Il paper propone IMaX, un metodo semplice ed efficace basato sul principio di massimizzazione dell'informazione reciproca che, integrando un obiettivo entropico α\alpha, risolve il problema delle distribuzioni di classe a coda lunga nella generalizzazione di dominio semi-supervisionata, migliorando le prestazioni degli stati dell'arte su diverse modalità visive.

Leo Fillioux, Omprakash Chakraborty, Quentin Gopée, Pierre Marza, Paul-Henry Cournède, Stergios Christodoulidis, Maria Vakalopoulou, Ismail Ben Ayed, Jose Dolz2026-03-10💻 cs

Spherical-GOF: Geometry-Aware Panoramic Gaussian Opacity Fields for 3D Scene Reconstruction

Il paper presenta Spherical-GOF, un nuovo framework di rendering panoramico basato su Gaussian Opacity Fields che, campionando i raggi direttamente sulla sfera unitaria e introducendo regole di culling e filtraggio specifiche, risolve le distorsioni geometriche tipiche delle estensioni panoramiche della 3DGS, ottenendo risultati superiori in termini di coerenza geometrica e qualità fotometrica su dataset sintetici e reali.

Zhe Yang, Guoqiang Zhao, Sheng Wu, Kai Luo, Kailun Yang2026-03-10💻 cs

Interactive World Simulator for Robot Policy Training and Evaluation

Il paper presenta l'Interactive World Simulator, un framework basato su modelli di consistenza che genera simulazioni interattive veloci e fisicamente coerenti, permettendo l'addestramento e la valutazione di politiche robotiche scalabili con prestazioni nel mondo reale comparabili a quelle ottenute con dati reali.

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control

Il documento presenta il DualFlexKAN, un'architettura di rete neurale flessibile che supera i limiti dei KAN tradizionali attraverso un meccanismo a due stadi con funzioni indipendenti, offrendo un'efficienza parametrica superiore e una maggiore adattabilità per compiti scientifici e di regressione.

Andrés Ortiz, Nicolás J. Gallego-Molina, Carmen Jiménez-Mesa, Juan M. Górriz, Javier Ramírez2026-03-10🤖 cs.LG

PRISM: Streaming Human Motion Generation with Per-Joint Latent Decomposition

Il paper presenta PRISM, un modello fondazionale per la generazione di motioni umane in streaming che risolve le limitazioni degli approcci esistenti grazie a uno spazio latente fattorizzato per giunto e un'iniezione di condizione priva di rumore, unificando così compiti come la generazione da testo, condizionata alla posa e sequenziale in un'unica architettura che raggiunge lo stato dell'arte.

Zeyu Ling, Qing Shuai, Teng Zhang, Shiyang Li, Bo Han, Changqing Zou2026-03-10💻 cs

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

Il paper introduce RAF (Retrieval-Augmented Faces), un metodo di augmentation durante l'addestramento che migliora la generalizzazione delle espressioni per avatar facciali privi di template, sostituendo le feature del soggetto con espressioni recuperate da un archivio non etichettato per aumentare la diversità dei dati e la robustezza senza richiedere annotazioni aggiuntive.

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski2026-03-10🤖 cs.LG