LikePhys: Evaluating Intuitive Physics Understanding in Video Diffusion Models via Likelihood Preference

Dit paper introduceert LikePhys, een trainingsvrije methode die intuïtieve fysica in videodiffusiemodellen evalueert door het onderscheid te maken tussen fysiek geldige en onmogelijke video's, en toont aan dat deze aanpak sterk overeenkomt met menselijke voorkeur terwijl het een duidelijke verbetering in fysiekbegrip bij grotere modellen aantoont.

Jianhao Yuan, Fabio Pizzati, Francesco Pinto, Lars Kunze, Ivan Laptev, Paul Newman, Philip Torr, Daniele De Martini2026-03-09🤖 cs.AI

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

Dit paper introduceert FireScope, een VLM-gebaseerd raamwerk dat chain-of-thought redenering combineert met visuele supervisie om op Sentinel-2-beelden en klimaatdata gebaseerde, interpreteerbare en cross-continentaal generaliserende wildvuurrisicokaarten te genereren.

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

Learning Latent Transmission and Glare Maps for Lens Veiling Glare Removal

Dit paper introduceert VeilGen, een generatief model dat ongesuperviseerd latent transmissie- en glanskaarten leert om realistische veilingglans te simuleren, en DeVeiler, een restauratienetwerk dat deze kaarten gebruikt om beeldkwaliteit in vereenvoudigde optische systemen te herstellen.

Xiaolong Qian, Qi Jiang, Lei Sun, Zongxi Yu, Kailun Yang, Peixuan Wu, Jiacheng Zhou, Yao Gao, Yaoguang Ma, Ming-Hsuan Yang, Kaiwei Wang2026-03-09🔬 physics.optics

SyncMV4D: Synchronized Multi-view Joint Diffusion of Appearance and Motion for Hand-Object Interaction Synthesis

Het artikel introduceert SyncMV4D, een baanbrekend model dat voor het eerst gesynchroniseerde multi-view video's en 4D-bewegingen van hand-object-interacties genereert door een gesloten lus te creëren tussen visuele priors, bewegingsdynamica en multi-view geometrie, waardoor zowel realisme als consistentie aanzienlijk worden verbeterd.

Lingwei Dang, Zonghan Li, Juntong Li, Hongwen Zhang, Liang An, Yebin Liu, Qingyao Wu2026-03-09💻 cs