FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

Dit paper introduceert FireScope, een VLM-gebaseerd raamwerk dat chain-of-thought redenering combineert met visuele supervisie om op Sentinel-2-beelden en klimaatdata gebaseerde, interpreteerbare en cross-continentaal generaliserende wildvuurrisicokaarten te genereren.

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

Learning Latent Transmission and Glare Maps for Lens Veiling Glare Removal

Dit paper introduceert VeilGen, een generatief model dat ongesuperviseerd latent transmissie- en glanskaarten leert om realistische veilingglans te simuleren, en DeVeiler, een restauratienetwerk dat deze kaarten gebruikt om beeldkwaliteit in vereenvoudigde optische systemen te herstellen.

Xiaolong Qian, Qi Jiang, Lei Sun, Zongxi Yu, Kailun Yang, Peixuan Wu, Jiacheng Zhou, Yao Gao, Yaoguang Ma, Ming-Hsuan Yang, Kaiwei Wang2026-03-09🔬 physics.optics

SyncMV4D: Synchronized Multi-view Joint Diffusion of Appearance and Motion for Hand-Object Interaction Synthesis

Het artikel introduceert SyncMV4D, een baanbrekend model dat voor het eerst gesynchroniseerde multi-view video's en 4D-bewegingen van hand-object-interacties genereert door een gesloten lus te creëren tussen visuele priors, bewegingsdynamica en multi-view geometrie, waardoor zowel realisme als consistentie aanzienlijk worden verbeterd.

Lingwei Dang, Zonghan Li, Juntong Li, Hongwen Zhang, Liang An, Yebin Liu, Qingyao Wu2026-03-09💻 cs

UniTS: Unified Spatio-Temporal Generative Model for Remote Sensing

In dit artikel wordt UniTS voorgesteld, een unificerend spatiotemporale generatief model op basis van flow matching dat diverse aardobservatietaken zoals reconstructie, wolkverwijdering, veranderingdetectie en voorspelling integreert in één raamwerk, waardoor het bestaande gespecialiseerde modellen overtreft, vooral onder uitdagende omstandigheden.

Yuxiang Zhang, Shunlin Liang, Wenyuan Li, Han Ma, Jianglei Xu, Yichuan Ma, Jiangwei Xie, Wei Li, Mengmeng Zhang, Ran Tao, Xiang-Gen Xia2026-03-09💻 cs

Exploiting Spatiotemporal Properties for Efficient Event-Driven Human Pose Estimation

Dit artikel introduceert een puntwolkgebaseerd raamwerk voor menselijke houdingsschatting dat de spatiotemporale eigenschappen van event-camerastromen benut via nieuwe modules voor tijdelijke slicing en sequentiële modellering, waardoor de prestaties aanzienlijk worden verbeterd zonder de hoge tijdsresolutie van het signaal te verliezen.

Haoxian Zhou, Chuanzhi Xu, Langyi Chen, Pengfei Ye, Haodong Chen, Yuk Ying Chung, Qiang Qu2026-03-09🤖 cs.AI

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

Het artikel introduceert DFIR-DETR, een transformer-gebaseerde detector die de prestaties bij het detecteren van kleine objecten in complexe scènes verbetert door dynamische content-aggregatie, normbehoudende feature-pyramides en frequentiedomein-iteratieve verfijning te combineren om hoge-frequentie randinformatie te behouden.

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

Fast-BEV++: Fast by Algorithm, Deployable by Design

Fast-BEV++ is een nieuw visueel Bird's-Eye-View-perceptieframework dat door middel van een hardware-geoptimaliseerde architectuur de traditionele afweging tussen detectienauwkeurigheid en verwerkingssnelheid oplost, waardoor het een nieuwe state-of-the-art prestatie op de nuScenes-benchmark bereikt met real-time inferentie van meer dan 134 FPS.

Yuanpeng Chen, Hui Song, Sheng Yang, Wei Tao, Shanhui Mo, Shuang Zhang, Xiao Hua, Tiankun Zhao2026-03-09💻 cs