Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Dit paper identificeert en analyseert een 'corruptiestadium' tijdens het few-shot fine-tunen van diffusiemodellen, waarbij beeldkwaliteit tijdelijk verslechtert door een versmalde leerverdeling, en lost dit op door Bayesiaanse neurale netwerken toe te passen om de distributie te verbreden en zo de beeldkwaliteit, diversiteit en trouw te verbeteren zonder extra inferentiekosten.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

Prithvi-EO-2.0: A Versatile Multi-Temporal Foundation Model for Earth Observation Applications

Dit artikel introduceert Prithvi-EO-2.0, een geavanceerd open-source fundamenteel model voor aardobservatie dat is getraind op 4,2 miljoen tijdreeksstalen en aanzienlijk beter presteert dan eerdere modellen bij diverse ruimtelijke taken, van landdekkingsmapping tot ecosysteemmonitoring.

Daniela Szwarcman, Sujit Roy, Paolo Fraccaro, {\TH}orsteinn Elí Gíslason, Benedikt Blumenstiel, Rinki Ghosal, Pedro Henrique de Oliveira, Joao Lucas de Sousa Almeida, Rocco Sedona, Yanghui Kang, Srija Chakraborty, Sizhe Wang, Carlos Gomes, Ankur Kumar, Myscon Truong, Denys Godwin, Hyunho Lee, Chia-Yu Hsu, Rohit Lal, Ata Akbari Asanjan, Besart Mujeci, Disha Shidham, Trevor Keenan, Paulo Arevalo, Wenwen Li, Hamed Alemohammad, Pontus Olofsson, Christopher Hain, Robert Kennedy, Bianca Zadrozny, David Bell, Gabriele Cavallaro, Campbell Watson, Manil Maskey, Rahul Ramachandran, Juan Bernabe Moreno2026-03-10💻 cs

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Deze paper introduceert een methode die voorgeprende vision-language modellen gebruikt om symbolische wereldmodellen te leren uit korte demonstraties, waardoor robots in staat zijn om via planning complexe, lange-horizon taken in nieuwe omgevingen en met nieuwe doelen op te lossen.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

VL-Nav: A Neuro-Symbolic Approach for Reasoning-based Vision-Language Navigation

Dit paper introduceert VL-Nav, een neuro-symbolisch systeem dat neurale redenering combineert met symbolische begeleiding om robots in staat te stellen complexe, abstracte instructies te volgen en effectief te navigeren in onbekende, grote omgevingen, wat resulteert in hoge succespercentages in zowel simulaties als real-world experimenten.

Yi Du, Taimeng Fu, Zhipeng Zhao, Shaoshu Su, Zitong Zhan, Zhuoqun Chen, Bowen Li, Chen Wang2026-03-10💻 cs