How Long Can Unified Multimodal Models Generate Images Reliably? Taming Long-Horizon Interleaved Image Generation via Context Curation

Dit paper introduceert UniLongGen, een trainingsvrije inferentiestrategie die de betrouwbaarheid van langdurige, interleaved beeldgeneratie in unified multimodale modellen verbetert door dynamisch irrelevante visuele informatie te verwijderen en zo de ophoping van visuele vervuiling te voorkomen.

Haoyu Chen, Qing Liu, Yuqian Zhou, He Zhang, Zhaowen Wang, Mengwei Ren, Jingjing Ren, Xiang Wang, Zhe Lin, Lei Zhu2026-03-10💻 cs

Targeted Speaker Poisoning Framework in Zero-Shot Text-to-Speech

Deze paper introduceert een nieuw raamwerk voor 'Speech Generation Speaker Poisoning' om de privacyrisico's van zero-shot tekst-naar-spraakmodellen te beperken door specifieke stemidentiteiten te verwijderen, waarbij wordt aangetoond dat dit effectief werkt voor tot 15 sprekers maar schaalbaarheidsproblemen ondervindt bij 100 sprekers.

Thanapat Trachu, Thanathai Lertpetchpun, Sai Praneeth Karimireddy, Shrikanth Narayanan2026-03-10💻 cs

ReconDrive: Fast Feed-Forward 4D Gaussian Splatting for Autonomous Driving Scene Reconstruction

ReconDrive is een voorspellend framework dat de 3D-fundatiemodel VGGT uitbreidt met hybride Gaussische voorspellingskoppen en een statisch-dynamische 4D-samenstellingsstrategie om snelle, hoogwaardige 4D-Gaussian Splatting-reconstructies voor autonome rijscènes te genereren, waarmee het de snelheid van bestaande methoden combineert met de kwaliteit van per-scene optimalisatie.

Haibao Yu, Kuntao Xiao, Jiahang Wang, Ruiyang Hao, Yuxin Huang, Guoran Hu, Haifang Qin, Bowen Jing, Yuntian Bo, Ping Luo2026-03-10💻 cs

AgentRaft: Automated Detection of Data Over-Exposure in LLM Agents

Dit paper introduceert AgentRaft, het eerste geautomatiseerde framework dat programma-analyse en semantische redenering combineert om data-overblootstelling in LLM-agenten te detecteren en zo privacyrisico's in cross-tool datatransfers effectief te identificeren.

Yixi Lin (Sun Yat-sen University, Zhuhai, Guangdong, China), Jiangrong Wu (Sun Yat-sen University, Zhuhai, Guangdong, China), Yuhong Nan (Sun Yat-sen University, Zhuhai, Guangdong, China), Xueqiang Wang (University of Central Florida, Orlando, Florida, USA), Xinyuan Zhang (Sun Yat-sen University, Zhuhai, Guangdong, China), Zibin Zheng (Sun Yat-sen University, Zhuhai, Guangdong, China)2026-03-10💻 cs

Active Inference for Micro-Gesture Recognition: EFE-Guided Temporal Sampling and Adaptive Learning

Dit artikel introduceert een actief inferentie-framework voor het herkennen van micro-gesten, dat gebruikmaakt van EFE-gestuurde temporele bemonstering en adaptief leren om de prestaties te verbeteren bij lage steekproefomvang, ruis en variabiliteit tussen gebruikers.

Weijia Feng, Jingyu Yang, Ruojia Zhang, Fengtao Sun, Qian Gao, Chenyang Wang, Tongtong Su, Jia Guo, Xiaobai Li, Minglai Shao2026-03-10💻 cs

Approximate Imitation Learning for Event-based Quadrotor Flight in Cluttered Environments

Deze paper introduceert een nieuwe benadering voor 'Approximate Imitation Learning' die het mogelijk maakt een quadcopter met slechts één event-camera snel en robuust door rommelige omgevingen te vliegen door de dure simulatie van events te omzeilen en in plaats daarvan een offline dataset te combineren met online training op basis van lichte state-informatie.

Nico Messikommer, Jiaxu Xing, Leonard Bauersfeld, Marco Cannici, Elie Aljalbout, Davide Scaramuzza2026-03-10💻 cs

3DGS-HPC: Distractor-free 3D Gaussian Splatting with Hybrid Patch-wise Classification

Het paper introduceert 3DGS-HPC, een robuust framework dat tijdelijke afleidingen in 3D-scènes effectief elimineert door een hybride, patch-gebaseerde classificatiestrategie te combineren die lokale ruimtelijke consistentie en adaptieve visuele cues benut, waardoor de kwaliteit van 3D-Gaussian Splatting voor nieuwe weergaven in realistische omgevingen aanzienlijk wordt verbeterd.

Jiahao Chen, Yipeng Qin, Ganlong Zhao, Xin Li, Wenping Wang, Guanbin Li2026-03-10💻 cs