GRD-Net: Generative-Reconstructive-Discriminative Anomaly Detection with Region of Interest Attention Module

Het paper introduceert GRD-Net, een nieuw model voor industriële afwijkingdetectie dat een generatieve reconstructie-architectuur combineert met een discriminatieve module voor segmentatie van gebieden van belang, waardoor de afhankelijkheid van vooraf gedefinieerde voorverwerkingsalgoritmen wordt verminderd en de generalisatie op zowel synthetische als realistische industriële datasets wordt verbeterd.

Niccolò Ferrari, Michele Fraccaroli, Evelina Lamma2026-03-10🤖 cs.LG

Integration of deep generative Anomaly Detection algorithm in high-speed industrial line

Dit paper presenteert een semi-supervised anomaliedetectieframework op basis van generatieve adversariale netwerken dat is ontworpen voor online implementatie op een hoge-snelheids Blow-Fill-Seal-productielijn, waar het met hoge nauwkeurigheid en binnen strikte tijdsbeperkingen defecten detecteert door enkel te trainen op nominale monsters.

Niccolò Ferrari, Nicola Zanarini, Michele Fraccaroli, Alice Bizzarri, Evelina Lamma2026-03-10🤖 cs.LG

3DGS-HPC: Distractor-free 3D Gaussian Splatting with Hybrid Patch-wise Classification

Het paper introduceert 3DGS-HPC, een robuust framework dat tijdelijke afleidingen in 3D-scènes effectief elimineert door een hybride, patch-gebaseerde classificatiestrategie te combineren die lokale ruimtelijke consistentie en adaptieve visuele cues benut, waardoor de kwaliteit van 3D-Gaussian Splatting voor nieuwe weergaven in realistische omgevingen aanzienlijk wordt verbeterd.

Jiahao Chen, Yipeng Qin, Ganlong Zhao, Xin Li, Wenping Wang, Guanbin Li2026-03-10💻 cs

Models as Lego Builders: Assembling Malice from Benign Blocks via Semantic Blueprints

Dit paper introduceert StructAttack, een black-box jailbreak-methode die kwetsbaarheden in Large Vision-Language Models exploiteert door schadelijke inhoud te verbergen in ogenschijnlijk onschadelijke visuele structuren die het model zelf tot een gevaarlijke output assembleert.

Chenxi Li, Xianggan Liu, Dake Shen, Yaosong Du, Zhibo Yao, Hao Jiang, Linyi Jiang, Chengwei Cao, Jingzhe Zhang, RanYi Peng, Peiling Bai, Xiande Huang2026-03-10🤖 cs.LG

Fast Attention-Based Simplification of LiDAR Point Clouds for Object Detection and Classification

Deze paper presenteert een efficiënte, geleerde methode voor het vereenvoudigen van LiDAR-puntwolken via een op attentie gebaseerd mechanisme, die een betere balans biedt tussen verwerkingssnelheid en nauwkeurigheid voor objectdetectie en -classificatie in vergelijking met bestaande steekproefmethodes.

Z. Rozsa, Á. Madaras, Q. Wei, X. Lu, M. Golarits, H. Yuan, T. Sziranyi, R. Hamzaoui2026-03-10💻 cs

Compression as Adaptation: Implicit Visual Representation with Diffusion Foundation Models

Dit artikel introduceert een nieuw raamwerk voor visuele representatie waarbij video's worden gecodeerd als functies met lage-rang aanpassingen op een bevroren generatief model, waardoor compressie met uiterst lage bitrates mogelijk is en een brug wordt geslagen tussen beeldcompressie en generatie.

Jiajun He, Zongyu Guo, Zhaoyang Jia, Xiaoyi Zhang, Jiahao Li, Xiao Li, Bin Li, José Miguel Hernández-Lobato, Yan Lu2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

Dit artikel introduceert een synthetische data-pipeline op basis van een digitale tweeling van de luchthaven van Algiers die, in combinatie met YOLO-OBB en gemengde training, de annotatie-inspanning voor het detecteren van bagagewagentjes met 25 tot 35 procent verlaagt terwijl de prestaties gelijk blijven aan of beter zijn dan die van modellen getraind op volledige real-world datasets.

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

Deze paper introduceert AtomicVLA, een unificerend kader voor robotplanning en -executie dat via een Skill-Guided Mixture-of-Experts (SG-MoE) schaalbare atomaire vaardigheden leert en dynamisch combineert, waardoor robuustere prestaties worden bereikt bij langdurige taken en voortdurend leren in vergelijking met bestaande VLA-modellen.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs

Holi-Spatial: Evolving Video Streams into Holistic 3D Spatial Intelligence

Dit paper introduceert Holi-Spatial, het eerste volledig geautomatiseerde, grootschalige multimodale datasetkader dat ruwe video-inputs omzet in holistische 3D-ruimtelijke intelligentie met behulp van een geoptimaliseerde pipeline voor 3D-Gaussian Splatting-reconstructies en ruimtelijke vraag-antwoordparen, waardoor de schaalbaarheid en prestaties van ruimtelijk redenerende modellen aanzienlijk worden verbeterd.

Yuanyuan Gao, Hao Li, Yifei Liu, Xinhao Ji, Yuning Gong, Yuanjun Liao, Fangfu Liu, Manyuan Zhang, Yuchen Yang, Dan Xu, Xue Yang, Huaxi Huang, Hongjie Zhang, Ziwei Liu, Xiao Sun, Dingwen Zhang, Zhihang Zhong2026-03-10💻 cs