OD-RASE: Ontology-Driven Risk Assessment and Safety Enhancement for Autonomous Driving

Dit paper introduceert OD-RASE, een raamwerk dat een ontologie en grote visuele taalmodellen combineert om proactief onveilige wegstructuren te identificeren en verbeteringsvoorstellen te genereren, waardoor de veiligheid van autonome voertuigen wordt verhoogd en de reactieve aanpak van verkeersveiligheid wordt doorbroken.

Kota Shimomura, Masaki Nambata, Atsuya Ishikawa, Ryota Mimura, Takayuki Kawabuchi, Takayoshi Yamashita, Koki Inoue2026-03-09💻 cs

LucidNFT: LR-Anchored Multi-Reward Preference Optimization for Generative Real-World Super-Resolution

Het paper introduceert LucidNFT, een multi-beloning RL-framework voor generatieve super-resolutie van real-world beelden dat d.m.v. een robuuste faithfulness-evaluator, een ontkoppelde normalisatiestrategie en een groot real-wereld dataset de balans tussen perceptuele kwaliteit en LR-gebaseerde trouw verbetert zonder hallucinaties.

Song Fei, Tian Ye, Sixiang Chen, Zhaohu Xing, Jianyu Lai, Lei Zhu2026-03-09💻 cs

Skeleton-to-Image Encoding: Enabling Skeleton Representation Learning via Vision-Pretrained Models

Deze paper introduceert Skeleton-to-Image Encoding (S2I), een nieuwe methode die skeletdata omzet in afbeeldingen om zo krachtige, voorgetrainde visiemodellen te kunnen gebruiken voor zelftoezichthoudend leren van skeletrepresentaties en zo de uitdagingen van dataformaten en schaarste aan datasets aan te pakken.

Siyuan Yang, Jun Liu, Hao Cheng, Chong Wang, Shijian Lu, Hedvig Kjellstrom, Weisi Lin, Alex C. Kot2026-03-09🤖 cs.AI

CR-QAT: Curriculum Relational Quantization-Aware Training for Open-Vocabulary Object Detection

Het artikel introduceert CR-QAT, een curriculum-gebaseerd raamwerk voor kwantisatiebewust trainen dat door middel van gefaseerde optimalisatie en relationele kennisdistillatie de prestaties van open-vocabulaire objectdetectie bij agressieve kwantisatie (zoals 4-bit) aanzienlijk verbetert zonder de visueel-taaluitlijning te verstoren.

Jinyeong Park, Donghwa Kim, Brent ByungHoon Kang, Hyeongboo Baek, Jibum Kim2026-03-09💻 cs

Breaking Smooth-Motion Assumptions: A UAV Benchmark for Multi-Object Tracking in Complex and Adverse Conditions

Dit paper introduceert DynUAV, een nieuw en uitdagend benchmark voor multi-object tracking vanuit UAV-perspectief dat specifiek is ontworpen om de beperkingen van bestaande methoden bloot te leggen door complexe, dynamische bewegingen en ongunstige omstandigheden te simuleren.

Jingtao Ye, Kexin Zhang, Xunchi Ma, Yuehan Li, Guangming Zhu, Peiyi Shen, Linhua Jiang, Xiangdong Zhang, Liang Zhang2026-03-09💻 cs

Towards High-resolution and Disentangled Reference-based Sketch Colorization

Deze paper introduceert een nieuw raamwerk voor referentiegebaseerde kleuring van schetsen dat door middel van een dubbelvertakkingsarchitectuur en Gram-regularisatie de distributieshift tussen trainings- en inferentiegegevens direct minimaliseert, waardoor state-of-the-art prestaties worden bereikt in kwaliteit, resolutie en controleerbaarheid.

Dingkun Yan, Xinrui Wang, Ru Wang, Zhuoru Li, Jinze Yu, Yusuke Iwasawa, Yutaka Matsuo, Jiaxian Guo2026-03-09💻 cs

Technical Report: Automated Optical Inspection of Surgical Instruments

Dit technische rapport beschrijft een samenwerking met toonaangevende Pakistanese producenten om een automatisch optisch inspectiesysteem te ontwikkelen, dat gebruikmaakt van diepe leerarchitecturen zoals YOLOv8, ResNet-152 en EfficientNet-b4 om defecten in chirurgische instrumenten te detecteren en zo de patiëntveiligheid en productkwaliteit te waarborgen.

Zunaira Shafqat, Atif Aftab Ahmed Jilani, Qurrat Ul Ain2026-03-09🤖 cs.AI