DA-Occ: Direction-Aware 2D Convolution for Efficient and Geometry-Preserving 3D Occupancy Prediction in Autonomous Driving

Il paper presenta DA-Occ, un framework 2D puro che migliora la previsione dell'occupazione 3D per la guida autonoma integrando una proiezione complementare basata sull'altezza e convoluzioni consapevoli della direzione per bilanciare precisione geometrica ed efficienza computazionale, raggiungendo un mIoU del 39,3% e 27,7 FPS su Occ3D-nuScenes.

Yuchen Zhou, Yan Luo, Xiaogang Wang + 3 more2026-03-02💻 cs

Draw-In-Mind: Rebalancing Designer-Painter Roles in Unified Multimodal Models Benefits Image Editing

Il paper introduce Draw-In-Mind (DIM), un dataset e un modello multimodale unificato che migliorano l'editing delle immagini bilanciando i ruoli tra comprensione e generazione, assegnando al modulo di comprensione la responsabilità progettuale tramite istruzioni esplicitate, ottenendo così prestazioni all'avanguardia nonostante una scala parametrica ridotta.

Ziyun Zeng, David Junhao Zhang, Wei Li + 1 more2026-03-02🤖 cs.AI