Glass Segmentation with Fusion of Learned and General Visual Features

Ce papier présente une architecture novatrice pour la segmentation de surfaces en verre, combinant des caractéristiques visuelles générales extraites d'un modèle DINOv3 gelé et des caractéristiques spécifiques apprises via un modèle Swin, afin d'atteindre des performances de pointe sur plusieurs jeux de données tout en conservant une vitesse d'inférence compétitive.

Risto Ojala, Tristan Ellison, Mo Chen2026-03-05💻 cs

Adaptive Enhancement and Dual-Pooling Sequential Attention for Lightweight Underwater Object Detection with YOLOv10

Cet article propose un cadre de détection d'objets sous-marins léger et robuste basé sur YOLOv10, intégrant un module d'amélioration adaptatif, un mécanisme d'attention à double mise en pool séquentielle et une fonction de perte FGIoU, qui améliore significativement la précision sur les jeux de données RUOD et DUO tout en conservant une architecture compacte adaptée aux systèmes embarqués.

Md. Mushibur Rahman, Umme Fawzia Rahim, Enam Ahmed Taufik2026-03-05💻 cs