Exploiting Intermediate Reconstructions in Optical Coherence Tomography for Test-Time Adaption of Medical Image Segmentation

Cet article présente IRTTA, une méthode d'adaptation au test qui améliore la segmentation d'images médicales en exploitant les reconstructions intermédiaires de la tomographie par cohérence optique pour ajuster dynamiquement les paramètres d'un réseau de segmentation figé sans modifier le processus de reconstruction ni le modèle initial.

Thomas Pinetz, Veit Hucke, Hrvoje Bogunovic2026-03-06💻 cs

CoIn3D: Revisiting Configuration-Invariant Multi-Camera 3D Object Detection

Le papier présente CoIn3D, un cadre généralisable pour la détection d'objets 3D multi-caméras qui améliore le transfert vers des configurations inédites en intégrant explicitement les disparités des priors spatiaux (intrinsèques, extrinsèques et agencement) via une modulation de caractéristiques spatiales et une augmentation de données par synthèse d'images.

Zhaonian Kuang, Rui Ding, Haotian Wang + 3 more2026-03-06💻 cs

A 360-degree Multi-camera System for Blue Emergency Light Detection Using Color Attention RT-DETR and the ABLDataset

Cette étude présente un système de détection des gyrophares bleus utilisant quatre caméras grand angle et un modèle RT-DETR amélioré par une attention chromatique, qui atteint une précision de 94,7 % sur le jeu de données ABLDataset pour renforcer la sécurité routière via les systèmes ADAS.

Francisco Vacalebri-Lloret, Lucas Banchero, Jose J. Lopez + 1 more2026-03-06🤖 cs.AI

MI-DETR: A Strong Baseline for Moving Infrared Small Target Detection with Bio-Inspired Motion Integration

L'article propose MI-DETR, une méthode bio-inspirée pour la détection de petites cibles infrarouges en mouvement qui intègre explicitement l'information motrice via un automate cellulaire et des voies parvocellulaire et magnocellulaire, atteignant des performances de pointe sur plusieurs benchmarks sans nécessiter de supervision ou d'alignement supplémentaires.

Nian Liu, Jin Gao, Shubo Lin + 8 more2026-03-06💻 cs

GEM-TFL: Bridging Weak and Full Supervision for Forgery Localization through EM-Guided Decomposition and Temporal Refinement

Le papier propose GEM-TFL, un cadre de localisation de falsification temporelle qui comble l'écart entre l'apprentissage faiblement et pleinement supervisé en combinant une optimisation EM pour enrichir les étiquettes binaires, un raffinement temporel sans entraînement et un module de raffinement basé sur des graphes pour améliorer la précision et la cohérence des détections.

Xiaodong Zhu, Yuanming Zheng, Suting Wang + 4 more2026-03-06🤖 cs.AI

Diff-ES: Stage-wise Structural Diffusion Pruning via Evolutionary Search

Diff-ES est un cadre de pruning structurel par étapes pour les modèles de diffusion qui utilise une recherche évolutionnaire pour optimiser automatiquement les schedules d'élagage et les exécute via un routage de poids efficace en mémoire, permettant d'accélérer la génération d'images sans duplication de paramètres ni perte significative de qualité.

Zongfang Liu, Shengkun Tang, Zongliang Wu + 2 more2026-03-06💻 cs

UniPAR: A Unified Framework for Pedestrian Attribute Recognition

Le papier présente UniPAR, un cadre unifié basé sur les Transformers qui surmonte les limites des approches actuelles en permettant à un seul modèle de traiter simultanément des données hétérogènes (images RGB, vidéos et flux d'événements) pour la reconnaissance d'attributs piétons, tout en améliorant la généralisation inter-domaines grâce à une stratégie de fusion progressive et un entraînement conjoint sur plusieurs jeux de données.

Minghe Xu, Rouying Wu, Jiarui Xu + 5 more2026-03-06🤖 cs.AI

Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models

Ce papier propose un cadre d'inférence adaptatif pour les modèles Vision-Language-Action qui, en analysant la complexité de l'état perçu via des embeddings visuels, permet de décider dynamiquement d'agir immédiatement, de raisonner sur des scénarios ambigus ou de s'abstenir d'agir pour éviter les échecs catastrophiques, optimisant ainsi l'allocation des ressources computationnelles.

Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-06💻 cs