DISC: Dense Integrated Semantic Context for Large-Scale Open-Set Semantic Mapping

Le papier présente DISC, une méthode de cartographie sémantique open-set à grande échelle qui surpasse les approches actuelles en éliminant l'extraction de caractéristiques par recadrage grâce à un mécanisme d'extraction dense et pondéré par la distance, permettant une cartographie sémantique précise et en temps réel directement sur GPU.

Felix Igelbrink, Lennart Niecksch, Martin Atzmueller + 1 more2026-03-05💻 cs

Cross-Modal Mapping and Dual-Branch Reconstruction for 2D-3D Multimodal Industrial Anomaly Detection

Ce papier présente CMDR-IAD, un cadre d'apprentissage non supervisé léger et flexible qui améliore la détection d'anomalies industrielles en combinant une cartographie bidirectionnelle 2D-3D et une reconstruction à double branche pour intégrer de manière robuste les données d'apparence et de géométrie, atteignant ainsi des performances de pointe sur les benchmarks MVTec 3D-AD et des ensembles de données industriels réels.

Radia Daci, Vito Renò, Cosimo Patruno + 4 more2026-03-05🤖 cs.AI

Slice-wise quality assessment of high b-value breast DWI via deep learning-based artifact detection

Cette étude démontre qu'un réseau de neurones convolutionnel de type DenseNet121 permet de détecter avec une grande précision les artefacts d'intensité hyper- et hypointense sur des images de résonance magnétique mammaire pondérées en diffusion à haut b-value, offrant ainsi une solution prometteuse pour l'évaluation de la qualité des images par tranches.

Ameya Markale, Luise Brock, Ihor Horishnyi + 10 more2026-03-05💻 cs

Structural Action Transformer for 3D Dexterous Manipulation

Ce papier présente le Structural Action Transformer (SAT), une nouvelle politique de manipulation dextre 3D qui surpasse les méthodes existantes en reformulant les actions comme des séquences structurelles de trajectoires articulaires plutôt que temporelles, permettant ainsi un transfert de compétences efficace entre différents robots grâce à un codebook articulaire et un apprentissage par flux continu sur des nuages de points 3D.

Xiaohan Lei, Min Wang, Bohong Weng + 2 more2026-03-05💻 cs

UniRain: Unified Image Deraining with RAG-based Dataset Distillation and Multi-objective Reweighted Optimization

Ce papier présente UniRain, un cadre unifié de dérainage d'images qui améliore la généralisation grâce à une distillation de données basée sur la génération augmentée par récupération (RAG) et une stratégie d'optimisation repondérée multi-objectifs intégrée à une architecture de mélange d'experts asymétrique, permettant ainsi de restaurer efficacement des images dégradées par la pluie et les gouttes dans diverses conditions diurnes et nocturnes.

Qianfeng Yang, Qiyuan Guan, Xiang Chen + 3 more2026-03-05💻 cs

When Visual Evidence is Ambiguous: Pareidolia as a Diagnostic Probe for Vision Models

Cette étude propose un cadre diagnostique basé sur la paréidolie faciale pour révéler comment les choix de représentation, plutôt que les seuils de score, déterminent si les modèles de vision interprètent les ambiguïtés visuelles par une suractivation sémantique (comme les VLM), une abstention par incertitude (comme ViT) ou une suppression conservatrice (comme les détecteurs).

Qianpu Chen, Derya Soydaner, Rob Saunders2026-03-05🤖 cs.AI

Rethinking the Efficiency and Effectiveness of Reinforcement Learning for Radiology Report Generation

Cet article propose un cadre d'apprentissage par renforcement pour la génération de rapports radiologiques qui améliore l'efficacité et l'efficacité clinique en introduisant une stratégie d'échantillonnage basée sur la diversité diagnostique et une optimisation de politique pondérée par les tokens diagnostiques (DiTPO), permettant d'atteindre des performances de pointe avec moins de données d'entraînement.

Zilin Lu, Ruifeng Yuan, Weiwei Cao + 6 more2026-03-05💻 cs

Volumetric Directional Diffusion: Anchoring Uncertainty Quantification in Anatomical Consensus for Ambiguous Medical Image Segmentation

Le papier propose le modèle de Diffusion Directionnelle Volumétrique (VDD), qui ancre la génération d'incertitudes dans un consensus anatomique déterministe pour quantifier précisément la variabilité inter-observateur dans la segmentation de lésions médicales 3D ambiguës, tout en évitant les hallucinations structurelles et en garantissant la cohérence topologique.

Chao Wu, Kangxian Xie, Mingchen Gao2026-03-05🤖 cs.AI