ROBUST-MIPS: A Combined Skeletal Pose and Instance Segmentation Dataset for Laparoscopic Surgical Instruments

Cet article présente ROBUST-MIPS, un jeu de données enrichi dérivé de ROBUST-MIS qui combine des annotations de pose squelettique et de segmentation d'instances d'instruments chirurgicaux pour démontrer que la pose constitue une méthode d'annotation efficace et riche en informations sémantiques, tout en fournissant des modèles de référence et un logiciel personnalisé pour faciliter son adoption.

Zhe Han, Charlie Budd, Gongyu Zhang + 3 more2026-03-05💻 cs

TIGeR: Tool-Integrated Geometric Reasoning in Vision-Language Models for Robotics

Ce papier présente TIGeR, un cadre novateur qui améliore la précision géométrique des modèles vision-langage pour la robotique en leur permettant de générer et d'exécuter du code via des outils externes, surpassant ainsi les limitations des approches purement qualitatives pour atteindre une précision centimétrique dans les tâches de manipulation réelle.

Yi Han, Enshen Zhou, Shanyu Rong + 6 more2026-03-05🤖 cs.AI

Composition-Grounded Data Synthesis for Visual Reasoning

Cet article présente COGS, un cadre de synthèse de données ancré sur la composition qui améliore les capacités de raisonnement des modèles de langage multimodaux préentraînés en décomposant et recomposant systématiquement des questions semences pour générer des données synthétiques, permettant ainsi des gains significatifs sur des tâches de raisonnement visuel complexes comme l'analyse de graphiques et de documents web.

Xinyi Gu, Jiayuan Mao, Zhang-Wei Hong + 5 more2026-03-05🤖 cs.LG

Weakly Supervised Concept Learning with Class-Level Priors for Interpretable Medical Diagnosis

Cet article propose le PCP, un cadre d'apprentissage faiblement supervisé qui utilise des priors de concepts au niveau des classes pour prédire des concepts médicaux interprétables sans annotations explicites ni modèles linguistiques, améliorant ainsi significativement la précision des concepts tout en maintenant des performances de classification compétitives sur plusieurs jeux de données médicaux.

Md Nahiduzzaman, Steven Korevaar, Alireza Bab-Hadiashar + 1 more2026-03-05💻 cs

Re-coding for Uncertainties: Edge-awareness Semantic Concordance for Resilient Event-RGB Segmentation

Cet article propose un cadre novateur de concordance sémantique sensible aux contours, baptisé ESC, qui fusionne de manière résiliente les modalités événementielle et RVB pour la segmentation sémantique dans des conditions extrêmes en récodant les caractéristiques hétérogènes à l'aide d'indicateurs d'incertitude et d'un dictionnaire de contours préétabli.

Nan Bao, Yifan Zhao, Lin Zhu + 1 more2026-03-05💻 cs