A Multi-Objective Evaluation Framework for Analyzing Utility-Fairness Trade-Offs in Machine Learning Systems

Cet article présente un cadre d'évaluation multi-objectif, agnostique et disponible publiquement, conçu pour analyser et visualiser les compromis entre utilité et équité dans les systèmes d'apprentissage automatique, en mettant particulièrement l'accent sur leur application critique dans le domaine de l'imagerie médicale.

Gökhan Özbulak, Oscar Jimenez-del-Toro, Maíra Fatoretto + 2 more2026-03-03🤖 cs.LG

VR-FuseNet: A Fusion of Heterogeneous Fundus Data and Explainable Deep Network for Diabetic Retinopathy Classification

Ce papier présente VR-FuseNet, un modèle d'apprentissage profond hybride fusionnant VGG19 et ResNet50V2 sur un ensemble de données hétérogènes prétraité, qui atteint une précision de 91,824 % pour la classification de la rétinopathie diabétique tout en intégrant des techniques d'IA explicable pour interpréter cliniquement les prédictions.

Shamim Rahim Refat, Ziyan Shirin Raha, Shuvashis Sarker + 4 more2026-03-03💻 cs

Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology

Cet article plaide pour l'évaluation des modèles de vision par ordinateur en écologie et en biologie à l'aide de métriques spécifiques à l'application plutôt que de simples indicateurs d'apprentissage automatique, en démontrant par deux études de cas que des performances algorithmiques élevées ne garantissent pas nécessairement la précision des inférences biologiques finales.

Alex Hoi Hang Chan, Otto Brookes, Urs Waldmann + 11 more2026-03-03💻 cs

Adversarially Pretrained Transformers May Be Universally Robust In-Context Learners

Cette étude présente une analyse théorique démontrant que les transformateurs pré-entraînés de manière adversariale peuvent agir comme des modèles fondateurs universellement robustes, capables de s'adapter de manière résiliente à diverses tâches en aval via l'apprentissage contextuel sans nécessiter de réentraînement adversarial supplémentaire.

Soichiro Kumano, Hiroshi Kera, Toshihiko Yamasaki2026-03-03📊 stat

Flexible-weighted Chamfer Distance: Enhanced Objective Function for Point Cloud Completion

Cet article présente la Distance de Chamfer à poids flexible (FCD), une nouvelle fonction objectif qui améliore la complétion de nuages de points en découplant la précision locale et l'intégrité globale grâce à une stratégie de pondération asymétrique, réduisant ainsi les défauts structurels et les regroupements de points sur divers benchmarks et tâches.

Jie Li, Shengwei Tian, Long Yu + 1 more2026-03-03💻 cs

DeepEyes: Incentivizing "Thinking with Images" via Reinforcement Learning

DeepEyes est un modèle vision-langage entraîné par apprentissage par renforcement qui apprend nativement à « réfléchir avec des images » en intégrant activement l'information visuelle dans son raisonnement, améliorant ainsi ses performances en perception, en raisonnement mathématique et en réduction des hallucinations sans nécessiter de données de raisonnement préalables.

Ziwei Zheng, Michael Yang, Jack Hong + 5 more2026-03-03💻 cs

Seek-CAD: A Self-refined Generative Modeling for 3D Parametric CAD Using Local Inference via DeepSeek

L'article présente Seek-CAD, une méthode sans entraînement pionnière qui utilise le modèle de langage ouvert DeepSeek-R1 couplé à un mécanisme d'auto-affinement basé sur la rétroaction visuelle et le raisonnement en chaîne de pensée pour générer des modèles CAO paramétriques 3D, validé par un nouveau jeu de données structuré selon le paradigme SSR.

Xueyang Li, Jiahao Li, Yu Song + 2 more2026-03-03🤖 cs.AI

Point-MoE: Large-Scale Multi-Dataset Training with Mixture-of-Experts for 3D Semantic Segmentation

Le papier présente Point-MoE, une architecture de type Mixture-of-Experts qui permet l'entraînement conjoint à grande échelle de modèles de segmentation sémantique 3D sur des ensembles de données hétérogènes sans étiquettes de jeu de données, en utilisant des experts spécialisés activés de manière parcimonieuse pour surmonter les biais inhérents aux différentes sources de nuages de points.

Xuweiyi Chen, Wentao Zhou, Aruni RoyChowdhury + 1 more2026-03-03💻 cs

SenseFlow: Scaling Distribution Matching for Flow-based Text-to-Image Distillation

Le papier présente SenseFlow, une méthode de distillation qui surmonte les difficultés de convergence de la distillation par correspondance de distribution sur les grands modèles de génération d'images basés sur le flux (comme SD 3.5 et FLUX) grâce à une alignement de distribution implicite et un guidage intra-segment, permettant d'obtenir des performances supérieures.

Xingtong Ge, Xin Zhang, Tongda Xu + 4 more2026-03-03💻 cs