DC-Merge: Improving Model Merging with Directional Consistency

Le papier présente DC-Merge, une méthode de fusion de modèles qui améliore la rétention des connaissances en équilibrant la distribution d'énergie des vecteurs de tâches et en alignant leur géométrie directionnelle dans un sous-espace orthogonal commun, permettant ainsi d'atteindre des performances de pointe sur divers benchmarks.

Han-Chen Zhang, Zi-Hao Zhou, Mao-Lin Luo, Shimin Di, Min-Ling Zhang, Tong Wei2026-03-09🤖 cs.LG

Synthetic Monitoring Environments for Reinforcement Learning

Ce papier présente les Environnements de Surveillance Synthétiques (SME), une suite infinie de tâches de contrôle continu aux politiques optimales connues, conçue pour permettre une analyse scientifique rigoureuse et transparente des algorithmes d'apprentissage par renforcement en isolant l'impact de facteurs environnementaux spécifiques sur leurs performances.

Leonard Pleiss, Carolin Schmidt, Maximilian Schiffer2026-03-09🤖 cs.LG

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

Cette étude démontre que l'intégration de pipelines de raisonnement agentic avec récupération d'informations améliore la robustesse et le consensus entre différents modèles de langage dans le domaine de la radiologie, tout en soulignant la nécessité d'évaluations dépassant la simple précision pour garantir la fiabilité clinique.

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

3D CBCT Artefact Removal Using Perpendicular Score-Based Diffusion Models

Cet article propose une méthode d'inpainting 3D basée sur des modèles de diffusion à score perpendiculaires pour éliminer les artefacts causés par les implants dentaires dans les images CBCT en modélisant les corrélations entre les projections, contrairement aux approches 2D existantes.

Susanne Schaub, Florentin Bieder, Matheus L. Oliveira, Yulan Wang, Dorothea Dagassan-Berndt, Michael M. Bornstein, Philippe C. Cattin2026-03-09🤖 cs.LG

Polarized Direct Cross-Attention Message Passing in GNNs for Machinery Fault Diagnosis

Cet article présente PolaDCA, un cadre d'apprentissage relationnel innovant utilisant une attention croisée directe polarisée pour construire des graphes adaptatifs et améliorer la robustesse au bruit ainsi que la précision du diagnostic de défauts dans les machines tournantes, surpassant les méthodes GNN conventionnelles sur plusieurs jeux de données industriels.

Zongyu Shi, Laibin Zhang, Maoyin Chen2026-03-09🤖 cs.LG

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

Le papier présente SAHOO, un cadre pratique qui garantit l'alignement lors de l'amélioration récursive de soi en surveillant la dérive des objectifs grâce à trois mécanismes de sécurité, tout en démontrant des gains de performance significatifs dans des tâches de codage et de raisonnement sans compromettre la sécurité.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

Le papier présente AIRT, un cadre d'apprentissage profond de bout en bout capable de générer des plans de radiothérapie VMAT pour le cancer de la prostate en moins d'une seconde, avec une qualité non inférieure aux plans de référence tout en réduisant considérablement le temps de planification.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

Dynamic Chunking Diffusion Transformer

Le papier présente le DC-DiT, un modèle de diffusion Transformer qui améliore l'efficacité et la qualité de la génération d'images en adaptant dynamiquement le nombre de tokens utilisés selon la complexité visuelle des régions et l'étape du processus de débruitage, surpassant ainsi les architectures DiT classiques tout en permettant un réentraînement minimal.

Akash Haridas, Utkarsh Saxena, Parsa Ashrafi Fashi, Mehdi Rezagholizadeh, Vikram Appia, Emad Barsoum2026-03-09🤖 cs.AI

Tiny, Hardware-Independent, Compression-based Classification

Cet article propose une méthode de classification basée sur la distance de compression normalisée, qui, bien que n'étant pas une métrique formelle, permet d'entraîner des modèles précis et légers directement sur les appareils clients en utilisant uniquement les données de l'utilisateur, résolvant ainsi les problèmes de confidentialité et de contraintes matérielles.

Charles Meyers, Aaron MacSween, Erik Elmroth, Tommy Löfstedt2026-03-09🤖 cs.LG

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

Ce papier présente CLAIRE, un cadre d'apprentissage profond hybride pour la détection de défauts dans la fabrication intelligente, qui combine un autoencodeur pour l'apprentissage de représentations latentes compactes et une classification supervisée, le tout renforcé par une interprétabilité basée sur la théorie des jeux pour identifier les caractéristiques clés.

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI