PromptGate Client Adaptive Vision Language Gating for Open Set Federated Active Learning

Le papier présente PromptGate, un cadre d'apprentissage fédéré actif adaptatif qui utilise des vecteurs de prompt optimisés pour purifier les pools de données non étiquetées des artefacts et des modalités erronées dans des environnements ouverts, garantissant ainsi une haute pureté des données médicales tout en préservant la confidentialité des patients.

Adea Nesturi, David Dueñas Gaviria, Jiajun Zeng, Shadi Albarqouni2026-03-10💻 cs

Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology

Cette étude évalue l'efficacité des visualisations de classes et des atlas d'activation pour interpréter les modèles de fondation basés sur les transformers en pathologie computationnelle, révélant que ces méthodes capturent la complexité morphologique inhérente aux tissus et aux sous-types de cancer tout en fournissant un cadre pour l'interrogation experte des représentations apprises.

Marco Gustav, Fabian Wolf, Christina Glasner, Nic G. Reitsam, Stefan Schulz, Kira Aschenbroich, Bruno Märkl, Sebastian Foersch, Jakob Nikolas Kather2026-03-10💻 cs

LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

Ce papier propose LEPA, une architecture prédictive qui apprend l'équivariance géométrique pour ajuster avec précision les embeddings de modèles de fondation géospatiaux selon des zones d'intérêt définies par l'utilisateur, surmontant ainsi les limitations de l'interpolation standard qui échoue dans les variétés non convexes.

Erik Scheurer, Rocco Sedona, Stefan Kesselheim, Gabriele Cavallaro2026-03-10💻 cs

Variational Flow Maps: Make Some Noise for One-Step Conditional Generation

Ce papier présente les Variational Flow Maps, un cadre qui permet la génération conditionnelle en une seule étape en apprenant un adaptateur de bruit pour respecter les observations et les a priori des données, surpassant ainsi les modèles itératifs en vitesse tout en maintenant une haute fidélité.

Abbas Mammadov, So Takao, Bohan Chen, Ricardo Baptista, Morteza Mardani, Yee Whye Teh, Julius Berner2026-03-10🤖 cs.LG

MAviS: A Multimodal Conversational Assistant For Avian Species

Ce papier présente MAviS, un assistant conversationnel multimodal spécialisé dans les espèces aviaires, qui s'appuie sur un nouveau jeu de données, un modèle de langage et une évaluation de référence pour améliorer la compréhension fine et le suivi écologique des oiseaux.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

Le papier propose StructSAM, un cadre de fusion et de récupération de tokens préservant la structure et le spectre, spécifiquement conçu pour accélérer les modèles Segment Anything (SAM) tout en protégeant les contours et les informations de prompt, surpassant ainsi les méthodes existantes sur divers benchmarks naturels et médicaux.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

A Lightweight Digital-Twin-Based Framework for Edge-Assisted Vehicle Tracking and Collision Prediction

Cet article présente un cadre léger basé sur un jumeau numérique pour le suivi des véhicules et la prédiction de collisions dans les systèmes de transport intelligents, qui utilise uniquement la détection d'objets et des cartes de trajectoires pré-calculées pour atteindre une précision de 88 % tout en restant adapté au déploiement sur des dispositifs périphériques à ressources limitées.

Murat Arda Onsu, Poonam Lohan, Burak Kantarci, Aisha Syed, Matthew Andrews, Sean Kennedy2026-03-10💻 cs