GEM-TFL: Bridging Weak and Full Supervision for Forgery Localization through EM-Guided Decomposition and Temporal Refinement

Le papier propose GEM-TFL, un cadre de localisation de falsification temporelle qui comble l'écart entre l'apprentissage faiblement et pleinement supervisé en combinant une optimisation EM pour enrichir les étiquettes binaires, un raffinement temporel sans entraînement et un module de raffinement basé sur des graphes pour améliorer la précision et la cohérence des détections.

Xiaodong Zhu, Yuanming Zheng, Suting Wang + 4 more2026-03-06🤖 cs.AI

Diff-ES: Stage-wise Structural Diffusion Pruning via Evolutionary Search

Diff-ES est un cadre de pruning structurel par étapes pour les modèles de diffusion qui utilise une recherche évolutionnaire pour optimiser automatiquement les schedules d'élagage et les exécute via un routage de poids efficace en mémoire, permettant d'accélérer la génération d'images sans duplication de paramètres ni perte significative de qualité.

Zongfang Liu, Shengkun Tang, Zongliang Wu + 2 more2026-03-06💻 cs

UniPAR: A Unified Framework for Pedestrian Attribute Recognition

Le papier présente UniPAR, un cadre unifié basé sur les Transformers qui surmonte les limites des approches actuelles en permettant à un seul modèle de traiter simultanément des données hétérogènes (images RGB, vidéos et flux d'événements) pour la reconnaissance d'attributs piétons, tout en améliorant la généralisation inter-domaines grâce à une stratégie de fusion progressive et un entraînement conjoint sur plusieurs jeux de données.

Minghe Xu, Rouying Wu, Jiarui Xu + 5 more2026-03-06🤖 cs.AI

Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models

Ce papier propose un cadre d'inférence adaptatif pour les modèles Vision-Language-Action qui, en analysant la complexité de l'état perçu via des embeddings visuels, permet de décider dynamiquement d'agir immédiatement, de raisonner sur des scénarios ambigus ou de s'abstenir d'agir pour éviter les échecs catastrophiques, optimisant ainsi l'allocation des ressources computationnelles.

Riccardo Andrea Izzo, Gianluca Bardaro, Matteo Matteucci2026-03-06💻 cs

Semantic Class Distribution Learning for Debiasing Semi-Supervised Medical Image Segmentation

Cet article propose le cadre SCDL, une méthode plug-and-play qui atténue les biais de supervision et de représentation dans la segmentation d'images médicales semi-supervisée en apprenant des distributions de caractéristiques conditionnelles aux classes, améliorant ainsi significativement la détection des structures minoritaires sur les jeux de données Synapse et AMOS.

Yingxue Su, Yiheng Zhong, Keying Zhu + 5 more2026-03-06💻 cs

ICHOR: A Robust Representation Learning Approach for ASL CBF Maps with Self-Supervised Masked Autoencoders

Ce papier présente ICHOR, une approche d'apprentissage auto-supervisé basée sur des auto-encodeurs masqués 3D et entraînée sur un vaste ensemble de données multi-sites, qui permet d'obtenir des représentations robustes pour les cartes de débit sanguin cérébral en IRM de perfusion par marquage de spin artériel (ASL) et surpasse les méthodes existantes dans diverses tâches diagnostiques et de prédiction de qualité.

Xavier Beltran-Urbano, Yiran Li, Xinglin Zeng + 10 more2026-03-06🔬 physics