UHD Image Deblurring via Autoregressive Flow with Ill-conditioned Constraints

Cet article propose une nouvelle méthode de défloutage d'images ultra-haute définition (UHD) basée sur un flot autorégressif avec contrainte mal conditionnée, qui décompose la restauration en un processus progressif de raffinement grossier à fin et utilise l'appariement de flux pour générer des détails fins tout en garantissant une stabilité numérique et une efficacité d'inférence.

Yucheng Xin, Dawei Zhao, Xiang Chen, Chen Wu, Pu Wang, Dianjie Lu, Guijuan Zhang, Xiuyi Jia, Zhuoran Zheng2026-03-12💻 cs

Visually-Guided Controllable Medical Image Generation via Fine-Grained Semantic Disentanglement

Cet article propose un cadre de désentanglement sémantique guidé par la vision qui, en alignant les priors visuels et en utilisant un module de fusion hybride au sein d'un transformateur de diffusion, permet une génération d'images médicales hautement contrôlable et de haute qualité pour surmonter les limites des modèles texte-à-image actuels.

Xin Huang, Junjie Liang, Qingshan Hou, Peng Cao, Jinzhu Yang, Xiaoli Liu, Osmar R. Zaiane2026-03-12💻 cs

Sparse Task Vector Mixup with Hypernetworks for Efficient Knowledge Transfer in Whole-Slide Image Prognosis

Le papier propose STEPH, une méthode efficace de fusion de modèles via des hyperréseaux et un mélange parcimonieux de vecteurs de tâches, qui améliore la prédiction du pronostic des cancers sur des images de lames entières en transférant des connaissances généralisables entre 13 types de cancers sans nécessiter d'entraînement conjoint à grande échelle.

Pei Liu, Xiangxiang Zeng, Tengfei Ma, Yucheng Xing, Xuanbai Ren, Yiping Liu2026-03-12💻 cs

BinWalker: Development and Field Evaluation of a Quadruped Manipulator Platform for Sustainable Litter Collection

Cet article présente le BinWalker, une plateforme robotique quadrupède équipée d'un bras manipulateur et d'un conteneur, conçue pour détecter, saisir et collecter automatiquement les déchets dans des environnements extérieurs difficiles d'accès, offrant ainsi une solution prometteuse pour automatiser le nettoyage des espaces publics.

Giulio Turrisi, Angelo Bratta, Giovanni Minelli, Gabriel Fischer Abati, Amir H. Rad, João Carlos Virgolino Soares, Claudio Semini2026-03-12💻 cs

An Event-Driven E-Skin System with Dynamic Binary Scanning and real time SNN Classification

Cet article présente un système d'électronique cutanée (e-skin) entièrement intégré et piloté par les événements, combinant une stratégie de balayage binaire dynamique pour une acquisition de données ultra-économe et un réseau de neurones à impulsions (SNN) implémenté sur FPGA, permettant une reconnaissance de chiffres manuscrits en temps réel avec une grande efficacité énergétique et une précision de 92,11 %.

Gaishan Li, Zhengnan Fu, Anubhab Tripathi, Junyi Yang, Arindam Basu2026-03-12💻 cs

In-Memory ADC-Based Nonlinear Activation Quantization for Efficient In-Memory Computing

Ce papier présente la quantification K-moyennes à suppression de frontières (BS-KMQ), une méthode innovante qui atténue les biais d'activation dans le calcul en mémoire pour réduire les exigences de résolution des convertisseurs analogique-numérique, tout en améliorant significativement la précision, la surface et l'efficacité énergétique des réseaux de neurones profonds.

Shuai Dong, Junyi Yang, Biyan Zhou, Hongyang Shang, Gourav Datta, Arindam Basu2026-03-12💻 cs

PET-F2I: A Comprehensive Benchmark and Parameter-Efficient Fine-Tuning of LLMs for PET/CT Report Impression Generation

Ce papier présente PET-F2I, un benchmark à grande échelle et un modèle de 7B paramètres finement ajusté qui améliorent significativement la génération automatisée de résumés diagnostiques pour les examens TEP/CT en introduisant des métriques cliniques rigoureuses.

Yuchen Liu, Wenbo Zhang, Liling Peng, Yichi Zhang, Yu Fu, Xin Guo, Chao Qu, Yuan Qi, Le Xue2026-03-12💻 cs

TacLoc: Global Tactile Localization on Objects from a Registration Perspective

Le papier présente TacLoc, un cadre novateur de localisation tactile qui traite l'estimation de pose comme une tâche d'enregistrement de nuages de points en une seule étape, utilisant une méthode graphique partielle-à-complet guidée par les normales pour obtenir une localisation précise et généralisable sans recourir à des données rendues ou à des modèles pré-entraînés.

Zirui Zhang, Boyang Zhang, Fumin Zhang, Huan Yin2026-03-12💻 cs

Safety-critical Control Under Partial Observability: Reach-Avoid POMDP meets Belief Space Control

Cet article propose une architecture de contrôle en couches pour les POMDPs de type « atteindre-éviter », qui découple la poursuite d'objectif, la collecte d'informations et la sécurité via des fonctions de Lyapunov et de barrière dans l'espace des croyances, permettant ainsi une synthèse de contrôle en temps réel avec des garanties de sécurité probabilistes.

Matti Vahs, Joris Verhagen, Jana Tumova2026-03-12💻 cs

Attribution as Retrieval: Model-Agnostic AI-Generated Image Attribution

Ce papier présente LIDA, un cadre d'attribution d'images générées par IA sans modèle spécifique qui reformule le problème comme une tâche de recherche d'instances en utilisant des empreintes numériques basées sur les bits de faible poids et une adaptation à quelques exemples, surpassant ainsi les méthodes existantes dans des scénarios sans échantillons ou à peu d'échantillons.

Hongsong Wang, Renxi Cheng, Chaolei Han, Jie Gui2026-03-12💻 cs

Need for Speed: Zero-Shot Depth Completion with Single-Step Diffusion

Le papier présente Marigold-SSD, un cadre de complétion de profondeur en zéro coup qui utilise des priors de diffusion en une seule étape pour éliminer l'optimisation coûteuse au moment de l'inférence, offrant ainsi une perception 3D robuste et efficace avec une généralisation cross-domaine exceptionnelle.

Jakub Gregorek, Paraskevas Pegios, Nando Metzger, Konrad Schindler, Theodora Kontogianni, Lazaros Nalpantidis2026-03-12💻 cs

Distilling LLM Semantic Priors into Encoder-Only Multi-Talker ASR with Talker-Count Routing

Cet article propose un cadre MT-ASR basé uniquement sur un encodeur qui distille les priors sémantiques d'un LLM pour améliorer la reconnaissance de la parole multi-parleurs avec un nombre variable d'interlocuteurs, en atteignant des performances compétitives avec une latence réduite par rapport aux systèmes utilisant des décodeurs LLM.

Hao Shi, Yusuke Fujita, Roman Koshkin, Mengjie Zhao, Yuan Gao, Lianbo Liu, Yui Sudo2026-03-12💻 cs

Exact Interpolation under Noise: A Reproducible Comparison of Clough-Tocher and Multiquadric RBF Surfaces

Cette étude présente une comparaison reproductible des méthodes d'interpolation Clough-Tocher et RBF multiquadrique, démontrant que bien que l'interpolation exacte sur des données bruyantes entraîne un surajustement, la méthode cubique offre une stabilité supérieure et permet de récupérer des comportements de processus thermodynamiques physiquement significatifs à partir de mesures imparfaites.

Mirkan Emir Sancak2026-03-12💻 cs