eess.IV articles | Gist.Science

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

Le papier présente ECLARE, une méthode d'apprentissage croisé planaire efficace qui améliore la résolution anisotrope des volumes IRM cliniques en estimant le profil de coupe et en apprenant directement à partir des données d'acquisition pour surmonter les limitations des méthodes précédentes, notamment le décalage de domaine et les facteurs de suréchantillonnage arbitraires.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs

Evaluating quality metrics through the lenses of psychophysical measurements of low-level vision

Cet article propose un ensemble de tests fondés sur des mesures psychophysiques de la vision de bas niveau pour évaluer la capacité de 34 métriques de qualité d'image et de vidéo à modéliser des mécanismes perceptuels clés tels que la sensibilité au contraste, le masquage et l'adaptation, révélant ainsi des limites et des comportements spécifiques non détectables par les protocoles d'évaluation standards.

Dounia Hammou, Yancheng Cai, Pavan Madhusudanarao, Christos G. Bampis, Rafał K. MantiukMon, 09 Ma💻 cs

Multivariate Fields of Experts for Convergent Image Reconstruction

Ce papier présente les « multivariate fields of experts », un nouveau cadre d'apprentissage de priors d'images qui, grâce à des fonctions potentielles multivariées basées sur les enveloppes de Moreau, surpasse les modèles univariés et rivalise avec les méthodes d'apprentissage profond pour résoudre divers problèmes inverses tout en offrant une meilleure rapidité, une plus grande efficacité des paramètres et des garanties théoriques de convergence.

Stanislas Ducotterd, Michael UnserMon, 09 Ma🤖 cs.LG

SAAIPAA: Optimizing aspect-angles-invariant physical adversarial attacks on SAR target recognition models

Ce papier propose SAAIPAA, un cadre d'attaque physique adversaire invariant aux angles d'aspect pour les modèles de reconnaissance automatique de cibles SAR, qui optimise la disposition de réflecteurs pour tromper efficacement ces systèmes même sans connaissance préalable des angles de vue de la plateforme.

Isar Lemeire, Yee Wei Law, Sang-Heon Lee, William Meakin, Tat-Jun ChinMon, 09 Ma⚡ eess

Learning Latent Transmission and Glare Maps for Lens Veiling Glare Removal

Ce papier présente VeilGen, un modèle génératif non supervisé qui apprend à simuler le voile lumineux en estimant des cartes de transmission et de glare latentes pour entraîner DeVeiler, un réseau de restauration capable de supprimer efficacement ce phénomène dans les systèmes optiques simplifiés.

Xiaolong Qian, Qi Jiang, Lei Sun, Zongxi Yu, Kailun Yang, Peixuan Wu, Jiacheng Zhou, Yao Gao, Yaoguang Ma, Ming-Hsuan Yang, Kaiwei WangMon, 09 Ma🔬 physics.optics

In-batch Relational Features Enhance Precision in An Unsupervised Medical Anomaly Detection Task

Cette étude propose une méthode d'apprentissage non supervisé pour la détection d'anomalies médicales qui, en enrichissant les représentations latentes d'un autoencodeur par des similarités contextuelles au sein d'un lot via une estimation d'hypergraphe et une convolution graphique, améliore significativement la précision et réduit les faux positifs en distinguant mieux les variations anatomiques normales des pathologies.

P. Bilha Githinji, Xi Yuan, Ijaz Gul, Lian Zhang, Jinhao Xu, Zhenglin Chen, Peiwu Qin, Dongmei YuMon, 09 Ma🧬 q-bio

Clinical-Injection Transformer with Domain-Adapted MAE for Lupus Nephritis Prognosis Prediction

Cet article propose un cadre multimodal innovant combinant un Transformer à injection clinique et un auto-encodeur masqué adapté au domaine pour prédire avec une grande précision le pronostic de la néphropathie lupique pédiatrique à partir de biopsies standardisées et de données cliniques.

Yuewen Huang, Zhitao Ye, Guangnan Feng, Fudan Zheng, Xia Gao, Yutong LuMon, 09 Ma🤖 cs.LG

Edges Are All You Need: Robust Gait Recognition via Label-Free Structure

Cet article propose SKETCHGAIT, un cadre de reconnaissance de la démarche robuste et sans étiquettes qui exploite les contours d'images RGB pour extraire des structures partielles denses et complémentaires aux silhouettes traditionnelles, atteignant ainsi des performances de pointe sur plusieurs jeux de données.

Chao Zhang, Zhuang Zheng, Ruixin Li, Zhanyong MeiMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Cet article présente le PPCMI-SF, un cadre collaboratif de segmentation d'images médicales qui préserve la confidentialité des données en utilisant des transformées latentes chiffrées et des autoencodeurs, permettant ainsi d'atteindre une précision élevée et une robustesse contre les attaques sans partager les données brutes entre institutions.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

Gabor Primitives for Accelerated Cardiac Cine MRI Reconstruction

Cet article propose une méthode de reconstruction accélérée pour l'IRM cardiaque ciné utilisant des primitives de Gabor, qui combinent l'interprétabilité géométrique des gaussiennes avec une capacité à représenter les hautes fréquences, surpassant ainsi les approches existantes tout en exploitant la redondance spatio-temporelle via une décomposition en bases de rang faible.

Wenqi Huang, Veronika Spieker, Nil Stolt-Ansó, Natascha Niessen, Maik Dannecker, Sevgi Gokce Kafali, Sila Kurugol, Julia A. Schnabel, Daniel RueckertMon, 09 Ma💻 cs

Longitudinal Lesion Inpainting in Brain MRI via 3D Region Aware Diffusion

Cet article présente un cadre novateur d'inpainting longitudinal des lésions en IRM cérébrale basé sur des modèles de diffusion 3D sensibles aux régions, qui améliore significativement la fidélité temporelle et la cohérence anatomique tout en offrant une accélération de traitement dix fois supérieure aux méthodes existantes.

Zahra Karimaghaloo, Dumitru Fetco, Haz-Edine Assemlal, Hassan Rivaz, Douglas L. ArnoldMon, 09 Ma🤖 cs.AI

Interpretable Motion Artificat Detection in structural Brain MRI

Cet article propose un cadre léger et interprétable pour la détection des artefacts de mouvement dans les IRM cérébrales structurales, en combinant des caractéristiques 2D et 3D basées sur l'histogramme discriminatif des magnitudes de gradient pour obtenir une évaluation de la qualité robuste et généralisable avec un nombre minimal de paramètres.

Naveetha Nithianandam, Prabhjot Kaur, Anil Kumar SaoMon, 09 Ma💻 cs

Uni-LVC: A Unified Method for Intra- and Inter-Mode Learned Video Compression

Le papier présente Uni-LVC, une méthode unifiée de compression vidéo apprise qui intègre le codage intra et inter dans un seul modèle grâce à une adaptation par attention croisée et une classification fiable, surpassant ainsi les performances des codecs existants tout en maintenant une efficacité computationnelle comparable.

Yichi Zhang, Ruoyu Yang, Fengqing ZhuMon, 09 Ma💻 cs

Architectural Unification for Polarimetric Imaging Across Multiple Degradations

Cet article propose un cadre architectural unifié pour l'imagerie polarimétrique qui, grâce à un traitement conjoint unique des images et des paramètres de Stokes, surpasse les méthodes existantes en éliminant l'accumulation d'erreurs et en garantissant la cohérence physique pour diverses dégradations telles que le bruit faible lumière, le flou de mouvement et les artefacts de mosaïquage.

Chu Zhou, Yufei Han, Junda Liao, Linrui Dai, Wangze Xu, Art Subpa-Asa, Heng Guo, Boxin Shi, Imari SatoMon, 09 Ma💻 cs

Technical Report: Automated Optical Inspection of Surgical Instruments

Ce rapport présente une méthode d'inspection optique automatisée utilisant des architectures d'apprentissage profond (YOLOv8, ResNet-152, EfficientNet-b4) sur un jeu de données de 4 414 images pour détecter les défauts critiques des instruments chirurgicaux fabriqués au Pakistan, afin d'améliorer la sécurité des patients et la qualité de production.

Zunaira Shafqat, Atif Aftab Ahmed Jilani, Qurrat Ul AinMon, 09 Ma🤖 cs.AI

Enhancing Neural Video Compression of Static Scenes with Positive-Incentive Noise

Cet article propose une méthode de compression vidéo neuronale pour les scènes statiques qui intègre un bruit à incitation positive pour distinguer les variations transitoires du fond persistant, permettant ainsi de réduire considérablement le débit de données tout en préservant la fidélité pixelique.

Cheng Yuan, Zhenyu Jia, Jiawei Shao, Xuelong LiMon, 09 Ma💻 cs

NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving

Le papier présente NOVA, une approche innovante de suivi multi-objets 3D qui utilise l'autorégression de modèles de langage pour généraliser la détection à des cibles inconnues en reformulant les trajectoires comme des séquences sémantiques spatio-temporelles, permettant ainsi d'atteindre des performances supérieures sur des catégories nouvelles grâce à un raisonnement sémantique de haut niveau.

Kai Luo, Xu Wang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise

Ce papier présente OccNL, le premier benchmark pour la prédiction d'occupation sémantique 3D sous bruit de labels, et propose DPR-Occ, un cadre robuste qui surpasse les méthodes existantes en maintenant la précision géométrique et sémantique malgré des niveaux de corruption extrêmes.

Wenxin Li, Kunyu Peng, Di Wen, Junwei Zheng, Jiale Wei, Mengfei Duan, Yuheng Zhang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

AI End-to-End Radiation Treatment Planning Under One Second

Le papier présente AIRT, un cadre d'apprentissage profond de bout en bout capable de générer des plans de radiothérapie VMAT pour le cancer de la prostate en moins d'une seconde, avec une qualité non inférieure aux plans de référence tout en réduisant considérablement le temps de planification.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin ComaniciuMon, 09 Ma🤖 cs.AI

EquivAnIA: A Spectral Method for Rotation-Equivariant Anisotropic Image Analysis

Ce papier propose EquivAnIA, une nouvelle méthode spectrale utilisant des ondelettes en forme de gâteau et des filtres de crête pour réaliser une analyse d'images anisotrope robuste aux rotations numériques, validée sur des données synthétiques et réelles ainsi que pour l'enregistrement d'images angulaires.

Jérémy Scanvic, Nils LaurentFri, 13 Ma⚡ eess

← Précédent Suivant →