eess.IV articles | Gist.Science

Image Compression Using Novel View Synthesis Priors

Ce papier propose une technique de compression d'images basée sur la synthèse de nouvelles vues et l'optimisation par descente de gradient pour permettre un retour visuel en temps réel des véhicules téléopérés sous-marins, surpassant les méthodes existantes en termes de ratio de compression et de qualité d'image.

Luyuan Peng, Mandar Chitre, Hari Vishnu, Yuen Min Too, Bharath Kalyan, Rajat Mishra, Soo Pieng TanWed, 11 Ma⚡ eess

Entropy-and-Channel-Aware Adaptive-Rate Semantic Communication with MLLM-Aided Feature Compensation

Cet article propose un cadre de communication sémantique adaptatif sur canaux MIMO Rayleigh qui ajuste dynamiquement le taux de transmission en fonction de l'entropie et de l'état du canal, tout en utilisant un modèle de langage multimodal (MLLM) pour compenser les informations perdues et optimiser ainsi l'utilisation des ressources.

Weixuan Chen, Qianqian Yang, Yuhao Chen, Chongwen Huang, Qian Wang, Zehui Xiong, Zhaoyang ZhangWed, 11 Ma⚡ eess

LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

Ce papier présente LiM-YOLO, un détecteur optimisé pour la détection de navires dans les images satellitaires qui améliore la précision et l'efficacité en déplaçant la pyramide de caractéristiques vers des niveaux plus fins (P2-P4) et en intégrant une normalisation par groupes pour surmonter les défis liés aux petites cibles et aux contraintes de mémoire.

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin KimWed, 11 Ma⚡ eess

Rydberg Vision via frugal Quantum Image Fingerprinting

Cet article présente un cadre natif quantique pour la correspondance d'images sur des ordinateurs analogiques à atomes neutres, utilisant une représentation par points clairsemés et des observables de matière condensée comme le facteur de structure statique pour générer des empreintes numériques efficaces, permettant ainsi le matching d'images et l'apprentissage automatique avec un nombre réduit d'atomes.

Vikrant Sharma, Neel Kanth KunduWed, 11 Ma⚛️ quant-ph

Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis

Ce papier présente CoPeDiT, un modèle de diffusion transformateur latent qui intègre une perception de complétude pour synthétiser de manière unifiée et fidèle des IRM 3D en inférant automatiquement les états manquants sans dépendre de guides externes.

Junkai Liu, Nay Aung, Theodoros N. Arvanitis, Joao A. C. Lima, Steffen E. Petersen, Le ZhangWed, 11 Ma⚡ eess

Robust Wildfire Forecasting under Partial Observability: From Reconstruction to Prediction

Cet article propose un cadre probabiliste à deux étapes pour la prévision robuste des incendies de forêt en présence d'observations partielles, où une phase de reconstruction par apprentissage (comparant quatre architectures) précède la prédiction spatio-temporelle, comblant ainsi l'écart de domaine et restaurant la précision des prévisions même sous des conditions de données fortement dégradées.

Chen Yang, Mehdi Zafari, Ziheng Duan, A. Lee SwindlehurstWed, 11 Ma⚡ eess

M2Diff: Multi-Modality Multi-Task Enhanced Diffusion Model for MRI-Guided Low-Dose PET Enhancement

Ce papier présente M2Diff, un modèle de diffusion multi-modale et multi-tâches qui améliore la reconstruction des images TEP à faible dose en traitant séparément les données IRM et TEP pour fusionner ensuite leurs caractéristiques spécifiques, offrant ainsi des résultats supérieurs sur des données cérébrales saines et Alzheimer.

Ghulam Nabi Ahmad Hassan Yar, Himashi Peiris, Victoria Mar, Cameron Dennis Pain, Zhaolin ChenWed, 11 Ma⚡ eess

DFPF-Net: Dynamically Focused Progressive Fusion Network for Remote Sensing Change Detection

Le papier présente le DFPF-Net, un réseau de fusion progressive à focalisation dynamique qui combine un transformateur de vision pyramidal et un module de focalisation dynamique pour surmonter les limitations des méthodes existantes en matière de bruit local et d'échelle globale dans la détection de changements d'images satellites.

Chengming Wang, Peng Duan, Jinjiang LiWed, 11 Ma⚡ eess

MetaSpectra+: A Compact Broadband Metasurface Camera for Snapshot Hyperspectral+ Imaging

Le papier présente MetaSpectra+, une caméra hyperspectrale compacte et multifonctionnelle basée sur des métasurfaces, capable de capturer en une seule prise de vue des données hyperspectrales sur tout le spectre visible combinées soit à une image HDR, soit à des informations de polarisation, surpassant ainsi les systèmes existants en termes de compacité et de précision de reconstruction.

Yuxuan Liu, Wei Xu, Qi GuoWed, 11 Ma⚡ eess

POLISH'ing the Sky: Wide-Field and High-Dynamic Range Interferometric Image Reconstruction with Application to Strong Lens Discovery

Cet article présente une amélioration du cadre d'apprentissage profond POLISH pour la reconstruction d'images en interférométrie radio, permettant une imagerie grand champ et à haut contraste dynamique qui améliore considérablement la détection des lentilles gravitationnelles fortes par rapport aux méthodes traditionnelles.

Zihui Wu, Liam Connor, Samuel McCarty, Katherine L. BoumanWed, 11 Ma🔭 astro-ph

Association of Radiologic PPFE Change with Mortality in Lung Cancer Screening Cohorts

Cette étude démontre que la progression radiologique de la fibroélastose pleuroparenchymateuse (PPFE) sur les scanners thoraciques à faible dose est un facteur prédictif indépendant de mortalité et d'admissions respiratoires dans deux grandes cohortes de dépistage du cancer du poumon.

Shahab Aslani, Mehran Azimbagirad, Daryl Cheng, Daisuke Yamada, Ryoko Egashira, Adam Szmul, Justine Chan-Fook, Robert Chapman, Alfred Chung Pui So, Shanshan Wang, John McCabe, Tianqi Yang, Jose M Brenes, Eyjolfur Gudmundsson, The SUMMIT Consortium, Susan M. Astley, Daniel C. Alexander, Sam M. Janes, Joseph JacobWed, 11 Ma🧬 q-bio

When to Lock Attention: Training-Free KV Control in Video Diffusion

Le papier présente KV-Lock, un cadre sans entraînement pour les modèles de diffusion vidéo basés sur DiT, qui améliore la qualité du premier plan tout en préservant la cohérence de l'arrière-plan en ajustant dynamiquement le verrouillage des clés-valeurs et l'échelle de guidage en fonction de la détection d'hallucinations.

Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian WangWed, 11 Ma🤖 cs.AI

$M^2$ -Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs

Ce papier présente $M^2$ -Occ, un cadre innovant pour la prédiction d'occupation sémantique 3D qui assure une robustesse face aux entrées de caméras incomplètes grâce à une reconstruction masquée multi-vues et un module de mémoire de caractéristiques, améliorant ainsi significativement la précision dans des scénarios de défaillance critique.

Kaixin Lin, Kunyu Peng, Di Wen, Yufan Chen, Ruiping Liu, Kailun YangWed, 11 Ma⚡ eess

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360{\deg} Indoor Environments

Ce papier présente PanoAffordanceNet, un cadre novateur et un nouveau jeu de données 360-AGD conçus pour résoudre les défis de l'ancrage holistique des affordances dans les environnements intérieurs panoramiques en surmontant les distorsions géométriques et la dispersion sémantique grâce à des mécanismes de calibration et de densification spécifiques.

Guoliang Zhu, Wanjun Jia, Caoyang Shao, Yuheng Zhang, Zhiyong Li, Kailun YangWed, 11 Ma⚡ eess

CycleULM: A unified label-free deep learning framework for ultrasound localisation microscopy

CycleULM est un cadre d'apprentissage profond unifié et sans étiquettes qui surpasse les méthodes existantes en améliorant la résolution et la précision de la localisation des microbulles pour la microscopie de localisation par ultrasons, tout en permettant un traitement en temps réel sans nécessiter de données d'entraînement annotées.

Su Yan, Clara Rodrigo Gonzalez, Vincent C. H. Leung, Herman Verinaz-Jadan, Jiakang Chen, Matthieu Toulemonde, Kai Riemer, Jipeng Yan, Clotilde Vié, Qingyuan Tan, Peter D. Weinberg, Pier Luigi Dragotti, Kevin G. Murphy, Meng-Xing TangWed, 11 Ma⚡ eess

Improving Visual Object Tracking through Visual Prompting

Ce papier présente PiVOT, un nouveau mécanisme de prompt visuel pour le suivi d'objets générique qui exploite le modèle fondamental CLIP pour générer et affiner dynamiquement des prompts en ligne, permettant ainsi au suiveur de mieux supprimer les distracteurs et d'améliorer ses performances.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu LinTue, 10 Ma💻 cs

MAP-based Problem-Agnostic diffusion model for Inverse Problems

Cet article propose une méthode d'estimation de terme guidé basée sur le maximum a posteriori (MAP) permettant d'adapter des modèles de diffusion préentraînés de manière agnostique aux problèmes d'inversion, améliorant ainsi la préservation des structures et la cohérence des résultats dans des tâches comme la super-résolution et l'inpainting.

Pingping Tao, Haixia Liu, Jing SuTue, 10 Ma💻 cs

Subclass Classification of Gliomas Using MRI Fusion Technique

Cette étude propose une méthode de classification des sous-types de gliomes atteignant une précision de 99,25 % en fusionnant des images IRM multimodales prétraitées via une architecture UNET 2D/3D et une technique de moyenne pondérée, puis en les soumettant à un modèle ResNet50.

Kiranmayee Janardhan, Christy Bobby ThomasTue, 10 Ma💻 cs

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

Cette étude propose une approche d'apprentissage profond basée sur les architectures UNET, Inception et ResNet pour réaliser une segmentation automatique et optimisée des gliomes en 2D et 3D à partir des données BraTS, atteignant des performances exceptionnelles (notamment 99,77 % de précision en 2D) qui surpassent les limites des méthodes traditionnelles en équilibrant efficacité computationnelle et précision spatiale.

Kiranmayee Janardhan, Christy Bobby TTue, 10 Ma💻 cs

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

Cet article propose un modèle d'apprentissage profond géométrique basé sur les transformers et des repères anatomiques sur des maillages tétraédriques pour améliorer le diagnostic de la maladie d'Alzheimer et prédire la positivité à l'amyloïde chez les patients à risque moyen, offrant ainsi une alternative non invasive et précise aux examens TEP coûteux.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin WangTue, 10 Ma💻 cs

eess.IV