Entropy-and-Channel-Aware Adaptive-Rate Semantic Communication with MLLM-Aided Feature Compensation

Cet article propose un cadre de communication sémantique adaptatif sur canaux MIMO Rayleigh qui ajuste dynamiquement le taux de transmission en fonction de l'entropie et de l'état du canal, tout en utilisant un modèle de langage multimodal (MLLM) pour compenser les informations perdues et optimiser ainsi l'utilisation des ressources.

Weixuan Chen, Qianqian Yang, Yuhao Chen, Chongwen Huang, Qian Wang, Zehui Xiong, Zhaoyang ZhangWed, 11 Ma⚡ eess

LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

Ce papier présente LiM-YOLO, un détecteur optimisé pour la détection de navires dans les images satellitaires qui améliore la précision et l'efficacité en déplaçant la pyramide de caractéristiques vers des niveaux plus fins (P2-P4) et en intégrant une normalisation par groupes pour surmonter les défis liés aux petites cibles et aux contraintes de mémoire.

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin KimWed, 11 Ma⚡ eess

Rydberg Vision via frugal Quantum Image Fingerprinting

Cet article présente un cadre natif quantique pour la correspondance d'images sur des ordinateurs analogiques à atomes neutres, utilisant une représentation par points clairsemés et des observables de matière condensée comme le facteur de structure statique pour générer des empreintes numériques efficaces, permettant ainsi le matching d'images et l'apprentissage automatique avec un nombre réduit d'atomes.

Vikrant Sharma, Neel Kanth KunduWed, 11 Ma⚛️ quant-ph

Robust Wildfire Forecasting under Partial Observability: From Reconstruction to Prediction

Cet article propose un cadre probabiliste à deux étapes pour la prévision robuste des incendies de forêt en présence d'observations partielles, où une phase de reconstruction par apprentissage (comparant quatre architectures) précède la prédiction spatio-temporelle, comblant ainsi l'écart de domaine et restaurant la précision des prévisions même sous des conditions de données fortement dégradées.

Chen Yang, Mehdi Zafari, Ziheng Duan, A. Lee SwindlehurstWed, 11 Ma⚡ eess

M2Diff: Multi-Modality Multi-Task Enhanced Diffusion Model for MRI-Guided Low-Dose PET Enhancement

Ce papier présente M2Diff, un modèle de diffusion multi-modale et multi-tâches qui améliore la reconstruction des images TEP à faible dose en traitant séparément les données IRM et TEP pour fusionner ensuite leurs caractéristiques spécifiques, offrant ainsi des résultats supérieurs sur des données cérébrales saines et Alzheimer.

Ghulam Nabi Ahmad Hassan Yar, Himashi Peiris, Victoria Mar, Cameron Dennis Pain, Zhaolin ChenWed, 11 Ma⚡ eess

MetaSpectra+: A Compact Broadband Metasurface Camera for Snapshot Hyperspectral+ Imaging

Le papier présente MetaSpectra+, une caméra hyperspectrale compacte et multifonctionnelle basée sur des métasurfaces, capable de capturer en une seule prise de vue des données hyperspectrales sur tout le spectre visible combinées soit à une image HDR, soit à des informations de polarisation, surpassant ainsi les systèmes existants en termes de compacité et de précision de reconstruction.

Yuxuan Liu, Wei Xu, Qi GuoWed, 11 Ma⚡ eess

POLISH'ing the Sky: Wide-Field and High-Dynamic Range Interferometric Image Reconstruction with Application to Strong Lens Discovery

Cet article présente une amélioration du cadre d'apprentissage profond POLISH pour la reconstruction d'images en interférométrie radio, permettant une imagerie grand champ et à haut contraste dynamique qui améliore considérablement la détection des lentilles gravitationnelles fortes par rapport aux méthodes traditionnelles.

Zihui Wu, Liam Connor, Samuel McCarty, Katherine L. BoumanWed, 11 Ma🔭 astro-ph

Association of Radiologic PPFE Change with Mortality in Lung Cancer Screening Cohorts

Cette étude démontre que la progression radiologique de la fibroélastose pleuroparenchymateuse (PPFE) sur les scanners thoraciques à faible dose est un facteur prédictif indépendant de mortalité et d'admissions respiratoires dans deux grandes cohortes de dépistage du cancer du poumon.

Shahab Aslani, Mehran Azimbagirad, Daryl Cheng, Daisuke Yamada, Ryoko Egashira, Adam Szmul, Justine Chan-Fook, Robert Chapman, Alfred Chung Pui So, Shanshan Wang, John McCabe, Tianqi Yang, Jose M Brenes, Eyjolfur Gudmundsson, The SUMMIT Consortium, Susan M. Astley, Daniel C. Alexander, Sam M. Janes, Joseph JacobWed, 11 Ma🧬 q-bio

When to Lock Attention: Training-Free KV Control in Video Diffusion

Le papier présente KV-Lock, un cadre sans entraînement pour les modèles de diffusion vidéo basés sur DiT, qui améliore la qualité du premier plan tout en préservant la cohérence de l'arrière-plan en ajustant dynamiquement le verrouillage des clés-valeurs et l'échelle de guidage en fonction de la détection d'hallucinations.

Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian WangWed, 11 Ma🤖 cs.AI

M2M^2-Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs

Ce papier présente M2M^2-Occ, un cadre innovant pour la prédiction d'occupation sémantique 3D qui assure une robustesse face aux entrées de caméras incomplètes grâce à une reconstruction masquée multi-vues et un module de mémoire de caractéristiques, améliorant ainsi significativement la précision dans des scénarios de défaillance critique.

Kaixin Lin, Kunyu Peng, Di Wen, Yufan Chen, Ruiping Liu, Kailun YangWed, 11 Ma⚡ eess

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360{\deg} Indoor Environments

Ce papier présente PanoAffordanceNet, un cadre novateur et un nouveau jeu de données 360-AGD conçus pour résoudre les défis de l'ancrage holistique des affordances dans les environnements intérieurs panoramiques en surmontant les distorsions géométriques et la dispersion sémantique grâce à des mécanismes de calibration et de densification spécifiques.

Guoliang Zhu, Wanjun Jia, Caoyang Shao, Yuheng Zhang, Zhiyong Li, Kailun YangWed, 11 Ma⚡ eess

CycleULM: A unified label-free deep learning framework for ultrasound localisation microscopy

CycleULM est un cadre d'apprentissage profond unifié et sans étiquettes qui surpasse les méthodes existantes en améliorant la résolution et la précision de la localisation des microbulles pour la microscopie de localisation par ultrasons, tout en permettant un traitement en temps réel sans nécessiter de données d'entraînement annotées.

Su Yan, Clara Rodrigo Gonzalez, Vincent C. H. Leung, Herman Verinaz-Jadan, Jiakang Chen, Matthieu Toulemonde, Kai Riemer, Jipeng Yan, Clotilde Vié, Qingyuan Tan, Peter D. Weinberg, Pier Luigi Dragotti, Kevin G. Murphy, Meng-Xing TangWed, 11 Ma⚡ eess

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

Cette étude propose une approche d'apprentissage profond basée sur les architectures UNET, Inception et ResNet pour réaliser une segmentation automatique et optimisée des gliomes en 2D et 3D à partir des données BraTS, atteignant des performances exceptionnelles (notamment 99,77 % de précision en 2D) qui surpassent les limites des méthodes traditionnelles en équilibrant efficacité computationnelle et précision spatiale.

Kiranmayee Janardhan, Christy Bobby TTue, 10 Ma💻 cs

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

Cet article propose un modèle d'apprentissage profond géométrique basé sur les transformers et des repères anatomiques sur des maillages tétraédriques pour améliorer le diagnostic de la maladie d'Alzheimer et prédire la positivité à l'amyloïde chez les patients à risque moyen, offrant ainsi une alternative non invasive et précise aux examens TEP coûteux.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin WangTue, 10 Ma💻 cs