eess.IV artículos | Gist.Science

Image Compression Using Novel View Synthesis Priors

Este artículo propone una técnica de compresión de imágenes basada en modelos que utiliza la síntesis de nuevas vistas y la optimización por descenso de gradiente para aprovechar la información previa de la misión, logrando así una compresión superior y robusta para la transmisión en tiempo real de vehículos operados remotamente sin cableado en entornos submarinos.

Luyuan Peng, Mandar Chitre, Hari Vishnu, Yuen Min Too, Bharath Kalyan, Rajat Mishra, Soo Pieng TanWed, 11 Ma⚡ eess

Entropy-and-Channel-Aware Adaptive-Rate Semantic Communication with MLLM-Aided Feature Compensation

Este artículo propone un marco de comunicación semántica adaptativa que ajusta dinámicamente la tasa de transmisión según las condiciones del canal y la entropía del contenido, utilizando un modelo de lenguaje multimodal (MLLM) para compensar las características descartadas y optimizar así el uso de recursos y el rendimiento en canales de desvanecimiento Rayleigh MIMO.

Weixuan Chen, Qianqian Yang, Yuhao Chen, Chongwen Huang, Qian Wang, Zehui Xiong, Zhaoyang ZhangWed, 11 Ma⚡ eess

LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

El artículo presenta LiM-YOLO, un detector de objetos optimizado para la detección de barcos en imágenes de teledetección óptica que logra un rendimiento superior con menos parámetros mediante el desplazamiento de los niveles de la pirámide de características (de P3-P5 a P2-P4) para preservar detalles de objetivos pequeños y la incorporación de un bloque de normalización por grupos para estabilizar el entrenamiento.

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin KimWed, 11 Ma⚡ eess

Rydberg Vision via frugal Quantum Image Fingerprinting

Este artículo presenta un marco nativo cuántico para la coincidencia de imágenes en computadoras cuánticas de átomos neutros que convierte las imágenes en nubes de puntos esparsas, las codifica físicamente en la interacción de van der Waals de un dispositivo Rydberg y genera un "huella digital" cuántica invariable mediante la estructura estática y las correlaciones, logrando así un reconocimiento de objetos industriales con un número reducido de átomos y sentando las bases para el aprendizaje automático cuántico.

Vikrant Sharma, Neel Kanth KunduWed, 11 Ma⚛️ quant-ph

Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis

El artículo presenta CoPeDiT, un modelo de difusión latente basado en transformadores que utiliza percepción de completitud autoaprendida para sintetizar de manera unificada y robusta imágenes de resonancia magnética 3D, superando las limitaciones de los métodos existentes al eliminar la dependencia de guías externas manuales.

Junkai Liu, Nay Aung, Theodoros N. Arvanitis, Joao A. C. Lima, Steffen E. Petersen, Le ZhangWed, 11 Ma⚡ eess

Robust Wildfire Forecasting under Partial Observability: From Reconstruction to Prediction

Este artículo propone un marco probabilístico de dos etapas que combina la reconstrucción de observaciones de incendios parciales mediante diversos modelos de aprendizaje profundo con la predicción de su propagación, logrando así mitigar significativamente el impacto de la observabilidad parcial y restaurar la precisión de las previsiones a niveles cercanos a los de datos limpios.

Chen Yang, Mehdi Zafari, Ziheng Duan, A. Lee SwindlehurstWed, 11 Ma⚡ eess

M2Diff: Multi-Modality Multi-Task Enhanced Diffusion Model for MRI-Guided Low-Dose PET Enhancement

El artículo presenta M2Diff, un modelo de difusión multi-modality y multi-tarea que mejora la reconstrucción de imágenes de PET de baja dosis utilizando datos de MRI para preservar características específicas de cada modalidad y fusionarlas jerárquicamente, logrando así una mayor fidelidad en pacientes sanos y con enfermedad de Alzheimer.

Ghulam Nabi Ahmad Hassan Yar, Himashi Peiris, Victoria Mar, Cameron Dennis Pain, Zhaolin ChenWed, 11 Ma⚡ eess

DFPF-Net: Dynamically Focused Progressive Fusion Network for Remote Sensing Change Detection

El artículo presenta DFPF-Net, una red de fusión progresiva dinámicamente enfocada que combina una red siamesa basada en transformadores de visión piramidal con un módulo de enfoque de cambio dinámico para superar las limitaciones locales y globales en la detección de cambios en imágenes de teledetección, logrando un rendimiento superior en cuatro conjuntos de datos.

Chengming Wang, Peng Duan, Jinjiang LiWed, 11 Ma⚡ eess

MetaSpectra+: A Compact Broadband Metasurface Camera for Snapshot Hyperspectral+ Imaging

El artículo presenta MetaSpectra+, una cámara compacta de metasuperficie que captura en un solo disparo datos hiperespectrales de banda ancha combinados con imágenes HDR o de polarización, superando a los sistemas anteriores en longitud, rango espectral y precisión de reconstrucción.

Yuxuan Liu, Wei Xu, Qi GuoWed, 11 Ma⚡ eess

POLISH'ing the Sky: Wide-Field and High-Dynamic Range Interferometric Image Reconstruction with Application to Strong Lens Discovery

Este trabajo presenta mejoras en el marco POLISH para la reconstrucción de imágenes interferométricas de radio mediante aprendizaje profundo, utilizando estrategias de parches y transformaciones de intensidad para lograr imágenes de gran campo y alto rango dinámico que permiten descubrir significativamente más lentes gravitacionales fuertes en futuras encuestas astronómicas.

Zihui Wu, Liam Connor, Samuel McCarty, Katherine L. BoumanWed, 11 Ma🔭 astro-ph

Association of Radiologic PPFE Change with Mortality in Lung Cancer Screening Cohorts

Este estudio demuestra que la progresión radiológica de la fibroelastosis pleuroparenquimatosa (PPFE) en poblaciones de cribado de cáncer de pulmón se asocia independientemente con un mayor riesgo de mortalidad y morbilidad respiratoria, lo que sugiere su utilidad como biomarcador de imagen para identificar a individuos de alto riesgo.

Shahab Aslani, Mehran Azimbagirad, Daryl Cheng, Daisuke Yamada, Ryoko Egashira, Adam Szmul, Justine Chan-Fook, Robert Chapman, Alfred Chung Pui So, Shanshan Wang, John McCabe, Tianqi Yang, Jose M Brenes, Eyjolfur Gudmundsson, The SUMMIT Consortium, Susan M. Astley, Daniel C. Alexander, Sam M. Janes, Joseph JacobWed, 11 Ma🧬 q-bio

When to Lock Attention: Training-Free KV Control in Video Diffusion

El artículo presenta KV-Lock, un marco de entrenamiento gratuito para modelos de difusión de video basados en DiT que sincroniza dinámicamente el bloqueo de claves y valores del fondo con la escala de guía condicional para mejorar la calidad del primer plano manteniendo la consistencia del fondo.

Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian WangWed, 11 Ma🤖 cs.AI

$M^2$ -Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs

El artículo presenta $M^2$ -Occ, un marco innovador que mejora la predicción de ocupación semántica 3D para la conducción autónoma al manejar entradas de cámaras incompletas mediante la reconstrucción de vistas faltantes y el uso de una memoria de características, logrando así una mayor robustez y precisión incluso en escenarios con múltiples vistas perdidas.

Kaixin Lin, Kunyu Peng, Di Wen, Yufan Chen, Ruiping Liu, Kailun YangWed, 11 Ma⚡ eess

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360{\deg} Indoor Environments

El artículo presenta PanoAffordanceNet, un marco innovador y un nuevo conjunto de datos (360-AGD) diseñados para superar los desafíos de la percepción global en entornos interiores de 360°, permitiendo una fundamentación holística de las affordances mediante la corrección de distorsiones geométricas y la alineación semántica a escala.

Guoliang Zhu, Wanjun Jia, Caoyang Shao, Yuheng Zhang, Zhiyong Li, Kailun YangWed, 11 Ma⚡ eess

CycleULM: A unified label-free deep learning framework for ultrasound localisation microscopy

CycleULM es un marco unificado de aprendizaje profundo sin etiquetas que utiliza una traducción de dominio basada en CycleGAN para superar las limitaciones de datos y simulación en la microscopía de localización por ultrasonido, logrando mejoras significativas en la resolución, la precisión de localización de microburbujas y la velocidad de procesamiento en tiempo real.

Su Yan, Clara Rodrigo Gonzalez, Vincent C. H. Leung, Herman Verinaz-Jadan, Jiakang Chen, Matthieu Toulemonde, Kai Riemer, Jipeng Yan, Clotilde Vié, Qingyuan Tan, Peter D. Weinberg, Pier Luigi Dragotti, Kevin G. Murphy, Meng-Xing TangWed, 11 Ma⚡ eess

Improving Visual Object Tracking through Visual Prompting

El artículo presenta PiVOT, un nuevo mecanismo de visual prompting que aprovecha el modelo fundacional CLIP para generar y refinar dinámicamente indicaciones visuales en línea, mejorando así la capacidad de los rastreadores de objetos genéricos para suprimir distracciones y distinguir el objetivo de su entorno.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu LinTue, 10 Ma💻 cs

MAP-based Problem-Agnostic diffusion model for Inverse Problems

Este artículo presenta un modelo de difusión agnóstico al problema basado en la estimación del máximo a posteriori (MAP) que, al dividir la función de puntuación condicional en un término incondicional preentrenado y un término guiado estimado mediante una nueva metodología, mejora la preservación de estructuras y la coherencia en tareas de procesamiento de imágenes como la superresolución y la inpainting.

Pingping Tao, Haixia Liu, Jing SuTue, 10 Ma💻 cs

Subclass Classification of Gliomas Using MRI Fusion Technique

Este estudio presenta un algoritmo que fusiona imágenes de resonancia magnética multimodal (T1, T2, T1ce y FLAIR) mediante técnicas de segmentación 2D/3D con U-Net y promedios ponderados, logrando una clasificación de subclases de gliomas con una precisión del 99,25% utilizando un modelo ResNet50.

Kiranmayee Janardhan, Christy Bobby ThomasTue, 10 Ma💻 cs

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

Este estudio propone un enfoque de aprendizaje profundo basado en arquitecturas como UNET, Inception y ResNet para la segmentación automática de gliomas en imágenes de resonancia magnética 2D y 3D, logrando una alta precisión y equilibrio entre eficiencia computacional y exactitud espacial que supera las limitaciones de los métodos tradicionales.

Kiranmayee Janardhan, Christy Bobby TTue, 10 Ma💻 cs

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

Este trabajo propone un modelo de aprendizaje profundo geométrico basado en transformadores que utiliza mallas tetraédricas y puntos de referencia anatómicos para mejorar el diagnóstico de la enfermedad de Alzheimer y predecir la positividad de amiloide cerebral en pacientes de riesgo medio, evitando así la necesidad de costosos y invasivos escáneres PET.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin WangTue, 10 Ma💻 cs

eess.IV