eess.IV artículos | Gist.Science

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

El artículo presenta ECLARE, un método de superresolución autocontenido que mejora la resolución anisotrópica en volúmenes de resonancia magnética 2D mediante el aprendizaje de parches intraplanares y la estimación del perfil de corte, superando a las técnicas existentes al evitar el desplazamiento de dominio y lograr un mejor rendimiento en tareas posteriores sin necesidad de datos externos.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs

Evaluating quality metrics through the lenses of psychophysical measurements of low-level vision

Este artículo introduce un conjunto de pruebas basadas en mediciones psicofísicas de la visión de bajo nivel para evaluar la capacidad de 34 métricas de calidad de imagen y video existentes para modelar aspectos clave de la percepción humana, como la sensibilidad al contraste y el enmascaramiento, revelando limitaciones y patrones de comportamiento que no se detectan con los protocolos de evaluación estándar.

Dounia Hammou, Yancheng Cai, Pavan Madhusudanarao, Christos G. Bampis, Rafał K. MantiukMon, 09 Ma💻 cs

Multivariate Fields of Experts for Convergent Image Reconstruction

Este artículo presenta los Campos de Expertos Multivariados, un nuevo marco de aprendizaje de priores de imágenes que generaliza métodos existentes mediante funciones potenciales multivariadas, logrando un rendimiento superior a los modelos univariados y comparable al de las redes neuronales profundas en diversas tareas de reconstrucción, pero con mayor velocidad, menor complejidad paramétrica y garantías teóricas de convergencia.

Stanislas Ducotterd, Michael UnserMon, 09 Ma🤖 cs.LG

SAAIPAA: Optimizing aspect-angles-invariant physical adversarial attacks on SAR target recognition models

El artículo presenta SAAIPAA, un marco de ataque adversario físico para reconocimiento de objetivos en radar de apertura sintética (SAR) que optimiza la posición y orientación de reflectores para engañar a modelos de aprendizaje automático de manera invariante a los ángulos de aspecto, logrando altas tasas de éxito incluso sin conocer la perspectiva de la plataforma SAR.

Isar Lemeire, Yee Wei Law, Sang-Heon Lee, William Meakin, Tat-Jun ChinMon, 09 Ma⚡ eess

Learning Latent Transmission and Glare Maps for Lens Veiling Glare Removal

Los autores proponen VeilGen, un modelo generativo no supervisado que estima mapas de transmisión y deslumbramiento latentes para sintetizar datos realistas, y DeVeiler, una red de restauración que utiliza estos mapas para eliminar eficazmente el deslumbramiento por velo en sistemas ópticos simplificados.

Xiaolong Qian, Qi Jiang, Lei Sun, Zongxi Yu, Kailun Yang, Peixuan Wu, Jiacheng Zhou, Yao Gao, Yaoguang Ma, Ming-Hsuan Yang, Kaiwei WangMon, 09 Ma🔬 physics.optics

In-batch Relational Features Enhance Precision in An Unsupervised Medical Anomaly Detection Task

Este artículo presenta un método de detección de anomalías médicas no supervisado que mejora la precisión al integrar variaciones anatómicas normales mediante estimación de hipergrafos y convolución gráfica en lotes, logrando una reducción significativa de falsos positivos en imágenes de resonancia magnética cerebral.

P. Bilha Githinji, Xi Yuan, Ijaz Gul, Lian Zhang, Jinhao Xu, Zhenglin Chen, Peiwu Qin, Dongmei YuMon, 09 Ma🧬 q-bio

Clinical-Injection Transformer with Domain-Adapted MAE for Lupus Nephritis Prognosis Prediction

Este estudio presenta el primer marco de patología computacional multimodal, basado en un Transformer de inyección clínica y un MAE adaptado al dominio, que logra una alta precisión (90,1%) en la predicción del pronóstico de nefritis lúpica pediátrica utilizando únicamente biopsias teñidas con PAS y datos clínicos estructurados.

Yuewen Huang, Zhitao Ye, Guangnan Feng, Fudan Zheng, Xia Gao, Yutong LuMon, 09 Ma🤖 cs.LG

Edges Are All You Need: Robust Gait Recognition via Label-Free Structure

El artículo presenta SKETCHGAIT, un marco de reconocimiento de la marcha que introduce el nuevo modo visual "Sketch" para extraer estructuras densas y libres de etiquetas directamente de imágenes RGB, logrando un rendimiento superior al combinarlo con representaciones de parsing en un sistema multimodal jerárquico.

Chao Zhang, Zhuang Zheng, Ruixin Li, Zhanyong MeiMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Este trabajo presenta el marco PPCMI-SF, una solución de colaboración privada para la segmentación de imágenes médicas que utiliza transformaciones latentes cifradas y mapeo en el servidor para lograr una alta precisión y resistencia a ataques de inferencia sin compartir datos sensibles entre instituciones.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

Gabor Primitives for Accelerated Cardiac Cine MRI Reconstruction

Este artículo propone el uso de primitivas de Gabor, que modulan envolventes gaussianas con exponenciales complejas para representar eficientemente tanto estructuras suaves como bordes agudos en resonancia magnética cardíaca acelerada, superando a los métodos existentes mediante una representación continua y físicamente interpretable que explota la redundancia espaciotemporal.

Wenqi Huang, Veronika Spieker, Nil Stolt-Ansó, Natascha Niessen, Maik Dannecker, Sevgi Gokce Kafali, Sila Kurugol, Julia A. Schnabel, Daniel RueckertMon, 09 Ma💻 cs

Longitudinal Lesion Inpainting in Brain MRI via 3D Region Aware Diffusion

Este trabajo presenta un nuevo marco de inpainting longitudinal pseudo-3D basado en modelos de difusión que, al integrar contexto temporal y un mecanismo de atención regional, supera a los métodos existentes en fidelidad perceptual, estabilidad temporal y eficiencia computacional para el análisis de resonancias magnéticas cerebrales con lesiones evolutivas.

Zahra Karimaghaloo, Dumitru Fetco, Haz-Edine Assemlal, Hassan Rivaz, Douglas L. ArnoldMon, 09 Ma🤖 cs.AI

Interpretable Motion Artificat Detection in structural Brain MRI

Este trabajo propone un marco ligero e interpretable que extiende los histogramas discriminativos de magnitud de gradiente a espacios tridimensionales para detectar artefactos de movimiento en resonancias magnéticas cerebrales estructurales, logrando una alta precisión y generalización en sitios no vistos mediante una estrategia de decisión paralela que combina características 2D y 3D.

Naveetha Nithianandam, Prabhjot Kaur, Anil Kumar SaoMon, 09 Ma💻 cs

Uni-LVC: A Unified Method for Intra- and Inter-Mode Learned Video Compression

El artículo presenta Uni-LVC, un método unificado de compresión de video aprendido que integra modos intra e inter en un solo modelo mediante atención cruzada y un clasificador consciente de la fiabilidad, logrando un rendimiento superior en eficiencia de compresión y adaptabilidad ante referencias temporales poco fiables.

Yichi Zhang, Ruoyu Yang, Fengqing ZhuMon, 09 Ma💻 cs

Architectural Unification for Polarimetric Imaging Across Multiple Degradations

Este trabajo propone un marco arquitectónico unificado que, mediante un procesamiento conjunto de imagen y Stokes en una sola etapa, logra un rendimiento superior en la restauración de imágenes polarimétricas degradadas por ruido, desenfoque o mosaicos, garantizando la consistencia física de los parámetros polarimétricos sin necesidad de rediseñar la red para cada tipo de degradación.

Chu Zhou, Yufei Han, Junda Liao, Linrui Dai, Wangze Xu, Art Subpa-Asa, Heng Guo, Boxin Shi, Imari SatoMon, 09 Ma💻 cs

Technical Report: Automated Optical Inspection of Surgical Instruments

Este informe presenta un sistema de inspección óptica automatizada basado en arquitecturas de aprendizaje profundo (YOLOv8, ResNet-152 y EfficientNet-b4) para detectar defectos críticos en instrumentos quirúrgicos fabricados en Pakistán, utilizando un conjunto de datos de 4.414 imágenes y colaborando con líderes de la industria local para mejorar la seguridad del paciente y la calidad de fabricación.

Zunaira Shafqat, Atif Aftab Ahmed Jilani, Qurrat Ul AinMon, 09 Ma🤖 cs.AI

Enhancing Neural Video Compression of Static Scenes with Positive-Incentive Noise

Este artículo propone un método de compresión de video neuronal que incorpora ruido de incentivo positivo para reutilizar cambios temporales de corto plazo, logrando una reducción del 73% en la tasa de bits frente a modelos generales mientras se mantiene la fidelidad a nivel de píxel en escenas estáticas.

Cheng Yuan, Zhenyu Jia, Jiawei Shao, Xuelong LiMon, 09 Ma💻 cs

NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving

El artículo presenta NOVA, un nuevo paradigma de autoregresión de vocabulario abierto que utiliza modelos de lenguaje grandes para reformular el seguimiento de múltiples objetos 3D como una tarea de generación de secuencias semánticas, logrando mejoras significativas en la generalización de categorías desconocidas y la consistencia de identidad en entornos de conducción autónoma.

Kai Luo, Xu Wang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise

Este artículo presenta OccNL, el primer benchmark para la predicción de ocupación semántica 3D bajo ruido de etiquetas, y propone DPR-Occ, un marco robusto que supera el colapso de los métodos existentes al generar supervisión fiable mediante razonamiento de etiquetas parciales de doble fuente, logrando así mejoras significativas en entornos dinámicos.

Wenxin Li, Kunyu Peng, Di Wen, Junwei Zheng, Jiale Wei, Mengfei Duan, Yuheng Zhang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

AI End-to-End Radiation Treatment Planning Under One Second

El estudio presenta AIRT, un marco de aprendizaje profundo de extremo a extremo capaz de generar planes de radioterapia VMAT para próstata en menos de un segundo con una calidad no inferior a los planes estándar, lo que representa un avance significativo hacia la estandarización y aceleración de los flujos de trabajo clínicos.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin ComaniciuMon, 09 Ma🤖 cs.AI

EquivAnIA: A Spectral Method for Rotation-Equivariant Anisotropic Image Analysis

El artículo presenta EquivAnIA, un nuevo método espectral basado en wavelets de pastel y filtros de cresta que realiza un análisis de imagen anisotrópico robusto frente a rotaciones numéricas, demostrando su eficacia en imágenes sintéticas y reales así como en tareas de registro angular.

Jérémy Scanvic, Nils LaurentFri, 13 Ma⚡ eess

← Anterior Siguiente →