UniLight: A Unified Representation for Lighting

El artículo presenta UniLight, una representación unificada de iluminación en un espacio latente compartido que alinea mediante aprendizaje contrastivo múltiples modalidades (texto, imágenes, irradiancia y mapas de entorno) para permitir la transferencia cruzada y la manipulación flexible de la iluminación en tareas como la recuperación, la generación de mapas y la síntesis de imágenes.

Zitian Zhang, Iliyan Georgiev, Michael Fischer + 3 more2026-03-05💻 cs

Measurement-Consistent Langevin Corrector for Stabilizing Latent Diffusion Inverse Problem Solvers

Este trabajo presenta el Corrector de Langevin Consistente con la Medición (MCLC), un módulo teórico y plug-and-play que estabiliza los solucionadores de problemas inversos basados en modelos de difusión latente al corregir la discrepancia entre la dinámica del solver y la difusión inversa aprendida mediante actualizaciones de Langevin consistentes con las mediciones.

Lee Hyoseok, Sohwi Lim, Eunju Cha + 1 more2026-03-05🤖 cs.LG

Tracing 3D Anatomy in 2D Strokes: A Multi-Stage Projection Driven Approach to Cervical Spine Fracture Identification

Este estudio presenta un pipeline automatizado de detección de fracturas de columna cervical que, mediante la fusión de segmentaciones 2D ortogonales para estimar volúmenes 3D y su posterior análisis con modelos CNN-Transformer, logra un rendimiento diagnóstico comparable al de radiólogos expertos mientras reduce la dimensionalidad de los procesos intermedios.

Fabi Nahian Madhurja, Rusab Sarmun, Muhammad E. H. Chowdhury + 3 more2026-03-05🤖 cs.AI

Improving Medical Visual Reinforcement Fine-Tuning via Perception and Reasoning Augmentation

Este trabajo presenta VRFT-Aug, un marco de ajuste fino por refuerzo visual diseñado para el dominio médico que, mediante estrategias de inyección de conocimiento previo, refinamiento de políticas y recompensas informadas, mejora significativamente tanto la percepción visual como el razonamiento estructurado en comparación con los métodos tradicionales.

Guangjing Yang, ZhangYuan Yu, Ziyuan Qin + 7 more2026-03-05🤖 cs.AI

First International StepUP Competition for Biometric Footstep Recognition: Methods, Results and Remaining Challenges

El artículo presenta los resultados del Primer Concurso Internacional StepUP para el reconocimiento biométrico de pisadas, donde 23 equipos utilizaron el nuevo conjunto de datos StepUP-P150 para desarrollar modelos de aprendizaje profundo, logrando un mejor error igualado del 10,77% y destacando que, a pesar de los avances, la generalización ante cambios en el calzado sigue siendo un desafío crítico.

Robyn Larracy, Eve MacDonald, Angkoon Phinyomark + 5 more2026-03-05🤖 cs.LG

When Safety Collides: Resolving Multi-Category Harmful Conflicts in Text-to-Image Diffusion via Adaptive Safety Guidance

El artículo presenta CASG, un marco de guía de seguridad adaptable y sin entrenamiento que resuelve los conflictos entre múltiples categorías de contenido dañino en modelos de difusión texto-a-imagen mediante la identificación dinámica de la categoría de riesgo más relevante y la aplicación de una dirección de seguridad alineada, logrando así una reducción significativa en la tasa de generación de contenido perjudicial.

Yongli Xiang, Ziming Hong, Zhaoqing Wang + 3 more2026-03-05💻 cs

Skullptor: High Fidelity 3D Head Reconstruction in Seconds with Multi-View Normal Prediction

Skullptor es un método híbrido que combina la predicción de normales de superficie multi-vista mediante atención cruzada con la optimización de renderizado inverso para lograr una reconstrucción 3D de alta fidelidad de cabezas en segundos, superando las limitaciones de detalle de los modelos de una sola imagen y la necesidad de costosas cámaras densas de la fotogrametría tradicional.

Noé Artru, Rukhshanda Hussain, Emeline Got + 3 more2026-03-05💻 cs

Momentum Memory for Knowledge Distillation in Computational Pathology

El artículo presenta MoMKD, un marco de destilación de conocimiento impulsado por una memoria actualizada con momento que supera las limitaciones de los métodos actuales al integrar información genómica e histopatológica a través de lotes, logrando así un rendimiento superior y una mejor generalización en tareas de diagnóstico de cáncer mediante inferencia basada únicamente en histología.

Yongxin Guo, Hao Lu, Onur C. Koyun + 3 more2026-03-05💻 cs

Automatic Map Density Selection for Locally-Performant Visual Place Recognition

Este artículo propone un enfoque dinámico de mapeo para el reconocimiento visual de lugares que selecciona automáticamente la densidad del mapa necesaria para garantizar que un porcentaje específico del entorno cumpla con un nivel de recuperación local definido por el usuario, superando así las limitaciones de los métodos actuales que solo optimizan el rendimiento global.

Somayeh Hussaini, Tobias Fischer, Michael Milford2026-03-05💻 cs

Beyond Dominant Patches: Spatial Credit Redistribution For Grounded Vision-Language Models

El artículo propone SCR (Redistribución de Crédito Espacial), un método de inferencia sin entrenamiento que mitiga las alucinaciones en modelos de visión y lenguaje al corregir el colapso espacial de la atención mediante la redistribución de estados ocultos entre parches vecinos, logrando una reducción significativa de errores en múltiples benchmarks sin comprometer la calidad de generación ni la latencia.

Niamul Hassan Samin, Md Arifur Rahman, Abdullah Ibne Hanif Arean + 2 more2026-03-05🤖 cs.AI