Unsupervised Domain Adaptation with Target-Only Margin Disparity Discrepancy

Este artículo presenta un marco novedoso de adaptación de dominio no supervisada basado en la discrepancia de disparidad de márgenes (MDD) que mejora la segmentación del hígado en imágenes de tomografía computarizada cónica (CBCT) intervencionista al aprovechar datos anotados de TC, logrando un rendimiento de vanguardia tanto en escenarios no supervisados como de pocos ejemplos.

Gauthier Miralles, Loïc Le Folgoc, Vincent Jugnon, Pietro Gori2026-03-11💻 cs

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

El artículo presenta k-MTR, un marco de aprendizaje de representaciones en el espacio k que alinea datos submuestreados directamente con etiquetas fisiológicas en un espacio latente compartido, superando la necesidad de reconstruir imágenes intermedias para lograr un análisis cardíaco multi-tarea preciso y eficiente.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

El paper presenta C2FMAE, un autoencoder enmascarado de aprendizaje auto-supervisado que resuelve la tensión entre el aprendizaje de semántica global y detalles locales mediante un enfoque jerárquico de tres niveles (semántico, de instancia y píxel) con un decodificador en cascada y un currículo de enmascaramiento progresivo, logrando mejoras significativas en tareas de visión por computadora.

Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao, Fan Yang, Xilin Chen2026-03-11🤖 cs.LG

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

El artículo presenta BEACON, un método que mejora la navegación guiada por lenguaje en entornos con oclusiones al predecir mapas de calor de viabilidad en vista cenital (BEV) que incluyen áreas ocultas, superando significativamente a los enfoques basados en imágenes al integrar un modelo de lenguaje visual con características de profundidad derivadas de observaciones multivista.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

ReCoSplat: Autoregressive Feed-Forward Gaussian Splatting Using Render-and-Compare

ReCoSplat es un modelo de Splatting Gaussiano autoregresivo que utiliza un módulo Render-and-Compare para estabilizar la reconstrucción de escenas ante errores de pose y una estrategia de compresión de caché híbrida para manejar secuencias largas, logrando así un rendimiento superior en la síntesis de nuevas vistas en línea.

Freeman Cheng, Botao Ye, Xueting Li, Junqi You, Fangneng Zhan, Ming-Hsuan Yang2026-03-11💻 cs

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Este artículo demuestra que, en escenarios realistas con características correlacionadas, la superposición en redes neuronales puede aprovechar la interferencia constructiva mediante la organización de características según sus patrones de co-activación, lo que genera estructuras semánticas y cíclicas que no se explican mediante el modelo tradicional de superposición basado en características no correlacionadas.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Differentiable Microscopy Designs an All Optical Phase Retrieval Microscope

El artículo presenta "diferenciabilidad microscópica" (μ\partial\mu), un enfoque de diseño de arriba hacia abajo basado en datos que supera a los métodos tradicionales y existentes para la recuperación de fase óptica, validado experimentalmente con muestras biológicas.

Kithmini Herath, Hasindu Kariyawasam, Ramith Hettiarachchi, Udith Haputhanthri, Dineth Jayakody, Raja N. Ahmad, Azeem Ahmad, Balpreet S. Ahluwalia, Chamira U. S. Edussooriya, Dushan N. Wadduwage2026-03-10🔬 physics.optics

Class Overwhelms: Mutual Conditional Blended-Target Domain Adaptation

Este artículo propone un método de adaptación de dominio para objetivos mezclados que, mediante un discriminador de dominio categórico guiado por incertidumbre y la alineación mutua de distribuciones condicionales, supera a los métodos actuales sin necesidad de etiquetas de dominio, logrando un rendimiento superior especialmente bajo desplazamientos en la distribución de etiquetas.

Pengcheng Xu, Boyu Wang, Charles Ling2026-03-10💻 cs

Multi-Scale Distillation for RGB-D Anomaly Detection on the PD-REAL Dataset

Este trabajo presenta PD-REAL, un nuevo conjunto de datos a gran escala para la detección de anomalías en 3D utilizando modelos de Play-Doh, junto con un marco de destilación jerárquica multiescala que aprovecha la información RGB-D para superar las limitaciones de los enfoques unimodales y mejorar la precisión en la detección de anomalías.

Jianjian Qin, Chao Zhang, Chunzhi Gu, Zi Wang, Jun Yu, Yijin Wei, Hui Xiao, Xin Yua2026-03-10💻 cs

DivCon: Divide and Conquer for Complex Numerical and Spatial Reasoning in Text-to-Image Generation

El artículo presenta DivCon, un enfoque de dividir y conquistar que mejora la generación de imágenes texto-a-imagen al desacoplar la predicción de la disposición espacial y la síntesis de objetos en subtasas manejables, permitiendo a modelos de lenguaje ligeros lograr una precisión superior y una mejor calidad perceptual en prompts complejos con múltiples objetos.

Yuhao Jia, Wenhan Tan2026-03-10💻 cs

Deepfake Generation and Detection: A Benchmark and Survey

Esta encuesta presenta una revisión integral y un benchmark de las tecnologías más avanzadas para la generación y detección de deepfakes, abarcando definiciones de tareas, conjuntos de datos, métricas, cuatro campos representativos (intercambio de rostros, reenactment, generación de rostros parlantes y edición de atributos faciales) y sus desafíos futuros.

Gan Pei, Jiangning Zhang, Menghan Hu, Zhenyu Zhang, Chengjie Wang, Yunsheng Wu, Guangtao Zhai, Jian Yang, Dacheng Tao2026-03-10💻 cs

Goldilocks Test Sets for Face Verification

Los autores proponen tres nuevos conjuntos de prueba de alta calidad denominados Hadrian, Eclipse y ND-Twins para evaluar la verificación facial en escenarios desafiantes como diferencias en atributos faciales y similitud entre individuos, evitando la degradación artificial de las imágenes y aplicando reglas estrictas para garantizar una evaluación equilibrada y rigurosa.

Haiyu Wu, Sicong Tian, Aman Bhatta, Jacob Gutierrez, Grace Bezold, Genesis Argueta, Karl Ricanek Jr., Michael C. King, Kevin W. Bowyer2026-03-10💻 cs

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Este artículo identifica y explica la etapa de corrupción en el ajuste fino de pocos ejemplos de modelos de difusión, proponiendo el uso de redes neuronales bayesianas para mitigar este fenómeno y mejorar la fidelidad, calidad y diversidad de las imágenes generadas sin incurrir en costos adicionales de inferencia.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG