A Multi-Objective Evaluation Framework for Analyzing Utility-Fairness Trade-Offs in Machine Learning Systems

Este trabajo presenta un marco de evaluación multiobjetivo, agnóstico al modelo y disponible públicamente, diseñado para analizar y visualizar de manera sistemática las compensaciones entre utilidad y equidad en sistemas de aprendizaje automático, con una aplicación específica y validada en el dominio de la imagen médica.

Gökhan Özbulak, Oscar Jimenez-del-Toro, Maíra Fatoretto + 2 more2026-03-03🤖 cs.LG

Target-Aware Video Diffusion Models

Los autores presentan un modelo de difusión de video consciente del objetivo que genera videos a partir de una imagen inicial, donde un actor interactúa con un objeto específico definido por una máscara de segmentación y descrito mediante un prompt de texto, logrando una mayor precisión en las interacciones humano-objeto mediante la incorporación de tokens especiales y una función de pérdida de atención cruzada.

Taeksoo Kim, Hanbyul Joo2026-03-03💻 cs

VR-FuseNet: A Fusion of Heterogeneous Fundus Data and Explainable Deep Network for Diabetic Retinopathy Classification

Este artículo presenta VR-FuseNet, un modelo híbrido de aprendizaje profundo que fusiona VGG19 y ResNet50V2 sobre un conjunto de datos unificado y equilibrado para clasificar la retinopatía diabética con una precisión del 91,824%, integrando además técnicas de IA explicable para mejorar la interpretabilidad clínica de las predicciones.

Shamim Rahim Refat, Ziyan Shirin Raha, Shuvashis Sarker + 4 more2026-03-03💻 cs

Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology

Este artículo argumenta que los modelos de visión por computadora en ecología y biología deben evaluarse mediante métricas específicas de la aplicación que reflejen su impacto en el análisis final, demostrando mediante estudios de caso sobre chimpancés y palomas que un alto rendimiento en métricas de aprendizaje automático no garantiza necesariamente la precisión en los resultados biológicos.

Alex Hoi Hang Chan, Otto Brookes, Urs Waldmann + 11 more2026-03-03💻 cs

Wasserstein Distances Made Explainable: Insights Into Dataset Shifts and Transport Phenomena

Este trabajo propone un método basado en Inteligencia Artificial Explicable que permite atribuir con precisión y eficiencia las distancias de Wasserstein a componentes específicos de los datos, como subgrupos o características, facilitando así la comprensión de los factores que influyen en los desplazamientos de distribuciones y fenómenos de transporte.

Philip Naumann, Jacob Kauffmann, Grégoire Montavon2026-03-03🤖 cs.AI

Adversarially Pretrained Transformers May Be Universally Robust In-Context Learners

Este estudio presenta el primer análisis teórico que demuestra que los transformadores preentrenados adversarialmente pueden funcionar como modelos fundacionales universalmente robustos, capaces de adaptarse a nuevas tareas mediante aprendizaje en contexto a partir de demostraciones limpias, superando así la necesidad de un entrenamiento adversarial adicional en las tareas posteriores.

Soichiro Kumano, Hiroshi Kera, Toshihiko Yamasaki2026-03-03📊 stat

Flexible-weighted Chamfer Distance: Enhanced Objective Function for Point Cloud Completion

El artículo presenta la Distancia de Chamfer con Ponderación Flexible (FCD), una función objetivo mejorada que, al desacoplar la precisión local de la completitud global mediante una estrategia de ponderación asimétrica, mitiga eficazmente la agregación de puntos y mejora la integridad estructural en tareas de completación y generación de nubes de puntos.

Jie Li, Shengwei Tian, Long Yu + 1 more2026-03-03💻 cs

GradPCA: Leveraging NTK Alignment for Reliable Out-of-Distribution Detection

El artículo presenta GradPCA, un método de detección de datos fuera de distribución que aprovecha la estructura de bajo rango de los gradientes inducida por la alineación del Kernel Tangente Neural (NTK) para lograr un rendimiento más consistente y ofrecer una perspectiva teórica sobre las propiedades del espacio de características que facilitan una detección efectiva.

Mariia Seleznova, Hung-Hsu Chou, Claudio Mayrink Verdun + 1 more2026-03-03🤖 cs.LG

Seek-CAD: A Self-refined Generative Modeling for 3D Parametric CAD Using Local Inference via DeepSeek

Este artículo presenta Seek-CAD, un método de generación de modelos CAD paramétricos 3D sin entrenamiento que utiliza el modelo de lenguaje DeepSeek-R1 desplegado localmente junto con retroalimentación visual y de razonamiento en cadena para refinar iterativamente los diseños, apoyado por un nuevo dataset estructurado bajo el paradigma SSR.

Xueyang Li, Jiahao Li, Yu Song + 2 more2026-03-03🤖 cs.AI

Point-MoE: Large-Scale Multi-Dataset Training with Mixture-of-Experts for 3D Semantic Segmentation

El artículo presenta Point-MoE, un enfoque basado en una mezcla de expertos que permite el entrenamiento conjunto a gran escala de múltiples conjuntos de datos heterogéneos para la segmentación semántica 3D sin necesidad de etiquetas de conjunto, superando a los métodos anteriores al permitir que el modelo descubra automáticamente la estructura de los datos.

Xuweiyi Chen, Wentao Zhou, Aruni RoyChowdhury + 1 more2026-03-03💻 cs