Making Reconstruction FID Predictive of Diffusion Generation FID

Este artículo propone el FID interpolado (iFID), una métrica sencilla que interpola las representaciones latentes de un VAE y su vecino más cercano, logrando por primera vez una fuerte correlación con el FID de generación de modelos de difusión, a diferencia del FID de reconstrucción tradicional.

Tongda Xu, Mingwei He, Shady Abu-Hussein, Jose Miguel Hernandez-Lobato, Haotian Zhang, Kai Zhao, Chao Zhou, Ya-Qin Zhang, Yan Wang2026-03-09🤖 cs.LG

When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On

Este artículo propone el Recuento de Errores Implícito (IEC), un método de aprendizaje por refuerzo sin referencias que enumera y penaliza errores específicos en lugar de depender de rúbricas basadas en respuestas ideales, logrando así un rendimiento superior en la tarea de probador virtual donde existen múltiples soluciones válidas.

Wisdom Ikezogwo, Mehmet Saygin Seyfioglu, Ranjay Krishna, Karim Bouyarmane2026-03-09🤖 cs.AI

Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks

Este artículo analiza las estrategias de paralelización para la implementación de modelos de lenguaje grandes (LLM) densos, demostrando que la paralelización tensorial optimiza la latencia mientras que la paralelización de pipeline mejora el rendimiento, permitiendo mediante su combinación un control efectivo sobre el equilibrio entre ambos factores.

Burak Topcu, Musa Oguzhan Cim, Poovaiah Palangappa, Meena Arunachalam, Mahmut Taylan Kandemir2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

Este artículo establece un marco geométrico basado en haces fibrados principales para analizar las limitaciones y oportunidades de aprender ecuaciones diferenciales que gobiernan la evolución de redes temporales dentro de grafos de producto escalar aleatorio, identificando obstáculos fundamentales como la libertad de gauge y la holonomía no trivial, mientras demuestra que las dinámicas simétricas pueden resolver la ambigüedad de gauge y proponiendo un pipeline constructivo para recuperar campos vectoriales a partir de secuencias de grafos ruidosos.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

El artículo advierte que la rápida adopción de la IA en la ciencia climática, al depender de una infraestructura computacional y de datos concentrada en el Norte Global, corre el riesgo de exacerbar las desigualdades globales y propone un cambio hacia un desarrollo centrado en los datos, infraestructura digital pública y co-producción de conocimiento para democratizar la soberanía tecnológica y garantizar una resiliencia sistémica equitativa.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

Este estudio demuestra que la adaptación de dominio no supervisada, específicamente mediante la minimización de la discrepancia máxima del momento medio (MMD), mejora significativamente la capacidad de generalización de modelos de aprendizaje automático entrenados con datos sintéticos para la identificación de radioisótopos en espectroscopía gamma, permitiendo su despliegue efectivo en entornos operativos reales sin necesidad de datos etiquetados.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation

El artículo presenta MIRACL, un marco jerárquico de meta-aprendizaje por refuerzo multiobjetivo que, mediante la descomposición de tareas y una estrategia de adaptación basada en Pareto, logra una generalización eficiente con pocos ejemplos en la optimización de cadenas de suministro multi-nivel, superando a las bases de referencia convencionales en rendimiento y adaptabilidad.

Rifny Rachman, Josh Tingey, Richard Allmendinger, Wei Pan, Pradyumn Shukla, Bahrul Ilmi Nasution2026-03-09🤖 cs.LG

Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

Este trabajo presenta Score-Guided Proximal Projection (SGPP), un marco geométrico unificado que reformula la edición de flujos rectificados como un problema de optimización proximal para equilibrar la fidelidad y el realismo, superando las limitaciones de los métodos actuales al garantizar la convergencia al modo posterior y ofrecer un control flexible entre la preservación de la identidad y la libertad generativa.

Vansh Bansal, James G Scott2026-03-09🤖 cs.LG

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

Este artículo propone la Hipótesis de Seguridad Desentrelazada (DSH), que revela una separación geométrica entre la detección de peligros y la ejecución de denegaciones en los modelos de lenguaje, permitiendo tanto la creación de un benchmark para validar esta disociación como el desarrollo del ataque de borrado de rechazo (REA) que logra tasas de éxito sin precedentes al eliminar quirúrgicamente el mecanismo de denegación.

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints

Este artículo presenta un nuevo método de gradiente conmutativo ponderado por softmax para la optimización minimax estocástica distribuida con restricciones estocásticas, que garantiza una convergencia estable y de alta probabilidad en escenarios de aprendizaje federado con participación parcial, superando las limitaciones de los enfoques tradicionales basados en primal-dual o penalizaciones.

Zhankun Luo, Antesh Upadhyay, Sang Bin Moon, Abolfazl Hashemi2026-03-09🤖 cs.LG

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Este artículo introduce métricas de alternancia temporalmente sensibles para evaluar la coordinación en juegos multiagente, demostrando que las métricas tradicionales pueden ocultar graves deficiencias en la dinámica temporal al revelar que las políticas aprendidas, a pesar de altos rendimientos agregados, pueden tener un desempeño significativamente inferior al de políticas aleatorias.

Nikolaos Al. Papadopoulos, Konstantinos Psannis2026-03-09🤖 cs.LG