Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

Este artículo establece un marco geométrico basado en haces fibrados principales para analizar las limitaciones y oportunidades de aprender ecuaciones diferenciales que gobiernan la evolución de redes temporales dentro de grafos de producto escalar aleatorio, identificando obstáculos fundamentales como la libertad de gauge y la holonomía no trivial, mientras demuestra que las dinámicas simétricas pueden resolver la ambigüedad de gauge y proponiendo un pipeline constructivo para recuperar campos vectoriales a partir de secuencias de grafos ruidosos.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

El artículo advierte que la rápida adopción de la IA en la ciencia climática, al depender de una infraestructura computacional y de datos concentrada en el Norte Global, corre el riesgo de exacerbar las desigualdades globales y propone un cambio hacia un desarrollo centrado en los datos, infraestructura digital pública y co-producción de conocimiento para democratizar la soberanía tecnológica y garantizar una resiliencia sistémica equitativa.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

Este estudio demuestra que la adaptación de dominio no supervisada, específicamente mediante la minimización de la discrepancia máxima del momento medio (MMD), mejora significativamente la capacidad de generalización de modelos de aprendizaje automático entrenados con datos sintéticos para la identificación de radioisótopos en espectroscopía gamma, permitiendo su despliegue efectivo en entornos operativos reales sin necesidad de datos etiquetados.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation

El artículo presenta MIRACL, un marco jerárquico de meta-aprendizaje por refuerzo multiobjetivo que, mediante la descomposición de tareas y una estrategia de adaptación basada en Pareto, logra una generalización eficiente con pocos ejemplos en la optimización de cadenas de suministro multi-nivel, superando a las bases de referencia convencionales en rendimiento y adaptabilidad.

Rifny Rachman, Josh Tingey, Richard Allmendinger, Wei Pan, Pradyumn Shukla, Bahrul Ilmi Nasution2026-03-09🤖 cs.LG

Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

Este trabajo presenta Score-Guided Proximal Projection (SGPP), un marco geométrico unificado que reformula la edición de flujos rectificados como un problema de optimización proximal para equilibrar la fidelidad y el realismo, superando las limitaciones de los métodos actuales al garantizar la convergencia al modo posterior y ofrecer un control flexible entre la preservación de la identidad y la libertad generativa.

Vansh Bansal, James G Scott2026-03-09🤖 cs.LG

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

Este artículo propone la Hipótesis de Seguridad Desentrelazada (DSH), que revela una separación geométrica entre la detección de peligros y la ejecución de denegaciones en los modelos de lenguaje, permitiendo tanto la creación de un benchmark para validar esta disociación como el desarrollo del ataque de borrado de rechazo (REA) que logra tasas de éxito sin precedentes al eliminar quirúrgicamente el mecanismo de denegación.

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints

Este artículo presenta un nuevo método de gradiente conmutativo ponderado por softmax para la optimización minimax estocástica distribuida con restricciones estocásticas, que garantiza una convergencia estable y de alta probabilidad en escenarios de aprendizaje federado con participación parcial, superando las limitaciones de los enfoques tradicionales basados en primal-dual o penalizaciones.

Zhankun Luo, Antesh Upadhyay, Sang Bin Moon, Abolfazl Hashemi2026-03-09🤖 cs.LG

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Este artículo introduce métricas de alternancia temporalmente sensibles para evaluar la coordinación en juegos multiagente, demostrando que las métricas tradicionales pueden ocultar graves deficiencias en la dinámica temporal al revelar que las políticas aprendidas, a pesar de altos rendimientos agregados, pueden tener un desempeño significativamente inferior al de políticas aleatorias.

Nikolaos Al. Papadopoulos, Konstantinos Psannis2026-03-09🤖 cs.LG

MoE Lens -- An Expert Is All You Need

El artículo "MoE Lens" demuestra mediante un análisis sistemático del modelo DeepSeekMoE que la especialización de los expertos en las arquitecturas Mixture of Experts está altamente concentrada en unos pocos dominantes, lo que sugiere que es posible optimizar la inferencia mediante la poda selectiva de expertos sin comprometer significativamente el rendimiento del modelo.

Marmik Chaudhari, Idhant Gulati, Nishkal Hundia, Pranav Karra, Shivam Raval2026-03-09🤖 cs.LG

Margin and Consistency Supervision for Calibrated and Robust Vision Models

El artículo presenta MaCS, un marco de regularización simple y agnóstico a la arquitectura que mejora la calibración y la robustez de los modelos de visión mediante la combinación de una penalización de margen en el espacio de logits y un regularizador de consistencia, logrando mejores garantías teóricas y rendimiento empírico sin requerir datos adicionales ni cambios arquitectónicos.

Salim Khazem2026-03-09🤖 cs.AI

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

Este estudio evalúa empíricamente la adaptación en tiempo de prueba mediante prompting con muchas muestras en modelos de lenguaje, revelando que aunque es eficaz para tareas estructuradas con alto valor informativo, su utilidad es limitada y sensible a la estrategia de selección en tareas de generación abierta, lo que permite definir sus límites prácticos frente a otras estrategias como el ICL dinámico y reforzado.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

ReflexiCoder: Teaching Large Language Models to Self-Reflect on Generated Code and Self-Correct It via Reinforcement Learning

ReflexiCoder es un nuevo marco de aprendizaje por refuerzo que entrena a modelos de lenguaje grandes para internalizar la capacidad de autocrítica y autocorrección de código de forma autónoma durante la inferencia, logrando un rendimiento de vanguardia en múltiples benchmarks sin depender de oráculos externos ni motores de ejecución.

Juyong Jiang, Jiasi Shen, Sunghun Kim, Kang Min Yoo, Jeonghoon Kim, Sungju Kim2026-03-09🤖 cs.LG