Breaking the Stochasticity Barrier: An Adaptive Variance-Reduced Method for Variational Inequalities

Este trabajo propone VR-SDA-A, un algoritmo adaptativo de reducción de varianza que supera la barrera de estocasticidad en desigualdades variacionales estocásticas no convexas no cóncavas mediante una verificación de curvatura y un esquema de línea de búsqueda, logrando una complejidad óptima de O(ϵ3)O(\epsilon^{-3}) y acelerando la convergencia en problemas de punto de silla.

Yungi Jeong, Takumi Otsuka2026-03-12🤖 cs.LG

Emergence of Distortions in High-Dimensional Guided Diffusion Models

Este trabajo formaliza la pérdida de diversidad en modelos de difusión con guía libre de clasificadores como una distorsión generativa que surge de una transición de fase en regímenes de alta dimensión, y propone un nuevo esquema de programación con una ventana de guía negativa para mitigar este efecto mientras se preserva la separabilidad de clases.

Enrico Ventura, Beatrice Achilli, Luca Ambrogioni, Carlo Lucibello2026-03-12📊 stat

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

Este artículo presenta un enfoque basado en muestreo Thompson contextual para generar secuencias de ejercicios personalizados que optimizan la mejora de habilidades en entornos educativos digitales, demostrando mediante datos de una plataforma de tutoría matemática que este método incrementa el aprendizaje y permite una instrucción adaptativa a escala.

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization

Este artículo presenta FGO, un algoritmo de aprendizaje por refuerzo que comprime eficazmente el razonamiento de cadena de pensamiento en modelos de lenguaje grandes mediante la subdivisión y ponderación de respuestas, resolviendo al mismo tiempo las limitaciones de ineficiencia en el uso de datos y colapso de entropía del método GRPO sin degradar el rendimiento.

Xinchen Han, Hossam Afifi, Michel Marot, Xilu Wang, Lu Yin2026-03-12🤖 cs.LG

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

El artículo presenta GOT-JEPA, un marco de preentrenamiento predictivo que adapta modelos de seguimiento mediante una arquitectura de incrustación conjunta para mejorar la generalización y el manejo de oclusiones, complementado por OccuSolver para refinar la estimación de visibilidad y los patrones de oclusión.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-12🤖 cs.AI

ZACH-ViT: Regime-Dependent Inductive Bias in Compact Vision Transformers for Medical Imaging

El artículo presenta ZACH-ViT, un transformador de visión compacto que elimina las codificaciones posicionales y el token [CLS] para lograr un procesamiento de parches invariante a permutaciones, demostrando que esta arquitectura adaptada a la estructura de los datos médicos alcanza un rendimiento competitivo en escenarios de pocos datos, especialmente cuando la disposición espacial es débilmente informativa.

Athanasios Angelakis2026-03-12⚡ eess

Benchmarking Graph Neural Networks in Solving Hard Constraint Satisfaction Problems

Este artículo propone nuevos benchmarks rigurosos basados en problemas aleatorios desde una perspectiva de física estadística para evaluar redes neuronales gráficas en problemas de satisfacción de restricciones, demostrando que, en comparación justa, los algoritmos clásicos siguen superando a las redes neuronales.

Geri Skenderi, Lorenzo Buffoni, Francesco D'Amico, David Machado, Raffaele Marino, Matteo Negri, Federico Ricci-Tersenghi, Carlo Lucibello, Maria Chiara Angelini2026-03-12🔬 cond-mat

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

Este estudio demuestra que los analistas autónomos basados en modelos de lenguaje grande pueden replicar a gran escala y bajo costo la diversidad analítica humana, generando una amplia dispersión de resultados que subraya la necesidad de un nuevo estándar de transparencia que incluya informes de estilo "multiverso" y la divulgación completa de los prompts utilizados.

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu2026-03-12🤖 cs.AI

Active Value Querying to Minimize Additive Error in Subadditive Set Function Learning

Este artículo propone un marco de consulta activa de valores para aproximar funciones de conjuntos subaditivas desconocidas minimizando el error aditivo entre sus completaciones mínima y máxima, abordando así la ambigüedad inherente a la especificación incompleta de estas funciones en aplicaciones como subastas combinatorias y aprendizaje automático.

Martin Černý, David Sychrovský, Filip Úradník, Jakub Černý2026-03-12🤖 cs.LG

CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework

Este artículo presenta CARE, un marco de agentes basado en evidencia que mejora la responsabilidad clínica y la precisión en el razonamiento médico multimodal al descomponer la tarea en módulos especializados coordinados que generan y verifican evidencia visual explícita, superando significativamente a los modelos de vanguardia en benchmarks médicos.

Yuexi Du, Jinglu Wang, Shujie Liu, Nicha C. Dvornek, Yan Lu2026-03-12🤖 cs.AI

CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance

El artículo presenta CFG-Ctrl, un marco unificado que reinterpreta la Guía Libre de Clasificadores (CFG) como un control de flujo generativo y propone SMC-CFG, un método basado en control por modo deslizante que supera las limitaciones de inestabilidad y overshooting de los enfoques lineales existentes, logrando una mejor alineación semántica y convergencia en modelos de generación de imágenes.

Hanyang Wang, Yiyang Liu, Jiawei Chi, Fangfu Liu, Ran Xue, Yueqi Duan2026-03-12🤖 cs.LG