cs.LG artículos | Gist.Science

Time series forecasting with Hahn Kolmogorov-Arnold networks

El artículo presenta HaKAN, un modelo de pronóstico de series temporales multivariantes basado en redes Kolmogorov-Arnold con funciones de activación aprendibles de polinomios de Hahn, que supera a los métodos actuales al ofrecer una arquitectura ligera, interpretable y capaz de capturar patrones temporales globales y locales.

Md Zahidul Hasan, A. Ben Hamza, Nizar Bouguila2026-03-12📊 stat

Breaking the Stochasticity Barrier: An Adaptive Variance-Reduced Method for Variational Inequalities

Este trabajo propone VR-SDA-A, un algoritmo adaptativo de reducción de varianza que supera la barrera de estocasticidad en desigualdades variacionales estocásticas no convexas no cóncavas mediante una verificación de curvatura y un esquema de línea de búsqueda, logrando una complejidad óptima de $O(\epsilon^{-3})$ y acelerando la convergencia en problemas de punto de silla.

Yungi Jeong, Takumi Otsuka2026-03-12🤖 cs.LG

Singular Bayesian Neural Networks

El artículo propone redes neuronales bayesianas singularmente parametrizadas mediante descomposición de bajo rango que, al concentrarse en una variedad de rango $r$ , logran una reducción significativa de parámetros y mejores límites de generalización sin sacrificar el rendimiento predictivo ni la calibración en comparación con los enfoques tradicionales.

Mame Diarra Toure, David A. Stephens2026-03-12📊 stat

Emergence of Distortions in High-Dimensional Guided Diffusion Models

Este trabajo formaliza la pérdida de diversidad en modelos de difusión con guía libre de clasificadores como una distorsión generativa que surge de una transición de fase en regímenes de alta dimensión, y propone un nuevo esquema de programación con una ventana de guía negativa para mitigar este efecto mientras se preserva la separabilidad de clases.

Enrico Ventura, Beatrice Achilli, Luca Ambrogioni, Carlo Lucibello2026-03-12📊 stat

Hallucination is a Consequence of Space-Optimality: A Rate-Distortion Theorem for Membership Testing

Este artículo demuestra teóricamente y valida empíricamente que las alucinaciones en los modelos de lenguaje son una consecuencia inevitable de la optimización de la memoria bajo capacidad limitada, donde la estrategia óptima de compresión de información requiere asignar alta confianza a hechos no reales para minimizar la pérdida de información.

Anxin Guo, Jingwei Li2026-03-12💬 cs.CL

Grounding Generated Videos in Feasible Plans via World Models

El artículo presenta GVP-WM, un método que utiliza modelos del mundo para convertir planes generados por video en secuencias de acciones factibles, corrigiendo las inconsistencias temporales y físicas mediante la optimización de trayectorias en el espacio latente.

Christos Ziakas, Amir Bar, Alessandra Russo2026-03-12🤖 cs.LG

Expert-Data Alignment Governs Generation Quality in Decentralized Diffusion Models

El estudio demuestra que la calidad de generación en los modelos de difusión descentralizados no depende de la estabilidad numérica del muestreo, sino del alineamiento entre los datos de entrada y los expertos seleccionados, quienes deben estar entrenados en distribuciones que cubran el estado actual de desruido.

Marcos Villagra, Bidhan Roy, Raihan Seraj, Zhiying Jiang2026-03-12🤖 cs.LG

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

Este artículo presenta un enfoque basado en muestreo Thompson contextual para generar secuencias de ejercicios personalizados que optimizan la mejora de habilidades en entornos educativos digitales, demostrando mediante datos de una plataforma de tutoría matemática que este método incrementa el aprendizaje y permite una instrucción adaptativa a escala.

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

Universality of General Spiked Tensor Models

Este artículo demuestra que, en el régimen de alta dimensión, el comportamiento espectral y los límites estadísticos de los modelos de tensores espigados asimétricos de rango uno son universales, es decir, coinciden con los del caso gaussiano incluso cuando el ruido tiene una distribución general con momento cuarto finito.

Yanjin Xiang, Zhihua Zhang2026-03-12📊 stat

BLITZRANK: Principled Zero-shot Ranking Agents with Tournament Graphs

El artículo presenta BLITZRANK, un marco basado en grafos de torneos que permite a los agentes de clasificación cero-shot determinar de manera principista los ítems superiores mediante comparaciones k-arias, logrando una precisión superior con una reducción significativa de tokens en comparación con métodos existentes.

Sheshansh Agrawal, Thien Hang Nguyen, Douwe Kiela2026-03-12🤖 cs.LG

Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization

Este artículo presenta FGO, un algoritmo de aprendizaje por refuerzo que comprime eficazmente el razonamiento de cadena de pensamiento en modelos de lenguaje grandes mediante la subdivisión y ponderación de respuestas, resolviendo al mismo tiempo las limitaciones de ineficiencia en el uso de datos y colapso de entropía del método GRPO sin degradar el rendimiento.

Xinchen Han, Hossam Afifi, Michel Marot, Xilu Wang, Lu Yin2026-03-12🤖 cs.LG

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

El artículo presenta GOT-JEPA, un marco de preentrenamiento predictivo que adapta modelos de seguimiento mediante una arquitectura de incrustación conjunta para mejorar la generalización y el manejo de oclusiones, complementado por OccuSolver para refinar la estimación de visibilidad y los patrones de oclusión.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-12🤖 cs.AI

LexiSafe: Offline Safe Reinforcement Learning with Lexicographic Safety-Reward Hierarchy

El artículo presenta LexiSafe, un marco de aprendizaje por refuerzo seguro offline que utiliza una jerarquía lexicográfica para priorizar la seguridad sobre la recompensa, ofreciendo garantías teóricas de complejidad de muestra y mejor rendimiento empírico en sistemas ciberfísicos críticos.

Hsin-Jung Yang, Zhanhong Jiang, Prajwal Koirala, Qisai Liu, Cody Fleming, Soumik Sarkar2026-03-12⚡ eess

ZACH-ViT: Regime-Dependent Inductive Bias in Compact Vision Transformers for Medical Imaging

El artículo presenta ZACH-ViT, un transformador de visión compacto que elimina las codificaciones posicionales y el token [CLS] para lograr un procesamiento de parches invariante a permutaciones, demostrando que esta arquitectura adaptada a la estructura de los datos médicos alcanza un rendimiento competitivo en escenarios de pocos datos, especialmente cuando la disposición espacial es débilmente informativa.

Athanasios Angelakis2026-03-12⚡ eess

Benchmarking Graph Neural Networks in Solving Hard Constraint Satisfaction Problems

Este artículo propone nuevos benchmarks rigurosos basados en problemas aleatorios desde una perspectiva de física estadística para evaluar redes neuronales gráficas en problemas de satisfacción de restricciones, demostrando que, en comparación justa, los algoritmos clásicos siguen superando a las redes neuronales.

Geri Skenderi, Lorenzo Buffoni, Francesco D'Amico, David Machado, Raffaele Marino, Matteo Negri, Federico Ricci-Tersenghi, Carlo Lucibello, Maria Chiara Angelini2026-03-12🔬 cond-mat

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

Este estudio demuestra que los analistas autónomos basados en modelos de lenguaje grande pueden replicar a gran escala y bajo costo la diversidad analítica humana, generando una amplia dispersión de resultados que subraya la necesidad de un nuevo estándar de transparencia que incluya informes de estilo "multiverso" y la divulgación completa de los prompts utilizados.

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu2026-03-12🤖 cs.AI

Active Value Querying to Minimize Additive Error in Subadditive Set Function Learning

Este artículo propone un marco de consulta activa de valores para aproximar funciones de conjuntos subaditivas desconocidas minimizando el error aditivo entre sus completaciones mínima y máxima, abordando así la ambigüedad inherente a la especificación incompleta de estas funciones en aplicaciones como subastas combinatorias y aprendizaje automático.

Martin Černý, David Sychrovský, Filip Úradník, Jakub Černý2026-03-12🤖 cs.LG

How Large Language Models Get Stuck: Early structure with persistent errors

El estudio demuestra que los modelos de lenguaje grandes como OPT pueden quedar atrapados en errores tempranos y persistentes durante el entrenamiento debido a sesgos estadísticos de bigramas, lo que dificulta su capacidad para aprender correctamente ciertas reglas gramaticales incluso después de un extenso entrenamiento.

Alokesh Manna, William Snyder, Whitney Tabor2026-03-12💬 cs.CL

CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework

Este artículo presenta CARE, un marco de agentes basado en evidencia que mejora la responsabilidad clínica y la precisión en el razonamiento médico multimodal al descomponer la tarea en módulos especializados coordinados que generan y verifican evidencia visual explícita, superando significativamente a los modelos de vanguardia en benchmarks médicos.

Yuexi Du, Jinglu Wang, Shujie Liu, Nicha C. Dvornek, Yan Lu2026-03-12🤖 cs.AI

CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance

El artículo presenta CFG-Ctrl, un marco unificado que reinterpreta la Guía Libre de Clasificadores (CFG) como un control de flujo generativo y propone SMC-CFG, un método basado en control por modo deslizante que supera las limitaciones de inestabilidad y overshooting de los enfoques lineales existentes, logrando una mejor alineación semántica y convergencia en modelos de generación de imágenes.

Hanyang Wang, Yiyang Liu, Jiawei Chi, Fangfu Liu, Ran Xue, Yueqi Duan2026-03-12🤖 cs.LG

← Anterior Siguiente →