cs.LG artículos | Gist.Science

Over-Searching in Search-Augmented Large Language Models

Este trabajo analiza el problema del "sobre-búsqueda" en modelos de lenguaje grandes aumentados con búsqueda, proponiendo la métrica Tokens por Corrección (TPC) para cuantificar este fenómeno, identificando sus causas y efectos negativos, y presentando estrategias de mitigación junto con el conjunto de datos OverSearchQA para fomentar investigaciones futuras.

Roy Xie, Deepak Gopinath, David Qiu, Dong Lin, Haitian Sun, Saloni Potdar, Bhuwan Dhingra2026-03-12🤖 cs.LG

Sampling via Stochastic Interpolants by Langevin-based Velocity and Initialization Estimation in Flow ODEs

Este artículo propone un método innovador para muestrear distribuciones de Boltzmann no normalizadas mediante ecuaciones diferenciales ordinarias de flujo, utilizando una secuencia de muestreadores de Langevin para generar muestras intermedias y estimar robustamente el campo de velocidades, lo que garantiza tasas de convergencia no asintóticas y demuestra alta eficiencia en distribuciones multimodales y tareas de inferencia bayesiana.

Chenguang Duan, Yuling Jiao, Gabriele Steidl, Christian Wald, Jerry Zhijian Yang, Ruizhe Zhang2026-03-12📊 stat

Error Analysis of Bayesian Inverse Problems with Generative Priors

Este artículo presenta un análisis de error con cotas cuantitativas para problemas inversos bayesianos que utilizan priores generativos entrenados con datos, demostrando que el error en la posterior hereda la tasa de convergencia del prior y validando estos resultados mediante experimentos numéricos en benchmarks y un problema inverso de EDP elíptica.

Bamdad Hosseini, Ziqi Huang2026-03-12📊 stat

Time series forecasting with Hahn Kolmogorov-Arnold networks

El artículo presenta HaKAN, un modelo de pronóstico de series temporales multivariantes basado en redes Kolmogorov-Arnold con funciones de activación aprendibles de polinomios de Hahn, que supera a los métodos actuales al ofrecer una arquitectura ligera, interpretable y capaz de capturar patrones temporales globales y locales.

Md Zahidul Hasan, A. Ben Hamza, Nizar Bouguila2026-03-12📊 stat

Breaking the Stochasticity Barrier: An Adaptive Variance-Reduced Method for Variational Inequalities

Este trabajo propone VR-SDA-A, un algoritmo adaptativo de reducción de varianza que supera la barrera de estocasticidad en desigualdades variacionales estocásticas no convexas no cóncavas mediante una verificación de curvatura y un esquema de línea de búsqueda, logrando una complejidad óptima de $O(\epsilon^{-3})$ y acelerando la convergencia en problemas de punto de silla.

Yungi Jeong, Takumi Otsuka2026-03-12🤖 cs.LG

Singular Bayesian Neural Networks

El artículo propone redes neuronales bayesianas singularmente parametrizadas mediante descomposición de bajo rango que, al concentrarse en una variedad de rango $r$ , logran una reducción significativa de parámetros y mejores límites de generalización sin sacrificar el rendimiento predictivo ni la calibración en comparación con los enfoques tradicionales.

Mame Diarra Toure, David A. Stephens2026-03-12📊 stat

Emergence of Distortions in High-Dimensional Guided Diffusion Models

Este trabajo formaliza la pérdida de diversidad en modelos de difusión con guía libre de clasificadores como una distorsión generativa que surge de una transición de fase en regímenes de alta dimensión, y propone un nuevo esquema de programación con una ventana de guía negativa para mitigar este efecto mientras se preserva la separabilidad de clases.

Enrico Ventura, Beatrice Achilli, Luca Ambrogioni, Carlo Lucibello2026-03-12📊 stat

Hallucination is a Consequence of Space-Optimality: A Rate-Distortion Theorem for Membership Testing

Este artículo demuestra teóricamente y valida empíricamente que las alucinaciones en los modelos de lenguaje son una consecuencia inevitable de la optimización de la memoria bajo capacidad limitada, donde la estrategia óptima de compresión de información requiere asignar alta confianza a hechos no reales para minimizar la pérdida de información.

Anxin Guo, Jingwei Li2026-03-12💬 cs.CL

Grounding Generated Videos in Feasible Plans via World Models

El artículo presenta GVP-WM, un método que utiliza modelos del mundo para convertir planes generados por video en secuencias de acciones factibles, corrigiendo las inconsistencias temporales y físicas mediante la optimización de trayectorias en el espacio latente.

Christos Ziakas, Amir Bar, Alessandra Russo2026-03-12🤖 cs.LG

Expert-Data Alignment Governs Generation Quality in Decentralized Diffusion Models

El estudio demuestra que la calidad de generación en los modelos de difusión descentralizados no depende de la estabilidad numérica del muestreo, sino del alineamiento entre los datos de entrada y los expertos seleccionados, quienes deben estar entrenados en distribuciones que cubran el estado actual de desruido.

Marcos Villagra, Bidhan Roy, Raihan Seraj, Zhiying Jiang2026-03-12🤖 cs.LG

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

Este artículo presenta un enfoque basado en muestreo Thompson contextual para generar secuencias de ejercicios personalizados que optimizan la mejora de habilidades en entornos educativos digitales, demostrando mediante datos de una plataforma de tutoría matemática que este método incrementa el aprendizaje y permite una instrucción adaptativa a escala.

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

Universality of General Spiked Tensor Models

Este artículo demuestra que, en el régimen de alta dimensión, el comportamiento espectral y los límites estadísticos de los modelos de tensores espigados asimétricos de rango uno son universales, es decir, coinciden con los del caso gaussiano incluso cuando el ruido tiene una distribución general con momento cuarto finito.

Yanjin Xiang, Zhihua Zhang2026-03-12📊 stat

BLITZRANK: Principled Zero-shot Ranking Agents with Tournament Graphs

El artículo presenta BLITZRANK, un marco basado en grafos de torneos que permite a los agentes de clasificación cero-shot determinar de manera principista los ítems superiores mediante comparaciones k-arias, logrando una precisión superior con una reducción significativa de tokens en comparación con métodos existentes.

Sheshansh Agrawal, Thien Hang Nguyen, Douwe Kiela2026-03-12🤖 cs.LG

Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization

Este artículo presenta FGO, un algoritmo de aprendizaje por refuerzo que comprime eficazmente el razonamiento de cadena de pensamiento en modelos de lenguaje grandes mediante la subdivisión y ponderación de respuestas, resolviendo al mismo tiempo las limitaciones de ineficiencia en el uso de datos y colapso de entropía del método GRPO sin degradar el rendimiento.

Xinchen Han, Hossam Afifi, Michel Marot, Xilu Wang, Lu Yin2026-03-12🤖 cs.LG

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

El artículo presenta GOT-JEPA, un marco de preentrenamiento predictivo que adapta modelos de seguimiento mediante una arquitectura de incrustación conjunta para mejorar la generalización y el manejo de oclusiones, complementado por OccuSolver para refinar la estimación de visibilidad y los patrones de oclusión.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-12🤖 cs.AI

LexiSafe: Offline Safe Reinforcement Learning with Lexicographic Safety-Reward Hierarchy

El artículo presenta LexiSafe, un marco de aprendizaje por refuerzo seguro offline que utiliza una jerarquía lexicográfica para priorizar la seguridad sobre la recompensa, ofreciendo garantías teóricas de complejidad de muestra y mejor rendimiento empírico en sistemas ciberfísicos críticos.

Hsin-Jung Yang, Zhanhong Jiang, Prajwal Koirala, Qisai Liu, Cody Fleming, Soumik Sarkar2026-03-12⚡ eess

ZACH-ViT: Regime-Dependent Inductive Bias in Compact Vision Transformers for Medical Imaging

El artículo presenta ZACH-ViT, un transformador de visión compacto que elimina las codificaciones posicionales y el token [CLS] para lograr un procesamiento de parches invariante a permutaciones, demostrando que esta arquitectura adaptada a la estructura de los datos médicos alcanza un rendimiento competitivo en escenarios de pocos datos, especialmente cuando la disposición espacial es débilmente informativa.

Athanasios Angelakis2026-03-12⚡ eess

Benchmarking Graph Neural Networks in Solving Hard Constraint Satisfaction Problems

Este artículo propone nuevos benchmarks rigurosos basados en problemas aleatorios desde una perspectiva de física estadística para evaluar redes neuronales gráficas en problemas de satisfacción de restricciones, demostrando que, en comparación justa, los algoritmos clásicos siguen superando a las redes neuronales.

Geri Skenderi, Lorenzo Buffoni, Francesco D'Amico, David Machado, Raffaele Marino, Matteo Negri, Federico Ricci-Tersenghi, Carlo Lucibello, Maria Chiara Angelini2026-03-12🔬 cond-mat

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

Este estudio demuestra que los analistas autónomos basados en modelos de lenguaje grande pueden replicar a gran escala y bajo costo la diversidad analítica humana, generando una amplia dispersión de resultados que subraya la necesidad de un nuevo estándar de transparencia que incluya informes de estilo "multiverso" y la divulgación completa de los prompts utilizados.

Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu2026-03-12🤖 cs.AI

Active Value Querying to Minimize Additive Error in Subadditive Set Function Learning

Este artículo propone un marco de consulta activa de valores para aproximar funciones de conjuntos subaditivas desconocidas minimizando el error aditivo entre sus completaciones mínima y máxima, abordando así la ambigüedad inherente a la especificación incompleta de estas funciones en aplicaciones como subastas combinatorias y aprendizaje automático.

Martin Černý, David Sychrovský, Filip Úradník, Jakub Černý2026-03-12🤖 cs.LG

← Anterior Siguiente →