cs.LG artículos | Gist.Science

How Far Can Unsupervised RLVR Scale LLM Training?

Este trabajo analiza exhaustivamente el aprendizaje por refuerzo no supervisado con recompensas verificables (URLVR), demostrando que los métodos intrínsecos sufren un colapso inevitable cuando la confianza inicial del modelo no se alinea con la corrección, mientras que sugiere que las recompensas externas basadas en asimetrías computacionales podrían ofrecer una vía para superar estas limitaciones.

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Characterization and upgrade of a quantum graph neural network for charged particle tracking

Este artículo presenta la caracterización y mejora de una red neuronal cuántica de grafos híbrida para la reconstrucción de trayectorias de partículas cargadas en el LHC, demostrando una mejoría en el comportamiento de entrenamiento y la convergencia del modelo.

Matteo Argenton, Laura Cappelli, Concezio Bozzi2026-03-10⚛️ quant-ph

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Este artículo presenta Momentum SVGD-EM, un método acelerado mediante la introducción de aceleración de Nesterov en los parámetros y en el espacio de medidas de probabilidad para optimizar la estimación de máxima verosimilitud marginal (MMLE) mediante el descenso de gradiente variacional de Stein (SVGD), logrando una convergencia más rápida en diversos escenarios de baja y alta dimensionalidad.

Adam Rozzio, Rafael Athanasiades, O. Deniz Akyildiz2026-03-10🤖 cs.LG

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Este trabajo emplea el marco de búsqueda evolutiva guiada por IA AlphaEvolve para identificar un nuevo caso límite que establece un límite inferior de 2.0749 en la relación entre el beneficio social óptimo y el obtenido por el mecanismo del oferente aleatorio, superando así las cotas anteriores de 2.02.

Yang Cai, Vineet Gupta, Zun Li, Aranyak Mehta2026-03-10🤖 cs.LG

Structural Causal Bottleneck Models

Este artículo introduce los modelos de cuello de botella causal estructural (SCBMs), un marco novedoso que asume que los efectos causales entre variables de alta dimensión dependen únicamente de estadísticas resumidas de baja dimensión, permitiendo una reducción de dimensiones específica para tareas y una estimación eficiente en escenarios de aprendizaje con pocas muestras.

Simon Bing, Jonas Wahl, Jakob Runge2026-03-10🤖 cs.LG

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

El artículo presenta Trilobyte, un esquema de tokenización a nivel de byte que hace viable la compresión sin pérdidas de audio de 24 bits mediante modelos de lenguaje autoregresivos, demostrando que, aunque superan a FLAC en audio de 8 y 16 bits, sus ventajas de compresión se vuelven más modestas a medida que aumenta la profundidad de bits.

Phillip Long, Zachary Novack, Chris Donahue2026-03-10🤖 cs.LG

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

Este trabajo propone un algoritmo heurístico de optimización conjunta para arquitecturas de Aprendizaje Federado Dividido Jerárquico que, al considerar explícitamente las capas de particionamiento y la asignación de clientes, logra mejorar la precisión del modelo en un 3% y reducir la latencia y la sobrecarga de comunicación en un 20% y 50% respectivamente en comparación con los métodos actuales.

Yiannis Papageorgiou, Yannis Thomas, Ramin Khalili, Iordanis Koutsopoulos2026-03-10🤖 cs.LG

Agentic Critical Training

El artículo presenta la Entrenamiento Crítico Agente (ACT), un paradigma de aprendizaje por refuerzo que supera las limitaciones del aprendizaje por imitación al entrenar a los agentes para que desarrollen un razonamiento autónomo sobre la calidad de sus acciones mediante la comparación de alternativas, logrando así mejoras significativas en el rendimiento y la generalización en diversas tareas de agentes.

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting

El artículo presenta "Impermanent", un nuevo benchmark en vivo que evalúa la generalización temporal de modelos de pronóstico de series temporales mediante el escalamiento secuencial de datos en flujo continuo (específicamente actividad de GitHub), superando las limitaciones de las divisiones estáticas tradicionales para medir la robustez frente a cambios distribucionales y la estabilidad del rendimiento a lo largo del tiempo.

Azul Garza, Renée Rosillo, Rodrigo Mendoza-Smith, David Salinas, Andrew Robert Williams, Arjun Ashok, Mononito Goswami, José Martín Juárez2026-03-10🤖 cs.LG

A mixed-frequency approach for exchange rates predictions

Este artículo propone un enfoque basado en modelos de frecuencia mixta para superar la pérdida de información derivada de la agregación temporal y mejorar la predicción del tipo de cambio CAD/USD, abordando así el acertijo de Meese y Rogoff sobre la imprevisibilidad de las fluctuaciones cambiarias.

Raffaele Mattera, Michelangelo Misuraca, Germana Scepi, Maria Spano2026-03-09🤖 cs.LG

A Cognitive Explainer for Fetal ultrasound images classifier Based on Medical Concepts

Este trabajo propone un marco interpretable basado en conceptos médicos clave y una red neuronal convolutiva de grafos (GCN) para explicar las decisiones de clasificación de imágenes de ultrasonido fetal desde la perspectiva de la cognición clínica, abordando así la falta de transparencia de los modelos de aprendizaje profundo tradicionales.

Yingni Wanga, Yunxiao Liua, Licong Dongc, Xuzhou Wua, Huabin Zhangb, Qiongyu Yed, Desheng Sunc, Xiaobo Zhoue, Kehong Yuan2026-03-09🤖 cs.AI

Correlations Between COVID-19 and Dengue

Este artículo presenta un modelo de redes neuronales, específicamente una red de memoria a corto y largo plazo (LSTM), que demuestra una fuerte correlación entre las tendencias de COVID-19 y dengue para predecir casos de dengue en países con datos insuficientes utilizando la información de COVID-19.

Paula Bergero, Laura P. Schaposnik, Grace Wang2026-03-09🧬 q-bio

Graph Neural Networks on Factor Graphs for Robust, Fast, and Scalable Linear State Estimation with PMUs

Este artículo presenta un método escalable y robusto para la estimación de estado lineal en sistemas de potencia que utiliza redes neuronales de grafos sobre grafos de factores para aprovechar las mediciones de unidades de medición fasorial, logrando una complejidad computacional lineal y una alta tolerancia a fallos locales.

Ognjen Kundacina, Mirsad Cosovic, Dragisa Miskovic + 1 more2026-03-09⚡ eess

Expert-Aided Causal Discovery of Ancestral Graphs

Este artículo presenta Ancestral GFlowNet (AGFN), un algoritmo de aprendizaje por refuerzo que realiza inferencia distribucional sobre grafos ancestrales integrando conocimiento experto a priori y retroalimentación incierta a posteriori para refinar modelos causales bajo confusión latente.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena Ribeiro2026-03-09🤖 cs.LG

A unified framework for learning with nonlinear model classes from arbitrary linear samples

Este artículo presenta un marco unificado que establece garantías de aprendizaje óptimas para recuperar objetos desconocidos a partir de muestras lineales arbitrarias utilizando clases de modelos no lineales, introduciendo el concepto de "variación" para cuantificar la interacción entre el modelo y el proceso de medición y generalizando resultados previos en áreas como el muestreo comprimido y el escalamiento de matrices.

Ben Adcock, Juan M. Cardenas, Nick Dexter2026-03-09🤖 cs.LG

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

Este artículo deriva estimaciones teóricas del límite inferior de energía por solución para optimizadores neuromórficos de aprendizaje en memoria, basadas en la termodinámica fuera del equilibrio y aplicables a cargas de trabajo de IA a gran escala.

Zihao Chen, Faiek Ahsan, Johannes Leugering, Gert Cauwenberghs, Shantanu Chakrabartty2026-03-09🤖 cs.AI

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

Este artículo propone un sistema de detección de alucinaciones visuales en imágenes de personajes de dibujos animados que utiliza modelos de lenguaje-visión con aprendizaje en contexto y guías de pose, logrando mejoras significativas en la precisión respecto a los métodos basados únicamente en imágenes RGB.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

BInD: Bond and Interaction-generating Diffusion Model for Multi-objective Structure-based Drug Design

El modelo BInD es una arquitectura de difusión basada en conocimiento que aborda las limitaciones de los métodos existentes al generar simultáneamente moléculas y sus interacciones con proteínas diana, logrando un rendimiento equilibrado y superior en múltiples objetivos para el diseño de fármacos.

Joongwon Lee, Wonho Zhung, Jisu Seo, Woo Youn Kim2026-03-09🤖 cs.LG

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Este artículo presenta una novedosa pipeline de aprendizaje activo en dos etapas para el reconocimiento automático del habla que combina la selección de muestras diversas mediante agrupamiento de x-vectores y la identificación de muestras informativas con un método bayesiano adaptado, logrando así un entrenamiento de modelos más eficiente con menos datos etiquetados.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Este trabajo ofrece una revisión exhaustiva y una especificación formal de las redes de codificación predictiva, situándolas como un marco versátil y biológicamente plausible dentro de la inteligencia artificial moderna que supera las limitaciones de la retropropagación tradicional.

Björn van Zwol, Ro Jefferson, Egon L. van den Broek2026-03-09🤖 cs.AI

← Anterior Siguiente →