cs.LG artículos | Gist.Science

Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action

Este artículo demuestra que, para una clase de procesos de decisión de Markov de horizonte finito con espacios generales de estado y acción, el paisaje de optimización de políticas satisface la condición PŁK, lo que garantiza la convergencia global de los métodos de gradiente de política a la política óptima con tasas no asintóticas y proporciona las primeras garantías de complejidad de muestra para sistemas de inventario y balances de efectivo estocásticos.

Xin Chen, Yifan Hu, Minda Zhao2026-03-10🤖 cs.LG

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

Este artículo presenta un marco de Ecuaciones Diferenciales con Retardo Neuronales (NDDEs) inspirado en el formalismo Mori-Zwanzig para aprender dinámicas no markovianas a partir de datos de sistemas parcialmente observables, demostrando un rendimiento superior frente a métodos existentes como las redes LSTM y las ANODEs.

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

Open-World Reinforcement Learning over Long Short-Term Imagination

El artículo presenta LS-Imagine, un enfoque que mejora la eficiencia de exploración en entornos de aprendizaje por refuerzo de mundo abierto mediante un modelo de mundo de "largo y corto plazo" que simula transiciones de estado saltarinas y mapas de afección para integrar valores a largo plazo en el aprendizaje de comportamientos.

Jiajian Li, Qi Wang, Yunbo Wang, Xin Jin, Yang Li, Wenjun Zeng, Xiaokang Yang2026-03-10🤖 cs.LG

How Learning Dynamics Drive Adversarially Robust Generalization?

Este artículo presenta un marco analítico PAC-Bayesiano que modela el entrenamiento adversarial como un sistema dinámico discreto para explicar mecánicamente el sobreajuste robusto y demostrar cómo la perturbación de pesos adversarios puede reducir la brecha de generalización al suprimir la curvatura de la pérdida, aunque con posibles limitaciones de optimización.

Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

Transformers as Implicit State Estimators: In-Context Learning in Dynamical Systems

Este trabajo demuestra que los transformadores, mediante el aprendizaje en contexto, pueden inferir implícitamente estados ocultos para predecir con alta precisión la salida de sistemas dinámicos lineales y no lineales sin necesidad de actualizaciones de gradiente ni conocimiento explícito del modelo, rivalizando así con métodos de filtrado bayesiano tradicionales como el filtro de Kalman.

Usman Akram, Haris Vikalo2026-03-10🤖 cs.LG

Adaptive Transfer Clustering: A Unified Framework

Los autores proponen un marco unificado de aprendizaje por transferencia para el agrupamiento, denominado ATC, que optimiza automáticamente el aprovechamiento de la información común entre conjuntos de datos principales y auxiliares a pesar de discrepancias desconocidas, demostrando su optimalidad teórica y eficacia práctica en diversos modelos estadísticos.

Yuqi Gu, Zhongyuan Lyu, Kaizheng Wang2026-03-10🤖 cs.LG

A Learned Proximal Alternating Minimization Algorithm and Its Induced Network for a Class of Two-block Nonconvex and Nonsmooth Optimization

Este trabajo propone un algoritmo de minimización alternada proximal aprendida (LPAM) y su red neuronal asociada (LPAM-net) para resolver problemas de optimización no convexos y no suaves de dos bloques, garantizando la convergencia a puntos estacionarios de Clarke y demostrando su eficacia y eficiencia paramétrica en la reconstrucción de imágenes de resonancia magnética multimodal.

Yunmei Chen, Lezhi Liu, Lei Zhang2026-03-10🤖 cs.LG

Autoassociative Learning of Structural Representations for Modeling and Classification in Medical Imaging

Este estudio propone un sistema neurosimbólico que reconstruye imágenes mediante primitivas visuales para generar explicaciones estructurales de alto nivel, logrando una mayor precisión y transparencia que las arquitecturas de aprendizaje profundo convencionales en el diagnóstico de anomalías en imágenes histológicas.

Zuzanna Buchnajzer, Kacper Dobek, Stanisław Hapke, Daniel Jankowski, Krzysztof Krawiec2026-03-10🤖 cs.LG

Puppet-CNN: Continuous Parameter Dynamics for Input-Adaptive Convolutional Networks

El artículo presenta Puppet-CNN, un marco que modela los parámetros de las redes neuronales convolucionales como un sistema dinámico continuo gobernado por una ecuación diferencial, lo que permite generar capas de manera adaptativa según la complejidad de la entrada y reducir significativamente los parámetros entrenables sin sacrificar el rendimiento.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Input-Adaptive Generative Dynamics in Diffusion Models

Este trabajo propone un marco para modelos de difusión que adapta dinámicamente el proceso de generación a la complejidad de cada muestra, logrando reducir el número de pasos de muestreo sin comprometer la calidad de las imágenes generadas.

Yucheng Xing, Xiaodong Liu, Xin Wang2026-03-10🤖 cs.LG

Optimizing Locomotor Task Sets in Biological Joint Moment Estimation for Hip Exoskeleton Applications

Este estudio presenta una estrategia de optimización de tareas locomotoras que, mediante análisis de agrupamiento de características biomecánicas, identifica un conjunto mínimo de tareas representativas para entrenar modelos de aprendizaje profundo que estiman con precisión los momentos articulares de la cadera, reduciendo significativamente la carga de recolección de datos sin comprometer el rendimiento del control del exoesqueleto.

Jimin An, Changseob Song, Eni Halilaj + 1 more2026-03-10🤖 cs.LG

Finite Sample Bounds for Non-Parametric Regression: Optimal Sample Efficiency and Space Complexity

Este artículo propone un método paramétrico de regresión no paramétrica que logra tasas de convergencia uniformes minimax óptimas para estimar funciones suaves y sus derivadas, resolviendo simultáneamente los problemas de alto costo computacional y memoria de los estimadores tradicionales mediante un enfoque ligero con límites finitos agudos y complejidad espacial reducida.

Davide Maran, Marcello Restelli2026-03-10🤖 cs.LG

GDM4MMIMO: Generative Diffusion Models for Massive MIMO Communications

Este artículo explora el potencial de los modelos de difusión generativos (GDM) en las comunicaciones MIMO masivas, ofreciendo una visión general de su marco teórico, presentando un estudio de caso sobre estimación de canales en campo cercano y delineando los desafíos y direcciones futuras para su aplicación en las redes 6G.

Zhenzhou Jin, Li You, Huibin Zhou + 6 more2026-03-10⚡ eess

Exploring Embedding Priors in Prompt-Tuning for Improved Interpretability and Control

Este trabajo investiga el papel del colapso de embeddings en el Prompt-Tuning, demostrando que los priors de embeddings influyen significativamente en la posición de los embeddings ajustados y que las capacidades de generalización de los modelos de lenguaje pueden funcionar en regiones activas diversas y no necesariamente localizadas en un único clúster.

Sergey Sedov, Sumanth Bharadwaj Hachalli Karanam, Venu Gopal Kadamba2026-03-10🤖 cs.LG

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Este trabajo presenta un método que utiliza modelos de visión y lenguaje preentrenados para aprender modelos de mundo simbólicos a partir de demostraciones cortas, permitiendo a los robots generalizar de forma cero-shot y resolver problemas de toma de decisiones a largo plazo en entornos complejos mediante planificación.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

UFGraphFR: Graph Federation Recommendation System based on User Text description features

El artículo presenta UFGraphFR, un sistema de recomendación federado que mejora la precisión y la personalización preservando la privacidad al transformar los datos locales en descripciones textuales para construir gráficos de relaciones de usuarios basados en similitud semántica y propagar información mediante redes neuronales gráficas ligeras y arquitecturas Transformer.

Xudong Wang, Qingbo Hao, Yingyuan Xiao2026-03-10🤖 cs.LG

Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction

Este artículo propone estrategias de reducción de datos basadas en agrupamiento latente para optimizar la eficiencia de la entrenamiento adversario semi-supervisado (SSAT), logrando una robustez comparable con 5 a 10 veces menos datos no etiquetados y reduciendo el tiempo de ejecución en 3 a 4 veces.

Somrita Ghosh, Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

The Exploration of Error Bounds in Classification with Noisy Labels

Este artículo establece límites de error para el riesgo excesivo en problemas de clasificación con etiquetas ruidosas dentro de marcos de aprendizaje profundo, descomponiendo el error en componentes estadísticos y de aproximación mediante técnicas de bloques independientes y la hipótesis de variedades de baja dimensión.

Haixia Liu, Boxiao Li, Can Yang, Yang Wang2026-03-10🤖 cs.LG

Strengthening Generative Robot Policies through Predictive World Modeling

El artículo presenta el control predictivo generativo (GPC), un marco de aprendizaje que combina la clonación de una política difusiva con un modelo de mundo predictivo para sintetizar un planificador en línea que supera consistentemente a la clonación de comportamiento en diversas tareas de manipulación robótica.

Han Qi, Haocheng Yin, Aris Zhu, Yilun Du, Heng Yang2026-03-10🤖 cs.LG

General Coded Computing in a Probabilistic Straggler Regime

Este artículo analiza teóricamente y valida experimentalmente cómo dos esquemas de computación codificada general (BACC y LeTCC) logran que el error de aproximación converja a cero bajo un régimen de servidores lentos probabilístico, demostrando que la independencia en las fallas permite una precisión creciente incluso cuando el número promedio de servidores lentos escala con el tamaño del sistema.

Parsa Moradi, Mohammad Ali Maddah-Ali2026-03-10🤖 cs.LG

← Anterior Siguiente →