cs.LG artículos | Gist.Science

LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks

El artículo presenta LoRA-Ensemble, un método eficiente de ensembling implícito para redes de autoatención que utiliza adaptaciones de bajo rango (LoRA) compartidas para lograr una precisión y calibración de incertidumbre superiores a las técnicas existentes, igualando o superando el rendimiento de los ensembles explícitos con un costo computacional significativamente menor.

Dominik J. Mühlematter, Michelle Halbheer, Alexander Becker, Dominik Narnhofer, Helge Aasen, Konrad Schindler, Mehmet Ozgur Turkoglu2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

El artículo presenta FEX, un marco de explicación rápida que optimiza distribuciones de atribución mediante gradientes de política, logrando una reducción superior al 97% en el tiempo de inferencia y un 70% en el uso de memoria frente a enfoques agnósticos al modelo, sin sacrificar la calidad ni la aplicabilidad general.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Este artículo identifica y explica la etapa de corrupción en el ajuste fino de pocos ejemplos de modelos de difusión, proponiendo el uso de redes neuronales bayesianas para mitigar este fenómeno y mejorar la fidelidad, calidad y diversidad de las imágenes generadas sin incurrir en costos adicionales de inferencia.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

DKDL-Net: A Lightweight Bearing Fault Detection Model via Decoupled Knowledge Distillation and Low-Rank Adaptation Fine-tuning

Este artículo presenta DKDL-Net, un modelo ligero para la detección de fallos en rodamientos que combina la destilación de conocimiento desacoplada y el ajuste fino de bajo rango para lograr una precisión del 99,48% con una complejidad computacional significativamente reducida en comparación con los métodos existentes.

Ovanes Petrosian, Li Pengyi, He Yulong + 4 more2026-03-10🤖 cs.LG

Estimating Treatment Effects under Algorithmic Interference: A Structured Neural Networks Approach

Este artículo presenta un marco semiparamétrico estructurado basado en redes neuronales y aprendizaje automático doble que corrige el sesgo en la estimación de efectos de tratamiento causado por la interferencia algorítmica en mercados de dos lados, demostrando mediante simulaciones y experimentos de campo que supera a los estimadores estándar al predecir con precisión el efecto global de la implementación de algoritmos en plataformas de contenido.

Ruohan Zhan, Shichao Han, Yuchen Hu, Zhenling Jiang2026-03-10🤖 cs.LG

LAMBDA: A Large Model Based Data Agent

El artículo presenta LAMBDA, un sistema de análisis de datos multiagente de código abierto y sin necesidad de programación que utiliza modelos de lenguaje grandes, roles especializados de programador e inspector, y mecanismos de integración de conocimiento para facilitar la colaboración entre humanos e inteligencia artificial en tareas de análisis de datos.

Maojun Sun, Ruijian Han, Binyan Jiang + 4 more2026-03-10🤖 cs.AI

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

El artículo presenta OTAD, un modelo de defensa adversarial robusto que combina el entrenamiento de redes neuronales con regularización basada en transporte óptimo y la interpolación mediante problemas de integración convexa para lograr tanto una alta precisión en los datos como una continuidad Lipschitz local certificada.

Kuo Gai, Sicong Wang, Shihua Zhang2026-03-10🤖 cs.LG

Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance

Este artículo establece las bases estadísticas y ofrece orientación práctica para el estimador de máxima verosimilitud parcial por mini-lotes (mb-MPLE) en modelos de Cox profundos, demostrando su consistencia, convergencia óptima y utilidad en aplicaciones a gran escala donde los métodos estándar son inviables.

Lang Zeng, Weijing Tang, Zhao Ren, Ying Ding2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Este trabajo propone un enfoque de muestreo de importancia con recocido (AIS) combinado con aprendizaje variacional para mejorar la inferencia en Modelos de Variables Latentes de Procesos Gaussianos, logrando límites variacionales más ajustados y una convergencia más robusta en espacios de alta dimensión.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

The Z-Gromov-Wasserstein Distance

Este artículo introduce la distancia Z-Gromov-Wasserstein como un marco teórico unificado para comparar Z-redes (espacios de medida con kernels en un espacio métrico arbitrario Z), demostrando que esta generalización define una métrica con propiedades deseables como completitud y geodesicidad, y ofreciendo además cotas inferiores computables para aplicaciones prácticas.

Martin Bauer, Facundo Mémoli, Tom Needham + 1 more2026-03-10🤖 cs.LG

From Model Explanation to Data Misinterpretation: A Cautionary Analysis of Post Hoc Explainers in Business Research

Este estudio advierte que los explicadores post hoc como SHAP y LIME, aunque útiles para generar hipótesis exploratorias, no deben utilizarse para validar hipótesis en investigación empresarial debido a su falta de fiabilidad en la recuperación de relaciones causales reales, especialmente cuando existen correlaciones entre variables o el efecto Rashomon.

Tong Wang (Jeffrey), Ronilo Ragodos (Jeffrey), Lu Feng (Jeffrey), Yu (Jeffrey), Hu2026-03-10🤖 cs.LG

Reconsidering the energy efficiency of spiking neural networks

Este artículo presenta una reevaluación rigurosa de la eficiencia energética de las redes neuronales de espigas (SNN) frente a las redes neuronales cuantizadas (QNN), demostrando mediante un modelo analítico detallado que las SNN solo superan a las QNN bajo condiciones específicas de hardware y parámetros operativos, como tasas de espiga bajas y ventanas temporales moderadas, lo que podría duplicar la vida útil de la batería en dispositivos como relojes inteligentes.

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

Este trabajo presenta una red de osciladores acoplados (CON) que, al garantizar una estructura lagrangiana, estabilidad global y un mapeo invertible entre entrada y fuerza latente, permite un control basado en modelos de espacio latente eficiente y de alto rendimiento utilizando únicamente imágenes como retroalimentación.

Maximilian Stölzle, Cosimo Della Santina2026-03-10🤖 cs.LG

xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing

El artículo presenta xTED, un marco que utiliza un modelo de difusión para editar trayectorias de un dominio fuente y adaptarlas a un dominio objetivo, corrigiendo las brechas de dominio a nivel de datos para mejorar el aprendizaje de políticas sin necesidad de arquitecturas complejas.

Haoyi Niu, Qimao Chen, Tenglong Liu, Jianxiong Li, Guyue Zhou, Yi Zhang, Jianming Hu, Xianyuan Zhan2026-03-10🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

Este trabajo presenta BNEM, un muestreador de Boltzmann basado en la coincidencia de energía ruidosa y una técnica de *bootstrapping* que permite generar muestras independientes a partir de funciones de energía conocidas, logrando un rendimiento superior y mayor robustez en comparación con métodos existentes.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action

Este artículo demuestra que, para una clase de procesos de decisión de Markov de horizonte finito con espacios generales de estado y acción, el paisaje de optimización de políticas satisface la condición PŁK, lo que garantiza la convergencia global de los métodos de gradiente de política a la política óptima con tasas no asintóticas y proporciona las primeras garantías de complejidad de muestra para sistemas de inventario y balances de efectivo estocásticos.

Xin Chen, Yifan Hu, Minda Zhao2026-03-10🤖 cs.LG

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

Este artículo presenta un marco de Ecuaciones Diferenciales con Retardo Neuronales (NDDEs) inspirado en el formalismo Mori-Zwanzig para aprender dinámicas no markovianas a partir de datos de sistemas parcialmente observables, demostrando un rendimiento superior frente a métodos existentes como las redes LSTM y las ANODEs.

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

Open-World Reinforcement Learning over Long Short-Term Imagination

El artículo presenta LS-Imagine, un enfoque que mejora la eficiencia de exploración en entornos de aprendizaje por refuerzo de mundo abierto mediante un modelo de mundo de "largo y corto plazo" que simula transiciones de estado saltarinas y mapas de afección para integrar valores a largo plazo en el aprendizaje de comportamientos.

Jiajian Li, Qi Wang, Yunbo Wang, Xin Jin, Yang Li, Wenjun Zeng, Xiaokang Yang2026-03-10🤖 cs.LG

How Learning Dynamics Drive Adversarially Robust Generalization?

Este artículo presenta un marco analítico PAC-Bayesiano que modela el entrenamiento adversarial como un sistema dinámico discreto para explicar mecánicamente el sobreajuste robusto y demostrar cómo la perturbación de pesos adversarios puede reducir la brecha de generalización al suprimir la curvatura de la pérdida, aunque con posibles limitaciones de optimización.

Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

Transformers as Implicit State Estimators: In-Context Learning in Dynamical Systems

Este trabajo demuestra que los transformadores, mediante el aprendizaje en contexto, pueden inferir implícitamente estados ocultos para predecir con alta precisión la salida de sistemas dinámicos lineales y no lineales sin necesidad de actualizaciones de gradiente ni conocimiento explícito del modelo, rivalizando así con métodos de filtrado bayesiano tradicionales como el filtro de Kalman.

Usman Akram, Haris Vikalo2026-03-10🤖 cs.LG

← Anterior Siguiente →