cs.LG artículos | Gist.Science

EvoESAP: Non-Uniform Expert Pruning for Sparse MoE

El artículo presenta EvoESAP, un marco de búsqueda evolutiva que optimiza la asignación no uniforme de la dispersidad entre capas en modelos MoE escasos mediante una métrica de proxy llamada ESAP, logrando mejoras significativas en la generación de texto abierto sin sacrificar la precisión en comparación con los métodos de poda uniformes.

Zongfang Liu, Shengkun Tang, Boyang Sun, Zhiqiang Shen, Xin Yuan2026-03-09🤖 cs.LG

Preventing Learning Stagnation in PPO by Scaling to 1 Million Parallel Environments

Este artículo demuestra que el estancamiento del aprendizaje en PPO se debe a que las estimaciones basadas en muestras se vuelven pobres proxies del objetivo real, y propone escalar a más de un millón de entornos paralelos como una solución robusta para reducir el ruido y el tamaño del paso, permitiendo mejoras de rendimiento monótonas hasta un billón de transiciones.

Michael Beukman, Khimya Khetarpal, Zeyu Zheng, Will Dabney, Jakob Foerster, Michael Dennis, Clare Lyle2026-03-09🤖 cs.LG

Agnostic learning in (almost) optimal time via Gaussian surface area

Este trabajo mejora el análisis de Klivans et al. demostrando que un grado de polinomio de $\tilde O(\Gamma^2 / \varepsilon^2)$ es suficiente para la aproximación $L_1$ bajo distribuciones gaussianas, lo que proporciona límites (casi) óptimos para el aprendizaje agnóstico de funciones umbral polinómicas en el modelo de consultas estadísticas.

Lucas Pesenti, Lucas Slot, Manuel Wiedmer2026-03-09🤖 cs.LG

Improved high-dimensional estimation with Langevin dynamics and stochastic weight averaging

Este artículo demuestra que la dinámica de Langevin, combinada con el promediado de iteraciones, puede recuperar una dirección oculta en entornos de alta dimensión con un número de muestras óptimo ( $n \gtrsim d^{k^\star/2}$ ) sin necesidad de un suavizado explícito del paisaje, emulando dicho efecto mediante la inyección de ruido y el promediado.

Stanley Wei, Alex Damian, Jason D. Lee2026-03-09🤖 cs.LG

TempoSyncDiff: Distilled Temporally-Consistent Diffusion for Low-Latency Audio-Driven Talking Head Generation

El artículo presenta TempoSyncDiff, un marco de difusión latente basado en destilación que genera cabezas parlantes impulsadas por audio con baja latencia y alta consistencia temporal, mitigando problemas como el parpadeo y la deriva de identidad mediante un enfoque maestro-alumno y condicionamiento basado en visemas.

Soumya Mazumdar, Vineet Kumar Rakesh2026-03-09🤖 cs.AI

Latent Diffusion-Based 3D Molecular Recovery from Vibrational Spectra

El artículo presenta IR-GeoDiff, un modelo de difusión latente que recupera geometrías moleculares tridimensionales a partir de espectros infrarrojos integrando información espectral en las representaciones de nodos y arcos, superando las limitaciones de los enfoques anteriores basados en estructuras unidimensionales o bidimensionales.

Wenjin Wu, Aleš Leonardis, Linjiang Chen, Jianbo Jiao2026-03-09🤖 cs.LG

Dynamic Momentum Recalibration in Online Gradient Learning

Este artículo propone SGDF, un optimizador basado en el filtrado lineal óptimo que recalibra dinámicamente el momento en el descenso de gradiente estocástico para equilibrar la supresión de ruido y la preservación de la señal, logrando un rendimiento superior o comparable al de los métodos de vanguardia.

Zhipeng Yao, Rui Yu, Guisong Chang, Ying Li, Yu Zhang, Dazhou Li2026-03-09🤖 cs.LG

Diffusion Language Models Are Natively Length-Aware

Este paper propone un mecanismo de recorte dinámico del contexto basado en la representación latente de la entrada para hacer que los Modelos de Lenguaje de Difusión sean conscientes de la longitud, logrando ahorros computacionales significativos sin degradar el rendimiento en diversas tareas.

Vittorio Rossi, Giacomo Cirò, Davide Beltrame, Luca Gandolfi, Paul Röttger, Dirk Hovy2026-03-09🤖 cs.LG

DQE: A Semantic-Aware Evaluation Metric for Time Series Anomaly Detection

Este trabajo propone DQE, una nueva métrica de evaluación para la detección de anomalías en series temporales que, mediante una segmentación semántica de las regiones temporales y la agregación de calificaciones en todo el espectro de umbrales, supera las limitaciones de sesgo e inconsistencia de las métricas existentes para ofrecer una evaluación más estable, discriminativa e interpretable.

Yuewei Li, Dalin Zhang, Huan Li, Xinyi Gong, Hongjun Chu, Zhaohui Song2026-03-09🤖 cs.LG

Partial Policy Gradients for RL in LLMs

Este artículo propone un enfoque de gradiente de política parcial para el aprendizaje por refuerzo en modelos de lenguaje grande, que optimiza subconjuntos de recompensas futuras para permitir el aprendizaje más fiable de políticas de distinta complejidad, demostrando empíricamente que diferentes clases de políticas (como las de planificación completa, voraces o de K pasos) sobresalen en distintos problemas de alineación conversacional.

Puneet Mathur, Branislav Kveton, Subhojyoti Mukherjee, Viet Dac Lai2026-03-09🤖 cs.AI

Predictive Coding Graphs are a Superset of Feedforward Neural Networks

El artículo demuestra que los gráficos de codificación predictiva (PCGs) constituyen un superconjunto matemático de las redes neuronales de alimentación hacia adelante, lo que fortalece su posición dentro del aprendizaje automático y resalta la importancia de la topología en las redes neuronales.

Björn van Zwol2026-03-09🤖 cs.AI

Ensemble Graph Neural Networks for Probabilistic Sea Surface Temperature Forecasting via Input Perturbations

Este trabajo demuestra que el uso de perturbaciones de entrada espacialmente coherentes, como el ruido de Perlin, en ensembles de redes neuronales gráficas permite generar pronósticos probabilísticos calibrados de la temperatura superficial del mar sin costos adicionales de entrenamiento, superando a las perturbaciones puramente aleatorias en la representación de la incertidumbre.

Alejandro J. González-Santana, Giovanny A. Cuervo-Londoño, Javier Sánchez2026-03-09🤖 cs.AI

Efficient Vector Search in the Wild: One Model for Multi-K Queries

El artículo presenta OMEGA, un método de búsqueda aprendida que generaliza a múltiples valores de K con alta precisión y rendimiento, utilizando un modelo base entrenado en K=1 y un procedimiento de refinamiento dinámico para reducir significativamente la latencia y los costos de preprocesamiento en comparación con los métodos actuales.

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo Chen2026-03-09🤖 cs.LG

Contrastive-to-Self-Supervised: A Two-Stage Framework for Script Similarity Learning

Este artículo propone un marco de dos etapas que combina aprendizaje contrastivo supervisado en alfabetos inventados con destilación de conocimiento no supervisada para aprender métricas de similitud entre sistemas de escritura históricos sin depender de relaciones evolutivas verificadas.

Claire Roman, Philippe Meyer2026-03-09🤖 cs.AI

Random Quadratic Form on a Sphere: Synchronization by Common Noise

Este artículo introduce el modelo de Forma Cuadrática Aleatoria (RQF) para demostrar que el ruido común puede sincronizar trayectorias en esferas, ofreciendo una explicación alternativa e independiente de la atención automática para el comportamiento de agrupamiento de tokens en transformadores profundos.

Maximilian Engel, Anna Shalova2026-03-09🤖 cs.LG

Topological descriptors of foot clearance gait dynamics improve differential diagnosis of Parkinsonism

Este estudio demuestra que el uso de descriptores topológicos de la dinámica de la elevación del pie, aplicados mediante análisis de datos topológicos y aprendizaje automático, mejora significativamente el diagnóstico diferencial entre la enfermedad de Parkinson idiopática y el parkinsonismo vascular.

Jhonathan Barrios, Wolfram Erlhagen, Miguel F. Gago, Estela Bicho, Flora Ferreira2026-03-09🤖 cs.LG

FedSCS-XGB -- Federated Server-centric surrogate XGBoost for continual health monitoring

Este trabajo presenta FedSCS-XGB, un nuevo protocolo de aprendizaje distribuido para el reconocimiento de actividades humanas mediante sensores portátiles que, inspirado en PAX, preserva las propiedades estructurales de XGBoost y logra un rendimiento casi equivalente al entrenamiento centralizado, facilitando así la monitorización continua de la salud en pacientes con lesiones de la médula espinal.

Felix Walger, Mehdi Ejtehadi, Anke Schmeink, Diego Paez-Granados2026-03-09🤖 cs.LG

DC-Merge: Improving Model Merging with Directional Consistency

El artículo presenta DC-Merge, un método de fusión de modelos que mejora el rendimiento al equilibrar la distribución de energía de los vectores de tarea y alinear sus geometrías direccionales en un subespacio ortogonal compartido, logrando así resultados de vanguardia en diversas tareas de visión y visión-idioma.

Han-Chen Zhang, Zi-Hao Zhou, Mao-Lin Luo, Shimin Di, Min-Ling Zhang, Tong Wei2026-03-09🤖 cs.LG

Gradient Flow Polarizes Softmax Outputs towards Low-Entropy Solutions

Este artículo demuestra que el flujo de gradiente en modelos de softmax con valores inherentemente impulsa la optimización hacia soluciones de baja entropía, ofreciendo un mecanismo teórico para explicar fenómenos empíricos en transformadores como los sumideros de atención y las activaciones masivas.

Aditya Varre, Mark Rofin, Nicolas Flammarion2026-03-09🤖 cs.LG

SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data

El artículo presenta SPPCSO, un innovador método de estimación penalizada que combina la regresión de componentes principales con regularización $L_1$ para lograr una selección de variables estable y precisa en datos de alta dimensión con alta correlación y ruido, demostrando su eficacia tanto en experimentos numéricos como en el análisis de expresión génica.

Ying Hu, Hu Yang2026-03-09🤖 cs.LG

← Anterior Siguiente →