cs.LG artículos | Gist.Science

Analysis-Driven Procedural Generation of an Engine Sound Dataset with Embedded Control Annotations

Este artículo presenta un marco de generación procedural de audio de motores que extrae estructuras armónicas de grabaciones reales para sintetizar un nuevo conjunto de datos de 19 horas con anotaciones precisas de RPM y par de torsión, validado para su uso en investigación de modelado acústico y síntesis basada en aprendizaje.

Robin Doerfler, Lonce Wyse2026-03-10🤖 cs.LG

Models as Lego Builders: Assembling Malice from Benign Blocks via Semantic Blueprints

El artículo presenta StructAttack, un marco de ataque de una sola consulta que explota la vulnerabilidad de los modelos de visión y lenguaje grandes al ensamblar contenido malicioso a partir de bloques semánticos benignos dispuestos en estructuras visuales, logrando así eludir los mecanismos de seguridad en entornos de caja negra.

Chenxi Li, Xianggan Liu, Dake Shen, Yaosong Du, Zhibo Yao, Hao Jiang, Linyi Jiang, Chengwei Cao, Jingzhe Zhang, RanYi Peng, Peiling Bai, Xiande Huang2026-03-10🤖 cs.LG

Shorter Thoughts, Same Answers: Difficulty-Scaled Segment-Wise RL for CoT Compression

El artículo presenta DSS-GRPO, un método de aprendizaje por refuerzo que escala la compresión de la cadena de pensamiento según la dificultad y separa las señales de aprendizaje entre el razonamiento y la respuesta final, logrando así reducir la longitud del proceso de pensamiento sin degradar la calidad de la respuesta.

Ye Tian, Aijun Liu2026-03-10🤖 cs.LG

MetaSort: An Accelerated Approach for Non-uniform Compression and Few-shot Classification of Neural Spike Waveforms

El artículo presenta MetaSort, un algoritmo innovador que combina compresión adaptativa de alta fidelidad y clasificación few-shot de formas de onda de picos neuronales mediante aprendizaje meta-transferido que explota la información geométrica, demostrando un alto rendimiento en datos in-vivo y su potencial para implementaciones en chip de ultra bajo consumo.

Luca M. Meyer, Majid Zamani2026-03-10🤖 cs.LG

TT-Sparse: Learning Sparse Rule Models with Differentiable Truth Tables

El artículo presenta TT-Sparse, un modelo neuronal interpretable que utiliza tablas de verdad diferenciables y un nuevo operador soft TopK para aprender reglas booleanas escasas y eficientes que logran un alto rendimiento predictivo con una complejidad reducida en comparación con los métodos actuales.

Hans Farrell Soegeng, Sarthak Ketanbhai Modi, Thomas Peyrin2026-03-10🤖 cs.LG

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

El artículo presenta MAS-H2, un sistema jerárquico de agentes multiagente que resuelve el problema del vacío estratégico en el escalado automático de la nube al integrar políticas de negocio con la planificación proactiva de recursos, logrando en pruebas con Kubernetes una reducción significativa del estrés de CPU y una migración estratégica sin tiempo de inactividad en comparación con los escaladores nativos.

Hamed Hamzeh, Parisa Vahdatian2026-03-10🤖 cs.LG

Compression as Adaptation: Implicit Visual Representation with Diffusion Foundation Models

Este trabajo presenta un nuevo marco de representación visual implícita que codifica señales como funciones parametrizadas por adaptaciones de bajo rango en modelos generativos congelados, logrando una compresión de video perceptual de alta calidad a tasas de bits extremadamente bajas y estableciendo un puente unificado entre la compresión y la generación visual.

Jiajun He, Zongyu Guo, Zhaoyang Jia, Xiaoyi Zhang, Jiahao Li, Xiao Li, Bin Li, José Miguel Hernández-Lobato, Yan Lu2026-03-10🤖 cs.LG

SMAT: Staged Multi-Agent Training for Co-Adaptive Exoskeleton Control

Este artículo presenta SMAT, un método de entrenamiento en etapas para múltiples agentes que permite el desarrollo de un controlador de exoesqueleto de cadera co-adaptativo y generalizable, el cual reduce la activación muscular en un 10,1% y proporciona asistencia mecánica positiva consistente en humanos sin necesidad de reentrenamiento específico por sujeto.

Yifei Yuan, Ghaith Androwis, Xianlian Zhou2026-03-10🤖 cs.LG

Accelerating Diffusion Models for Generative AI Applications with Silicon Photonics

Este artículo presenta un nuevo acelerador basado en fotónica de silicio para modelos de difusión que, según evaluaciones experimentales, mejora la eficiencia energética en al menos un 3x y el rendimiento en 5,5x en comparación con los aceleradores electrónicos más avanzados.

Tharini Suresh, Salma Afifi, Sudeep Pasricha2026-03-10🤖 cs.LG

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

Este artículo presenta un marco de aprendizaje por refuerzo para entrenar controladores de exoesqueleto en simulación que reducen los momentos articulares biológicos, validando su consistencia con datos reales mediante un pipeline que demuestra una fuerte correlación temporal en los torques de asistencia, especialmente en la cadera, a pesar de ciertas discrepancias en velocidades e inclinaciones más extremas.

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

Helix: Evolutionary Reinforcement Learning for Open-Ended Scientific Problem Solving

El artículo presenta HELIX, un marco de aprendizaje por refuerzo evolutivo jerárquico que combina el aprendizaje en contexto con la refinación iterativa de políticas para superar las limitaciones de exploración y generalización en la resolución de problemas científicos abiertos, logrando resultados de vanguardia en tareas como el empaquetado de círculos y en benchmarks de aprendizaje automático.

Chang Su, Zhongkai Hao, Zhizhou Zhang, Zeyu Xia, Youjia Wu, Hang Su, Jun Zhu2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

Este artículo presenta una tubería de generación de datos sintéticos basada en un gemelo digital del Aeropuerto Internacional de Argel para entrenar un detector YOLO-OBB, demostrando que la combinación de estos datos con solo el 40% de las anotaciones reales iguala o supera el rendimiento de un modelo entrenado exclusivamente con datos reales completos, reduciendo así el esfuerzo de anotación entre un 25% y un 35%.

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

El artículo presenta FedCEF, un algoritmo novedoso de aprendizaje federado que combina actualizaciones proximales desacopladas, mecanismos de retroalimentación de errores y estrategias de comunicación eficientes para lograr convergencia robusta y eficiente en la optimización compuesta no convexa sobre datos heterogéneos con compresión sesgada.

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang Shi2026-03-10🤖 cs.LG

Partial Differential Equations in the Age of Machine Learning: A Critical Synthesis of Classical, Machine Learning, and Hybrid Methods

Este artículo presenta una revisión crítica que contrasta los métodos numéricos clásicos y los enfoques de aprendizaje automático para resolver ecuaciones en derivadas parciales, destacando sus diferencias epistemológicas y proponiendo principios para el diseño de métodos híbridos que integren sus fortalezas complementarias.

Mohammad Nooraiepour, Jakub Wiktor Both, Teeratorn Kadeethum, Saeid Sadeghnejad2026-03-10🤖 cs.LG

Beyond Surrogates: A Quantitative Analysis for Inter-Metric Relationships

Este artículo propone un marco teórico unificado que cuantifica las relaciones entre métricas de evaluación mediante el análisis de la transferencia de arrepentimiento y el conjunto óptimo de Bayes, con el objetivo de resolver la desconexión entre las mejoras en validación offline y el rendimiento online.

Yuanhao Pu, Defu Lian, Enhong Chen2026-03-10🤖 cs.LG

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Esta tesis doctoral propone superar el cuello de botella de la memoria mediante técnicas microarquitectónicas que pasan de ser ajenas a los datos a ser informadas por ellos, utilizando aprendizaje automático y características semánticas de los datos para optimizar significativamente el rendimiento y la eficiencia energética de los procesadores.

Rahul Bera2026-03-10🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Este informe presenta Megatron Core, un marco de código abierto que aborda los desafíos de escalabilidad en el entrenamiento de modelos de expertos mezclados (MoE) mediante optimizaciones integradas en memoria, comunicación y computación, logrando un alto rendimiento en hardware NVIDIA GB300/GB200 para modelos desde miles de millones hasta billones de parámetros.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

Global Convergence of Average Reward Constrained MDPs with Neural Critic and General Policy Parameterization

Este trabajo presenta un algoritmo actor-crítico natural primal-dual que integra redes neuronales y la teoría del Kernel Tangente Neuronal para establecer garantías de convergencia global y violación de restricciones en Procesos de Decisión de Markov Constrained de recompensa promedio con políticas generales, superando las limitaciones de los análisis teóricos anteriores basados en políticas tabulares o críticos lineales.

Anirudh Satheesh, Pankaj Kumar Barman, Washim Uddin Mondal, Vaneet Aggarwal2026-03-10🤖 cs.LG

Step-Size Decay and Structural Stagnation in Greedy Sparse Learning

Este artículo demuestra que el uso de calendarios de tamaño de paso con decaimiento excesivo en algoritmos voraces para aprendizaje disperso provoca un estancamiento estructural incluso en configuraciones de baja dimensión, estableciendo límites inferiores explícitos para el error residual y destacando el papel crítico de la coherencia de las características.

Pablo M. Berná2026-03-10🤖 cs.LG

Deep Incentive Design with Differentiable Equilibrium Blocks

El artículo propone el "Deep Incentive Design" (DID), un marco diferenciable que utiliza bloques de equilibrio diferenciables (DEBs) para resolver automáticamente diversos problemas de diseño de incentivos en economía y ciencias de la computación mediante el entrenamiento de una única red neuronal capaz de manejar múltiples tareas y escalas de juegos.

Vinzenz Thoma, Georgios Piliouras, Luke Marris2026-03-10🤖 cs.LG

← Anterior Siguiente →