Models as Lego Builders: Assembling Malice from Benign Blocks via Semantic Blueprints

El artículo presenta StructAttack, un marco de ataque de una sola consulta que explota la vulnerabilidad de los modelos de visión y lenguaje grandes al ensamblar contenido malicioso a partir de bloques semánticos benignos dispuestos en estructuras visuales, logrando así eludir los mecanismos de seguridad en entornos de caja negra.

Chenxi Li, Xianggan Liu, Dake Shen, Yaosong Du, Zhibo Yao, Hao Jiang, Linyi Jiang, Chengwei Cao, Jingzhe Zhang, RanYi Peng, Peiling Bai, Xiande Huang2026-03-10🤖 cs.LG

MetaSort: An Accelerated Approach for Non-uniform Compression and Few-shot Classification of Neural Spike Waveforms

El artículo presenta MetaSort, un algoritmo innovador que combina compresión adaptativa de alta fidelidad y clasificación few-shot de formas de onda de picos neuronales mediante aprendizaje meta-transferido que explota la información geométrica, demostrando un alto rendimiento en datos in-vivo y su potencial para implementaciones en chip de ultra bajo consumo.

Luca M. Meyer, Majid Zamani2026-03-10🤖 cs.LG

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

El artículo presenta MAS-H2, un sistema jerárquico de agentes multiagente que resuelve el problema del vacío estratégico en el escalado automático de la nube al integrar políticas de negocio con la planificación proactiva de recursos, logrando en pruebas con Kubernetes una reducción significativa del estrés de CPU y una migración estratégica sin tiempo de inactividad en comparación con los escaladores nativos.

Hamed Hamzeh, Parisa Vahdatian2026-03-10🤖 cs.LG

Compression as Adaptation: Implicit Visual Representation with Diffusion Foundation Models

Este trabajo presenta un nuevo marco de representación visual implícita que codifica señales como funciones parametrizadas por adaptaciones de bajo rango en modelos generativos congelados, logrando una compresión de video perceptual de alta calidad a tasas de bits extremadamente bajas y estableciendo un puente unificado entre la compresión y la generación visual.

Jiajun He, Zongyu Guo, Zhaoyang Jia, Xiaoyi Zhang, Jiahao Li, Xiao Li, Bin Li, José Miguel Hernández-Lobato, Yan Lu2026-03-10🤖 cs.LG

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

Este artículo presenta un marco de aprendizaje por refuerzo para entrenar controladores de exoesqueleto en simulación que reducen los momentos articulares biológicos, validando su consistencia con datos reales mediante un pipeline que demuestra una fuerte correlación temporal en los torques de asistencia, especialmente en la cadera, a pesar de ciertas discrepancias en velocidades e inclinaciones más extremas.

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

Helix: Evolutionary Reinforcement Learning for Open-Ended Scientific Problem Solving

El artículo presenta HELIX, un marco de aprendizaje por refuerzo evolutivo jerárquico que combina el aprendizaje en contexto con la refinación iterativa de políticas para superar las limitaciones de exploración y generalización en la resolución de problemas científicos abiertos, logrando resultados de vanguardia en tareas como el empaquetado de círculos y en benchmarks de aprendizaje automático.

Chang Su, Zhongkai Hao, Zhizhou Zhang, Zeyu Xia, Youjia Wu, Hang Su, Jun Zhu2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

Este artículo presenta una tubería de generación de datos sintéticos basada en un gemelo digital del Aeropuerto Internacional de Argel para entrenar un detector YOLO-OBB, demostrando que la combinación de estos datos con solo el 40% de las anotaciones reales iguala o supera el rendimiento de un modelo entrenado exclusivamente con datos reales completos, reduciendo así el esfuerzo de anotación entre un 25% y un 35%.

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

El artículo presenta FedCEF, un algoritmo novedoso de aprendizaje federado que combina actualizaciones proximales desacopladas, mecanismos de retroalimentación de errores y estrategias de comunicación eficientes para lograr convergencia robusta y eficiente en la optimización compuesta no convexa sobre datos heterogéneos con compresión sesgada.

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang Shi2026-03-10🤖 cs.LG

Partial Differential Equations in the Age of Machine Learning: A Critical Synthesis of Classical, Machine Learning, and Hybrid Methods

Este artículo presenta una revisión crítica que contrasta los métodos numéricos clásicos y los enfoques de aprendizaje automático para resolver ecuaciones en derivadas parciales, destacando sus diferencias epistemológicas y proponiendo principios para el diseño de métodos híbridos que integren sus fortalezas complementarias.

Mohammad Nooraiepour, Jakub Wiktor Both, Teeratorn Kadeethum, Saeid Sadeghnejad2026-03-10🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Este informe presenta Megatron Core, un marco de código abierto que aborda los desafíos de escalabilidad en el entrenamiento de modelos de expertos mezclados (MoE) mediante optimizaciones integradas en memoria, comunicación y computación, logrando un alto rendimiento en hardware NVIDIA GB300/GB200 para modelos desde miles de millones hasta billones de parámetros.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

Global Convergence of Average Reward Constrained MDPs with Neural Critic and General Policy Parameterization

Este trabajo presenta un algoritmo actor-crítico natural primal-dual que integra redes neuronales y la teoría del Kernel Tangente Neuronal para establecer garantías de convergencia global y violación de restricciones en Procesos de Decisión de Markov Constrained de recompensa promedio con políticas generales, superando las limitaciones de los análisis teóricos anteriores basados en políticas tabulares o críticos lineales.

Anirudh Satheesh, Pankaj Kumar Barman, Washim Uddin Mondal, Vaneet Aggarwal2026-03-10🤖 cs.LG