Analysis-Driven Procedural Generation of an Engine Sound Dataset with Embedded Control Annotations

Este artigo apresenta um framework de geração procedural de dados de som de motor com anotações de controle precisas, baseado na extração de estruturas harmônicas de gravações reais, resultando no Procedural Engine Sounds Dataset, um conjunto de dados público validado para apoiar pesquisas em modelagem acústica e síntese baseada em aprendizado.

Robin Doerfler, Lonce Wyse2026-03-10🤖 cs.LG

Models as Lego Builders: Assembling Malice from Benign Blocks via Semantic Blueprints

Este artigo apresenta o StructAttack, um framework de jailbreak que explora a vulnerabilidade de preenchimento de slots semânticos em Modelos Visuais-Linguísticos (LVLMs), utilizando prompts visuais estruturados e slots aparentemente benignos para recompor e gerar respostas maliciosas sem acionar mecanismos de segurança.

Chenxi Li, Xianggan Liu, Dake Shen, Yaosong Du, Zhibo Yao, Hao Jiang, Linyi Jiang, Chengwei Cao, Jingzhe Zhang, RanYi Peng, Peiling Bai, Xiande Huang2026-03-10🤖 cs.LG

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

O artigo apresenta o MAS-H2, um sistema hierárquico de agentes multiagentes que resolve o problema do "vazio estratégico" no autoscaling nativo de nuvem ao decompor a gestão de recursos em camadas estratégicas, de planejamento e execução, demonstrando em testes no Kubernetes superioridade em redução de estresse de CPU, mitigação de picos de carga e migração sem tempo de inatividade em comparação com as soluções nativas.

Hamed Hamzeh, Parisa Vahdatian2026-03-10🤖 cs.LG

Compression as Adaptation: Implicit Visual Representation with Diffusion Foundation Models

Este trabalho apresenta um novo framework de representação visual implícita que codifica sinais como funções parametrizadas por adaptações de baixo rank em modelos generativos congelados, permitindo compressão de vídeo extremamente eficiente e unificando os campos de compressão e geração visual.

Jiajun He, Zongyu Guo, Zhaoyang Jia, Xiaoyi Zhang, Jiahao Li, Xiao Li, Bin Li, José Miguel Hernández-Lobato, Yan Lu2026-03-10🤖 cs.LG

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

Este artigo apresenta um quadro de aprendizado por reforço para controlar exoesqueletos que reduzem os momentos articulares biológicos e valida esses controladores treinados em simulação através de um conjunto de dados de marcha aberto, demonstrando forte consistência entre simulação e dados reais, especialmente no nível de torque no quadril, embora desafios permaneçam para a transferência sim-real em velocidades mais altas e inclinações mais íngremes.

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

Helix: Evolutionary Reinforcement Learning for Open-Ended Scientific Problem Solving

O artigo apresenta o HELIX, um framework de aprendizado por reforço evolutivo hierárquico que combina in-context learning e refinamento iterativo de políticas para superar limitações de exploração e generalização em problemas científicos abertos, alcançando resultados state-of-the-art em tarefas de empacotamento de círculos e benchmarks de aprendizado de máquina.

Chang Su, Zhongkai Hao, Zhizhou Zhang, Zeyu Xia, Youjia Wu, Hang Su, Jun Zhu2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

Este artigo apresenta um pipeline de geração de dados sintéticos baseado em um Digital Twin do Aeroporto Internacional de Algiers, demonstrando que o treinamento híbrido com esses dados e apenas 40% das anotações reais alcança desempenho superior ou equivalente ao uso de dados reais completos para a detecção de carrinhos de bagagem, reduzindo o esforço de anotação em 25 a 35%.

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

O artigo propõe o FedCEF, um novo algoritmo de aprendizado federado que combina atualização proximal desacoplada, mecanismo de feedback de erro e variáveis de controle para alcançar convergência robusta e eficiente em comunicação em cenários de otimização não convexa com dados heterogêneos e compressão agressiva.

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang Shi2026-03-10🤖 cs.LG

Partial Differential Equations in the Age of Machine Learning: A Critical Synthesis of Classical, Machine Learning, and Hybrid Methods

Este artigo apresenta uma revisão crítica que sintetiza os métodos numéricos clássicos e as abordagens de aprendizado de máquina para a resolução de equações diferenciais parciais, destacando suas distinções epistemológicas, identificando complementaridades genuínas e estabelecendo princípios para o design de métodos híbridos.

Mohammad Nooraiepour, Jakub Wiktor Both, Teeratorn Kadeethum, Saeid Sadeghnejad2026-03-10🤖 cs.LG

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Esta dissertação propõe uma mudança no design de microarquitetura de abordagens agnósticas a dados para técnicas orientadas a dados e impulsionadas por aprendizado de máquina, demonstrando em quatro estudos de caso que explorar o comportamento de execução e as características semânticas dos dados melhora significativamente o desempenho e a eficiência energética ao mitigar o gargalo de memória.

Rahul Bera2026-03-10🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Este artigo apresenta o Megatron Core, uma solução de código aberto que otimiza o treinamento escalável de modelos Mixture-of-Experts (MoE) através de técnicas integradas de memória, comunicação e computação, alcançando alto desempenho em clusters de milhares de GPUs para modelos de bilhões a trilhões de parâmetros.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

Global Convergence of Average Reward Constrained MDPs with Neural Critic and General Policy Parameterization

Este artigo propõe um algoritmo primal-dual de ator-critic natural que integra estimativa de crítico com redes neurais e teoria NTK para garantir convergência global e violação de restrições cumulativa em processos de decisão de Markov com recompensa média e políticas generalizadas, superando as limitações de análises teóricas anteriores que dependiam de políticas tabulares ou críticos lineares.

Anirudh Satheesh, Pankaj Kumar Barman, Washim Uddin Mondal, Vaneet Aggarwal2026-03-10🤖 cs.LG

Deep Incentive Design with Differentiable Equilibrium Blocks

Este trabalho propõe o "Deep Incentive Design" (DID), uma nova estrutura diferenciável que utiliza blocos de equilíbrio diferenciáveis (DEBs) para automatizar o projeto de incentivos em interações multiagentes, resolvendo com sucesso tarefas desafiadoras como design de contratos, agendamento de máquinas e problemas de equilíbrio inverso através de uma única rede neural treinada.

Vinzenz Thoma, Georgios Piliouras, Luke Marris2026-03-10🤖 cs.LG