cs.LG artigos | Gist.Science

Analysis-Driven Procedural Generation of an Engine Sound Dataset with Embedded Control Annotations

Este artigo apresenta um framework de geração procedural de dados de som de motor com anotações de controle precisas, baseado na extração de estruturas harmônicas de gravações reais, resultando no Procedural Engine Sounds Dataset, um conjunto de dados público validado para apoiar pesquisas em modelagem acústica e síntese baseada em aprendizado.

Robin Doerfler, Lonce Wyse2026-03-10🤖 cs.LG

Models as Lego Builders: Assembling Malice from Benign Blocks via Semantic Blueprints

Este artigo apresenta o StructAttack, um framework de jailbreak que explora a vulnerabilidade de preenchimento de slots semânticos em Modelos Visuais-Linguísticos (LVLMs), utilizando prompts visuais estruturados e slots aparentemente benignos para recompor e gerar respostas maliciosas sem acionar mecanismos de segurança.

Chenxi Li, Xianggan Liu, Dake Shen, Yaosong Du, Zhibo Yao, Hao Jiang, Linyi Jiang, Chengwei Cao, Jingzhe Zhang, RanYi Peng, Peiling Bai, Xiande Huang2026-03-10🤖 cs.LG

Shorter Thoughts, Same Answers: Difficulty-Scaled Segment-Wise RL for CoT Compression

O artigo propõe o método DSS-GRPO, que utiliza aprendizado por reforço segmentado e escalado por dificuldade para comprimir as cadeias de raciocínio (CoT) de forma adaptativa, garantindo que o encurtamento do processo de pensamento não degrade a qualidade da resposta final.

Ye Tian, Aijun Liu2026-03-10🤖 cs.LG

MetaSort: An Accelerated Approach for Non-uniform Compression and Few-shot Classification of Neural Spike Waveforms

O artigo apresenta o MetaSort, um novo algoritmo que integra compressão adaptativa de alta fidelidade e classificação de poucos exemplos de formas de onda de picos neurais por meio de aprendizado de transferência meta, demonstrando alto desempenho em dados in-vivo e potencial para implementação em chip de ultra baixo consumo.

Luca M. Meyer, Majid Zamani2026-03-10🤖 cs.LG

TT-Sparse: Learning Sparse Rule Models with Differentiable Truth Tables

O artigo apresenta o TT-Sparse, um modelo de aprendizado de máquina interpretável que utiliza tabelas-verdade diferenciáveis e um novo operador TopK suave para aprender regras esparsas de alto desempenho, permitindo a extração exata de fórmulas booleanas compactas e superando métodos existentes em precisão e simplicidade.

Hans Farrell Soegeng, Sarthak Ketanbhai Modi, Thomas Peyrin2026-03-10🤖 cs.LG

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

O artigo apresenta o MAS-H2, um sistema hierárquico de agentes multiagentes que resolve o problema do "vazio estratégico" no autoscaling nativo de nuvem ao decompor a gestão de recursos em camadas estratégicas, de planejamento e execução, demonstrando em testes no Kubernetes superioridade em redução de estresse de CPU, mitigação de picos de carga e migração sem tempo de inatividade em comparação com as soluções nativas.

Hamed Hamzeh, Parisa Vahdatian2026-03-10🤖 cs.LG

Compression as Adaptation: Implicit Visual Representation with Diffusion Foundation Models

Este trabalho apresenta um novo framework de representação visual implícita que codifica sinais como funções parametrizadas por adaptações de baixo rank em modelos generativos congelados, permitindo compressão de vídeo extremamente eficiente e unificando os campos de compressão e geração visual.

Jiajun He, Zongyu Guo, Zhaoyang Jia, Xiaoyi Zhang, Jiahao Li, Xiao Li, Bin Li, José Miguel Hernández-Lobato, Yan Lu2026-03-10🤖 cs.LG

SMAT: Staged Multi-Agent Training for Co-Adaptive Exoskeleton Control

O artigo apresenta o SMAT, um método de treinamento multiagente em quatro estágios que permite o desenvolvimento de um controlador de exoesqueleto de quadril capaz de reduzir a ativação muscular e fornecer assistência mecânica positiva consistente em diversos usuários sem necessidade de re-treinamento específico.

Yifei Yuan, Ghaith Androwis, Xianlian Zhou2026-03-10🤖 cs.LG

Accelerating Diffusion Models for Generative AI Applications with Silicon Photonics

Este artigo apresenta um novo acelerador baseado em fotônica de silício para modelos de difusão, que supera os aceleradores eletrônicos atuais alcançando uma eficiência energética 3 vezes maior e um aumento de 5,5 vezes no rendimento.

Tharini Suresh, Salma Afifi, Sudeep Pasricha2026-03-10🤖 cs.LG

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

Este artigo apresenta um quadro de aprendizado por reforço para controlar exoesqueletos que reduzem os momentos articulares biológicos e valida esses controladores treinados em simulação através de um conjunto de dados de marcha aberto, demonstrando forte consistência entre simulação e dados reais, especialmente no nível de torque no quadril, embora desafios permaneçam para a transferência sim-real em velocidades mais altas e inclinações mais íngremes.

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

Helix: Evolutionary Reinforcement Learning for Open-Ended Scientific Problem Solving

O artigo apresenta o HELIX, um framework de aprendizado por reforço evolutivo hierárquico que combina in-context learning e refinamento iterativo de políticas para superar limitações de exploração e generalização em problemas científicos abertos, alcançando resultados state-of-the-art em tarefas de empacotamento de círculos e benchmarks de aprendizado de máquina.

Chang Su, Zhongkai Hao, Zhizhou Zhang, Zeyu Xia, Youjia Wu, Hang Su, Jun Zhu2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

Este artigo apresenta um pipeline de geração de dados sintéticos baseado em um Digital Twin do Aeroporto Internacional de Algiers, demonstrando que o treinamento híbrido com esses dados e apenas 40% das anotações reais alcança desempenho superior ou equivalente ao uso de dados reais completos para a detecção de carrinhos de bagagem, reduzindo o esforço de anotação em 25 a 35%.

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

O artigo propõe o FedCEF, um novo algoritmo de aprendizado federado que combina atualização proximal desacoplada, mecanismo de feedback de erro e variáveis de controle para alcançar convergência robusta e eficiente em comunicação em cenários de otimização não convexa com dados heterogêneos e compressão agressiva.

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang Shi2026-03-10🤖 cs.LG

Partial Differential Equations in the Age of Machine Learning: A Critical Synthesis of Classical, Machine Learning, and Hybrid Methods

Este artigo apresenta uma revisão crítica que sintetiza os métodos numéricos clássicos e as abordagens de aprendizado de máquina para a resolução de equações diferenciais parciais, destacando suas distinções epistemológicas, identificando complementaridades genuínas e estabelecendo princípios para o design de métodos híbridos.

Mohammad Nooraiepour, Jakub Wiktor Both, Teeratorn Kadeethum, Saeid Sadeghnejad2026-03-10🤖 cs.LG

Beyond Surrogates: A Quantitative Analysis for Inter-Metric Relationships

Este artigo propõe um quadro teórico unificado que quantifica as relações entre diferentes métricas de avaliação, categorizando-as e analisando-as através do Conjunto Bayesiano-Ótimo e da Transferência de Arrependimento para resolver o problema de "Desajuste de Métricas" e garantir que melhorias em validação offline se traduzam em desempenho online.

Yuanhao Pu, Defu Lian, Enhong Chen2026-03-10🤖 cs.LG

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Esta dissertação propõe uma mudança no design de microarquitetura de abordagens agnósticas a dados para técnicas orientadas a dados e impulsionadas por aprendizado de máquina, demonstrando em quatro estudos de caso que explorar o comportamento de execução e as características semânticas dos dados melhora significativamente o desempenho e a eficiência energética ao mitigar o gargalo de memória.

Rahul Bera2026-03-10🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Este artigo apresenta o Megatron Core, uma solução de código aberto que otimiza o treinamento escalável de modelos Mixture-of-Experts (MoE) através de técnicas integradas de memória, comunicação e computação, alcançando alto desempenho em clusters de milhares de GPUs para modelos de bilhões a trilhões de parâmetros.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

Global Convergence of Average Reward Constrained MDPs with Neural Critic and General Policy Parameterization

Este artigo propõe um algoritmo primal-dual de ator-critic natural que integra estimativa de crítico com redes neurais e teoria NTK para garantir convergência global e violação de restrições cumulativa em processos de decisão de Markov com recompensa média e políticas generalizadas, superando as limitações de análises teóricas anteriores que dependiam de políticas tabulares ou críticos lineares.

Anirudh Satheesh, Pankaj Kumar Barman, Washim Uddin Mondal, Vaneet Aggarwal2026-03-10🤖 cs.LG

Step-Size Decay and Structural Stagnation in Greedy Sparse Learning

Este artigo investiga como o decaimento excessivo da taxa de aprendizado em algoritmos gananciosos para aprendizado esparsos leva à estagnação estrutural, mesmo em configurações de baixa dimensão, demonstrando que a coerência das características desempenha um papel crucial na definição de limites inferiores para o erro de resíduo.

Pablo M. Berná2026-03-10🤖 cs.LG

Deep Incentive Design with Differentiable Equilibrium Blocks

Este trabalho propõe o "Deep Incentive Design" (DID), uma nova estrutura diferenciável que utiliza blocos de equilíbrio diferenciáveis (DEBs) para automatizar o projeto de incentivos em interações multiagentes, resolvendo com sucesso tarefas desafiadoras como design de contratos, agendamento de máquinas e problemas de equilíbrio inverso através de uma única rede neural treinada.

Vinzenz Thoma, Georgios Piliouras, Luke Marris2026-03-10🤖 cs.LG

← Anterior Próximo →