cs.LG papers | Gist.Science

Analysis-Driven Procedural Generation of an Engine Sound Dataset with Embedded Control Annotations

Dit artikel introduceert een analyse-gedreven framework voor de procedurale generatie van een openbaar dataset met 19 uur aan motorgeluiden en nauwkeurige RPM- en koppelannotaties, die de industriële behoefte aan schaalbare, schone trainingsdata voor data-gedreven akoestische modellering en synthese adresseert.

Robin Doerfler, Lonce Wyse2026-03-10🤖 cs.LG

Models as Lego Builders: Assembling Malice from Benign Blocks via Semantic Blueprints

Dit paper introduceert StructAttack, een black-box jailbreak-methode die kwetsbaarheden in Large Vision-Language Models exploiteert door schadelijke inhoud te verbergen in ogenschijnlijk onschadelijke visuele structuren die het model zelf tot een gevaarlijke output assembleert.

Chenxi Li, Xianggan Liu, Dake Shen, Yaosong Du, Zhibo Yao, Hao Jiang, Linyi Jiang, Chengwei Cao, Jingzhe Zhang, RanYi Peng, Peiling Bai, Xiande Huang2026-03-10🤖 cs.LG

Shorter Thoughts, Same Answers: Difficulty-Scaled Segment-Wise RL for CoT Compression

Dit paper introduceert DSS-GRPO, een difficulty-geschaalde segment-gebaseerde versterkingsleermethode die Chain-of-Thought-redenering effectief comprimeert zonder de kwaliteit van het eindantwoord te beïnvloeden door de leerprocessen voor 'denken' en 'antwoorden' strikt te scheiden.

Ye Tian, Aijun Liu2026-03-10🤖 cs.LG

MetaSort: An Accelerated Approach for Non-uniform Compression and Few-shot Classification of Neural Spike Waveforms

Dit paper introduceert MetaSort, een nieuw algoritme dat neurale spike-wavevormen zowel efficiënt comprimeert via een adaptief niveau-kruising-algoritme als nauwkeurig classificeert door gebruik te maken van meta-transfer learning voor few-shot learning.

Luca M. Meyer, Majid Zamani2026-03-10🤖 cs.LG

TT-Sparse: Learning Sparse Rule Models with Differentiable Truth Tables

Het artikel introduceert TT-Sparse, een interpreteerbaar machine learning-model dat differentieerbare waarheidstabellen en een nieuwe soft TopK-operator gebruikt om compacte, exact afleidbare Booleaanse regels te leren die op 28 datasets superieure prestaties leveren met lagere complexiteit dan bestaande methoden.

Hans Farrell Soegeng, Sarthak Ketanbhai Modi, Thomas Peyrin2026-03-10🤖 cs.LG

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

Dit paper introduceert MAS-H2, een hiërarchisch multi-agent systeem dat de strategische kloof in cloud-native autoscaling overbrugt door bedrijfsbeleidsdoelen om te zetten in proactieve, gecoördineerde schaalplannen, wat resulteert in aanzienlijk lagere CPU-belasting en kostenefficiëntere, onderbrekingsvrije migraties vergeleken met traditionele Kubernetes-oplossingen.

Hamed Hamzeh, Parisa Vahdatian2026-03-10🤖 cs.LG

Compression as Adaptation: Implicit Visual Representation with Diffusion Foundation Models

Dit artikel introduceert een nieuw raamwerk voor visuele representatie waarbij video's worden gecodeerd als functies met lage-rang aanpassingen op een bevroren generatief model, waardoor compressie met uiterst lage bitrates mogelijk is en een brug wordt geslagen tussen beeldcompressie en generatie.

Jiajun He, Zongyu Guo, Zhaoyang Jia, Xiaoyi Zhang, Jiahao Li, Xiao Li, Bin Li, José Miguel Hernández-Lobato, Yan Lu2026-03-10🤖 cs.LG

SMAT: Staged Multi-Agent Training for Co-Adaptive Exoskeleton Control

Dit artikel introduceert SMAT, een gestructureerd trainingskader voor co-adaptieve exoskeletbesturing dat via een vierstapscurriculum een robuust en subjectonafhankelijk hulpmiddel levert dat de heupspieractivatie met gemiddeld 10,1% verlaagt en consistente positieve mechanische kracht genereert zonder specifieke aanpassing per gebruiker.

Yifei Yuan, Ghaith Androwis, Xianlian Zhou2026-03-10🤖 cs.LG

Accelerating Diffusion Models for Generative AI Applications with Silicon Photonics

Dit paper introduceert een nieuwe siliciumfotonische versneller die de energie-efficiëntie en doorvoersnelheid van diffusiemodellen voor generatieve AI aanzienlijk verbetert ten opzichte van bestaande elektronische platforms.

Tharini Suresh, Salma Afifi, Sudeep Pasricha2026-03-10🤖 cs.LG

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

Dit artikel introduceert een versterkingsleerframework voor exoskeletbesturing dat biologische gewrichtsmomenten reduceert en presenteert een kwantitatieve validatiepiplijn die sterke overeenkomst toont tussen in simulatie getrainde besturingsnetwerken en biologische data, hoewel uitdagingen bij hogere snelheden en steilere hellingen blijven bestaan.

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

Helix: Evolutionary Reinforcement Learning for Open-Ended Scientific Problem Solving

Het paper introduceert HELIX, een hiërarchisch evolutionair reinforcement learning-framework dat in-context ervaringen combineert met beleidsverfijning om open-ended wetenschappelijke problemen effectiever op te lossen dan bestaande methoden, zoals aangetoond door state-of-the-art resultaten op de cirkelpakkingstaak en verbeterde prestaties op machine learning-benchmarks.

Chang Su, Zhongkai Hao, Zhizhou Zhang, Zeyu Xia, Youjia Wu, Hang Su, Jun Zhu2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

Dit artikel introduceert een synthetische data-pipeline op basis van een digitale tweeling van de luchthaven van Algiers die, in combinatie met YOLO-OBB en gemengde training, de annotatie-inspanning voor het detecteren van bagagewagentjes met 25 tot 35 procent verlaagt terwijl de prestaties gelijk blijven aan of beter zijn dan die van modellen getraind op volledige real-world datasets.

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

Dit paper introduceert FedCEF, een nieuw federatief leeralgoritme dat via een ontkoppeld proximaal update-schema en een geavanceerd foutfeedbackmechanisme efficiënte communicatie en robuuste convergentie garandeert voor niet-convexe composietoptimalisatie op heterogene data, zelfs onder extreme compressie.

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang Shi2026-03-10🤖 cs.LG

Partial Differential Equations in the Age of Machine Learning: A Critical Synthesis of Classical, Machine Learning, and Hybrid Methods

Dit kritisch overzicht vergelijkt klassieke numerieke methoden en machine learning-benaderingen voor het oplossen van partiële differentiaalvergelijkingen, benadrukt hun fundamentele epistemologische verschillen en biedt een raamwerk voor het ontwerpen van hybride methoden die de sterke punten van beide paradigma's combineren.

Mohammad Nooraiepour, Jakub Wiktor Both, Teeratorn Kadeethum, Saeid Sadeghnejad2026-03-10🤖 cs.LG

Beyond Surrogates: A Quantitative Analysis for Inter-Metric Relationships

Dit artikel introduceert een unificerend theoretisch raamwerk dat de kwantitatieve relaties tussen verschillende evaluatiemetrics analyseert via Bayes-optimale sets en regret-overdracht om de discrepantie tussen offline validatie en online prestaties op te lossen.

Yuanhao Pu, Defu Lian, Enhong Chen2026-03-10🤖 cs.LG

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Deze dissertatie stelt voor om processorontwerp te verschuiven van data-agnostisch naar data-informeerd door middel van machine learning en semantische data-eigenschappen, waardoor de prestaties en energie-efficiëntie aanzienlijk worden verbeterd door het memory-bottleneck effectief aan te pakken.

Rahul Bera2026-03-10🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Dit paper introduceert Megatron Core, een schaalbaar en productieklaar open-source framework dat geïntegreerde optimalisaties voor geheugen, communicatie en berekening combineert om de training van Mixture-of-Experts-modellen tot triljoenen parameters op duizenden GPU's efficiënt te maken.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

Global Convergence of Average Reward Constrained MDPs with Neural Critic and General Policy Parameterization

Dit paper introduceert een primal-dual natural actor-critic algoritme met neurale critics dat, voor het eerst, globale convergentie en cumulatieve constraint-schendingen van $\tilde{\mathcal{O}}(T^{-1/4})$ garandeert voor onbepaalde-horizon Constrained MDP's met algemene beleidsparametrisaties en multi-layer neurale netwerken.

Anirudh Satheesh, Pankaj Kumar Barman, Washim Uddin Mondal, Vaneet Aggarwal2026-03-10🤖 cs.LG

Step-Size Decay and Structural Stagnation in Greedy Sparse Learning

Dit artikel toont aan dat te snel afnemende stapgroottes in gretige algoritmen voor sparsere leerproblemen, zelfs in laagdimensionale settings, leiden tot structurele stagnatie door over-decay en feature coherentie.

Pablo M. Berná2026-03-10🤖 cs.LG

Deep Incentive Design with Differentiable Equilibrium Blocks

Dit paper introduceert Deep Incentive Design (DID), een nieuw differentieerbaar framework dat game-agnostische differentieerbare evenwichtsblocks (DEBs) gebruikt om complexe prikkeldesignproblemen in economie en informatica, zoals contractontwerp en machineschema's, effectief op te lossen.

Vinzenz Thoma, Georgios Piliouras, Luke Marris2026-03-10🤖 cs.LG

← Vorige Volgende →