Diffusion Controller: Framework, Algorithms and Parameterization

Het paper introduceert Diffusion Controller (DiffCon), een unificerend controle-theoretisch kader dat reverse diffusion sampling als stochastische besturing ziet, waardoor er efficiënte versterkingsleer-methoden en een lichtgewicht zijnetwerk-parameterisatie ontstaan die de prestaties van gefinetunteerde diffusiemodellen verbeteren.

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

Adaptive Discovery of Interpretable Audio Attributes with Multimodal LLMs for Low-Resource Classification

Dit paper introduceert een methode die Multimodal Large Language Models (MLLMs) gebruikt om binnen het AdaFlock-framework snel interpreteerbare audio-attributes te ontdekken voor low-resource classificatie, wat resulteert in een efficiënter en nauwkeuriger ensemble-classificatiesysteem dan directe MLLM-predicties of menselijke benaderingen.

Kosuke Yoshimura, Hisashi Kashima2026-03-10🤖 cs.LG

RESCHED: Rethinking Flexible Job Shop Scheduling from a Transformer-based Architecture with Simplified States

Dit paper introduceert RESCHED, een minimalistisch deep reinforcement learning-framework dat de Flexible Job Shop Scheduling-problemen oplost door de state-representatie te reduceren tot vier essentiële kenmerken en een aangepaste Transformer-architectuur te gebruiken, wat leidt tot superieure prestaties en betere generalisatie dan bestaande methoden.

Xiangjie Xiao, Cong Zhang, Wen Song, Zhiguang Cao2026-03-10🤖 cs.LG

Resource-Adaptive Federated Text Generation with Differential Privacy

Deze paper introduceert een adaptief federatief leerframework dat de beperkingen van heterogene resources en privacy vereisten overbrugt door krachtige clients te laten finetunen en zwakkere clients te betrekken via een lichtgewicht DP-stemmingsmechanisme, waardoor privacy-beschermde synthetische tekstdatasets worden gegenereerd die de globale verdeling nauwkeurig nabootsen voor diverse downstream-taken.

Jiayi Wang, John Gounley, Heidi Hanson2026-03-10🤖 cs.LG

The Talking Robot: Distortion-Robust Acoustic Models for Robot-Robot Communication

Dit paper introduceert Artoo, een lichtgewicht, end-to-end getraind akoestisch communicatiesysteem voor robots dat handmatige signaalverwerking vervangt door een gezamenlijk geoptimaliseerd TTS- en ASR-netwerk, waardoor robuuste communicatie onder ruis mogelijk is met een zeer lage parametercount en snelle CPU-uitvoering.

Hanlong Li, Karishma Kamalahasan, Jiahui Li, Kazuhiro Nakadai, Shreyas Kousik2026-03-10🤖 cs.LG

VLN-Cache: Enabling Token Caching for VLN Models with Visual/Semantic Dynamics Awareness

Het paper introduceert VLN-Cache, een trainingsvrij caching-framework dat de inferentiekosten van Vision-and-Language Navigation-modellen verlaagt door visuele en semantische dynamiek te detecteren en te compenseren, wat resulteert tot een snelheidswinst van 1,52x zonder in te leveren op de navigatiesuccesratio.

Zihao Zheng, Zhihao Mao, Xingyue Zhou, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Agentic Planning with Reasoning for Image Styling via Offline RL

Dit paper introduceert een framework voor agentic planning met redenering voor afbeeldingsstyling, dat composiete bewerkingen deconstrueert in interpreteerbare toolsequenties en via offline RL wordt geoptimaliseerd op synthetische datasets om superieure resultaten te behalen ten opzichte van directe prompt-gebaseerde methoden.

Subhojyoti Mukherjee, Stefano Petrangeli, Branislav Kveton, Trung Bui, Franck Dernoncourt, Arko Mukherjee2026-03-10🤖 cs.LG