Chart-RL: Generalized Chart Comprehension via Reinforcement Learning with Verifiable Rewards

Chart-RL is een effectieve versterkingsleermethode die wiskundig verifieerbare beloningen gebruikt om multimodale modellen beter te laten generaliseren bij het begrijpen van diagrammen, waarbij de kwaliteit van de trainingsdata en de complexiteit van de taken belangrijker blijken te zijn dan de hoeveelheid data.

Xin Zhang, Xingyu Li, Rongguang Wang, Ruizhong Miao, Zheng Wang, Dan Roth, Chenyang Li2026-03-10🤖 cs.LG

A SISA-based Machine Unlearning Framework for Power Transformer Inter-Turn Short-Circuit Fault Localization

Dit artikel presenteert een SISA-gebaseerd framework voor machine unlearning dat de invloed van vergiftigde trainingsdata op de diagnose van inter-turn kortsluitfouten in transformatoren effectief verwijdert door alleen de aangetaste data-shards opnieuw te trainen, wat aanzienlijk minder tijd kost dan volledige hertraining terwijl de diagnose-accuraatheid behouden blijft.

Nanhong Liu, Jingyi Yan, Mucun Sun, Jie Zhang2026-03-10🤖 cs.LG

Topology-Aware Reinforcement Learning over Graphs for Resilient Power Distribution Networks

Deze studie introduceert een topology-bewust versterkingsleerframework dat persistentiehomologie integreert om de herconfiguratie en lastafschijving in stroomdistributienetwerken tijdens storingen te optimaliseren, wat resulteert in een aanzienlijke verbetering van de energielevering en spanningsstabiliteit.

Roshni Anna Jacob, Prithvi Poddar, Jaidev Goel, Souma Chowdhury, Yulia R. Gel, Jie Zhang2026-03-10🤖 cs.LG

Conditional Unbalanced Optimal Transport Maps: An Outlier-Robust Framework for Conditional Generative Modeling

Dit paper introduceert Conditional Unbalanced Optimal Transport (CUOT), een robuust raamwerk voor conditionele generatieve modellering dat de gevoeligheid voor uitbijters in klassieke methoden oplost door de distributievastleggingsbeperkingen te versoepelen via Csiszár-divergentiestraffen, wat resulteert in een efficiënt en nauwkeurig model voor het genereren van data.

Jiwoo Yoon, Kyumin Choi, Jaewoong Choi2026-03-10🤖 cs.LG

Diffusion Controller: Framework, Algorithms and Parameterization

Het paper introduceert Diffusion Controller (DiffCon), een unificerend controle-theoretisch kader dat reverse diffusion sampling als stochastische besturing ziet, waardoor er efficiënte versterkingsleer-methoden en een lichtgewicht zijnetwerk-parameterisatie ontstaan die de prestaties van gefinetunteerde diffusiemodellen verbeteren.

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

Adaptive Discovery of Interpretable Audio Attributes with Multimodal LLMs for Low-Resource Classification

Dit paper introduceert een methode die Multimodal Large Language Models (MLLMs) gebruikt om binnen het AdaFlock-framework snel interpreteerbare audio-attributes te ontdekken voor low-resource classificatie, wat resulteert in een efficiënter en nauwkeuriger ensemble-classificatiesysteem dan directe MLLM-predicties of menselijke benaderingen.

Kosuke Yoshimura, Hisashi Kashima2026-03-10🤖 cs.LG

RESCHED: Rethinking Flexible Job Shop Scheduling from a Transformer-based Architecture with Simplified States

Dit paper introduceert RESCHED, een minimalistisch deep reinforcement learning-framework dat de Flexible Job Shop Scheduling-problemen oplost door de state-representatie te reduceren tot vier essentiële kenmerken en een aangepaste Transformer-architectuur te gebruiken, wat leidt tot superieure prestaties en betere generalisatie dan bestaande methoden.

Xiangjie Xiao, Cong Zhang, Wen Song, Zhiguang Cao2026-03-10🤖 cs.LG

Resource-Adaptive Federated Text Generation with Differential Privacy

Deze paper introduceert een adaptief federatief leerframework dat de beperkingen van heterogene resources en privacy vereisten overbrugt door krachtige clients te laten finetunen en zwakkere clients te betrekken via een lichtgewicht DP-stemmingsmechanisme, waardoor privacy-beschermde synthetische tekstdatasets worden gegenereerd die de globale verdeling nauwkeurig nabootsen voor diverse downstream-taken.

Jiayi Wang, John Gounley, Heidi Hanson2026-03-10🤖 cs.LG

The Talking Robot: Distortion-Robust Acoustic Models for Robot-Robot Communication

Dit paper introduceert Artoo, een lichtgewicht, end-to-end getraind akoestisch communicatiesysteem voor robots dat handmatige signaalverwerking vervangt door een gezamenlijk geoptimaliseerd TTS- en ASR-netwerk, waardoor robuuste communicatie onder ruis mogelijk is met een zeer lage parametercount en snelle CPU-uitvoering.

Hanlong Li, Karishma Kamalahasan, Jiahui Li, Kazuhiro Nakadai, Shreyas Kousik2026-03-10🤖 cs.LG

VLN-Cache: Enabling Token Caching for VLN Models with Visual/Semantic Dynamics Awareness

Het paper introduceert VLN-Cache, een trainingsvrij caching-framework dat de inferentiekosten van Vision-and-Language Navigation-modellen verlaagt door visuele en semantische dynamiek te detecteren en te compenseren, wat resulteert tot een snelheidswinst van 1,52x zonder in te leveren op de navigatiesuccesratio.

Zihao Zheng, Zhihao Mao, Xingyue Zhou, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG