Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits

Dieser Artikel stellt einen verteilten, adaptiven Multi-Agenten-Algorithmus zur Identifizierung des optimalen Dienstes für das Edge-Computing in Small-Cell-Netzen vor, der unter Verwendung linearer Banditen und kollaborativer Lernmechanismen die Latenz minimiert und dabei eine nahezu optimale Beschleunigung sowie eine theoretisch fundierte Komplexitätsanalyse bietet.

Mariam Yahya, Aydin Sezgin, Setareh Maghsudi2026-03-11🤖 cs.LG

MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination

Das Paper stellt MuFlex vor, eine skalierbare, Open-Source-Plattform für die koordinierte Flexibilitätsanalyse mehrerer Gebäude, die detaillierte physikalische Modelle (EnergyPlus/Modelica) mit Reinforcement Learning verbindet und durch eine Fallstudie ihre Wirksamkeit bei der Reduzierung des Spitzenlastbedarfs unter Wahrung des Komforts demonstriert.

Ziyan Wu, Ivan Korolija, Rui Tang2026-03-11⚡ eess

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

Diese Arbeit stellt einen dateneffizienten, topologiebewussten Graph-Neural-Network-Ansatz vor, der durch domänenspezifische Merkmalsindizierung und Transistor-Level-Graphenabstraktionen die Leistungsvorhersage aktiver RF-Schaltungen mit einer durchschnittlichen relativen Fehlerquote von 3,45 % und einer deutlich verbesserten Generalisierungsfähigkeit ermöglicht.

Anahita Asadi, Leonid Popryho, Inna Partin-Vaisband2026-03-11🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

Die Studie stellt eine iterative In-Context-Learning-Methode vor, die durch schrittweise Auswahl angepasster Few-Shot-Beispiele und explizite Anweisungen die systematische Generalisierungsfähigkeit von LLMs bei algebraischen Aufgaben mit nicht-standardisierten Rechenregeln verbessert, wobei überraschenderweise einfachere Beispiele oft wirksamer sind als komplexe.

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò Navarin2026-03-11🤖 cs.LG

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

Diese Arbeit stellt ein auf einem residualen neuronalen Netz basierendes Surrogatmodell vor, das die Stromverteilung in REBCO-Solenoiden effizient vorhersagt und damit die zeitaufwendige Optimierung von Hochtemperatursupraleiter-Magneten durch schnelle und präzise Designprozesse ermöglicht.

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing Qu2026-03-11🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

Diese Arbeit untersucht und vergleicht verschiedene Monte-Carlo-Quadraturmethoden mit repulsiven Knoten zur effizienten Berechnung des geschnittenen Wasserstein-Abstands auf der Kugel, wobei sie insbesondere die Varianzreduktion durch deterministische Punktprozesse analysiert und für niedrige Dimensionen randomisierte Quasi-Monte-Carlo-Verfahren sowie für hohe Dimensionen den UnifOrtho-Schätzer empfiehlt.

Vladimir Petrovic, Rémi Bardenet, Agnès Desolneux2026-03-11🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

Dieses Paper stellt den Robot Control Stack (RCS) vor, ein schlankes und modulares Ökosystem, das speziell entwickelt wurde, um die Forschung im Bereich des Robot Learning mit großen generalistischen Vision-Language-Action-Modellen zu unterstützen und dabei die Lücke zwischen Simulation und realer Welt zu schließen.

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian Walter2026-03-11🤖 cs.LG

ZeroSiam: An Efficient Asymmetry for Test-Time Entropy Optimization without Collapse

Die Arbeit stellt ZeroSiam vor, eine effiziente asymmetrische Siamese-Architektur, die durch Divergenz-Alignment mit einem Stop-Gradient-Operator das Kollabieren von Modellen während der Testzeit-Entropieoptimierung verhindert und gleichzeitig die Anpassungsfähigkeit und Leistung bei visuellen sowie sprachbasierten Aufgaben verbessert.

Guohao Chen, Shuaicheng Niu, Deyu Chen, Jiahao Yang, Zitian Zhang, Mingkui Tan, Pengcheng Wu, Zhiqi Shen2026-03-11🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

Die Arbeit stellt General Policy Composition (GPC) vor, eine trainingsfreie Methode, die durch die testzeitliche konvexe Kombination von Verteilungsscores mehrerer vortrainierter Diffusions- oder Flow-basierter Roboterpolicies deren Leistung über das Niveau der einzelnen Elternmodelle hinaus steigert.

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. Luo2026-03-11🤖 cs.LG

Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking

Diese Arbeit stellt einen hybriden Regler vor, der Deep Reinforcement Learning mit robuster, modellunabhängiger Extremwertregelung kombiniert, um die Leistungsfähigkeit von Steuerungssystemen für nichtlineare, zeitvariierende Prozesse zu verbessern und gleichzeitig deren Robustheit gegenüber schnellen Modelländerungen zu gewährleisten.

Shaifalee Saxena, Alan Williams, Rafael Fierro, Alexander Scheinker2026-03-11🤖 cs.LG