cs.LG Arbeiten | Gist.Science

Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits

Dieser Artikel stellt einen verteilten, adaptiven Multi-Agenten-Algorithmus zur Identifizierung des optimalen Dienstes für das Edge-Computing in Small-Cell-Netzen vor, der unter Verwendung linearer Banditen und kollaborativer Lernmechanismen die Latenz minimiert und dabei eine nahezu optimale Beschleunigung sowie eine theoretisch fundierte Komplexitätsanalyse bietet.

Mariam Yahya, Aydin Sezgin, Setareh Maghsudi2026-03-11🤖 cs.LG

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

Die Arbeit leitet unter Verwendung diskreter Gronwall-Ungleichungen Konvergenzraten für die letzte Iteration von stochastischem Gradientenabstieg und stochastischem Heavy-Ball-Verfahren bei konvexen und nicht-konvexen Zielfunktionen mit $\gamma$ -Hölder-stetigem Gradienten her.

Marcel Hudiani2026-03-11🤖 cs.LG

Operator Learning for Consolidation: An Architectural Comparison for DeepONet Variants

Diese Studie vergleicht DeepONet-Architekturen für die Konsolidierung in der Geotechnik, identifiziert eine physikinspirierte Variante mit Fourier-Features als leistungsfähigste Lösung und demonstriert deren Potenzial zur drastischen Beschleunigung der Unsicherheitsquantifizierung in 3D-Szenarien.

Yongjin Choi, Chenying Liu, Jorge Macedo2026-03-11🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

Dieses Paper stellt LangevinFlow vor, ein physikinspiriertes sequenzielles Variational Auto-Encoder-Modell, das unterdämpfte Langevin-Dynamik und lokal gekoppelte Oszillatoren nutzt, um latente neuronale Dynamiken präziser zu modellieren als bestehende Methoden.

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

Die Arbeit stellt „Latent Policy Steering" (LPS) vor, eine Methode, die durch Vortraining eines Weltmodells mit embodiment-unabhängigem optischem Fluss und anschließendem Feinabstimmen auf wenigen Zielsystem-Demonstrationen die Leistung visuomotorischer Robotik-Policies in datenarmen Szenarien erheblich verbessert.

Yiqi Wang, Mrinal Verghese, Jeff Schneider2026-03-11🤖 cs.AI

Multimodal LLM-assisted Evolutionary Search for Programmatic Control Policies

Diese Arbeit stellt MLES vor, einen neuartigen Ansatz, der multimodale Large Language Models mit evolutionärer Suche kombiniert, um transparente, verifizierbare und leistungsfähige programmatische Steuerungsstrategien zu entdecken, die die Black-Box-Natur herkömmlicher Deep-Reinforcement-Learning-Policies überwinden.

Qinglong Hu, Xialiang Tong, Mingxuan Yuan, Fei Liu, Zhichao Lu, Qingfu Zhang2026-03-11🤖 cs.LG

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

Die Arbeit stellt CTRL vor, eine Meta-Learning-Methode, die durch die Kombination von residualer Transferlernung und adaptiver Clusterbildung die Vorhersagegenauigkeit über viele kleine, heterogene Datenquellen hinweg verbessert und dabei gleichzeitig die spezifischen Unterschiede zwischen den Quellen bewahrt.

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth Paulson2026-03-11🤖 cs.LG

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

Diese Studie stellt einen neuartigen Ansatz vor, bei dem mithilfe von KI-generiertem Gesang und virtuellen Avataren (insbesondere mit dem Tool HeyGem) Lehrpläne in unterhaltsame audiovisuelle Präsentationen umgewandelt werden, um das Engagement der Studierenden zu steigern und die Merkfähigkeit wichtiger Kursinformationen zu verbessern.

Xinxing Wu2026-03-11🤖 cs.AI

MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination

Das Paper stellt MuFlex vor, eine skalierbare, Open-Source-Plattform für die koordinierte Flexibilitätsanalyse mehrerer Gebäude, die detaillierte physikalische Modelle (EnergyPlus/Modelica) mit Reinforcement Learning verbindet und durch eine Fallstudie ihre Wirksamkeit bei der Reduzierung des Spitzenlastbedarfs unter Wahrung des Komforts demonstriert.

Ziyan Wu, Ivan Korolija, Rui Tang2026-03-11⚡ eess

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

Diese Arbeit stellt einen dateneffizienten, topologiebewussten Graph-Neural-Network-Ansatz vor, der durch domänenspezifische Merkmalsindizierung und Transistor-Level-Graphenabstraktionen die Leistungsvorhersage aktiver RF-Schaltungen mit einer durchschnittlichen relativen Fehlerquote von 3,45 % und einer deutlich verbesserten Generalisierungsfähigkeit ermöglicht.

Anahita Asadi, Leonid Popryho, Inna Partin-Vaisband2026-03-11🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

Die Studie stellt eine iterative In-Context-Learning-Methode vor, die durch schrittweise Auswahl angepasster Few-Shot-Beispiele und explizite Anweisungen die systematische Generalisierungsfähigkeit von LLMs bei algebraischen Aufgaben mit nicht-standardisierten Rechenregeln verbessert, wobei überraschenderweise einfachere Beispiele oft wirksamer sind als komplexe.

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò Navarin2026-03-11🤖 cs.LG

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

Diese Arbeit stellt ein auf einem residualen neuronalen Netz basierendes Surrogatmodell vor, das die Stromverteilung in REBCO-Solenoiden effizient vorhersagt und damit die zeitaufwendige Optimierung von Hochtemperatursupraleiter-Magneten durch schnelle und präzise Designprozesse ermöglicht.

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing Qu2026-03-11🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

Diese Arbeit untersucht und vergleicht verschiedene Monte-Carlo-Quadraturmethoden mit repulsiven Knoten zur effizienten Berechnung des geschnittenen Wasserstein-Abstands auf der Kugel, wobei sie insbesondere die Varianzreduktion durch deterministische Punktprozesse analysiert und für niedrige Dimensionen randomisierte Quasi-Monte-Carlo-Verfahren sowie für hohe Dimensionen den UnifOrtho-Schätzer empfiehlt.

Vladimir Petrovic, Rémi Bardenet, Agnès Desolneux2026-03-11🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

Dieses Paper stellt den Robot Control Stack (RCS) vor, ein schlankes und modulares Ökosystem, das speziell entwickelt wurde, um die Forschung im Bereich des Robot Learning mit großen generalistischen Vision-Language-Action-Modellen zu unterstützen und dabei die Lücke zwischen Simulation und realer Welt zu schließen.

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian Walter2026-03-11🤖 cs.LG

Kuramoto Orientation Diffusion Models

Diese Arbeit stellt ein score-basiertes generatives Modell vor, das stochastische Kuramoto-Dynamiken nutzt, um die Erzeugung von orientierungsreichen Bildern wie Fingerabdrücken und Texturen durch die Modellierung von Phasensynchronisation auf periodischen Domänen zu verbessern.

Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Reinforced Generation of Combinatorial Structures: Hardness of Approximation

Die Arbeit demonstriert, wie das KI-Tool AlphaEvolve durch die automatische Entwicklung von Code-Mutationen und effizienteren Verifikationsverfahren neue Härte-Approximationsergebnisse für kombinatorische Optimierungsprobleme wie MAX-CUT, MAX-4-CUT und das metrische Traveling Salesman Problem liefert.

Ansh Nagda, Prabhakar Raghavan, Abhradeep Thakurta2026-03-11🤖 cs.AI

VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment

Die Studie stellt VLCE vor, ein zweistufiges Framework, das durch die Integration von semantischem Wissen aus ConceptNet und WordNet in die Bildbeschreibung generierung von Vision-Language-Modellen die Genauigkeit und Fachsprache bei der Schadensbewertung von Katastrophenbildern erheblich verbessert.

Md. Mahfuzur Rahman, Kishor Datta Gupta, Marufa Kamal + 5 more2026-03-11🤖 cs.LG

ZeroSiam: An Efficient Asymmetry for Test-Time Entropy Optimization without Collapse

Die Arbeit stellt ZeroSiam vor, eine effiziente asymmetrische Siamese-Architektur, die durch Divergenz-Alignment mit einem Stop-Gradient-Operator das Kollabieren von Modellen während der Testzeit-Entropieoptimierung verhindert und gleichzeitig die Anpassungsfähigkeit und Leistung bei visuellen sowie sprachbasierten Aufgaben verbessert.

Guohao Chen, Shuaicheng Niu, Deyu Chen, Jiahao Yang, Zitian Zhang, Mingkui Tan, Pengcheng Wu, Zhiqi Shen2026-03-11🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

Die Arbeit stellt General Policy Composition (GPC) vor, eine trainingsfreie Methode, die durch die testzeitliche konvexe Kombination von Verteilungsscores mehrerer vortrainierter Diffusions- oder Flow-basierter Roboterpolicies deren Leistung über das Niveau der einzelnen Elternmodelle hinaus steigert.

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. Luo2026-03-11🤖 cs.LG

Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking

Diese Arbeit stellt einen hybriden Regler vor, der Deep Reinforcement Learning mit robuster, modellunabhängiger Extremwertregelung kombiniert, um die Leistungsfähigkeit von Steuerungssystemen für nichtlineare, zeitvariierende Prozesse zu verbessern und gleichzeitig deren Robustheit gegenüber schnellen Modelländerungen zu gewährleisten.

Shaifalee Saxena, Alan Williams, Rafael Fierro, Alexander Scheinker2026-03-11🤖 cs.LG

← Zurück Weiter →