Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Die Arbeit stellt CORA vor, eine Methode zur Kreditvergabe im kooperativen Multi-Agenten-Reinforcement-Learning, die mithilfe des Kerns der kooperativen Spieltheorie und zufälliger Koalitionsstichproben globale Vorteile effizient auf Agenten verteilt, um koordiniertes Verhalten zu fördern und die Leistung gegenüber bestehenden Baselines zu verbessern.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang Li2026-03-11🤖 cs.AI

Uncovering Social Network Activity Using Joint User and Topic Interaction

Die vorgestellte Arbeit führt das Modell „Mixture of Interacting Cascades" (MIC) ein, das mithilfe von markierten mehrdimensionalen Hawkes-Prozessen die komplexe Wechselwirkung zwischen Informationskaskaden und Nutzerverhalten in sozialen Netzwerken gemeinsam modelliert und dabei sowohl eine überlegene Leistung als auch aussagekräftige Visualisierungen ermöglicht.

Gaspard Abel, Argyris Kalogeratos, Jean-Pierre Nadal, Julien Randon-Furling2026-03-11🤖 cs.LG

Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery

Diese Arbeit liefert die ersten globalen Konvergenzgarantien für eine Variante des iterativ gewichteten kleinsten Quadrate-Verfahrens (IRLS) mit dynamischer Regularisierung, die unter deterministischen Bedingungen von jeder Initialisierung aus linear zum zugrunde liegenden Unterraum konvergiert und diese Ergebnisse zudem auf die affinen Unterraumschätzung sowie Anwendungen im Training neuronaler Netze erweitert.

Gilad Lerman, Kang Li, Tyler Maunu, Teng Zhang2026-03-11🤖 cs.LG

Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits

Dieser Artikel stellt einen verteilten, adaptiven Multi-Agenten-Algorithmus zur Identifizierung des optimalen Dienstes für das Edge-Computing in Small-Cell-Netzen vor, der unter Verwendung linearer Banditen und kollaborativer Lernmechanismen die Latenz minimiert und dabei eine nahezu optimale Beschleunigung sowie eine theoretisch fundierte Komplexitätsanalyse bietet.

Mariam Yahya, Aydin Sezgin, Setareh Maghsudi2026-03-11🤖 cs.LG

MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination

Das Paper stellt MuFlex vor, eine skalierbare, Open-Source-Plattform für die koordinierte Flexibilitätsanalyse mehrerer Gebäude, die detaillierte physikalische Modelle (EnergyPlus/Modelica) mit Reinforcement Learning verbindet und durch eine Fallstudie ihre Wirksamkeit bei der Reduzierung des Spitzenlastbedarfs unter Wahrung des Komforts demonstriert.

Ziyan Wu, Ivan Korolija, Rui Tang2026-03-11⚡ eess

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

Diese Arbeit stellt einen dateneffizienten, topologiebewussten Graph-Neural-Network-Ansatz vor, der durch domänenspezifische Merkmalsindizierung und Transistor-Level-Graphenabstraktionen die Leistungsvorhersage aktiver RF-Schaltungen mit einer durchschnittlichen relativen Fehlerquote von 3,45 % und einer deutlich verbesserten Generalisierungsfähigkeit ermöglicht.

Anahita Asadi, Leonid Popryho, Inna Partin-Vaisband2026-03-11🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

Die Studie stellt eine iterative In-Context-Learning-Methode vor, die durch schrittweise Auswahl angepasster Few-Shot-Beispiele und explizite Anweisungen die systematische Generalisierungsfähigkeit von LLMs bei algebraischen Aufgaben mit nicht-standardisierten Rechenregeln verbessert, wobei überraschenderweise einfachere Beispiele oft wirksamer sind als komplexe.

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò Navarin2026-03-11🤖 cs.LG