cs.LG Arbeiten | Gist.Science

Pure Exploration with Infinite Answers

Dieses Paper stellt mit „Sticky-Sequence Track-and-Stop" einen neuartigen Rahmen für reine Exploration bei möglicherweise unendlich vielen korrekten Antworten vor, der die Asymptotische Optimalität bestehender Methoden für endliche Antworträume erweitert und deren Versagen in diesem allgemeineren Setting analysiert.

Riccardo Poiani, Martino Bernasconi, Andrea Celli2026-03-11🤖 cs.LG

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

Das Paper stellt TSRating vor, ein neuartiges Meta-Learning-Framework, das die Qualität von Zeitreihendaten aus unterschiedlichen Domänen bewertet, indem es die Urteilsfähigkeit von Large Language Models nutzt und durch effiziente Meta-Learning-Verfahren in eine skalierbare Bewertungsmethode überführt.

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong Ng2026-03-11🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Die Arbeit stellt CORA vor, eine Methode zur Kreditvergabe im kooperativen Multi-Agenten-Reinforcement-Learning, die mithilfe des Kerns der kooperativen Spieltheorie und zufälliger Koalitionsstichproben globale Vorteile effizient auf Agenten verteilt, um koordiniertes Verhalten zu fördern und die Leistung gegenüber bestehenden Baselines zu verbessern.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang Li2026-03-11🤖 cs.AI

Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning

Die Autoren stellen zwei neue modellfreie Algorithmen für Single-Agent- und Federated-Reinforcement-Learning vor, die erstmals gleichzeitig nahezu optimale Regret, lineare Burn-in-Kosten in Bezug auf Zustands- und Aktionsraum sowie logarithmische Kosten für Politikwechsel oder Kommunikation erreichen.

Haochen Zhang, Zhong Zheng, Lingzhou Xue2026-03-11🤖 cs.LG

Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

Die Arbeit stellt ChannelTokenFormer vor, ein Transformer-basiertes Framework, das durch die gleichzeitige Modellierung von Kanalabhängigkeiten, asynchroner Abtastung und fehlenden Werten eine robuste multivariate Zeitreihenvorhersage unter realen Bedingungen ermöglicht.

Jinkwan Jang, Hyungjin Park, Jinmyeong Choi, Taesup Kim2026-03-11🤖 cs.AI

Wavelet Scattering Transform and Fourier Representation for Offline Detection of Malicious Clients in Federated Learning

Die Arbeit stellt WAFFLE vor, einen Algorithmus zur Vorselektion bösartiger Clients im Federated Learning, der mittels Wavelet-Scattering- oder Fourier-Transformationen lokale, komprimierte Repräsentationen nutzt, um Anomalien ohne Zugriff auf Rohdaten zu erkennen und so die Modellleistung zu verbessern.

Alessandro Licciardi, Davide Leo, Davide Carbone2026-03-11🤖 cs.LG

Uncovering Social Network Activity Using Joint User and Topic Interaction

Die vorgestellte Arbeit führt das Modell „Mixture of Interacting Cascades" (MIC) ein, das mithilfe von markierten mehrdimensionalen Hawkes-Prozessen die komplexe Wechselwirkung zwischen Informationskaskaden und Nutzerverhalten in sozialen Netzwerken gemeinsam modelliert und dabei sowohl eine überlegene Leistung als auch aussagekräftige Visualisierungen ermöglicht.

Gaspard Abel, Argyris Kalogeratos, Jean-Pierre Nadal, Julien Randon-Furling2026-03-11🤖 cs.LG

ConLID: Supervised Contrastive Learning for Low-Resource Language Identification

Die Arbeit stellt ConLID vor, eine Methode des überwachten kontrastiven Lernens, die die domänenunabhängige Sprachidentifikation für ressourcenarme Sprachen verbessert und deren Leistung auf Out-of-Domain-Daten um 3,2 Prozentpunkte steigert, ohne die Ergebnisse für ressourcenstarke Sprachen zu beeinträchtigen.

Negar Foroutan, Jakhongir Saydaliev, Ye Eun Kim, Antoine Bosselut2026-03-11🤖 cs.AI

Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery

Diese Arbeit liefert die ersten globalen Konvergenzgarantien für eine Variante des iterativ gewichteten kleinsten Quadrate-Verfahrens (IRLS) mit dynamischer Regularisierung, die unter deterministischen Bedingungen von jeder Initialisierung aus linear zum zugrunde liegenden Unterraum konvergiert und diese Ergebnisse zudem auf die affinen Unterraumschätzung sowie Anwendungen im Training neuronaler Netze erweitert.

Gilad Lerman, Kang Li, Tyler Maunu, Teng Zhang2026-03-11🤖 cs.LG

Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits

Dieser Artikel stellt einen verteilten, adaptiven Multi-Agenten-Algorithmus zur Identifizierung des optimalen Dienstes für das Edge-Computing in Small-Cell-Netzen vor, der unter Verwendung linearer Banditen und kollaborativer Lernmechanismen die Latenz minimiert und dabei eine nahezu optimale Beschleunigung sowie eine theoretisch fundierte Komplexitätsanalyse bietet.

Mariam Yahya, Aydin Sezgin, Setareh Maghsudi2026-03-11🤖 cs.LG

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

Die Arbeit leitet unter Verwendung diskreter Gronwall-Ungleichungen Konvergenzraten für die letzte Iteration von stochastischem Gradientenabstieg und stochastischem Heavy-Ball-Verfahren bei konvexen und nicht-konvexen Zielfunktionen mit $\gamma$ -Hölder-stetigem Gradienten her.

Marcel Hudiani2026-03-11🤖 cs.LG

Operator Learning for Consolidation: An Architectural Comparison for DeepONet Variants

Diese Studie vergleicht DeepONet-Architekturen für die Konsolidierung in der Geotechnik, identifiziert eine physikinspirierte Variante mit Fourier-Features als leistungsfähigste Lösung und demonstriert deren Potenzial zur drastischen Beschleunigung der Unsicherheitsquantifizierung in 3D-Szenarien.

Yongjin Choi, Chenying Liu, Jorge Macedo2026-03-11🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

Dieses Paper stellt LangevinFlow vor, ein physikinspiriertes sequenzielles Variational Auto-Encoder-Modell, das unterdämpfte Langevin-Dynamik und lokal gekoppelte Oszillatoren nutzt, um latente neuronale Dynamiken präziser zu modellieren als bestehende Methoden.

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

Die Arbeit stellt „Latent Policy Steering" (LPS) vor, eine Methode, die durch Vortraining eines Weltmodells mit embodiment-unabhängigem optischem Fluss und anschließendem Feinabstimmen auf wenigen Zielsystem-Demonstrationen die Leistung visuomotorischer Robotik-Policies in datenarmen Szenarien erheblich verbessert.

Yiqi Wang, Mrinal Verghese, Jeff Schneider2026-03-11🤖 cs.AI

Multimodal LLM-assisted Evolutionary Search for Programmatic Control Policies

Diese Arbeit stellt MLES vor, einen neuartigen Ansatz, der multimodale Large Language Models mit evolutionärer Suche kombiniert, um transparente, verifizierbare und leistungsfähige programmatische Steuerungsstrategien zu entdecken, die die Black-Box-Natur herkömmlicher Deep-Reinforcement-Learning-Policies überwinden.

Qinglong Hu, Xialiang Tong, Mingxuan Yuan, Fei Liu, Zhichao Lu, Qingfu Zhang2026-03-11🤖 cs.LG

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

Die Arbeit stellt CTRL vor, eine Meta-Learning-Methode, die durch die Kombination von residualer Transferlernung und adaptiver Clusterbildung die Vorhersagegenauigkeit über viele kleine, heterogene Datenquellen hinweg verbessert und dabei gleichzeitig die spezifischen Unterschiede zwischen den Quellen bewahrt.

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth Paulson2026-03-11🤖 cs.LG

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

Diese Studie stellt einen neuartigen Ansatz vor, bei dem mithilfe von KI-generiertem Gesang und virtuellen Avataren (insbesondere mit dem Tool HeyGem) Lehrpläne in unterhaltsame audiovisuelle Präsentationen umgewandelt werden, um das Engagement der Studierenden zu steigern und die Merkfähigkeit wichtiger Kursinformationen zu verbessern.

Xinxing Wu2026-03-11🤖 cs.AI

MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination

Das Paper stellt MuFlex vor, eine skalierbare, Open-Source-Plattform für die koordinierte Flexibilitätsanalyse mehrerer Gebäude, die detaillierte physikalische Modelle (EnergyPlus/Modelica) mit Reinforcement Learning verbindet und durch eine Fallstudie ihre Wirksamkeit bei der Reduzierung des Spitzenlastbedarfs unter Wahrung des Komforts demonstriert.

Ziyan Wu, Ivan Korolija, Rui Tang2026-03-11⚡ eess

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

Diese Arbeit stellt einen dateneffizienten, topologiebewussten Graph-Neural-Network-Ansatz vor, der durch domänenspezifische Merkmalsindizierung und Transistor-Level-Graphenabstraktionen die Leistungsvorhersage aktiver RF-Schaltungen mit einer durchschnittlichen relativen Fehlerquote von 3,45 % und einer deutlich verbesserten Generalisierungsfähigkeit ermöglicht.

Anahita Asadi, Leonid Popryho, Inna Partin-Vaisband2026-03-11🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

Die Studie stellt eine iterative In-Context-Learning-Methode vor, die durch schrittweise Auswahl angepasster Few-Shot-Beispiele und explizite Anweisungen die systematische Generalisierungsfähigkeit von LLMs bei algebraischen Aufgaben mit nicht-standardisierten Rechenregeln verbessert, wobei überraschenderweise einfachere Beispiele oft wirksamer sind als komplexe.

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò Navarin2026-03-11🤖 cs.LG

← Zurück Weiter →