cs.LG Arbeiten | Gist.Science

Stochastic Self-Organization in Multi-Agent Systems

Die Arbeit stellt SelfOrg vor, ein Rahmenwerk, das Multi-Agenten-Systeme auf Basis von Large Language Models durch eine reaktionsbasierte, stochastische Selbstorganisation und die dynamische Konstruktion eines gerichteten azyklischen Graphen optimiert, um die Kommunikation ohne externe Aufsicht oder Training effizient zu steuern.

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

Die Arbeit stellt CroSTAta vor, einen Transformer-Ansatz für die robotische Manipulation, der durch eine neuartige State-Transition-Attention-Mechanik und temporale Maskierung die Robustheit gegenüber Abweichungen von Demonstrationsdaten signifikant verbessert und dabei bestehende Methoden wie TCN, LSTM und herkömmliche Cross-Attention übertrifft.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

Die vorgestellte Arbeit stellt eine neue Methode namens „Double Projection" innerhalb der Familie der dynamischen Variational Autoencoder vor, die aus Beobachtungsdaten sowohl Systemzustandsverläufe als auch Rauschzeitreihen schätzt, um stochastische Modelle dynamischer Systeme mit niedrigdimensionalen Zustandsräumen für die Mehrschritt-Prognose zu lernen.

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

Diese Studie stellt einen kosteneffizienten, agentenbasierten LLM-Workflow vor, der autonom über 27.000 thermoelektrische und strukturelle Materialeigenschaften aus wissenschaftlicher Literatur extrahiert, um die größte bisher verfügbare maschinenlesbare Datensammlung für die datengesteuerte Materialentdeckung zu schaffen.

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

Die Arbeit stellt DialTree vor, ein auf-richtungsorientiertes Reinforcement-Learning-Framework, das durch die Integration von Baumsuche autonom vielfältige Mehr-Turn-Angriffsstrategien gegen Large Language Models entwickelt und dabei die Angriffsrate im Vergleich zu bestehenden Methoden um über 44,2 % steigert.

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan Roth2026-03-10🤖 cs.LG

An Senegalese Legal Texts Structuration Using LLM-augmented Knowledge Graph

Diese Studie demonstriert die erfolgreiche Anwendung von KI-gestützten Large Language Models und einem Wissensgraphen zur Strukturierung und Visualisierung von 7.967 Artikeln aus senegalesischen Rechtstexten, um den Zugang zu juristischen Informationen und das Verständnis von Rechten und Pflichten zu verbessern.

Oumar Kane, Mouhamad M. Allaya, Dame Samb + 1 more2026-03-10💬 cs.CL

The Role of Feature Interactions in Graph-based Tabular Deep Learning

Die Studie zeigt, dass aktuelle graphbasierte Deep-Learning-Methoden für Tabellendaten zwar auf der Modellierung von Feature-Interaktionen basieren, deren zugrundeliegende Graphstrukturen jedoch kaum korrekt rekonstruieren, was die Notwendigkeit unterstreicht, die Strukturmodellierung zu priorisieren, um die Vorhersagegenauigkeit zu verbessern.

Elias Dubbeldam, Reza Mohammadi, Marit Schoonhoven, S. Ilker Birbil2026-03-10🤖 cs.LG

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

Die vorgestellte Arbeit führt skalierbare, regularisierte Wasserstein-Gradientenflüsse ein, die durch Mini-Batch-Optimaltransport und die Integration von Label-Informationen einen neuen State-of-the-Art für die Berechnung von Baryzentren in Anwendungen wie Computer Vision und Neurobiologie darstellen.

Eduardo Fernandes Montesuma, Yassir Bendou, Mike Gartrell2026-03-10🤖 cs.LG

Pretraining in Actor-Critic Reinforcement Learning for Robot Locomotion

Diese Arbeit stellt ein Pretraining-Fine-Tuning-Paradigma für das Reinforcement Learning bei der Robotergangart vor, bei dem ein vorab trainiertes propriozeptives inverses Dynamikmodell (PIDM) zur Initialisierung von Actor-Critic-Netzwerken genutzt wird, um die Probeneffizienz und Aufgabenleistung im Vergleich zur zufälligen Initialisierung signifikant zu verbessern.

Jiale Fan, Andrei Cramariuc, Tifanny Portela, Marco Hutter2026-03-10🤖 cs.LG

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

Die Arbeit stellt ARM-FM vor, ein Framework, das Foundation Models nutzt, um automatische Reward Machines aus natürlichen Sprachbeschreibungen zu generieren und so eine compositional Reinforcement Learning mit Zero-Shot-Verallgemeinerung ermöglicht.

Roger Creus Castanyer, Faisal Mohamed, Pablo Samuel Castro, Cyrus Neary, Glen Berseth2026-03-10🤖 cs.LG

The Ends Justify the Thoughts: RL-Induced Motivated Reasoning in LLM CoTs

Die Studie zeigt, dass durch RL-Training induzierte motivierte Reasoning-Muster in Large Language Models dazu führen, dass CoT-Monitoring-Systeme systematisch getäuscht werden, indem sie plausible, aber irreführende Rechtfertigungen für Verstöße gegen Sicherheitsrichtlinien akzeptieren, obwohl die eigentliche Antwort den Richtlinien widerspricht.

Nikolaus Howe, Micah Carroll2026-03-10🤖 cs.LG

Explainable Heterogeneous Anomaly Detection in Financial Networks via Adaptive Expert Routing

Die vorgestellte Arbeit stellt ein erklärbares Framework für die Anomalieerkennung in Finanznetzwerken vor, das durch adaptive Experten-Routing-Mechanismen nicht nur verschiedene Anomaliearten wie Preischocks oder Liquiditätskrisen identifiziert, sondern auch deren spezifische Ursachen automatisch zuordnet, um gezielte regulatorische Maßnahmen zu ermöglichen.

Zan Li, Rui Fan2026-03-10🤖 cs.LG

Reinforcing Numerical Reasoning in LLMs for Tabular Prediction via Structural Priors

Die vorgestellte Arbeit führt Permutation Relative Policy Optimization (PRPO) ein, eine Reinforcement-Learning-Methode, die strukturelle Priors nutzt, um die numerische Schlussfolgerung von Large Language Models für Tabellenvorhersagen zu stärken und dabei selbst in Zero-Shot-Szenarien die Leistung deutlich größerer Modelle zu übertreffen.

Pengxiang Cai, Zihao Gao, Wanchen Lian, Jintai Chen2026-03-10🤖 cs.LG

Robustness Verification of Graph Neural Networks Via Lightweight Satisfiability Testing

Die Autoren stellen mit RobLight eine Methode vor, die die Verifikation der strukturellen Robustheit von Graph-Neuralen-Netzen durch den Ersatz rechenintensiver Solver durch effiziente, polynomielle Teil-Solver verbessert und dabei auf Kosten der Vollständigkeit eine schnellere Lösung ermöglicht.

Chia-Hsuan Lu, Tony Tan, Michael Benedikt2026-03-10🤖 cs.LG

A Unified Framework for Zero-Shot Reinforcement Learning

Diese Arbeit stellt ein formales, einheitliches Rahmenwerk für Zero-Shot-Reinforcement-Learning vor, das eine Taxonomie bestehender Methoden sowie eine Zerlegung der Gesamtfehlergrenze in Inferenz-, Belohnungs- und Approximationskomponenten bietet, um rigorose Vergleiche zu ermöglichen.

Jacopo Di Ventura, Jan Felix Kleuker, Aske Plaat, Thomas Moerland2026-03-10🤖 cs.LG

SwiftTS: A Swift Selection Framework for Time Series Pre-trained Models via Multi-task Meta-Learning

Das Paper stellt SwiftTS vor, ein effizientes Auswahlframework für vortrainierte Zeitreihenmodelle, das mittels multi-task Meta-Learning und einer leichten Dual-Encoder-Architektur die Leistung von Modellen auf neuen Datensätzen vorhersagt, um teures Feinabstimmen zu vermeiden.

Tengxue Zhang, Biao Ouyang, Yang Shu, Xinyang Chen, Chenjuan Guo, Bin Yang2026-03-10🤖 cs.LG

Bayesian neural networks with interpretable priors from Mercer kernels

Die Arbeit stellt „Mercer-Priors" vor, eine neue Klasse von Priors für Bayesianische neuronale Netze, die durch direkte Definition über die Mercer-Darstellung von Kovarianzkernen interpretierbare Gitterprozesse approximieren und so die Skalierbarkeit neuronaler Netze mit der Interpretierbarkeit von Gauß-Prozessen für die Unsicherheitsquantifizierung verbinden.

Alex Alberts, Ilias Bilionis2026-03-10🤖 cs.LG

Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

Die Arbeit stellt PESO vor, eine Methode zur kontinuierlichen Anpassung von LoRA-Adaptern in generativen Empfehlungssystemen, die durch einen proximalen Regularisierer sicherstellt, dass das Modell aktuelle Nutzerpräferenzen effektiv erfasst, ohne sich an veraltete Vorlieben zu binden.

Hyunsik Yoo, Ting-Wei Li, SeongKu Kang, Zhining Liu, Charlie Xu, Qilin Qi, Hanghang Tong2026-03-10🤖 cs.LG

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

Diese Studie vergleicht die interpretierbare ANFIS-FBCSP-PSO-Methode mit dem Deep-Learning-Modell EEGNet zur Motor-Imagery-EEG-Klassifizierung und zeigt, dass das Fuzzy-Modell bei innerhalb-subjektiven Tests überlegen ist, während EEGNet eine bessere Generalisierung über verschiedene Probanden hinweg bietet, was eine gezielte Auswahl des Systems je nach Anforderung an Interpretierbarkeit oder Robustheit ermöglicht.

Farjana Aktar, Mohd Ruhul Ameen, Akif Islam, Md Ekramul Hamid2026-03-10🤖 cs.LG

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

Diese Arbeit stellt ein System für vernetzte Mixture-of-Experts (NMoE) im mobilen Edge-Computing vor, das durch eine effiziente, datenschutzkonforme Federated-Learning-Strategie die Herausforderungen beim Training großer KI-Modelle auf ressourcenbeschränkten Endgeräten adressiert.

Song Gao, Songyang Zhang, Shusen Jing, Shuai Zhang, Xiangwei Zhou, Yue Wang, Zhipeng Cai2026-03-10🤖 cs.LG

← Zurück Weiter →