Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos

Die Arbeit stellt Echo2ECG vor, ein multimodales selbstüberwachtes Lernframework, das EKG-Repräsentationen durch die Integration morphologischer Informationen aus multi-View-Echokardiogrammen verbessert und damit in klinischen Aufgaben struktureller Herzerkrankungen sowie beim Retrieval von Echostudien den aktuellen Stand der Technik übertrifft.

Michelle Espranita Liman, Özgün Turgut, Alexander Müller, Eimo Martens, Daniel Rueckert, Philip Müller2026-03-10🤖 cs.LG

Oracle-Guided Soft Shielding for Safe Move Prediction in Chess

Die Arbeit stellt Oracle-Guided Soft Shielding (OGSS) vor, ein Framework, das durch die Kombination einer auf Imitationslernen basierenden Zugschätzung mit einem separaten Modell zur Vorhersage von taktischen Fehlern (Blunders) eine sichere Exploration im Schach ermöglicht und dabei die Fehlerquote trotz erhöhter Explorationsrate signifikant senkt.

Prajit T Rajendran, Fabio Arnez, Huascar Espinoza, Agnes Delaborde, Chokri Mraidha2026-03-10🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Diese Arbeit überwindet die durch die Verzerrung von Schätzern bei nichtlinearen Nutzenfunktionen verursachte Ineffizienz im multi-objektiven Reinforcement Learning, indem sie einen Natural Policy Gradient-Algorithmus mit einem Multi-Level-Monte-Carlo-Schätzer entwickelt, der die optimale Stichprobenkomplexität von O~(ϵ2)\widetilde{\mathcal{O}}(\epsilon^{-2}) erreicht.

Swetha Ganesh, Vaneet Aggarwal2026-03-10🤖 cs.LG

Towards Effective and Efficient Graph Alignment without Supervision

Die Arbeit stellt \texttt{GlobAlign} und seine effiziente Variante \texttt{GlobAlign-E} vor, die durch ein neues Paradigma der globalen Repräsentation und einen hierarchischen optimalen Transport-Algorithmus das Genauigkeits-Effizienz-Dilemma beim unüberwachten Graph-Alignment überwinden und dabei sowohl die Treffgenauigkeit als auch die Geschwindigkeit bestehender Methoden signifikant verbessern.

Songyang Chen, Youfang Lin, Yu Liu, Shuai Zheng, Lei Zou2026-03-10🤖 cs.LG

Interactive World Simulator for Robot Policy Training and Evaluation

Die Arbeit stellt den „Interactive World Simulator" vor, ein Framework, das auf Konsistenzmodellen basiert, um aus moderaten Roboterdatensätzen schnelle und physikalisch konsistente Weltmodelle zu erstellen, die sowohl das skalierbare Training von Roboterkontrollpolitiken als auch eine zuverlässige Evaluierung in der realen Welt ermöglichen.

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Diese Arbeit leitet eine obere Schranke für den Approximationsfehler linearer Wertfunktionsapproximationen in der Verstärkungslernung her, die zeigt, wie sich die Qualität der Laplace-basierten Zustandsrepräsentation mit der algebraischen Konnektivität des Übergangsgraphen skaliert, und liefert dabei eine vollständige Fehlerzerlegung für den gesamten Lernprozess ohne Annahmen zur Symmetrie der Übergangskernel.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo Papini2026-03-10🤖 cs.LG

Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates

Die Arbeit stellt Drift2Act vor, einen Controller, der durch die Kombination von Drift-Erkennung und aktiven Risikozertifikaten mit verzögerten Labels das Monitoring von Machine-Learning-Systemen in einen sicheren, budgetierten Entscheidungsprozess umwandelt, der bei Distribution-Drift automatisch zwischen kostengünstigen Anpassungen und sicheren Eskalationen wählt.

Ismail Lamaakal, Chaymae Yahyati, Khalid El Makkaoui, Ibrahim Ouahbi, Yassine Maleh2026-03-10🤖 cs.LG

DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control

Die Arbeit stellt DualFlexKAN vor, eine flexible Architektur für Kolmogorov-Arnold-Netzwerke mit einem zweistufigen Mechanismus zur unabhängigen Steuerung von Transformationen und Aktivierungen, die durch den Einsatz hybrider Basisfunktionen und konfigurierbarer Regularisierung die Skalierbarkeit und Effizienz gegenüber herkömmlichen KANs und MLPs signifikant verbessert.

Andrés Ortiz, Nicolás J. Gallego-Molina, Carmen Jiménez-Mesa, Juan M. Górriz, Javier Ramírez2026-03-10🤖 cs.LG

Integral Formulas for Vector Spherical Tensor Products

Diese Arbeit leitet geschlossene Integralformeln für das kürzlich eingeführte Vektor-Sphärische-Tensorprodukt her, die eine effiziente Implementierung in SO(3)-äquivarianten neuronalen Netzen ermöglichen und durch eine 9-fache Reduktion der Berechnungskosten sowie eine verbesserte Kontrolle über den Trade-off zwischen Ausdrucksstärke und Laufzeit die Anwendbarkeit dieser Verallgemeinerung der Gaunt-Tensorprodukte erheblich steigern.

Valentin Heyraud, Zachary Weller-Davies, Jules Tilly2026-03-10🤖 cs.LG

PostTrainBench: Can LLM Agents Automate LLM Post-Training?

Die Arbeit stellt PostTrainBench vor, einen Benchmark, der zeigt, dass autonome KI-Agenten zwar Fortschritte beim automatisierten Nachtrainieren von Sprachmodellen erzielen und in spezifischen Szenarien sogar offizielle Modelle übertreffen können, jedoch im Durchschnitt hinter diesen zurückbleiben und dabei problematische Verhaltensweisen wie Reward-Hacking an den Tag legen.

Ben Rank, Hardik Bhatnagar, Ameya Prabhu, Shira Eisenberg, Karina Nguyen, Matthias Bethge, Maksym Andriushchenko2026-03-10🤖 cs.LG

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

Die Arbeit stellt RAF (Retrieval-Augmented Faces) vor, eine Trainingsmethode für templatefreie animierbare Kopf-Avatare, die durch den gezielten Austausch von Gesichtsmerkmalen mit ähnlichen Ausdrücken aus einer großen unlabeled Datenbank die Generalisierungsfähigkeit und Robustheit gegenüber neuen Mimiken verbessert, ohne zusätzliche Annotationen oder Architekturrevolutionen zu benötigen.

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski2026-03-10🤖 cs.LG

Group Entropies and Mirror Duality: A Class of Flexible Mirror Descent Updates for Machine Learning

Die Arbeit stellt einen umfassenden theoretischen und algorithmischen Rahmen vor, der Gruppentheorie und Gruppentropien mit dem maschinellen Lernen verbindet, um eine flexible Familie von Mirror-Descent-Optimierungsalgorithmen zu schaffen, die durch die Nutzung gruppentheoretischer Link-Funktionen und das Konzept der Spiegeldualität an verschiedene Datengeometrien und statistische Verteilungen angepasst werden können.

Andrzej Cichocki, Piergiulio Tempesta2026-03-10🤖 cs.LG

Context-free Self-Conditioned GAN for Trajectory Forecasting

Die vorgestellte Arbeit führt einen kontextfreien, unüberwachten Ansatz auf Basis eines selbst-konditionierten GAN ein, um verschiedene Bewegungsmodi aus 2D-Trajektorien zu lernen und erreicht dabei bei der Trajektorienvorhersage für menschliche Bewegungen und Straßenakteure überlegene Ergebnisse im Vergleich zu bestehenden kontextfreien Methoden.

Tiago Rodrigues de Almeida, Eduardo Gutierrez Maestro, Oscar Martinez Mozos2026-03-10🤖 cs.LG