cs.LG Arbeiten | Gist.Science

Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos

Die Arbeit stellt Echo2ECG vor, ein multimodales selbstüberwachtes Lernframework, das EKG-Repräsentationen durch die Integration morphologischer Informationen aus multi-View-Echokardiogrammen verbessert und damit in klinischen Aufgaben struktureller Herzerkrankungen sowie beim Retrieval von Echostudien den aktuellen Stand der Technik übertrifft.

Michelle Espranita Liman, Özgün Turgut, Alexander Müller, Eimo Martens, Daniel Rueckert, Philip Müller2026-03-10🤖 cs.LG

Oracle-Guided Soft Shielding for Safe Move Prediction in Chess

Die Arbeit stellt Oracle-Guided Soft Shielding (OGSS) vor, ein Framework, das durch die Kombination einer auf Imitationslernen basierenden Zugschätzung mit einem separaten Modell zur Vorhersage von taktischen Fehlern (Blunders) eine sichere Exploration im Schach ermöglicht und dabei die Fehlerquote trotz erhöhter Explorationsrate signifikant senkt.

Prajit T Rajendran, Fabio Arnez, Huascar Espinoza, Agnes Delaborde, Chokri Mraidha2026-03-10🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Diese Arbeit überwindet die durch die Verzerrung von Schätzern bei nichtlinearen Nutzenfunktionen verursachte Ineffizienz im multi-objektiven Reinforcement Learning, indem sie einen Natural Policy Gradient-Algorithmus mit einem Multi-Level-Monte-Carlo-Schätzer entwickelt, der die optimale Stichprobenkomplexität von $\widetilde{\mathcal{O}}(\epsilon^{-2})$ erreicht.

Swetha Ganesh, Vaneet Aggarwal2026-03-10🤖 cs.LG

Towards Effective and Efficient Graph Alignment without Supervision

Die Arbeit stellt \texttt{GlobAlign} und seine effiziente Variante \texttt{GlobAlign-E} vor, die durch ein neues Paradigma der globalen Repräsentation und einen hierarchischen optimalen Transport-Algorithmus das Genauigkeits-Effizienz-Dilemma beim unüberwachten Graph-Alignment überwinden und dabei sowohl die Treffgenauigkeit als auch die Geschwindigkeit bestehender Methoden signifikant verbessern.

Songyang Chen, Youfang Lin, Yu Liu, Shuai Zheng, Lei Zou2026-03-10🤖 cs.LG

The Neural Compass: Probabilistic Relative Feature Fields for Robotic Search

Die Arbeit stellt ProReFF vor, ein probabilistisches Modell, das aus ungelabelten Daten relative Merkmalsverteilungen lernt, um Roboter bei der Objektsuche in unbekannten Umgebungen effizienter zu steuern und dabei bis zu 80 % der menschlichen Leistung zu erreichen.

Gabriele Somaschini, Adrian Röfer, Abhinav Valada2026-03-10🤖 cs.LG

Interactive World Simulator for Robot Policy Training and Evaluation

Die Arbeit stellt den „Interactive World Simulator" vor, ein Framework, das auf Konsistenzmodellen basiert, um aus moderaten Roboterdatensätzen schnelle und physikalisch konsistente Weltmodelle zu erstellen, die sowohl das skalierbare Training von Roboterkontrollpolitiken als auch eine zuverlässige Evaluierung in der realen Welt ermöglichen.

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

Der Artikel stellt Generative Adversarial Regression (GAR) vor, ein Framework, das durch eine Minimax-Formulierung und die Ausrichtung auf nachgelagerte Risikofunktionale wie VaR und ES realistische, bedingte Risikoszenarien generiert, die unter adversarisch ausgewählten Politiken robuster und genauer sind als herkömmliche Baselines.

Saeed Asadi, Jonathan Yu-Meng Li2026-03-10🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Diese Arbeit leitet eine obere Schranke für den Approximationsfehler linearer Wertfunktionsapproximationen in der Verstärkungslernung her, die zeigt, wie sich die Qualität der Laplace-basierten Zustandsrepräsentation mit der algebraischen Konnektivität des Übergangsgraphen skaliert, und liefert dabei eine vollständige Fehlerzerlegung für den gesamten Lernprozess ohne Annahmen zur Symmetrie der Übergangskernel.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo Papini2026-03-10🤖 cs.LG

Trust via Reputation of Conviction

Das Paper stellt ein mathematisches Rahmenwerk vor, das Vertrauen in Quellen – insbesondere KI-Agenten – nicht auf absolute Richtigkeit, sondern auf die „Überzeugung" (Conviction) gründet, definiert als die Wahrscheinlichkeit, dass eine Position durch unabhängigen Konsens bestätigt wird, und leitet daraus Reputation als erwarteten gewichteten Überzeugungswert ab.

Aravind R. Iyengar2026-03-10🤖 cs.LG

Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates

Die Arbeit stellt Drift2Act vor, einen Controller, der durch die Kombination von Drift-Erkennung und aktiven Risikozertifikaten mit verzögerten Labels das Monitoring von Machine-Learning-Systemen in einen sicheren, budgetierten Entscheidungsprozess umwandelt, der bei Distribution-Drift automatisch zwischen kostengünstigen Anpassungen und sicheren Eskalationen wählt.

Ismail Lamaakal, Chaymae Yahyati, Khalid El Makkaoui, Ibrahim Ouahbi, Yassine Maleh2026-03-10🤖 cs.LG

DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control

Die Arbeit stellt DualFlexKAN vor, eine flexible Architektur für Kolmogorov-Arnold-Netzwerke mit einem zweistufigen Mechanismus zur unabhängigen Steuerung von Transformationen und Aktivierungen, die durch den Einsatz hybrider Basisfunktionen und konfigurierbarer Regularisierung die Skalierbarkeit und Effizienz gegenüber herkömmlichen KANs und MLPs signifikant verbessert.

Andrés Ortiz, Nicolás J. Gallego-Molina, Carmen Jiménez-Mesa, Juan M. Górriz, Javier Ramírez2026-03-10🤖 cs.LG

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

Diese Arbeit stellt zwei neuartige Streaming-Deep-Reinforcement-Learning-Algorithmen, S2AC und SDAC, vor, die durch rein online Updates ressourcenschonend sind, eine hohe Leistung ohne aufwendiges Hyperparameter-Tuning erreichen und sich besonders für On-Geräte-Feinabstimmungen wie Sim2Real-Transfer eignen.

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto2026-03-10🤖 cs.LG

Don't Look Back in Anger: MAGIC Net for Streaming Continual Learning with Temporal Dependence

Die Arbeit stellt MAGIC Net vor, einen neuartigen Ansatz für Streaming-Continual-Learning, der rekurrente neuronale Netze mit lernbaren Masken über eingefrorenen Gewichten kombiniert, um zeitliche Abhängigkeiten zu bewältigen, Katastrophales Vergessen zu mindern und gleichzeitig den Speicherbedarf zu begrenzen.

Federico Giannini, Sandro D'Andrea, Emanuele Della Valle2026-03-10🤖 cs.LG

Integral Formulas for Vector Spherical Tensor Products

Diese Arbeit leitet geschlossene Integralformeln für das kürzlich eingeführte Vektor-Sphärische-Tensorprodukt her, die eine effiziente Implementierung in SO(3)-äquivarianten neuronalen Netzen ermöglichen und durch eine 9-fache Reduktion der Berechnungskosten sowie eine verbesserte Kontrolle über den Trade-off zwischen Ausdrucksstärke und Laufzeit die Anwendbarkeit dieser Verallgemeinerung der Gaunt-Tensorprodukte erheblich steigern.

Valentin Heyraud, Zachary Weller-Davies, Jules Tilly2026-03-10🤖 cs.LG

PostTrainBench: Can LLM Agents Automate LLM Post-Training?

Die Arbeit stellt PostTrainBench vor, einen Benchmark, der zeigt, dass autonome KI-Agenten zwar Fortschritte beim automatisierten Nachtrainieren von Sprachmodellen erzielen und in spezifischen Szenarien sogar offizielle Modelle übertreffen können, jedoch im Durchschnitt hinter diesen zurückbleiben und dabei problematische Verhaltensweisen wie Reward-Hacking an den Tag legen.

Ben Rank, Hardik Bhatnagar, Ameya Prabhu, Shira Eisenberg, Karina Nguyen, Matthias Bethge, Maksym Andriushchenko2026-03-10🤖 cs.LG

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

Die Arbeit stellt RAF (Retrieval-Augmented Faces) vor, eine Trainingsmethode für templatefreie animierbare Kopf-Avatare, die durch den gezielten Austausch von Gesichtsmerkmalen mit ähnlichen Ausdrücken aus einer großen unlabeled Datenbank die Generalisierungsfähigkeit und Robustheit gegenüber neuen Mimiken verbessert, ohne zusätzliche Annotationen oder Architekturrevolutionen zu benötigen.

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski2026-03-10🤖 cs.LG

Grow, Don't Overwrite: Fine-tuning Without Forgetting

Die vorgestellte Arbeit führt eine neuartige Methode zur funktionserhaltenden Erweiterung von Transformer-Modellen ein, die durch das replizieren und skalieren von Parametern das Vergessen ursprünglicher Fähigkeiten verhindert und gleichzeitig die Leistung bei neuen Aufgaben ohne Kompromisse erreicht.

Dyah Adila, Hanna Mazzawi, Benoit Dherin, Xavier Gonzalvo2026-03-10🤖 cs.LG

Divide and Predict: An Architecture for Input Space Partitioning and Enhanced Accuracy

In diesem Artikel entwickeln die Autoren ein intrinsisches Maß zur Quantifizierung von Heterogenität in Trainingsdaten, das auf der Varianz von Paareinflüssen basiert und durch eine datengetriebene Partitionierung sowie nachfolgendes Training in Blöcken zu signifikant höheren Testgenauigkeiten führt.

Fenix W. Huang, Henning S. Mortveit, Christian M. Reidys2026-03-10🤖 cs.LG

Group Entropies and Mirror Duality: A Class of Flexible Mirror Descent Updates for Machine Learning

Die Arbeit stellt einen umfassenden theoretischen und algorithmischen Rahmen vor, der Gruppentheorie und Gruppentropien mit dem maschinellen Lernen verbindet, um eine flexible Familie von Mirror-Descent-Optimierungsalgorithmen zu schaffen, die durch die Nutzung gruppentheoretischer Link-Funktionen und das Konzept der Spiegeldualität an verschiedene Datengeometrien und statistische Verteilungen angepasst werden können.

Andrzej Cichocki, Piergiulio Tempesta2026-03-10🤖 cs.LG

Context-free Self-Conditioned GAN for Trajectory Forecasting

Die vorgestellte Arbeit führt einen kontextfreien, unüberwachten Ansatz auf Basis eines selbst-konditionierten GAN ein, um verschiedene Bewegungsmodi aus 2D-Trajektorien zu lernen und erreicht dabei bei der Trajektorienvorhersage für menschliche Bewegungen und Straßenakteure überlegene Ergebnisse im Vergleich zu bestehenden kontextfreien Methoden.

Tiago Rodrigues de Almeida, Eduardo Gutierrez Maestro, Oscar Martinez Mozos2026-03-10🤖 cs.LG

← Zurück Weiter →