cs.LG Arbeiten | Gist.Science

Latent Policy Steering through One-Step Flow Policies

Die Arbeit stellt Latent Policy Steering (LPS) vor, eine Methode für das Offline-Reinforcement-Learning, die durch die direkte Rückpropagation von Q-Gradienten aus dem Original-Aktionsraum über eine differenzierbare One-Step-MeanFlow-Politik eine robuste und hyperparameterunabhängige Verbesserung von Latent-Policies ermöglicht und dabei den Datensatz-Support strikt wahrt.

Hokyun Im, Andrey Kolobov, Jianlong Fu + 1 more2026-03-06🤖 cs.LG

WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

Die Arbeit stellt WavSLM vor, ein einfaches, single-stream Sprachmodell, das durch Quantisierung und Distillation von WavLM-Repräsentationen semantische und akustische Informationen ohne Textsupervision in einem einzigen Token-Stream modelliert und dabei wettbewerbsfähige Ergebnisse bei geringerer Komplexität erzielt.

Luca Della Libera, Cem Subakan, Mirco Ravanelli2026-03-06🤖 cs.AI

How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features

Die Autoren schlagen asymmetrische Shapley-Werte als ehrliches Maß zur Bewertung der Bedeutung genomischer Merkmale in klinischen Vorhersagemodellen vor, um die Probleme von Kollinearität und bekannten Kausalrichtungen zu adressieren, und stellen effiziente Algorithmen für lokale und globale Analysen vor, die am Beispiel der Progressions-freien Überlebenszeit bei Darmkrebspatienten veranschaulicht werden.

Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum + 1 more2026-03-06🤖 cs.LG

GALACTIC: Global and Local Agnostic Counterfactuals for Time-series Clustering

Die Arbeit stellt GALACTIC vor, ein einheitliches Framework, das erstmals lokale und globale kontrafaktische Erklärungen für das unüberwachte Clustering von Zeitreihen vereint, indem es instanzspezifische Störungen generiert und durch ein supermodulares MDL-Optimierungsverfahren eine kompakte, nicht-redundante globale Zusammenfassung der Clusterübergänge liefert.

Christos Fragkathoulas, Eleni Psaroudaki, Themis Palpanas + 1 more2026-03-06🤖 cs.AI

FairFinGAN: Fairness-aware Synthetic Financial Data Generation

Die Arbeit stellt FairFinGAN vor, ein auf WGAN basierendes Framework zur Erzeugung fairer synthetischer Finanzdaten, das durch direkte Integration von Fairness-Bedingungen in den Trainingsprozess Verzerrungen bezüglich geschützter Attribute reduziert, ohne die Nützlichkeit der Daten für nachgelagerte Aufgaben signifikant zu beeinträchtigen.

Tai Le Quy, Dung Nguyen Tuan, Trung Nguyen Thanh + 3 more2026-03-06🤖 cs.LG

Bayes with No Shame: Admissibility Geometries of Predictive Inference

Diese Arbeit zeigt, dass die Admissibilität in der prädiktiven Inferenz irreduzibel kriterienrelativ ist, indem sie vier paarweise nicht-nested Admissibilitätsgeometrien identifiziert, die jeweils durch unterschiedliche Zertifikate der Optimalität und inkompatible Optimierungsrahmen charakterisiert werden.

Nicholas G. Polson, Daniel Zantedeschi2026-03-06🔢 math

On the Statistical Optimality of Optimal Decision Trees

Diese Arbeit entwickelt eine umfassende statistische Theorie für empirische Risikominimierungs-Entscheidungsbäume, die durch scharfe Oracle-Ungleichungen und minimax-optimale Raten über neuartige Funktionenklassen die statistische Optimalität und den Kompromiss zwischen Interpretierbarkeit und Genauigkeit unter verschiedenen Rauschbedingungen rigoros begründet.

Zineng Xu, Subhroshekhar Ghosh, Yan Shuo Tan2026-03-06🔢 math

Preserving Continuous Symmetry in Discrete Spaces: Geometric-Aware Quantization for SO(3)-Equivariant GNNs

Diese Arbeit stellt den Geometric-Aware Quantization (GAQ)-Framework vor, der durch eine magnituden- und richtungsentkoppelte Quantisierung sowie symmetriebewusste Trainingsstrategien SO(3)-äquivariante Graph Neural Networks komprimiert, ohne deren kontinuierliche Symmetrie zu verletzen, und damit auf Consumer-Hardware eine signifikante Beschleunigung bei gleichzeitiger Erhaltung der physikalischen Konsistenz für molekulare Simulationen ermöglicht.

Haoyu Zhou, Ping Xue, Hao Zhang + 1 more2026-03-06🤖 cs.LG

InfoFlow KV: Information-Flow-Aware KV Recomputation for Long Context

Der vorgestellte Ansatz „InfoFlow KV" überwindet die Engpässe bei der Inferenz für lange Kontexte in RAG-Systemen, indem er die selektive KV-Neuberechnung als Informationsflussproblem formuliert und mithilfe eines Aufmerksamkeits-Norm-Signals sowie einer kontextsensitiven Chunk-Neuordnung effizient die für die Generierung relevanten Token identifiziert.

Xin Teng, Canyu Zhang, Shaoyi Zheng + 3 more2026-03-06🤖 cs.LG

Learning Causal Structure of Time Series using Best Order Score Search

Die Arbeit stellt TS-BOSS vor, einen skalierbaren, score-basierten Algorithmus zur Entdeckung kausaler Strukturen in multivariaten Zeitreihen, der durch die Erweiterung der BOSS-Methode mit dynamischen Bayesianischen Netzwerken und Grow-Shrink-Bäumen eine hohe Effizienz und theoretische Fundierung bietet, insbesondere in Regimen mit starker Autokorrelation.

Irene Gema Castillo Mansilla, Urmi Ninad2026-03-06🤖 cs.AI

Embedded Inter-Subject Variability in Adversarial Learning for Inertial Sensor-Based Human Activity Recognition

Diese Arbeit stellt ein neuartiges tiefes adversariales Framework vor, das Inter-Subjekt-Variabilität explizit in die adversarielle Aufgabe integriert, um subjektunabhängige Merkmalsrepräsentationen zu erlernen und die Generalisierungsfähigkeit bei der inertialsensorbasierten Aktivitätserkennung zu verbessern.

Francisco M. Calatrava-Nicolás, Shoko Miyauchi, Vitor Fortes Rey + 3 more2026-03-06🤖 cs.LG

Robust Node Affinities via Jaccard-Biased Random Walks and Rank Aggregation

Die Studie stellt TopKGraphs vor, eine robuste und interpretierbare Methode zur Schätzung von Knotenähnlichkeiten in Netzwerken, die durch jaccard-biasierte Random Walks und Rangaggregation in verschiedenen Szenarien überlegene oder wettbewerbsfähige Ergebnisse im Vergleich zu etablierten Ähnlichkeitsmaßen und Embedding-Ansätzen liefert.

Bastian Pfeifer, Michael G. Schimek2026-03-06🤖 cs.LG

On the Necessity of Learnable Sheaf Laplacians

Diese Studie widerlegt die Notwendigkeit lernbarer Restriktionsabbildungen in Sheaf Neural Networks, indem sie zeigt, dass ein einfacher Baseline-Ansatz mit identischen Abbildungen auf heterophilen Graphen vergleichbare Ergebnisse erzielt und das erwartete Überglättungsverhalten nicht empirisch bestätigt wird.

Ferran Hernandez Caralt, Mar GonzÃ lez i CatalÃ, Adrián Bazaga + 1 more2026-03-06🤖 cs.LG

Harnessing Synthetic Data from Generative AI for Statistical Inference

Dieser Artikel bietet eine statistische Übersicht über den Einsatz synthetischer Daten durch generative KI, beleuchtet deren Chancen und methodische Grenzen und leitet daraus Prinzipien sowie praktische Empfehlungen für eine valide Anwendung in Forschung und Praxis ab.

Ahmad Abdel-Azim, Ruoyu Wang, Xihong Lin2026-03-06🤖 cs.LG

MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

Die Arbeit stellt MobileFetalCLIP vor, einen effizienten 11,4-Millionen-Parameter-Studenten-Modell, das durch eine neuartige selektive repulsive Wissensdistillation trainiert wird und damit einen 304-Millionen-Parameter-Lehrer bei der Analyse fetaler Ultraschallbilder übertrifft, was eine Echtzeit-Anwendung auf mobilen Geräten in ressourcenarmen Umgebungen ermöglicht.

Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub2026-03-06🤖 cs.AI

An interpretable prototype parts-based neural network for medical tabular data

Die Autoren stellen ein neuartiges, inhärent interpretierbares neuronales Netzwerk für medizinische Tabellendaten vor, das durch das Lernen von diskretisierten Prototypen-Teilen klinisch verständliche Vorhersagen trifft und dabei eine mit etablierten Basismodellen vergleichbare Genauigkeit erreicht.

Jacek Karolczak, Jerzy Stefanowski2026-03-06🤖 cs.LG

Ensembling Language Models with Sequential Monte Carlo

Diese Arbeit stellt ein einheitliches Framework vor, das mithilfe eines byte-level Sequential-Monte-Carlo-Algorithmus mehrere Sprachmodelle zu $f$ -Ensembles kombiniert, um Verzerrungen bei der Stichprobenziehung zu vermeiden und die Leistung bei strukturierten Textgenerierungsaufgaben zu verbessern.

Robin Shing Moon Chan, Tianyu Liu, Samuel Kiegeland + 5 more2026-03-06🤖 cs.AI

On-Policy Self-Distillation for Reasoning Compression

Die Arbeit stellt OPSDC vor, eine Methode zur on-policy Selbst-Distillation, die Reasoning-Modelle durch Minimierung der Reverse-KL-Divergenz gegenüber ihren eigenen, durch den Befehl „sei prägnant" gesteuerten Ausgaben dazu anleitet, ihre Denkprozesse automatisch zu komprimieren, wodurch bei gleichzeitiger Verbesserung der Genauigkeit auf Benchmarks wie MATH-500 und AIME 2024 bis zu 59 % der Token eingespart werden.

Hejian Sang, Yuanda Xu, Zhengze Zhou + 3 more2026-03-06🤖 cs.LG

Latent Wasserstein Adversarial Imitation Learning

Die Arbeit stellt Latent Wasserstein Adversarial Imitation Learning (LWAIL) vor, ein neuartiges Framework, das durch die Nutzung eines dynamikbewussten latenten Raums und des Wasserstein-Abstands erfolgreich Expertenniveau erreicht, indem es lediglich ein oder wenige Demonstrationsbeispiele ohne Aktionsdaten benötigt.

Siqi Yang, Kai Yan, Alexander G. Schwing + 1 more2026-03-06🤖 cs.LG

Kraus Constrained Sequence Learning For Quantum Trajectories from Continuous Measurement

Die Studie stellt einen physikalisch konsistenten Ansatz zur Echtzeit-Rekonstruktion quantenmechanischer Zustände aus kontinuierlichen Messdaten vor, der durch eine Kraus-Strukturierte Ausgabeschicht in Kombination mit verschiedenen Sequenzmodellen (insbesondere Kraus-LSTM) die Genauigkeit verbessert und gleichzeitig die Einhaltung physikalischer Gesetze wie Positivität und Spur-Erhaltung garantiert.

Priyanshi Singh, Krishna Bhatia2026-03-06🤖 cs.LG

← Zurück Weiter →