cs.LG Arbeiten | Gist.Science

Best-of- $\infty$ -- Asymptotic Performance of Test-Time LLM Ensembling

Die Arbeit untersucht die asymptotische Leistung von Best-of- $N$ -Ensembles für Large Language Models bei unendlicher Stichprobengröße und schlägt einen adaptiven, gewichteten Ansatz vor, der die Inferenzkosten effizient steuert und durch optimale Modellkombinationen die Leistung einzelner Modelle übertrifft.

Junpei Komiyama, Daisuke Oba, Masafumi Oyamada2026-03-05🤖 cs.AI

CAD-Tokenizer: Towards Text-based CAD Prototyping via Modality-Specific Tokenization

Die Arbeit stellt CAD-Tokenizer vor, ein Framework, das durch modality-spezifische Tokenisierung und primitive-basierte Kodierung die Text-zu-CAD-Generierung und -Bearbeitung verbessert, indem sie die strukturellen Semantiken von CAD-Modellen besser erfasst als herkömmliche LLM-Tokenisierer.

Ruiyu Wang, Shizhao Sun, Weijian Ma + 1 more2026-03-05🤖 cs.LG

Talking Trees: Reasoning-Assisted Induction of Decision Trees for Tabular Data

Diese Arbeit stellt einen Ansatz vor, bei dem ein reasoning-fähiger LLM-Agent mittels eines agentic-Setups kleine tabellarische Datensätze in interpretierbare, faire und leichtgewichtige Entscheidungsbäume überführt, die mit state-of-the-art Black-Box-Modellen konkurrieren können.

George Yakushev, Alina Shutova, Ivan Rubachev + 3 more2026-03-05🤖 cs.LG

Scalable Second-order Riemannian Optimization for $K$ -means Clustering

Dieses Papier stellt eine neue Formulierung des $K$ -Means-Clustering-Problems als glatte, unbeschränkte Optimierung auf einer Untermannigfaltigkeit vor, die durch einen zweiten Ordnung Riemannschen Newton-Algorithmus mit kubischer Regularisierung effizient gelöst wird und dabei eine signifikant schnellere Konvergenz als bestehende erste-Ordnung-Methoden bei gleicher statistischer Genauigkeit erreicht.

Peng Xu, Chun-Ying Hou, Xiaohui Chen + 1 more2026-03-05🤖 cs.LG

Erase or Hide? Suppressing Spurious Unlearning Neurons for Robust Unlearning

Die Studie stellt Ssiuu vor, eine neue Methode zum maschinellen Vergessen, die durch attributionsgesteuerte Regularisierung oberflächliche Verdrängung vermeidet und sensitive Daten in großen Sprachmodellen zuverlässig und dauerhaft löscht, um deren Wiederauftauchen bei nachfolgendem Training zu verhindern.

Nakyeong Yang, Dong-Kyum Kim, Jea Kwon + 3 more2026-03-05🤖 cs.LG

The Lie of the Average: How Class Incremental Learning Evaluation Deceives You?

Die Arbeit entlarvt die Verzerrung herkömmlicher Evaluierungsprotokolle im Class Incremental Learning durch unzureichende Sequenzstichproben und stellt EDGE vor, ein neues Verfahren, das mittels inter-task-Ähnlichkeit extreme Sequenzen identifiziert, um die wahre Leistungsverteilung präziser abzubilden.

Guannan Lai, Da-Wei Zhou, Xin Yang + 1 more2026-03-05🤖 cs.LG

Uni-NTFM: A Unified Foundation Model for EEG Signal Representation Learning

Das Paper stellt Uni-NTFM vor, ein einheitliches Fundamentmodell für EEG-Signale, das durch die Integration neurobiologischer Prinzipien wie heterogener Merkmalsprojektion, topologischer Einbettung und eines Mixture-of-Experts-Transformers auf 28.000 Stunden Daten trainiert wurde und in neun Downstream-Aufgaben bestehende Modelle übertrifft.

Zhisheng Chen, Yingwei Zhang, Qizhen Lan + 7 more2026-03-05🤖 cs.AI

Benchmarking ECG FMs: A Reality Check Across Clinical Tasks

Die Studie zeigt, dass ECG-Foundation-Modelle die Effizienz bei der Auswertung von EKGs erheblich steigern können, wobei die Architektur (insbesondere bei ECG-CPC) einen größeren Einfluss auf die Leistung hat als die reine Skalierung, obwohl signifikante Lücken in der Vorhersage von Krankheitsverläufen und der Patientenkarakterisierung bestehen.

M A Al-Masud, Juan Miguel Lopez Alcaraz, Nils Strodthoff2026-03-05🤖 cs.LG

Learning in an Echo Chamber: Online Learning with Replay Adversary

Diese Arbeit führt den Lernbegriff „Online Learning with Replay Adversary" ein, in dem ein Lerner mit selbstannotierten, fehlerhaften Daten konfrontiert wird, und beweist, dass die „Extended Threshold dimension" die exakte Grenze für die Lernbarkeit darstellt, wobei ein closure-basierter Algorithmus eine optimale Fehlerrate erreicht, während klassische Algorithmen und Proper Learning in diesem Szenario versagen.

Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler + 1 more2026-03-05🤖 cs.LG

Even Faster Kernel Matrix Linear Algebra via Density Estimation

Diese Arbeit verbessert bestehende Algorithmen für lineare Algebra-Aufgaben mit Kernel-Matrizen durch den Einsatz von Dichteschätzung, wodurch die Abhängigkeit von der Datenmenge $n$ und dem Fehler $\varepsilon$ signifikant reduziert wird, und ergänzt diese Ergebnisse durch untere Schranken, die die Grenzen dieser Ansätze aufzeigen.

Rikhav Shah, Sandeep Silwal, Haike Xu2026-03-05🤖 cs.LG

FLOWR.root: A flow matching based foundation model for joint multi-purpose structure-aware 3D ligand generation and affinity prediction

FLOWR.root ist ein SE(3)-äquivarianter Flow-Matching-Grundlagenmodell, das die strukturbewusste 3D-Generierung von Liganden mit der Vorhersage von Bindungsaffinität und Konfidenzschätzung vereint und durch effizientes Fine-Tuning sowie Inferenz-Skalierung einen umfassenden Ansatz für den strukturbasierten Wirkstoffentwurf von der Hit-Identifizierung bis zur Leitstrukturoptimierung bietet.

Julian Cremer, Tuan Le, Mohammad M. Ghahremanpour + 3 more2026-03-05🤖 cs.LG

Learning Explicit Single-Cell Dynamics Using ODE Representations

Die Autoren stellen Cell-Mechanistic Neural Networks (Cell-MNN) vor, ein vollständig end-to-end trainierbares Encoder-Decoder-Modell, das die Dynamik der zellulären Differenzierung durch eine lokal linearisierte ODE abbildet, um skalierbare Vorhersagen und biologisch interpretierbare Geninteraktionen zu ermöglichen.

Jan-Philipp von Bassewitz, Adeel Pervez, Marco Fumero + 3 more2026-03-05🤖 cs.LG

ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL Problems

Das Paper stellt ELMUR vor, eine Transformer-Architektur mit strukturierter externer Speicherprozedur, die durch bidirektionale Cross-Attention und ein LRU-basiertes Update-Verfahren langfristige Abhängigkeiten in teilweise beobachtbaren Umgebungen effektiv modelliert und damit bei Langzeit-Robotersteuerungsaufgaben signifikant bessere Ergebnisse als bestehende Baselines erzielt.

Egor Cherepanov, Alexey K. Kovalev, Aleksandr I. Panov2026-03-05🤖 cs.AI

Value Flows

Die Arbeit stellt „Value Flows" vor, eine neue Methode im Bereich des Distributional Reinforcement Learning, die mithilfe flexibler Flow-basierter Modelle und eines neuartigen Flow-Matching-Ziels die gesamte Verteilung zukünftiger Belohnungen schätzt, um Unsicherheiten zu quantifizieren und die Entscheidungsfindung in verschiedenen Umgebungen signifikant zu verbessern.

Perry Dong, Chongyi Zheng, Chelsea Finn + 2 more2026-03-05🤖 cs.AI

The Geometry of Reasoning: Flowing Logics in Representation Space

Diese Arbeit stellt ein neuartiges geometrisches Rahmenwerk vor, das das logische Denken von Large Language Models als glatte Flüsse im Repräsentationsraum modelliert und zeigt, dass diese Modelle logische Invarianten unabhängig von ihrer Architektur verinnerlichen, was die These der „stochastischen Papageien" widerlegt.

Yufa Zhou, Yixiao Wang, Xunjian Yin + 2 more2026-03-05🤖 cs.AI

Topological Alignment of Shared Vision-Language Embedding Space

Die Arbeit stellt ToMCLIP vor, ein neuartiges Framework, das durch die Integration topologieerhaltender Constraints mittels persistenter Homologie die globale Geometrie multilingualer Vision-Language-Embedding-Räume verbessert und so die Verzerrung zugunsten der englischen Sprache sowie die Null-Shot- und Abrufleistung signifikant steigert.

Junwon You, Dasol Kang, Jae-Hun Jung2026-03-05🤖 cs.AI

Gym-TORAX: Open-source software for integrating RL with plasma control simulators

Das Paper stellt Gym-TORAX vor, eine Open-Source-Python-Bibliothek, die es ermöglicht, Reinforcement-Learning-Umgebungen für die Simulation und Steuerung von Plasmen in Tokamaks zu erstellen, indem sie TORAX mit dem Gymnasium-Framework verbindet und so die Forschung im Bereich der Plasmakontrolle, beispielsweise für ITER, erleichtert.

Antoine Mouchamps, Arthur Malherbe, Adrien Bolland + 1 more2026-03-05🤖 cs.LG

Circuit Insights: Towards Interpretability Beyond Activations

Die Arbeit stellt WeightLens und CircuitLens vor, zwei komplementäre Methoden, die über eine reine Aktivierungsanalyse hinausgehen, indem sie Merkmale direkt aus Gewichten ableiten bzw. deren Interaktionen untersuchen, um die Skalierbarkeit und Robustheit der mechanistischen Interpretierbarkeit von neuronalen Netzen zu verbessern.

Elena Golimblevskaia, Aakriti Jain, Bruno Puri + 3 more2026-03-05🤖 cs.AI

Composition-Grounded Data Synthesis for Visual Reasoning

Die Arbeit stellt COGS vor, ein dateneffizientes Framework, das durch die Zerlegung von Seed-Fragen in primitive Faktoren und deren systematische Neukombination mit synthetischen Bildern große Mengen an Trainingsdaten für das visuelle Schlussfolgern von Multi-modalen Large Language Models generiert und so deren Leistungsfähigkeit insbesondere bei komplexen, zusammengesetzten Aufgaben erheblich steigert.

Xinyi Gu, Jiayuan Mao, Zhang-Wei Hong + 5 more2026-03-05🤖 cs.LG

A Geometry-Based View of Mahalanobis OOD Detection

Die Studie zeigt, dass die Zuverlässigkeit von Mahalanobis-basierten OOD-Detektoren stark von der geometrischen Struktur des Merkmalsraums abhängt, und führt eine neuartige radiale Skalierung der $\ell_2$ -Normalisierung ein, um die Detektionsleistung durch gezielte Anpassung der In-Distribution-Geometrie zu verbessern.

Denis Janiak, Jakub Binkowski, Tomasz Kajdanowicz2026-03-05🤖 cs.LG

← Zurück Weiter →

cs.LG

Best-of-∞\infty∞ -- Asymptotic Performance of Test-Time LLM Ensembling