Scalable Second-order Riemannian Optimization for KK-means Clustering

Dieses Papier stellt eine neue Formulierung des KK-Means-Clustering-Problems als glatte, unbeschränkte Optimierung auf einer Untermannigfaltigkeit vor, die durch einen zweiten Ordnung Riemannschen Newton-Algorithmus mit kubischer Regularisierung effizient gelöst wird und dabei eine signifikant schnellere Konvergenz als bestehende erste-Ordnung-Methoden bei gleicher statistischer Genauigkeit erreicht.

Peng Xu, Chun-Ying Hou, Xiaohui Chen + 1 more2026-03-05🤖 cs.LG

Learning in an Echo Chamber: Online Learning with Replay Adversary

Diese Arbeit führt den Lernbegriff „Online Learning with Replay Adversary" ein, in dem ein Lerner mit selbstannotierten, fehlerhaften Daten konfrontiert wird, und beweist, dass die „Extended Threshold dimension" die exakte Grenze für die Lernbarkeit darstellt, wobei ein closure-basierter Algorithmus eine optimale Fehlerrate erreicht, während klassische Algorithmen und Proper Learning in diesem Szenario versagen.

Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler + 1 more2026-03-05🤖 cs.LG

FLOWR.root: A flow matching based foundation model for joint multi-purpose structure-aware 3D ligand generation and affinity prediction

FLOWR.root ist ein SE(3)-äquivarianter Flow-Matching-Grundlagenmodell, das die strukturbewusste 3D-Generierung von Liganden mit der Vorhersage von Bindungsaffinität und Konfidenzschätzung vereint und durch effizientes Fine-Tuning sowie Inferenz-Skalierung einen umfassenden Ansatz für den strukturbasierten Wirkstoffentwurf von der Hit-Identifizierung bis zur Leitstrukturoptimierung bietet.

Julian Cremer, Tuan Le, Mohammad M. Ghahremanpour + 3 more2026-03-05🤖 cs.LG

ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL Problems

Das Paper stellt ELMUR vor, eine Transformer-Architektur mit strukturierter externer Speicherprozedur, die durch bidirektionale Cross-Attention und ein LRU-basiertes Update-Verfahren langfristige Abhängigkeiten in teilweise beobachtbaren Umgebungen effektiv modelliert und damit bei Langzeit-Robotersteuerungsaufgaben signifikant bessere Ergebnisse als bestehende Baselines erzielt.

Egor Cherepanov, Alexey K. Kovalev, Aleksandr I. Panov2026-03-05🤖 cs.AI

Composition-Grounded Data Synthesis for Visual Reasoning

Die Arbeit stellt COGS vor, ein dateneffizientes Framework, das durch die Zerlegung von Seed-Fragen in primitive Faktoren und deren systematische Neukombination mit synthetischen Bildern große Mengen an Trainingsdaten für das visuelle Schlussfolgern von Multi-modalen Large Language Models generiert und so deren Leistungsfähigkeit insbesondere bei komplexen, zusammengesetzten Aufgaben erheblich steigert.

Xinyi Gu, Jiayuan Mao, Zhang-Wei Hong + 5 more2026-03-05🤖 cs.LG