cs.LG Arbeiten | Gist.Science

Recursive Language Models Meet Uncertainty: The Surprising Effectiveness of Self-Reflective Program Search for Long Context

Die Arbeit stellt SRLM vor, ein Framework, das durch unsicherheitsbewusste Selbstreflexion und die Nutzung intrinsischer Signale wie Selbstkonsistenz und verbale Konfidenz die Leistung von Sprachmodellen bei langen Kontexten verbessert, indem es die Notwendigkeit expliziter rekursiver Mechanismen überwindet und selbst bei kurzen Kontexten sowie semantisch anspruchsvollen Aufgaben konsistent bessere Ergebnisse als herkömmliche rekursive Ansätze erzielt.

Keivan Alizadeh, Parshin Shojaee, Minsik Cho, Mehrdad Farajtabar2026-03-18💬 cs.CL

Deep Reinforcement Learning for Fano Hypersurfaces

Die Autoren entwickeln einen Deep-Reinforcement-Learning-Algorithmus, der erfolgreich Tausende bisher unbekannter Beispiele für Fano-4-Mannigfaltigkeiten mit terminalen Singularitäten entdeckt und damit die durch kombinatorische Komplexität bisher limitierte Klassifikation in der algebraischen Geometrie erheblich erweitert.

Marc Truter2026-03-17🔢 math

A scaled TW-PINN: A physics-informed neural network for traveling wave solutions of reaction-diffusion equations with general coefficients

Die Autoren stellen einen effizienten und generalisierbaren „scaled TW-PINN"-Rahmen vor, der durch Skalierungstransformation die Berechnung von Travelling-Wave-Lösungen für Reaktions-Diffusions-Gleichungen mit beliebigen Koeffizienten und Dimensionen auf eine einzige, wiederverwendbare eindimensionale Gleichung reduziert und dabei Genauigkeit sowie Überlegenheit gegenüber bestehenden Methoden demonstriert.

Seungwan Han, Kwanghyuk Park, Jiaxi Gu + 1 more2026-03-17🔢 math

Angel or Devil: Discriminating Hard Samples and Anomaly Contaminations for Unsupervised Time Series Anomaly Detection

Der Artikel stellt PLDA vor, eine neuartige, auf Verstärkungslernen basierende Daten-Augmentationsmethode, die durch die Kombination von Verlust- und Parameterverhalten schädliche Anomalie-Kontaminationen von informativen harten Normalproben unterscheidet und so die Leistung unsupervierter Zeitreihen-Anomalieerkennung signifikant verbessert.

Ruyi Zhang, Hongzuo Xu, Songlei Jian + 3 more2026-03-17🤖 cs.AI

Machine Learning-Driven Intelligent Memory System Design: From On-Chip Caches to Storage

Dieser Artikel stellt einen neuartigen Ansatz vor, der leichte maschinelle Lernmethoden nutzt, um adaptive und datengesteuerte Steuerungsmechanismen für den gesamten Speicherhierarchie zu entwickeln, wobei die vorgeschlagenen Richtlinien Pythia, Hermes und Sibyl menschlich entworfene Heuristiken in Bezug auf Leistung und Effizienz deutlich übertreffen.

Rahul Bera, Rakesh Nadig, Onur Mutlu2026-03-17🤖 cs.AI

A Real-Time Neuro-Symbolic Ethical Governor for Safe Decision Control in Autonomous Robotic Manipulation

Diese Arbeit stellt einen Echtzeit-neuro-symbolischen ethischen Governor vor, der durch die Integration von Transformer-basiertem ethischen Schlussfolgern und probabilistischen Risikofeldern autonome Roboterarme in menschenzentrierten Umgebungen sicher und transparent steuert.

Aueaphum Aueawatthanaphisut, Kuepon Aueawatthanaphisut2026-03-17🤖 cs.AI

Diffusion Reinforcement Learning via Centered Reward Distillation

Die Arbeit stellt Centered Reward Distillation (CRD) vor, ein effizientes Reinforcement-Learning-Framework für Diffusionsmodelle, das durch innerhalb von Prompts zentrierte Belohnungsdistillation und spezielle Techniken zur Kontrolle von Verteilungsdrift eine schnelle Konvergenz bei gleichzeitiger Minimierung von Reward-Hacking bei Text-zu-Bild-Generierung ermöglicht.

Yuanzhi Zhu, Xi Wang, Stéphane Lathuilière + 1 more2026-03-17🤖 cs.AI

IFNSO: Iteration-Free Newton-Schulz Orthogonalization

Die Arbeit stellt IFNSO vor, ein neuartiges, iterationsfreies Framework zur Orthogonalisierung, das die rechenintensive Newton-Schulz-Iteration durch eine optimierte Polynomformulierung mit lernbaren Koeffizienten ersetzt, um die Effizienz zu steigern und gleichzeitig eine stabile Konvergenz zu gewährleisten.

Chen Hu, Qianxi Zhao, Xiaochen Yuan + 4 more2026-03-17🔢 math

Stochastic Operator Network: A Stochastic Maximum Principle Based Approach to Operator Learning

Die Arbeit stellt das Stochastic Operator Network (SON) vor, ein neuartiges Framework zur Unsicherheitsquantifizierung im Operator-Learning, das DeepONet mit stochastischen optimalen Steuerungskonzepten kombiniert, indem es die Branch-Netze als stochastische Differentialgleichungen formuliert und den Stochastic Maximum Principle zur Gradientenberechnung nutzt, um Unsicherheiten durch Diffusionsparameter zu erfassen.

Ryan Bausback, Jingqiao Tang, Lu Lu + 2 more2026-03-17🔢 math

Admission Control of Quasi-Reversible Queueing Systems: Optimization and Reinforcement Learning

Diese Arbeit stellt ein optimales Zulassungssteuerungsschema für quasi-reversible Warteschlangensysteme vor, das durch eine verallgemeinerte Definition der Quasi-Reversibilität und balancierte Ankunftsstrategien die Stationarität erhält und Anwendungen in der Optimierung sowie im Reinforcement Learning ermöglicht.

Céline Comte, Pascal Moyal2026-03-17🔢 math

Almost Bayesian: The Fractal Dynamics of Stochastic Gradient Descent

Die Arbeit zeigt, dass Stochastic Gradient Descent als modifizierter Bayes'scher Sampler auf einer fraktalen Landschaft interpretiert werden kann, wobei die fraktale Dimension die Zugänglichkeitsbeschränkungen erklärt und so eine Verbindung zur Bayes'schen Statistik herstellt.

Max Hennick, Stijn De Baerdemacker2026-03-17🔢 math

Improved Approximation Algorithms for Orthogonally Constrained Problems Using Semidefinite Optimization

Der Artikel stellt einen polynomiellen Approximationsalgorithmus für quadratische Optimierungsprobleme mit orthogonaler Nebenbedingung vor, der auf einer semidefiniten Relaxierung und einer randomisierten Rundung basiert und eine Approximationsgüte von $1/3$ garantiert, wobei die Analyse als scharf nachgewiesen wird.

Ryan Cory-Wright, Jean Pauphilet2026-03-17🔢 math

Survey on Neural Routing Solvers

Diese Arbeit stellt eine umfassende Übersicht über neuronale Routenlösungsverfahren vor, die diese aus heuristischer Perspektive kategorisiert und durch eine generalisierungsorientierte Evaluierungskette bisher unentdeckte Forschungslücken aufdeckt.

Yunpeng Ba, Xi Lin, Changliang Zhou + 7 more2026-03-17🤖 cs.AI

The Geometry of Multi-Task Grokking: Transverse Instability, Superposition, and Weight Decay Phase Structure

Die Arbeit untersucht die geometrische Struktur des Multi-Task-Grokking bei modularen arithmetischen Aufgaben und zeigt, dass durch systematische Gewichtsabnahme eine transiente Instabilität und eine hierarchische Generalisierungsreihenfolge entstehen, wobei überparametrisierte Modelle einen komprimierten Superpositionsraum bilden, der durch redundante Optimierungspfade und eine spezifische Phasenstruktur gekennzeichnet ist.

Yongzhong Xu2026-03-17🤖 cs.AI

Early-Warning Signals of Grokking via Loss-Landscape Geometry

Die Studie identifiziert den Kommutator-Defekt, ein Maß für die Krümmung des Verlustlandschafts, als robustes und kausal wirksames Frühwarnsignal für das „Grokking"-Phänomen, das sich über verschiedene Aufgaben hinweg als universeller Vorläufer der Generalisierung in Transformern erweist.

Yongzhong Xu2026-03-17🤖 cs.AI

Low-Dimensional and Transversely Curved Optimization Dynamics in Grokking

Die Studie zeigt, dass Grokking bei Transformern durch das Entkommen aus einem metastabilen Regime gekennzeichnet ist, in dem die Optimierungsdynamik in einem niedrigdimensionalen Unterraum konfiniert ist, während eine vorangehende Zunahme der transversalen Krümmung notwendig, aber nicht hinreichend für die Generalisierung ist.

Yongzhong Xu2026-03-17🤖 cs.AI

Towards On-Policy SFT: Distribution Discriminant Theory and its Applications in LLM Training

Die Arbeit schlägt einen Rahmen für On-Policy-SFT vor, der auf der neu eingeführten Distribution Discriminant Theory (DDT) basiert und durch die Techniken In-Distribution Finetuning (IDFT) sowie Hinted Decoding die Generalisierungsfähigkeit von SFT so verbessert, dass sie die Leistung prominenter Offline-RL-Algorithmen übertrifft, während die Effizienz des SFT-Prozesses erhalten bleibt.

Miaosen Zhang, Yishan Liu, Shuxia Lin + 8 more2026-03-17🤖 cs.AI

KAN-FIF: Spline-Parameterized Lightweight Physics-based Tropical Cyclone Estimation on Meteorological Satellite

Die Studie stellt KAN-FIF vor, ein leichtgewichtiges, physikbasiertes Modell zur Schätzung tropischer Wirbelstürme mittels splinesparametrisierter Kolmogorov-Arnold-Netze, das im Vergleich zu bestehenden Methoden eine drastische Reduktion der Parameterzahl und Inferenzzeit bei gleichzeitig höherer Genauigkeit ermöglicht und somit eine effiziente Echtzeit-Überwachung auf ressourcenbeschränkten Satelliten-Hardwareplattformen erlaubt.

Jiakang Shen, Qinghui Chen, Runtong Wang + 4 more2026-03-17🤖 cs.AI

Circuit Representations of Random Forests with Applications to XAI

Diese Arbeit stellt einen effizienten Ansatz vor, um Random-Forest-Klassifikatoren in logische Schaltkreise zu übersetzen, um darauf aufbauend fundierte, robuste und erklärbare Entscheidungsanalysen wie vollständige Gründe, Kontrasterklärungen und Robustheitsmetriken zu berechnen.

Chunxi Ji, Adnan Darwiche2026-03-17🤖 cs.AI

Seg-MoE: Multi-Resolution Segment-wise Mixture-of-Experts for Time Series Forecasting Transformers

Die Arbeit stellt Seg-MoE vor, einen neuartigen Sparse-Mixture-of-Experts-Ansatz für Zeitreihenvorhersage, der durch die Weiterleitung ganzer zeitlicher Segmente statt einzelner Token die inhärente Kontinuität von Zeitreihen nutzt und damit den State-of-the-Art bei der langfristigen Vorhersage übertrifft.

Evandro S. Ortigossa, Eran Segal2026-03-17🤖 cs.AI

← Zurück Weiter →