Recursive Language Models Meet Uncertainty: The Surprising Effectiveness of Self-Reflective Program Search for Long Context

Die Arbeit stellt SRLM vor, ein Framework, das durch unsicherheitsbewusste Selbstreflexion und die Nutzung intrinsischer Signale wie Selbstkonsistenz und verbale Konfidenz die Leistung von Sprachmodellen bei langen Kontexten verbessert, indem es die Notwendigkeit expliziter rekursiver Mechanismen überwindet und selbst bei kurzen Kontexten sowie semantisch anspruchsvollen Aufgaben konsistent bessere Ergebnisse als herkömmliche rekursive Ansätze erzielt.

Keivan Alizadeh, Parshin Shojaee, Minsik Cho, Mehrdad Farajtabar2026-03-18💬 cs.CL

A scaled TW-PINN: A physics-informed neural network for traveling wave solutions of reaction-diffusion equations with general coefficients

Die Autoren stellen einen effizienten und generalisierbaren „scaled TW-PINN"-Rahmen vor, der durch Skalierungstransformation die Berechnung von Travelling-Wave-Lösungen für Reaktions-Diffusions-Gleichungen mit beliebigen Koeffizienten und Dimensionen auf eine einzige, wiederverwendbare eindimensionale Gleichung reduziert und dabei Genauigkeit sowie Überlegenheit gegenüber bestehenden Methoden demonstriert.

Seungwan Han, Kwanghyuk Park, Jiaxi Gu + 1 more2026-03-17🔢 math

Angel or Devil: Discriminating Hard Samples and Anomaly Contaminations for Unsupervised Time Series Anomaly Detection

Der Artikel stellt PLDA vor, eine neuartige, auf Verstärkungslernen basierende Daten-Augmentationsmethode, die durch die Kombination von Verlust- und Parameterverhalten schädliche Anomalie-Kontaminationen von informativen harten Normalproben unterscheidet und so die Leistung unsupervierter Zeitreihen-Anomalieerkennung signifikant verbessert.

Ruyi Zhang, Hongzuo Xu, Songlei Jian + 3 more2026-03-17🤖 cs.AI

Diffusion Reinforcement Learning via Centered Reward Distillation

Die Arbeit stellt Centered Reward Distillation (CRD) vor, ein effizientes Reinforcement-Learning-Framework für Diffusionsmodelle, das durch innerhalb von Prompts zentrierte Belohnungsdistillation und spezielle Techniken zur Kontrolle von Verteilungsdrift eine schnelle Konvergenz bei gleichzeitiger Minimierung von Reward-Hacking bei Text-zu-Bild-Generierung ermöglicht.

Yuanzhi Zhu, Xi Wang, Stéphane Lathuilière + 1 more2026-03-17🤖 cs.AI

Stochastic Operator Network: A Stochastic Maximum Principle Based Approach to Operator Learning

Die Arbeit stellt das Stochastic Operator Network (SON) vor, ein neuartiges Framework zur Unsicherheitsquantifizierung im Operator-Learning, das DeepONet mit stochastischen optimalen Steuerungskonzepten kombiniert, indem es die Branch-Netze als stochastische Differentialgleichungen formuliert und den Stochastic Maximum Principle zur Gradientenberechnung nutzt, um Unsicherheiten durch Diffusionsparameter zu erfassen.

Ryan Bausback, Jingqiao Tang, Lu Lu + 2 more2026-03-17🔢 math

The Geometry of Multi-Task Grokking: Transverse Instability, Superposition, and Weight Decay Phase Structure

Die Arbeit untersucht die geometrische Struktur des Multi-Task-Grokking bei modularen arithmetischen Aufgaben und zeigt, dass durch systematische Gewichtsabnahme eine transiente Instabilität und eine hierarchische Generalisierungsreihenfolge entstehen, wobei überparametrisierte Modelle einen komprimierten Superpositionsraum bilden, der durch redundante Optimierungspfade und eine spezifische Phasenstruktur gekennzeichnet ist.

Yongzhong Xu2026-03-17🤖 cs.AI

Towards On-Policy SFT: Distribution Discriminant Theory and its Applications in LLM Training

Die Arbeit schlägt einen Rahmen für On-Policy-SFT vor, der auf der neu eingeführten Distribution Discriminant Theory (DDT) basiert und durch die Techniken In-Distribution Finetuning (IDFT) sowie Hinted Decoding die Generalisierungsfähigkeit von SFT so verbessert, dass sie die Leistung prominenter Offline-RL-Algorithmen übertrifft, während die Effizienz des SFT-Prozesses erhalten bleibt.

Miaosen Zhang, Yishan Liu, Shuxia Lin + 8 more2026-03-17🤖 cs.AI

KAN-FIF: Spline-Parameterized Lightweight Physics-based Tropical Cyclone Estimation on Meteorological Satellite

Die Studie stellt KAN-FIF vor, ein leichtgewichtiges, physikbasiertes Modell zur Schätzung tropischer Wirbelstürme mittels splinesparametrisierter Kolmogorov-Arnold-Netze, das im Vergleich zu bestehenden Methoden eine drastische Reduktion der Parameterzahl und Inferenzzeit bei gleichzeitig höherer Genauigkeit ermöglicht und somit eine effiziente Echtzeit-Überwachung auf ressourcenbeschränkten Satelliten-Hardwareplattformen erlaubt.

Jiakang Shen, Qinghui Chen, Runtong Wang + 4 more2026-03-17🤖 cs.AI