Tackling Length Inflation Without Trade-offs: Group Relative Reward Rescaling for Reinforcement Learning

Die Arbeit stellt GR³ (Group Relative Reward Rescaling) vor, einen neuen Ansatz für das Reinforcement Learning, der durch eine multiplikative Belohnungsanpassung und regularisierte Kalibrierung die problematische Längeninflation von Sprachmodellen effektiv eindämmt, ohne dabei die Trainingsdynamik oder die Leistungsfähigkeit zu beeinträchtigen.

Zichao Li, Jie Lou, Fangchen Dong, Zhiyuan Fan, Mengjie Ren, Hongyu Lin, Xianpei Han, Debing Zhang, Le Sun, Yaojie Lu, Xing Yu2026-03-12🤖 cs.LG

A Bipartite Graph Approach to U.S.-China Cross-Market Return Forecasting

Diese Studie nutzt einen gerichteten bipartiten Graphen innerhalb eines maschinellen Lernrahmens, um die Vorhersagbarkeit von Aktienrenditen zwischen den US- und chinesischen Märkten zu analysieren, und zeigt dabei eine ausgeprägte Asymmetrie auf, bei der US-Renditen signifikante Informationen für chinesische Intraday-Renditen liefern, während der umgekehrte Effekt begrenzt ist.

Jing Liu, Maria Grith, Xiaowen Dong, Mihai Cucuringu2026-03-12💰 q-fin

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

Diese empirische Studie widerlegt die Hypothese, dass Ausrichtungsaufgaben für Large Language Models zwingend diversitätsfördernde Algorithmen benötigen, und zeigt, dass konventionelle, belohnungsmaximierende RLVR-Methoden auch für das moralische Reasoning effektiv sind, da sich hochbewertete Antworten in diesem Bereich in einem konzentrierten semantischen Raum befinden.

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

Die Arbeit stellt Geo-ATBench, einen neuen Benchmark für geospatiales Audio-Tagging, und das Framework GeoFusion-AT vor, um nachzuweisen, dass die Integration geospatialer semantischer Kontexte die Mehrklassen-Erkennung von Umgebungsgeräuschen, insbesondere bei akustisch ähnlichen Ereignissen, signifikant verbessert.

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Spatio-Temporal Attention Graph Neural Network: Explaining Causalities With Attention

Die Arbeit stellt ein erklärbares, unüberwachtes STA-GNN-Modell für die Anomalieerkennung in industriellen Steuerungssystemen vor, das räumlich-zeitliche Abhängigkeiten nutzt, um durch Aufmerksamkeitsmechanismen kausale Zusammenhänge zu identifizieren und durch konforme Vorhersage die Zuverlässigkeit bei sich ändernden Umgebungen sicherzustellen.

Kosti Koistinen, Kirsi Hellsten, Joni Herttuainen, Kimmo K. Kaski2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

Diese Studie demonstriert, dass ein datengetriebener Ansatz, der die Singulärwertzerlegung mit dem neuronalen Netzwerk SHRED kombiniert, in der Lage ist, den vollständigen magnetohydrodynamischen Zustand in Fusionsreaktoren aus wenigen Temperatursensoren effizient und robust zu rekonstruieren, was eine kostengünstige Echtzeit-Überwachung ermöglicht.

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG