Beam-Plasma Collective Oscillations in Intense Charged-Particle Beams: Dielectric Response Theory, Langmuir Wave Dispersion, and Unsupervised Detection via Prometheus

Diese Arbeit entwickelt ein theoretisches und computergestütztes Rahmenwerk für kollektive Beam-Plasma-Oszillationen in intensiven geladenen Teilchenstrahlen, das mittels der Dielektrikums-Theorie und der Vlasov-Poisson-Gleichung sowie einer Validierung durch das auf PIC-Simulationen trainierte unüberwachte Lernmodell Prometheus die Existenz ungedämpfter Langmuir-Wellen, die universelle Plasmafrequenz und Phasenübergangssignaturen nachweist.

Brandon Yee, Wilson Collins, Michael Iofin, Jiayi Fu2026-03-12🔬 physics

Muscle Synergy Priors Enhance Biomechanical Fidelity in Predictive Musculoskeletal Locomotion Simulation

Die Studie zeigt, dass die Integration physiologischer Muskel-Synergie-Prioritäten in ein verstärkendes Lernframework die biomechanische Genauigkeit und Generalisierungsfähigkeit prädiktiver muskuloskelettaler Laufsimulationen über verschiedene Geschwindigkeiten und Geländebedingungen hinweg verbessert.

Ilseung Park (Carnegie Mellon University), Eunsik Choi (Seoul National University), Jangwhan Ahn (UNC-Chapel Hill and NC State University), Jooeun Ahn (Seoul National University)2026-03-12🤖 cs.LG

VERI-DPO: Evidence-Aware Alignment for Clinical Summarization via Claim Verification and Direct Preference Optimization

Die Arbeit stellt VERI-DPO vor, eine Methode zur evidenzbewussten Ausrichtung klinischer Zusammenfassungen, die durch Claim-Verifikation und Direct Preference Optimization (DPO) die Rate nicht unterstützter Aussagen signifikant reduziert und gleichzeitig die klinische Validität sowie Informationsdichte verbessert.

Weixin Liu, Congning Ni, Qingyuan Song, Susannah L. Rose, Christopher Symons, Murat Kantarcioglu, Bradley A. Malin, Zhijun Yin2026-03-12💬 cs.CL

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

Diese Arbeit stellt ein ressourcenschonendes, hybrides Entscheidungsframework für das Amazons-Schach vor, das Graph-Attention-Autoencoder mit der generativen Kraft von GPT-4o-mini kombiniert, um durch synthetische Daten und strukturelles Rauschen eine überlegene Spielstärke zu erreichen, die sogar die des zugrundeliegenden Lehrmodells übertrifft.

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

Die Arbeit stellt IH-Challenge vor, ein Reinforcement-Learning-Datenset, das die Robustheit von Sprachmodellen gegenüber Konflikten in der Instruktionshierarchie signifikant verbessert, indem es Sicherheitsverletzungen reduziert und gleichzeitig die Hilfsbereitschaft erhält.

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

Tackling Length Inflation Without Trade-offs: Group Relative Reward Rescaling for Reinforcement Learning

Die Arbeit stellt GR³ (Group Relative Reward Rescaling) vor, einen neuen Ansatz für das Reinforcement Learning, der durch eine multiplikative Belohnungsanpassung und regularisierte Kalibrierung die problematische Längeninflation von Sprachmodellen effektiv eindämmt, ohne dabei die Trainingsdynamik oder die Leistungsfähigkeit zu beeinträchtigen.

Zichao Li, Jie Lou, Fangchen Dong, Zhiyuan Fan, Mengjie Ren, Hongyu Lin, Xianpei Han, Debing Zhang, Le Sun, Yaojie Lu, Xing Yu2026-03-12🤖 cs.LG

A Bipartite Graph Approach to U.S.-China Cross-Market Return Forecasting

Diese Studie nutzt einen gerichteten bipartiten Graphen innerhalb eines maschinellen Lernrahmens, um die Vorhersagbarkeit von Aktienrenditen zwischen den US- und chinesischen Märkten zu analysieren, und zeigt dabei eine ausgeprägte Asymmetrie auf, bei der US-Renditen signifikante Informationen für chinesische Intraday-Renditen liefern, während der umgekehrte Effekt begrenzt ist.

Jing Liu, Maria Grith, Xiaowen Dong, Mihai Cucuringu2026-03-12💰 q-fin

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

Diese empirische Studie widerlegt die Hypothese, dass Ausrichtungsaufgaben für Large Language Models zwingend diversitätsfördernde Algorithmen benötigen, und zeigt, dass konventionelle, belohnungsmaximierende RLVR-Methoden auch für das moralische Reasoning effektiv sind, da sich hochbewertete Antworten in diesem Bereich in einem konzentrierten semantischen Raum befinden.

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI