cs.LG Arbeiten | Gist.Science

Beam-Plasma Collective Oscillations in Intense Charged-Particle Beams: Dielectric Response Theory, Langmuir Wave Dispersion, and Unsupervised Detection via Prometheus

Diese Arbeit entwickelt ein theoretisches und computergestütztes Rahmenwerk für kollektive Beam-Plasma-Oszillationen in intensiven geladenen Teilchenstrahlen, das mittels der Dielektrikums-Theorie und der Vlasov-Poisson-Gleichung sowie einer Validierung durch das auf PIC-Simulationen trainierte unüberwachte Lernmodell Prometheus die Existenz ungedämpfter Langmuir-Wellen, die universelle Plasmafrequenz und Phasenübergangssignaturen nachweist.

Brandon Yee, Wilson Collins, Michael Iofin, Jiayi Fu2026-03-12🔬 physics

Muscle Synergy Priors Enhance Biomechanical Fidelity in Predictive Musculoskeletal Locomotion Simulation

Die Studie zeigt, dass die Integration physiologischer Muskel-Synergie-Prioritäten in ein verstärkendes Lernframework die biomechanische Genauigkeit und Generalisierungsfähigkeit prädiktiver muskuloskelettaler Laufsimulationen über verschiedene Geschwindigkeiten und Geländebedingungen hinweg verbessert.

Ilseung Park (Carnegie Mellon University), Eunsik Choi (Seoul National University), Jangwhan Ahn (UNC-Chapel Hill and NC State University), Jooeun Ahn (Seoul National University)2026-03-12🤖 cs.LG

Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime

Diese Arbeit beweist die Konvergenz von dualraumvorkonditioniertem Gradientenabstieg auf eine interpolierende Lösung im überparametrisierten Regime und analysiert dessen implizite Verzerrung, wobei gezeigt wird, dass isotrope Vorkonditionierer die gleiche Lösung wie der Standard-Gradientenabstieg liefern.

Reza Ghane, Danil Akhtiamov, Babak Hassibi2026-03-12📊 stat

JEDI: Jointly Embedded Inference of Neural Dynamics

Das Paper stellt JEDI vor, ein hierarchisches Modell, das durch das gemeinsame Lernen von kontextuellen Einbettungen und rekurrenten Gewichten neuronale Dynamiken über verschiedene Aufgaben hinweg aus experimentellen Aufzeichnungen effizient und generalisierbar inferiert.

Anirudh Jamkhandi, Ali Korojy, Olivier Codol, Guillaume Lajoie, Matthew G. Perich2026-03-12🧬 q-bio

A Universal Nearest-Neighbor Estimator for Intrinsic Dimensionality

Diese Arbeit stellt einen universellen Schätzer für die intrinsische Dimensionalität vor, der auf Verhältnissen von Nachbarschaftsabständen basiert, unabhängig von der zugrunde liegenden Datenverteilung konvergiert und sowohl theoretisch als auch experimentell überlegene Ergebnisse liefert.

Eng-Jon Ong, Omer Bobrowski, Gesine Reinert, Primoz Skraba2026-03-12🤖 cs.LG

VERI-DPO: Evidence-Aware Alignment for Clinical Summarization via Claim Verification and Direct Preference Optimization

Die Arbeit stellt VERI-DPO vor, eine Methode zur evidenzbewussten Ausrichtung klinischer Zusammenfassungen, die durch Claim-Verifikation und Direct Preference Optimization (DPO) die Rate nicht unterstützter Aussagen signifikant reduziert und gleichzeitig die klinische Validität sowie Informationsdichte verbessert.

Weixin Liu, Congning Ni, Qingyuan Song, Susannah L. Rose, Christopher Symons, Murat Kantarcioglu, Bradley A. Malin, Zhijun Yin2026-03-12💬 cs.CL

A New Tensor Network: Tubal Tensor Train and Its Applications

Die Arbeit stellt die Tubal Tensor Train (TTT)-Zerlegung vor, ein neues Tensor-Netzwerkmodell, das die t-Produkt-Algebra der T-SVD mit der effizienten Speicherstruktur des Tensor-Train-Formats kombiniert und sich durch lineare Skalierbarkeit sowie erfolgreiche Anwendungen in Bereichen wie Bild- und Videokompression auszeichnet.

Salman Ahmadi-Asl, Valentin Leplat, Anh-Huy Phan, Andrzej Cichocki2026-03-12🔢 math

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

Diese Arbeit stellt ein ressourcenschonendes, hybrides Entscheidungsframework für das Amazons-Schach vor, das Graph-Attention-Autoencoder mit der generativen Kraft von GPT-4o-mini kombiniert, um durch synthetische Daten und strukturelles Rauschen eine überlegene Spielstärke zu erreichen, die sogar die des zugrundeliegenden Lehrmodells übertrifft.

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

Die Arbeit stellt IH-Challenge vor, ein Reinforcement-Learning-Datenset, das die Robustheit von Sprachmodellen gegenüber Konflikten in der Instruktionshierarchie signifikant verbessert, indem es Sicherheitsverletzungen reduziert und gleichzeitig die Hilfsbereitschaft erhält.

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

World Model for Battery Degradation Prediction Under Non-Stationary Aging

Diese Arbeit formuliert die Vorhersage des Batteriealterungsverlaufs als Weltmodellproblem, das durch die Propagierung latenter Zustände und die Einbeziehung eines Single-Particle-Modell-Constraints die Genauigkeit der Degradationsprognose, insbesondere im kritischen „Knie"-Bereich, im Vergleich zu direkten Regressionsansätzen signifikant verbessert.

Kai Chin Lim, Khay Wai See2026-03-12⚡ eess

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

Diese Arbeit stellt ein Multi-Agenten-Reinforcement-Learning-Framework vor, das auf dem Proximal Policy Optimization-Algorithmus basiert, um Drohnenschwärme für die dynamische und priorisierte Lieferung medizinischer Güter in unsicheren Umgebungen zu koordinieren.

Islam Guven, Mehmet Parlak2026-03-12🤖 cs.LG

Tackling Length Inflation Without Trade-offs: Group Relative Reward Rescaling for Reinforcement Learning

Die Arbeit stellt GR³ (Group Relative Reward Rescaling) vor, einen neuen Ansatz für das Reinforcement Learning, der durch eine multiplikative Belohnungsanpassung und regularisierte Kalibrierung die problematische Längeninflation von Sprachmodellen effektiv eindämmt, ohne dabei die Trainingsdynamik oder die Leistungsfähigkeit zu beeinträchtigen.

Zichao Li, Jie Lou, Fangchen Dong, Zhiyuan Fan, Mengjie Ren, Hongyu Lin, Xianpei Han, Debing Zhang, Le Sun, Yaojie Lu, Xing Yu2026-03-12🤖 cs.LG

SCORE: Replacing Layer Stacking with Contractive Recurrent Depth

Die Arbeit stellt SCORE vor, eine ressourceneffiziente Alternative zum klassischen Schichtstapel, die durch wiederholte Anwendung eines einzigen geteilten neuronalen Blocks mit einem kontraktiven ODE-inspirierten Update-Verfahren die Konvergenzgeschwindigkeit verbessert und die Parameteranzahl reduziert.

Guillaume Godin2026-03-12✓ Author reviewed ⓘ🤖 cs.LG

Learning to Score: Tuning Cluster Schedulers through Reinforcement Learning

Diese Arbeit stellt einen Reinforcement-Learning-Ansatz vor, der durch das adaptive Lernen von Gewichten für Cluster-Scheduler-Funktionen die End-to-End-Leistung von Jobs im Vergleich zu festen Gewichten und bestehenden Baselines signifikant verbessert.

Martin Asenov, Qiwen Deng, Gingfung Yeung, Adam Barker2026-03-12🤖 cs.LG

A Bipartite Graph Approach to U.S.-China Cross-Market Return Forecasting

Diese Studie nutzt einen gerichteten bipartiten Graphen innerhalb eines maschinellen Lernrahmens, um die Vorhersagbarkeit von Aktienrenditen zwischen den US- und chinesischen Märkten zu analysieren, und zeigt dabei eine ausgeprägte Asymmetrie auf, bei der US-Renditen signifikante Informationen für chinesische Intraday-Renditen liefern, während der umgekehrte Effekt begrenzt ist.

Jing Liu, Maria Grith, Xiaowen Dong, Mihai Cucuringu2026-03-12💰 q-fin

Quantization Robustness of Monotone Operator Equilibrium Networks

Die Arbeit analysiert die Robustheit von Monotone Operator Equilibrium Networks gegenüber Gewichtsquantisierung, zeigt, dass die Konvergenz garantiert bleibt, solange die spektrale Störung kleiner als der Monotonie-Margin ist, und demonstriert experimentell, dass eine quantisierungsbewusste Training diese Konvergenzgarantien selbst bei vier Bit wiederherstellen kann.

James Li, Philip H. W. Leong, Thomas Chaffey2026-03-12⚡ eess

Riemannian Geometry-Preserving Variational Autoencoder for MI-BCI Data Augmentation

Diese Arbeit stellt einen Riemannischen Geometie-erhaltenden Variational Autoencoder (RGP-VAE) vor, der synthetische, symmetrisch positiv definite EEG-Kovarianzmatrizen für Motor-Imagery-BCI-Anwendungen generiert, um die Datenverfügbarkeit zu erhöhen und einen subjektsunabhängigen latenten Raum zu lernen.

Viktorija Polaka, Ivo Pascal de Jong, Andreea Ioana Sburlea2026-03-12🤖 cs.LG

Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context

Die Studie zeigt, dass Transformer-Modelle durch In-Context-Learning keine einfache Ähnlichkeitsprüfung durchführen, sondern statistische Schätzer konstruieren, die durch eine logistische Analyse als Approximation optimaler Likelihood-Ratio-Tests identifiziert werden können.

Faris Chaudhry, Siddhant Gadkari2026-03-12🤖 cs.LG

HAPEns: Hardware-Aware Post-Hoc Ensembling for Tabular Data

Die Arbeit stellt HAPEns vor, eine hardwarebewusste Nachträglich-Ensemble-Methode für Tabellendaten, die durch die Optimierung entlang der Pareto-Front von Vorhersagegenauigkeit und Ressourcennutzung überlegene Kompromisse zwischen Leistung und Bereitstellungskosten im Vergleich zu bestehenden Baselines erreicht.

Jannis Maier, Lennart Purucker2026-03-12🤖 cs.LG

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

Diese empirische Studie widerlegt die Hypothese, dass Ausrichtungsaufgaben für Large Language Models zwingend diversitätsfördernde Algorithmen benötigen, und zeigt, dass konventionelle, belohnungsmaximierende RLVR-Methoden auch für das moralische Reasoning effektiv sind, da sich hochbewertete Antworten in diesem Bereich in einem konzentrierten semantischen Raum befinden.

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

← Zurück Weiter →