Beam-Plasma Collective Oscillations in Intense Charged-Particle Beams: Dielectric Response Theory, Langmuir Wave Dispersion, and Unsupervised Detection via Prometheus

この論文は、中間エネルギー領域の強力な荷電粒子ビームにおけるビーム・プラズマ集団振動を、Vlasov-Poisson 系に基づく動力学場理論と Prometheus による教師なし学習を用いた検証の両面から解明し、ランダウ減衰の消失や Friedel 振動などの新しい物理現象を予測・実証したものである。

Brandon Yee, Wilson Collins, Michael Iofin, Jiayi Fu2026-03-12🔬 physics

Muscle Synergy Priors Enhance Biomechanical Fidelity in Predictive Musculoskeletal Locomotion Simulation

筋協調(筋肉のシナジー)を強化学習の制御空間に組み込むことで、限られた実験データから多様な歩行条件において生体力学的に忠実で汎用性の高い人間の歩行シミュレーションを実現する新しいフレームワークを提案しています。

Ilseung Park (Carnegie Mellon University), Eunsik Choi (Seoul National University), Jangwhan Ahn (UNC-Chapel Hill and NC State University), Jooeun Ahn (Seoul National University)2026-03-12🤖 cs.LG

VERI-DPO: Evidence-Aware Alignment for Clinical Summarization via Claim Verification and Direct Preference Optimization

この論文は、臨床要約における事実誤りを削減し妥当性を向上させるため、主張検証を用いて選好データを抽出し直接選好最適化(DPO)でモデルを調整する「VERI-DPO」という手法を提案し、MIMIC-III データセット上でその有効性を実証しています。

Weixin Liu, Congning Ni, Qingyuan Song, Susannah L. Rose, Christopher Symons, Murat Kantarcioglu, Bradley A. Malin, Zhijun Yin2026-03-12💬 cs.CL

A New Tensor Network: Tubal Tensor Train and Its Applications

この論文では、テンソル特異値分解(T-SVD)の t-積代数とテンソル・トレイン(TT)形式の低次コア構造を融合させた新しいテンソルネットワーク「Tubal Tensor Train(TTT)」分解を提案し、その効率的な計算手法と画像・動画圧縮、テンソル補完、ハイパースペクトル画像処理などにおける実用性を示しています。

Salman Ahmadi-Asl, Valentin Leplat, Anh-Huy Phan, Andrzej Cichocki2026-03-12🔢 math

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

本論文は、大規模言語モデルの生成能力とグラフ注意メカニズムを統合した軽量ハイブリッド枠組みを提案し、限られた計算資源下でも「アマゾンズ」ゲームにおいて教師モデルを上回る高性能な意思決定を実現することを示しています。

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

この論文は、LLM における指示階層(IH)の堅牢性を向上させるための強化学習用データセット「IH-Challenge」を提案し、GPT-5-Mini への適用により安全性と有用性を大幅に改善しつつ能力の低下を最小限に抑えたことを報告しています。

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

World Model for Battery Degradation Prediction Under Non-Stationary Aging

本論文は、リチウムイオン電池の劣化を世界モデルとして定式化し、潜在状態の学習された力学遷移を用いて将来の劣化軌道を予測する手法を提案するとともに、単一粒子モデルの制約を損失関数に組み込むことで、特に劣化の膝点における予測精度を向上させることを示しています。

Kai Chin Lim, Khay Wai See2026-03-12⚡ eess

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

この論文は、部分的に観測可能なマルコフ決定過程(POMDP)として定式化した医療物資の時間的制約付き配送問題を、近接方策最適化(PPO)を用いたマルチエージェント強化学習フレームワークで解決し、実世界の地理データに基づく実験により古典的 PPO が非同期学習よりも優れた協調性能を示すことを実証しています。

Islam Guven, Mehmet Parlak2026-03-12🤖 cs.LG

Tackling Length Inflation Without Trade-offs: Group Relative Reward Rescaling for Reinforcement Learning

この論文は、強化学習におけるLLMの長さ過剰(length inflation)問題を、加法的なペナルティやヒューリスティックなゲートングの欠点を克服し、損失なく最適化を維持しながら解決する「グループ相対報酬スケーリング(GR³)」という手法を提案し、RLHFおよびRLVRの両設定で既存の手法を上回る性能を実証したものである。

Zichao Li, Jie Lou, Fangchen Dong, Zhiyuan Fan, Mengjie Ren, Hongyu Lin, Xianpei Han, Debing Zhang, Le Sun, Yaojie Lu, Xing Yu2026-03-12🤖 cs.LG

Riemannian Geometry-Preserving Variational Autoencoder for MI-BCI Data Augmentation

この論文は、モーターイメージングを用いた脳波インターフェース(MI-BCI)のデータ拡張とプライバシー保護を目的として、対称正定行列の幾何学的性質を保持するリーマン幾何学保存型変分オートエンコーダ(RGP-VAE)を提案し、高忠実度の合成共分散行列を生成する手法を確立したものである。

Viktorija Polaka, Ivo Pascal de Jong, Andreea Ioana Sburlea2026-03-12🤖 cs.LG

Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context

この論文は、文脈内学習(ICL)を行うトランスフォーマーが、単純な類似度マッチングではなく、タスクの幾何学的特性に応じて尤度比検定に基づく最適な統計推定器を構築し、線形タスクでは投票型アンサンブル、非線形タスクでは逐次計算を用いてベイズ最適推定を近似することを示しています。

Faris Chaudhry, Siddhant Gadkari2026-03-12🤖 cs.LG

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

本論文は、道徳的推論におけるアライメントタスクが本質的に多様性を必要とするという仮説を否定し、数学的推論と同様に報酬最大化型の強化学習(RLVR)が効果的であることを、高報酬応答の分布が集中しているという実証的発見を通じて明らかにしています。

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI