World Model for Battery Degradation Prediction Under Non-Stationary Aging

本論文は、リチウムイオン電池の劣化を世界モデルとして定式化し、潜在状態の学習された力学遷移を用いて将来の劣化軌道を予測する手法を提案するとともに、単一粒子モデルの制約を損失関数に組み込むことで、特に劣化の膝点における予測精度を向上させることを示しています。

Kai Chin Lim, Khay Wai See2026-03-12⚡ eess

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

この論文は、部分的に観測可能なマルコフ決定過程(POMDP)として定式化した医療物資の時間的制約付き配送問題を、近接方策最適化(PPO)を用いたマルチエージェント強化学習フレームワークで解決し、実世界の地理データに基づく実験により古典的 PPO が非同期学習よりも優れた協調性能を示すことを実証しています。

Islam Guven, Mehmet Parlak2026-03-12🤖 cs.LG

Tackling Length Inflation Without Trade-offs: Group Relative Reward Rescaling for Reinforcement Learning

この論文は、強化学習におけるLLMの長さ過剰(length inflation)問題を、加法的なペナルティやヒューリスティックなゲートングの欠点を克服し、損失なく最適化を維持しながら解決する「グループ相対報酬スケーリング(GR³)」という手法を提案し、RLHFおよびRLVRの両設定で既存の手法を上回る性能を実証したものである。

Zichao Li, Jie Lou, Fangchen Dong, Zhiyuan Fan, Mengjie Ren, Hongyu Lin, Xianpei Han, Debing Zhang, Le Sun, Yaojie Lu, Xing Yu2026-03-12🤖 cs.LG

Riemannian Geometry-Preserving Variational Autoencoder for MI-BCI Data Augmentation

この論文は、モーターイメージングを用いた脳波インターフェース(MI-BCI)のデータ拡張とプライバシー保護を目的として、対称正定行列の幾何学的性質を保持するリーマン幾何学保存型変分オートエンコーダ(RGP-VAE)を提案し、高忠実度の合成共分散行列を生成する手法を確立したものである。

Viktorija Polaka, Ivo Pascal de Jong, Andreea Ioana Sburlea2026-03-12🤖 cs.LG

Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context

この論文は、文脈内学習(ICL)を行うトランスフォーマーが、単純な類似度マッチングではなく、タスクの幾何学的特性に応じて尤度比検定に基づく最適な統計推定器を構築し、線形タスクでは投票型アンサンブル、非線形タスクでは逐次計算を用いてベイズ最適推定を近似することを示しています。

Faris Chaudhry, Siddhant Gadkari2026-03-12🤖 cs.LG

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

本論文は、道徳的推論におけるアライメントタスクが本質的に多様性を必要とするという仮説を否定し、数学的推論と同様に報酬最大化型の強化学習(RLVR)が効果的であることを、高報酬応答の分布が集中しているという実証的発見を通じて明らかにしています。

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

この論文は、カーネル密度推定に基づく発散のワッサーシュタイン勾配流として「Drifting Model」を数学的に定式化し、モード崩壊とモードのぼやけを同時に回避する混合発散戦略や多様体への拡張を含む新しい生成モデルの枠組み「Gradient Flow Drifting」を提案し、その理論的根拠と有効性を示しています。

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

この論文は、地理空間的意味文脈(GSC)を活用して音声イベントの曖昧さを解消する「Geo-AT」タスクを提案し、その評価基準となるデータセット「Geo-ATBench」と融合フレームワーク「GeoFusion-AT」を開発して、音声認識の精度向上と人間との整合性を検証したものです。

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Reinforcement Learning with Conditional Expectation Reward

この論文は、数学や一般分野など多様な推論タスクにおいて、手動で設計された検証ルールに依存せず、大規模言語モデル自体を暗黙の検証器として利用し、生成された回答の条件付き期待尤度を報酬信号とする「条件付き期待報酬(CER)」を提案し、自由形式の回答にも柔軟に対応できる汎用的な強化学習手法を確立したことを示しています。

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

この論文は、ニューラルネットワーク内の「アクティブパス」に基づいた新規かつ説明可能な手法を提案し、侵入検知システムにおける機械学習モデルのバックドアトリガーを検出・除去する有効性を示す実験結果を報告しています。

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

Spatio-Temporal Attention Graph Neural Network: Explaining Causalities With Attention

この論文は、工業制御システム(ICS)における説明性とドリフト耐性を兼ね備えた異常検知を実現するため、時空間的注意機構とグラフニューラルネットワークを統合し、コンフォーマル予測による誤報制御を可能にする「STA-GNN」を提案するものです。

Kosti Koistinen, Kirsi Hellsten, Joni Herttuainen, Kimmo K. Kaski2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

本論文は、核融合炉の磁気流体力学(MHD)問題において、限られた温度センサーデータから全状態を高精度に再構築するデータ駆動型の代理モデル「SHRED」の有効性を示し、リアルタイム監視・制御への応用可能性を明らかにしたものである。

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG