cs.LG 件の論文 | Gist.Science

World Model for Battery Degradation Prediction Under Non-Stationary Aging

本論文は、リチウムイオン電池の劣化を世界モデルとして定式化し、潜在状態の学習された力学遷移を用いて将来の劣化軌道を予測する手法を提案するとともに、単一粒子モデルの制約を損失関数に組み込むことで、特に劣化の膝点における予測精度を向上させることを示しています。

Kai Chin Lim, Khay Wai See2026-03-12⚡ eess

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

この論文は、部分的に観測可能なマルコフ決定過程（POMDP）として定式化した医療物資の時間的制約付き配送問題を、近接方策最適化（PPO）を用いたマルチエージェント強化学習フレームワークで解決し、実世界の地理データに基づく実験により古典的 PPO が非同期学習よりも優れた協調性能を示すことを実証しています。

Islam Guven, Mehmet Parlak2026-03-12🤖 cs.LG

Tackling Length Inflation Without Trade-offs: Group Relative Reward Rescaling for Reinforcement Learning

この論文は、強化学習におけるLLMの長さ過剰（length inflation）問題を、加法的なペナルティやヒューリスティックなゲートングの欠点を克服し、損失なく最適化を維持しながら解決する「グループ相対報酬スケーリング（GR³）」という手法を提案し、RLHFおよびRLVRの両設定で既存の手法を上回る性能を実証したものである。

Zichao Li, Jie Lou, Fangchen Dong, Zhiyuan Fan, Mengjie Ren, Hongyu Lin, Xianpei Han, Debing Zhang, Le Sun, Yaojie Lu, Xing Yu2026-03-12🤖 cs.LG

SCORE: Replacing Layer Stacking with Contractive Recurrent Depth

本論文では、従来の層の積み重ねに代わり、ODE に着想を得た収束的な更新を用いて単一の共有ニューラルブロックを反復適用する「SCORE」という離散再帰的アプローチを提案し、パラメータ数の削減と収束速度の向上を実現することを示しています。

Guillaume Godin2026-03-12🤖 cs.LG

Learning to Score: Tuning Cluster Schedulers through Reinforcement Learning

この論文は、強化学習を用いてクラスタースケジューラのスコアリング関数の重みを自動調整し、固定重みや既存のベースラインと比較してサーバーレス環境でのジョブ性能を大幅に向上させる手法を提案しています。

Martin Asenov, Qiwen Deng, Gingfung Yeung, Adam Barker2026-03-12🤖 cs.LG

A Bipartite Graph Approach to U.S.-China Cross-Market Return Forecasting

この論文は、米国と中国の株式市場の非同時取引時間を利用した有向二部グラフを構築し、機械学習モデルに組み込むことで、米国市場の情報が中国市場の日内リターンを予測する強い非対称性を持つことを明らかにしています。

Jing Liu, Maria Grith, Xiaowen Dong, Mihai Cucuringu2026-03-12💰 q-fin

Quantization Robustness of Monotone Operator Equilibrium Networks

本論文は、単調作用素均衡ネットワークの重み量子化をスペクトル摂動として解析し、摂動が単調性マージンより小さい場合に収束保証が維持されることを理論的に示し、MNIST 実験で閾値の存在と量子化感知学習による低ビット数での収束回復を実証しています。

James Li, Philip H. W. Leong, Thomas Chaffey2026-03-12⚡ eess

Riemannian Geometry-Preserving Variational Autoencoder for MI-BCI Data Augmentation

この論文は、モーターイメージングを用いた脳波インターフェース（MI-BCI）のデータ拡張とプライバシー保護を目的として、対称正定行列の幾何学的性質を保持するリーマン幾何学保存型変分オートエンコーダ（RGP-VAE）を提案し、高忠実度の合成共分散行列を生成する手法を確立したものである。

Viktorija Polaka, Ivo Pascal de Jong, Andreea Ioana Sburlea2026-03-12🤖 cs.LG

Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context

この論文は、文脈内学習（ICL）を行うトランスフォーマーが、単純な類似度マッチングではなく、タスクの幾何学的特性に応じて尤度比検定に基づく最適な統計推定器を構築し、線形タスクでは投票型アンサンブル、非線形タスクでは逐次計算を用いてベイズ最適推定を近似することを示しています。

Faris Chaudhry, Siddhant Gadkari2026-03-12🤖 cs.LG

HAPEns: Hardware-Aware Post-Hoc Ensembling for Tabular Data

この論文は、予測性能とハードウェア効率のトレードオフを明示的に最適化する多目的最適化に基づく新しいポストホックアンサンブル手法「HAPEns」を提案し、83 の表データ分類データセットを用いた実験で既存手法を上回る性能とコストのバランスを実現したことを示しています。

Jannis Maier, Lennart Purucker2026-03-12🤖 cs.LG

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

本論文は、道徳的推論におけるアライメントタスクが本質的に多様性を必要とするという仮説を否定し、数学的推論と同様に報酬最大化型の強化学習（RLVR）が効果的であることを、高報酬応答の分布が集中しているという実証的発見を通じて明らかにしています。

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

この論文は、カーネル密度推定に基づく発散のワッサーシュタイン勾配流として「Drifting Model」を数学的に定式化し、モード崩壊とモードのぼやけを同時に回避する混合発散戦略や多様体への拡張を含む新しい生成モデルの枠組み「Gradient Flow Drifting」を提案し、その理論的根拠と有効性を示しています。

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Self-Scaled Broyden Family of Quasi-Newton Methods in JAX

この技術ノートは、Optimistix ライブラリに基づき、JAX 環境で完全に互換性のある自己スケーリング・ブロイデン族（BFGS、DFP、ブロイデンおよびその自己スケーリング変種）と強 Wolfe 条件を満たすズーム線探索を実装したコードの概要と導入を目的としています。

Ivan Bioli, Mikel Mendibe Abarrategi2026-03-12🤖 cs.LG

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

この論文は、地理空間的意味文脈（GSC）を活用して音声イベントの曖昧さを解消する「Geo-AT」タスクを提案し、その評価基準となるデータセット「Geo-ATBench」と融合フレームワーク「GeoFusion-AT」を開発して、音声認識の精度向上と人間との整合性を検証したものです。

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Reinforcement Learning with Conditional Expectation Reward

この論文は、数学や一般分野など多様な推論タスクにおいて、手動で設計された検証ルールに依存せず、大規模言語モデル自体を暗黙の検証器として利用し、生成された回答の条件付き期待尤度を報酬信号とする「条件付き期待報酬（CER）」を提案し、自由形式の回答にも柔軟に対応できる汎用的な強化学習手法を確立したことを示しています。

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

この論文は、ニューラルネットワーク内の「アクティブパス」に基づいた新規かつ説明可能な手法を提案し、侵入検知システムにおける機械学習モデルのバックドアトリガーを検出・除去する有効性を示す実験結果を報告しています。

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

FAME: Formal Abstract Minimal Explanation for Neural Networks

この論文は、抽象解釈に基づく新しい帰納的説明手法「FAME」を提案し、大規模なニューラルネットワークにおいても説明のサイズを縮小しつつ計算を効率化し、VERIX+ などの既存手法を上回る性能を実証するものである。

Ryma Boumazouza, Raya Elsaleh, Melanie Ducoffe, Shahaf Bassan, Guy Katz2026-03-12🤖 cs.AI

Spatio-Temporal Attention Graph Neural Network: Explaining Causalities With Attention

この論文は、工業制御システム（ICS）における説明性とドリフト耐性を兼ね備えた異常検知を実現するため、時空間的注意機構とグラフニューラルネットワークを統合し、コンフォーマル予測による誤報制御を可能にする「STA-GNN」を提案するものです。

Kosti Koistinen, Kirsi Hellsten, Joni Herttuainen, Kimmo K. Kaski2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

本論文は、核融合炉の磁気流体力学（MHD）問題において、限られた温度センサーデータから全状態を高精度に再構築するデータ駆動型の代理モデル「SHRED」の有効性を示し、リアルタイム監視・制御への応用可能性を明らかにしたものである。

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

この論文は、ブラックボックスモデルに対して敵対的サンプルを数学的に保証付きで計算する「Contract And Conquer（CAC）」手法を提案し、知識蒸留と探索空間の収縮に基づいて、既存の最先端手法を上回る性能を ImageNet データセットで実証したものである。

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

← 前へ次へ →