LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks

本論文は、低ランク適応(LoRA)を拡張して自己注意ネットワークに適用する「LoRA-Ensemble」を提案し、明示的なアンサンブルと同等以上の精度と較正性能を、はるかに高い計算効率で実現する手法を提示しています。

Dominik J. Mühlematter, Michelle Halbheer, Alexander Becker, Dominik Narnhofer, Helge Aasen, Konrad Schindler, Mehmet Ozgur Turkoglu2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

本論文は、少ショット微調整における拡散モデルの学習過程で生じる「腐敗段階」を、ベイズニューラルネットワークを用いて学習分布を広く捉えることで理論的に説明し、生成画像の忠実度と多様性を向上させる手法を提案しています。

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

Estimating Treatment Effects under Algorithmic Interference: A Structured Neural Networks Approach

この論文は、二面市場におけるアルゴリズム干渉により既存の推定量が偏る問題を解決するため、競争的な割り当てメカニズムを明示的にモデル化する構造化半パラメトリック枠組みと二重機械学習を組み合わせた新たな推定手法を提案し、大規模フィールド実験を通じてその有効性を実証したものである。

Ruohan Zhan, Shichao Han, Yuchen Hu, Zhenling Jiang2026-03-10🤖 cs.LG

Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance

本論文は、深層コックスモデルにおけるミニバッチ確率的勾配降下法(SGD)の統計的基盤を確立し、新しい推定量(mb-MPLE)の一貫性と収束性を証明するとともに、学習率とバッチサイズの比率の重要性や大規模実データへの適用可能性など、実用的な指針を提供しています。

Lang Zeng, Weijing Tang, Zhao Ren, Ying Ding2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

この論文は、高次元空間や複雑なデータにおける提案分布の生成が困難という既存のベイズ GPLVM の課題を解決するため、変分推論と Annealed Importance Sampling を組み合わせ、すべての変数を再パラメータ化することで効率的な学習を実現し、より tight な変分境界や高い対数尤度、頑健な収束性を実現する手法を提案しています。

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

The Z-Gromov-Wasserstein Distance

本論文は、任意の距離空間ZZに値をとるカーネルを持つZZ-ネットワークを定義し、これらを比較するためのZZ-グロモフ・ワッサーシュタイン距離を導入することで、既存の距離の多くを包含する統一的な理論的枠組みを構築し、その距離が持つ望ましい性質や計算可能な近似手法を示しています。

Martin Bauer, Facundo Mémoli, Tom Needham + 1 more2026-03-10🤖 cs.LG

From Model Explanation to Data Misinterpretation: A Cautionary Analysis of Post Hoc Explainers in Business Research

本論文は、SHAP や LIME などのポストホック説明手法がビジネス研究で広く用いられているものの、それらが生成する説明をデータの本質的な関係性の証拠として誤解釈する傾向が横行しており、高い予測精度があっても説明の信頼性は保証されないため、仮説検証ではなく探索的ツールとして位置づけるべきであると警鐘を鳴らしています。

Tong Wang (Jeffrey), Ronilo Ragodos (Jeffrey), Lu Feng (Jeffrey), Yu (Jeffrey), Hu2026-03-10🤖 cs.LG

Reconsidering the energy efficiency of spiking neural networks

本論文は、データ移動やメモリアクセスなどのオーバーヘッドを包括的に評価する厳密なエネルギーモデルを用いて、特定の条件下(平均スパイク率が 6.4% 未満など)でのみスパイクニューラルネットワーク(SNN)が従来の量子化人工ニューラルネットワーク(QNN)を上回るエネルギー効率を実現し得ることを実証し、スマートウォッチのバッテリー寿命を倍増させる可能性を示唆しています。

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

この論文は、物理システムの数学的構造と安定性を保ち、入力と潜在空間の力を双方向に変換可能にする「結合振動子ネットワーク(CON)」を提案し、これにより画像からのみ学習した複雑な非線形力学を閉形式の制御理論と組み合わせて効率的に制御する手法を実現したことを示しています。

Maximilian Stölzle, Cosimo Della Santina2026-03-10🤖 cs.LG

xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing

この論文は、事前学習された拡散モデルを用いてソースドメインの軌跡にノイズを加え、ターゲットドメインの特性に整合させながら元の意味情報を保持する「xTED」というフレームワークを提案し、複雑なモデル構造に依存せず、データレベルでドメインギャップを効果的に埋めることで、限られたターゲットデータ下での意思決定タスクにおける政策学習の性能を向上させることを示しています。

Haoyi Niu, Qimao Chen, Tenglong Liu, Jianxiong Li, Guyue Zhou, Yi Zhang, Jianming Hu, Xianyuan Zhan2026-03-10🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

本論文は、ボルツマン分布からの効率的なサンプリングを目的として、ノイズ付きエネルギーの学習に基づく拡散サンプリング手法「NEM」と、そのバイアスと分散を調整するブートストラップ技術を組み合わせた「BNEM」を提案し、複雑な分布における最先端の性能と頑健性を示しています。

RuiKang OuYang, Bo Qiang, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action

この論文は、有限 horizon のマルコフ決定過程における方策勾配法の非凸最適化問題に対し、Polyak-Łojasiewicz-Kurdyka 条件を満たす構造的特徴を特定することで、非凸性にもかかわらず大域的最適解への収束を保証し、在庫管理やキャッシュバランス問題など多様なオペレーションモデルにおけるサンプル複雑性の保証を初めて提供することを示しています。

Xin Chen, Yifan Hu, Minda Zhao2026-03-10🤖 cs.LG

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

この論文は、Mori-Zwanzig 形式に着想を得て、遅延時間変数をデータから学習するニューラル遅延微分方程式(NDDE)を提案し、部分観測条件下での非マルコフ的動的システムのモデル化において、既存の手法よりも優れた性能とデータ効率を実現することを示しています。

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

Open-World Reinforcement Learning over Long Short-Term Imagination

本論文は、MineDojo などの高次元オープンワールド環境において、ゴール条件付きのジャンプ状態遷移とアフォーダンスマップの活用を通じて「長短期世界モデル」を構築し、エージェントの想像ホライズンを拡張することで長期的な報酬を見据えた探索効率を大幅に向上させる手法「LS-Imagine」を提案しています。

Jiajian Li, Qi Wang, Yunbo Wang, Xin Jin, Yang Li, Wenjun Zeng, Xiaokang Yang2026-03-10🤖 cs.LG