A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

本論文は、確率的な目的関数と決定論的な非線形制約条件を持つ最適化問題に対して、適応的な精度条件を満たす確率的オラクルと内点法を組み合わせた新しい「TR-IP-SSQP」手法を提案し、その第一-order 停留点への大域的な収束性を理論的に証明するとともに、CUTEst テストセットやロジスティック回帰問題への適用を通じて実用性を示したものである。

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Why Does It Look There? Structured Explanations for Image Classification

この論文は、既存の XAI 手法から抽出したプロトタイプを用いて訓練過程の進展を定量化し、モデルの判断根拠を構造化された形で説明すると同時に、不確実なプロトタイプを特定してターゲットとした摂動を加えることでモデルの精度向上を実現するフレームワーク「I2X」を提案しています。

Jiarui Li, Zixiang Yin, Samuel J Landry, Zhengming Ding, Ramgopal R. Mettu2026-03-12🤖 cs.LG

One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning

本論文は、タスクごとのクラス数が大きく変動する「ステップ不均衡」なクラスインクリメンタル学習の課題に対し、大規模タスクの支配的なサブスペースを維持しつつ小規模タスクの不安定な更新を抑制する非対称な部分空間アライメントと方向性ゲート機構を採用し、単一のアダプタで効率的かつ安定した学習を実現する「One-A」フレームワークを提案するものである。

Xiaoyan Zhang, Jiangpeng He2026-03-12🤖 cs.LG

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

この論文は、偏微分方程式を解くためのスパイク型ニューロモルフィックアルゴリズムが、最大 32% のニューロン欠損や 90% のスパイク欠落に対しても精度を維持する構造的な頑健性と耐故障性を有し、その耐性が構造的ハイパーパラメータによって調整可能であることを実証しています。

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

SiMPO: Measure Matching for Online Diffusion Reinforcement Learning

本論文は、拡散モデルを用いた強化学習において、負のサンプルからのフィードバックを有効活用し過剰な貪欲性を抑制するため、符号付き測度を用いたマッチングと任意の単調増加重み付け関数を一般化した新しいフレームワーク「SiMPO」を提案し、その理論的正当性と実証的な優位性を示すものである。

Haitong Ma, Chenxiao Gao, Tianyi Chen, Na Li, Bo Dai2026-03-12🤖 cs.LG

Bayesian Hierarchical Models and the Maximum Entropy Principle

この論文は、ハイパーパラメータに条件付けた事前分布が最大エントロピー分布(canonical distribution)である場合、ハイパーパラメータを積分して得られるパラメータの周辺事前分布も、未知量の関数の周辺分布に関する異なる制約のもとで最大エントロピー性を満たすことを示し、階層モデルを割り当てる際に仮定されている情報の本質を明らかにするものである。

Brendon J. Brewer2026-03-12📊 stat

From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning

この論文は、事前学習された生成ロボット方策をオンラインフィードバックから成功行動を強化する「分布収縮」オペレーターとして機能する強化学習フレームワーク「DICE-RL」を導入し、シミュレーションおよび実ロボットにおいて高次元の画素入力から複雑な長期操作スキルの効率的な習得を実現することを提案しています。

Zhanyi Sun, Shuran Song2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

この論文は、ノイズのあるユーザーフィードバックやプロパティスコアの欠如といった課題に直面する大規模生成型レコメンデーションシステムにおいて、報酬モデルの学習を不要とし、理論的保証を持つ「指数関数的報酬重み付け SFT」が、従来の RLHF 手法よりもロバストかつ効果的にユーザー嗜好に適合できることを示しています。

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

この論文は、幾何学的構造を尊重する学習の観点から一般化特異値分解(GSVD)を用いて2つのデータセットを比較し、各サンプルがどちらのデータセットに由来するかを定量化する解釈可能な「角度スコア」を提案し、MNIST における診断ツールとしての有効性を示しています。

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

LLM による評価スコアにおける計算コストとバイアスの課題を解決し、評価スコアテンソルの構造を解明するため、質問・回答者・評価者の各モードに対してクラスタ所属と代表点(メドイド)を同時に推定する新しいテンソルクラスタリング手法「MultiwayPAM」を提案し、その有効性を実データで実証した。

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

この論文は、Pong という競争的マルコフゲームにおける量子古典ハイブリッドエージェントの実験を通じて、量子もつれが表現学習に不可欠なリソースとして機能し、分離可能な回路や古典的なニューラルネットワークを凌駕する競争優位性をもたらすことを実証しています。

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

この論文は、人間の記憶の構造と自己進化の特性に着想を得て、離散的高レベル記号ノードと連続的軌道埋め込みを結合したグラフベースのハイブリッド自己進化構造化メモリ「HyMEM」を提案し、これによりオープンソースの GUI エージェントが強力なクローズドソースモデルと同等かそれ以上の性能を発揮することを示しています。

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

Regime-aware financial volatility forecasting via in-context learning

この論文は、パラメータの微調整を行わずに事前学習済み大規模言語モデル(LLM)を用いて市場のレジームを推定し、条件付きで選択されたデモンストレーションを文脈に組み込むことで、非定常な市場環境下における金融ボラティリティの予測精度を向上させる「レジーム対応型インコンテキスト学習フレームワーク」を提案するものである。

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG