Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

この論文は、ノイズのあるユーザーフィードバックやプロパティスコアの欠如といった課題に直面する大規模生成型レコメンデーションシステムにおいて、報酬モデルの学習を不要とし、理論的保証を持つ「指数関数的報酬重み付け SFT」が、従来の RLHF 手法よりもロバストかつ効果的にユーザー嗜好に適合できることを示しています。

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

この論文は、幾何学的構造を尊重する学習の観点から一般化特異値分解(GSVD)を用いて2つのデータセットを比較し、各サンプルがどちらのデータセットに由来するかを定量化する解釈可能な「角度スコア」を提案し、MNIST における診断ツールとしての有効性を示しています。

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

LLM による評価スコアにおける計算コストとバイアスの課題を解決し、評価スコアテンソルの構造を解明するため、質問・回答者・評価者の各モードに対してクラスタ所属と代表点(メドイド)を同時に推定する新しいテンソルクラスタリング手法「MultiwayPAM」を提案し、その有効性を実データで実証した。

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

この論文は、Pong という競争的マルコフゲームにおける量子古典ハイブリッドエージェントの実験を通じて、量子もつれが表現学習に不可欠なリソースとして機能し、分離可能な回路や古典的なニューラルネットワークを凌駕する競争優位性をもたらすことを実証しています。

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

この論文は、人間の記憶の構造と自己進化の特性に着想を得て、離散的高レベル記号ノードと連続的軌道埋め込みを結合したグラフベースのハイブリッド自己進化構造化メモリ「HyMEM」を提案し、これによりオープンソースの GUI エージェントが強力なクローズドソースモデルと同等かそれ以上の性能を発揮することを示しています。

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

Regime-aware financial volatility forecasting via in-context learning

この論文は、パラメータの微調整を行わずに事前学習済み大規模言語モデル(LLM)を用いて市場のレジームを推定し、条件付きで選択されたデモンストレーションを文脈に組み込むことで、非定常な市場環境下における金融ボラティリティの予測精度を向上させる「レジーム対応型インコンテキスト学習フレームワーク」を提案するものである。

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

How to make the most of your masked language model for protein engineering

本論文は、抗体治療薬の設計において、マスク言語モデルから目的の生物学的特性を最適化するための柔軟かつ効果的なサンプリング手法(確率的ビームサーチ)を提案し、その有効性を計算機シミュレーションおよび実際の抗体エンジニアリング実験を通じて実証したものである。

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

この論文は、非局所的な情報集約と局所的な非線形予測を明示的に分離する「データ駆動型積分カーネル」という枠組みを導入することで、気候プロセスの学習における解釈性と過学習の課題を解決し、南アジアのモンスーン降水量予測において、パラメータ数を大幅に削減しながら高い予測精度を達成する手法を提案しています。

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

この論文は、極端な非 IID 環境とグローバルなクラス不均衡下におけるフェデレーテッド・アクティブ・ラーニングの課題を解決するため、グローバルとローカルなモデルの適応的選択やクラス公平性を重視したサンプリング戦略を採用し、既存手法を上回る性能を示す「FairFAL」という新しいフレームワークを提案しています。

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

この論文は、非定常線形バンディット問題における固定予算ベストアーム同定(BAI)の複雑性を研究し、従来の次元に比例する複雑度評価の限界を克服するアーム集合依存の下限を導出するとともに、これに基づいて提案された「Adjacent-BAI」アルゴリズムがその下限と一致する誤り確率を達成することを証明し、アーム集合の幾何学的構造に依存した最適複雑性を確立したものである。

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

本論文は、教師モデルの失敗例を排除する従来の限界を克服し、教育理論の「最近接発達領域」に基づいて、エントロピーに基づく修復や段階的カリキュラム学習を組み合わせる RL フリーのフレームワーク「HEAL」を提案し、大規模推論モデルから小規模モデルへの推論能力の蒸留を大幅に改善することを示しています。

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

この論文は、スパースオートエンコーダと微分可能な構造学習を組み合わせることで大規模言語モデルの潜在空間に因果概念グラフを構築し、多段階推論における概念間の因果依存関係を可視化するとともに、介入実験による評価スコア(CFS)で既存手法を上回る性能を実証する手法を提案しています。

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

この論文は、Mixture-of-Experts(MoE)モデルにおいて、トータルな計算量とスパース性に応じてエキスパート層とアテンション層への計算リソース配分を最適化するべき比率をべき乗則として導き出し、Chinchilla の法則を拡張したスケーリング法則を提案するものである。

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG