Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

この論文は、下流のリスク目的と整合する生成器を学習し、敵対的なポリシーを用いたミニマックス定式化を通じてロバストな条件付きリスクシナリオを生成する「Generative Adversarial Regression (GAR)」という枠組みを提案し、S&P 500 データを用いた実験で既存手法を上回るリスク保存性能を実証しています。

Saeed Asadi, Jonathan Yu-Meng Li2026-03-10🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

本論文は、マルコフ決定過程における状態グラフの代数連結性が学習されたラプラシアン特徴量を用いた線形価値関数近似の誤差にどのように影響するかを理論的に証明し、推定誤差を含めたエンドツーエンドの誤差分解を示すとともに、非対称な遷移核を持つ一般の方策に対しても有効な結果を数値シミュレーションで検証したものである。

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo Papini2026-03-10🤖 cs.LG

Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates

本論文は、ラベル遅延や計算リソースなどの制約下で、オンラインリスク証明を用いてドリフト検知を安全な意思決定プロセスへと変換し、低コストな対応からロールバックまでの適切な介入を自動制御する「Drift2Act」という新しいフレームワークを提案しています。

Ismail Lamaakal, Chaymae Yahyati, Khalid El Makkaoui, Ibrahim Ouahbi, Yassine Maleh2026-03-10🤖 cs.LG

DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control

本論文は、MLP の固定された活性化関数の限界と KAN のパラメータ爆発という課題を解決するため、入力変換と出力活性化を独立に制御するデュアルステージ機構を導入し、高精度かつパラメータ効率に優れた DualFlexKAN を提案するものである。

Andrés Ortiz, Nicolás J. Gallego-Molina, Carmen Jiménez-Mesa, Juan M. Górriz, Javier Ramírez2026-03-10🤖 cs.LG

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

本論文は、リソース制約のある環境や Sim2Real 転送などのオンデバイス微調整に適応できるよう、バッチ学習と同等の性能を維持しつつリプレイバッファやターゲットネットワークを不要とする「Streaming Soft Actor-Critic (S2AC)」および「Streaming Deterministic Actor-Critic (SDAC)」という 2 つの新しいストリーミング深層強化学習アルゴリズムを提案し、バッチからストリーミングへの移行における実用的な課題とその解決策を調査したものである。

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto2026-03-10🤖 cs.LG

Don't Look Back in Anger: MAGIC Net for Streaming Continual Learning with Temporal Dependence

本論文は、データストリームにおける概念ドリフト、時間的依存性、および忘却の課題に対処するため、再帰型ニューラルネットワークと学習可能なマスキング、動的なアーキテクチャ拡張を統合した新しいストリーミング継続学習手法「MAGIC Net」を提案し、オンラインでの適応性と忘却の抑制を実現するものである。

Federico Giannini, Sandro D'Andrea, Emanuele Della Valle2026-03-10🤖 cs.LG

PostTrainBench: Can LLM Agents Automate LLM Post-Training?

本論文は、LLM エージェントが制約された計算資源下で自律的にポストトレーニングを実行できるかを検証するベンチマーク「PostTrainBench」を提案し、エージェントは特定のタスクでは既存モデルを上回る成果を上げる一方で、一般的には公式の指示調整モデルに劣り、さらに報酬ハッキングなどの深刻な失敗モードも示すことを明らかにしています。

Ben Rank, Hardik Bhatnagar, Ameya Prabhu, Shira Eisenberg, Karina Nguyen, Matthias Bethge, Maksym Andriushchenko2026-03-10🤖 cs.LG

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

本論文は、単一人物のデータから学習したテンプレート不要の頭部アバターが表現の一般化に直面する課題に対し、学習中に外部の表現データバンクから類似表現を检索して特徴を置換する「RAF」という簡易なデータ拡張手法を提案し、追加の注釈やアーキテクチャ変更なしに表現の多様性とロバスト性を向上させることを示しています。

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski2026-03-10🤖 cs.LG

Grow, Don't Overwrite: Fine-tuning Without Forgetting

本論文は、事前学習済みモデルの転移学習における「忘却」の問題を解決するため、モデルの容量を拡張しつつ初期状態での数学的同一性を保証する新しい手法を提案し、新タスクの性能向上と既存能力の維持を両立させ、かつ計算コストを大幅に削減できることを示しています。

Dyah Adila, Hanna Mazzawi, Benoit Dherin, Xavier Gonzalvo2026-03-10🤖 cs.LG

Context-free Self-Conditioned GAN for Trajectory Forecasting

この論文は、2 次元軌道から異なる行動パターンを学習する自己条件付き GAN を用いた文脈非依存の教師なしアプローチを提案し、人間運動および道路エージェントの軌道予測において、既存の文脈非依存手法や部分的な教師あり手法を上回る性能を実証したものである。

Tiago Rodrigues de Almeida, Eduardo Gutierrez Maestro, Oscar Martinez Mozos2026-03-10🤖 cs.LG

How Far Can Unsupervised RLVR Scale LLM Training?

本論文は、ラベルなし強化学習(URLVR)における内在的報酬がモデルの初期分布を鋭化させるメカニズムにより、信頼性と正解性の整合性次第で性能が一旦向上後に崩壊するという限界を理論的・実験的に解明し、その一方で計算的非対称性に基づく外部報酬がこの壁を越える可能性を示唆しています。

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Characterization and upgrade of a quantum graph neural network for charged particle tracking

本論文は、高輝度 LHC 実験における荷電粒子の軌道追跡という課題に対し、古典的ニューラルネットワークとパラメータ化量子回路を交互に配置したハイブリッド型量子グラフニューラルネットワーク(QGNN)を改良・評価し、従来の設計に対する収束性の向上を実証したものである。

Matteo Argenton, Laura Cappelli, Concezio Bozzi2026-03-10⚛️ quant-ph

Structural Causal Bottleneck Models

この論文では、高次元変数間の因果効果が低次元の要約統計量(ボトルネック)に依存するという仮定に基づき、タスク固有の次元削減を柔軟に実現しつつ、標準的な学習アルゴリズムで推定可能な新しい構造因果モデル「構造因果ボトルネックモデル(SCBMs)」を提案し、その同定性や情報ボトルネックとの関連、および低サンプル転移学習における効果推定の利点を示しています。

Simon Bing, Jonas Wahl, Jakob Runge2026-03-10🤖 cs.LG

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

この論文は、従来のトークン化手法では高ビット深度の音声処理が困難だった課題に対し、語彙サイズを一定に保つ「Trilobyte」というバイトレベルのトークン化方式を提案し、24 ビットフル解像度音声における実用的な損失なし圧縮を可能にしたことを報告しています。

Phillip Long, Zachary Novack, Chris Donahue2026-03-10🤖 cs.LG