cs.LG 件の論文 | Gist.Science

Diffusion Alignment as Variational Expectation-Maximization

この論文は、強化学習や直接の逆伝播に基づく既存手法が抱える報酬の過剰最適化やモード崩壊の問題を解決するため、テスト時探索によるサンプリング（E ステップ）とモデルの更新（M ステップ）を交互に繰り返す「変分 EM 法としての拡散アライメント（DAV）」という新しいフレームワークを提案し、テキストから画像の生成や DNA 配列設計など多様なタスクにおいて、報酬の最大化と多様性の維持を両立させることを示しています。

Jaewoo Lee, Minsu Kim, Sanghyeok Choi, Inhyuck Song, Sujin Yun, Hyeongyu Kang, Woocheol Shin, Taeyoung Yun, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.LG

Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits

この論文は、エージェントの先天的な意見が未知であるオンライン環境下で、低ランク行列バンディットに基づく二段階アルゴリズムを提案し、Friedkin-Johnsen 意見動力学モデルにおける分極と不一致を最小化する累積後悔の理論的上限を導出するとともに、その有効性を示すものです。

Federico Cinus, Yuko Kuroki, Atsushi Miyauchi, Francesco Bonchi2026-03-09🤖 cs.LG

Self-Speculative Masked Diffusions

本論文は、非因果的アテンションマスクを因果的に変更してドラフトトークンを生成し、モデル統合型のスペキュレイティブサンプリング機構により並列検証を行う「自己スペキュレイティブ・マスクド拡散」を提案し、離散データ生成における標準的なマスクド拡散モデルと比較して、ネットワークの順伝播回数を約半分にするのに成功したことを報告しています。

Andrew Campbell, Valentin De Bortoli, Jiaxin Shi, Arnaud Doucet2026-03-09🤖 cs.LG

TCR-EML: Explainable Model Layers for TCR-pMHC Prediction

TCR-EML は、既知の TCR-pMHC 結合メカニズムに基づくプロトタイプ層をプロテイン言語モデルに統合することで、予測精度を維持しつつ「設計による説明性」を実現する新しい手法を提案する。

Jiarui Li, Zixiang Yin, Zhengming Ding, Samuel J. Landry, Ramgopal R. Mettu2026-03-09🤖 cs.LG

Decoding Partial Differential Equations: Cross-Modal Adaptation of Decoder-only Models to PDEs

本論文は、偏微分方程式のタスクにおいて既存手法をそのまま適用するとデコーダ専用モデルがエンコーダ専用モデルに劣ることを示しつつ、並列反転とシーケンス倍増という 2 つの双方向性を模倣する新規手法を提案することで、デコーダ専用モデルの性能を大幅に向上させ、エンコーダモデルとの性能差を解消したことを報告しています。

Paloma García-de-Herreros, Philipp Slusallek, Dietrich Klakow, Vagrant Gautam2026-03-09🤖 cs.LG

How Reliable is Language Model Micro-Benchmarking?

この論文は、大規模言語モデルの評価におけるマイクロベンチマークが、完全なベンチマークや無作為なデータ抽出と比較してモデルの性能差を一貫して正しくランク付けできず、特に類似した性能を持つモデルを区別するには数百のサンプルが必要となり、その規模では既存のマイクロベンチマーク手法が無作為抽出と同等の信頼性しか持たないことを示しています。

Gregory Yauney, Shahzaib Saqib Warraich, Swabha Swayamdipta2026-03-09🤖 cs.LG

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

本論文は、ぼやけたグローバルな予測「キャンバス」を非一様マスクとして導入し、動きに応じたサンプリング順序やコンポジション型の Classifier-Free Guidance を組み合わせることで、少ないサンプリングステップで高品質な動画生成を実現する新しい自己回帰モデル「CanvasMAR」を提案するものです。

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

本論文は、外部の検証器（人間や高性能モデル）による合成データの検証プロセスを導入することで、モデル崩壊を回避し短期的な性能向上を実現できる一方、長期的には検証器の知識中心に収束し、検証器の完全な信頼性がなければ初期の改善が頭打ちや逆転する可能性があることを、理論と実験を通じて明らかにしています。

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng Xu2026-03-09🤖 cs.LG

Mixed Monotonicity Reachability Analysis of Neural ODE: A Trade-Off Between Tightness and Efficiency

この論文は、連続時間混合単調性手法を活用してニューラル ODE の到達可能集合を効率的に過近似する新しい区間ベースの検証手法を提案し、厳密性と計算効率のトレードオフを最適化することで、高次元かつリアルタイムな安全クリティカルなアプリケーションへの適用を可能にすることを示しています。

Abdelrahman Sayed Sayed, Pierre-Jean Meyer, Mohamed Ghazel2026-03-09🤖 cs.LG

Real-Time Learning of Predictive Dynamic Obstacle Models for Robotic Motion Planning

この論文は、部分観測かつノイズを含むデータから動的な障害物の非線形予測モデルをリアルタイムで学習するオンライン枠組みを提案し、ハンケル行列とページ行列を用いた特異値硬しきい値処理およびカドゾウ射影によるノイズ除去とランク推定、そして時間変化するハンケル-DMD による多ステップ予測を実現し、シミュレーションおよび実機実験でその有効性を検証したものである。

Stella Kombo, Masih Haseli, Skylar X. Wei, Joel W. Burdick2026-03-09🤖 cs.LG

KLASS: KL-Guided Fast Inference in Masked Diffusion Models

本論文は、トークンレベルの KL 発散を利用して安定した高信頼度予測を特定し、追加のモデル学習なしに反復ごとに複数のトークンをマスク解除することで、生成品質を維持しつつ推論速度を大幅に向上させる新しいサンプリング手法「KLASS」を提案し、言語から画像・分子生成まで多様なドメインで最先端の性能を示したものである。

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, Youngrok Park, Se-Young Yun2026-03-09🤖 cs.LG

CADM: Cluster-customized Adaptive Distance Metric for Categorical Data Clustering

この論文は、カテゴリカルデータおよび混合データにおけるクラスタ内の属性分布の違いを反映して距離を適応的に更新する「クラスタカスタマイズ適応距離指標（CADM）」を提案し、14 のデータセットで平均順位 1 位を達成する高い有効性を示したものである。

Taixi Chen, Yiu-ming Cheung, Yiqun Zhang2026-03-09🤖 cs.LG

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

この論文は、視覚・気候・地理データを統合して推論する大規模ベンチマーク「FireScope-Bench」と、強化学習および視覚的監督を活用して推論プロセスを伴う高解像度の野火リスク予測モデル「FireScope」を提案し、言語ベースの推論が視覚生成モデルの汎化性能と解釈可能性を向上させることを実証しています。

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

← 前へ次へ →

cs.LG

Diffusion Alignment as Variational Expectation-Maximization

Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits

Self-Speculative Masked Diffusions

TCR-EML: Explainable Model Layers for TCR-pMHC Prediction

Decoding Partial Differential Equations: Cross-Modal Adaptation of Decoder-only Models to PDEs

How Reliable is Language Model Micro-Benchmarking?

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

Mixed Monotonicity Reachability Analysis of Neural ODE: A Trade-Off Between Tightness and Efficiency

Real-Time Learning of Predictive Dynamic Obstacle Models for Robotic Motion Planning

KLASS: KL-Guided Fast Inference in Masked Diffusion Models

CADM: Cluster-customized Adaptive Distance Metric for Categorical Data Clustering

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

EgoCogNav: Cognition-aware Human Egocentric Navigation

SPINE: Token-Selective Test-Time Reinforcement Learning with Entropy-Band Regularization

DAISI: Data Assimilation with Inverse Sampling using Stochastic Interpolants

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection