Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits

この論文は、エージェントの先天的な意見が未知であるオンライン環境下で、低ランク行列バンディットに基づく二段階アルゴリズムを提案し、Friedkin-Johnsen 意見動力学モデルにおける分極と不一致を最小化する累積後悔の理論的上限を導出するとともに、その有効性を示すものです。

Federico Cinus, Yuko Kuroki, Atsushi Miyauchi, Francesco Bonchi2026-03-09🤖 cs.LG

Self-Speculative Masked Diffusions

本論文は、非因果的アテンションマスクを因果的に変更してドラフトトークンを生成し、モデル統合型のスペキュレイティブサンプリング機構により並列検証を行う「自己スペキュレイティブ・マスクド拡散」を提案し、離散データ生成における標準的なマスクド拡散モデルと比較して、ネットワークの順伝播回数を約半分にするのに成功したことを報告しています。

Andrew Campbell, Valentin De Bortoli, Jiaxin Shi, Arnaud Doucet2026-03-09🤖 cs.LG

Decoding Partial Differential Equations: Cross-Modal Adaptation of Decoder-only Models to PDEs

本論文は、偏微分方程式のタスクにおいて既存手法をそのまま適用するとデコーダ専用モデルがエンコーダ専用モデルに劣ることを示しつつ、並列反転とシーケンス倍増という 2 つの双方向性を模倣する新規手法を提案することで、デコーダ専用モデルの性能を大幅に向上させ、エンコーダモデルとの性能差を解消したことを報告しています。

Paloma García-de-Herreros, Philipp Slusallek, Dietrich Klakow, Vagrant Gautam2026-03-09🤖 cs.LG

How Reliable is Language Model Micro-Benchmarking?

この論文は、大規模言語モデルの評価におけるマイクロベンチマークが、完全なベンチマークや無作為なデータ抽出と比較してモデルの性能差を一貫して正しくランク付けできず、特に類似した性能を持つモデルを区別するには数百のサンプルが必要となり、その規模では既存のマイクロベンチマーク手法が無作為抽出と同等の信頼性しか持たないことを示しています。

Gregory Yauney, Shahzaib Saqib Warraich, Swabha Swayamdipta2026-03-09🤖 cs.LG

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

本論文は、ぼやけたグローバルな予測「キャンバス」を非一様マスクとして導入し、動きに応じたサンプリング順序やコンポジション型の Classifier-Free Guidance を組み合わせることで、少ないサンプリングステップで高品質な動画生成を実現する新しい自己回帰モデル「CanvasMAR」を提案するものです。

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

本論文は、外部の検証器(人間や高性能モデル)による合成データの検証プロセスを導入することで、モデル崩壊を回避し短期的な性能向上を実現できる一方、長期的には検証器の知識中心に収束し、検証器の完全な信頼性がなければ初期の改善が頭打ちや逆転する可能性があることを、理論と実験を通じて明らかにしています。

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng Xu2026-03-09🤖 cs.LG

Mixed Monotonicity Reachability Analysis of Neural ODE: A Trade-Off Between Tightness and Efficiency

この論文は、連続時間混合単調性手法を活用してニューラル ODE の到達可能集合を効率的に過近似する新しい区間ベースの検証手法を提案し、厳密性と計算効率のトレードオフを最適化することで、高次元かつリアルタイムな安全クリティカルなアプリケーションへの適用を可能にすることを示しています。

Abdelrahman Sayed Sayed, Pierre-Jean Meyer, Mohamed Ghazel2026-03-09🤖 cs.LG

Real-Time Learning of Predictive Dynamic Obstacle Models for Robotic Motion Planning

この論文は、部分観測かつノイズを含むデータから動的な障害物の非線形予測モデルをリアルタイムで学習するオンライン枠組みを提案し、ハンケル行列とページ行列を用いた特異値硬しきい値処理およびカドゾウ射影によるノイズ除去とランク推定、そして時間変化するハンケル-DMD による多ステップ予測を実現し、シミュレーションおよび実機実験でその有効性を検証したものである。

Stella Kombo, Masih Haseli, Skylar X. Wei, Joel W. Burdick2026-03-09🤖 cs.LG

KLASS: KL-Guided Fast Inference in Masked Diffusion Models

本論文は、トークンレベルの KL 発散を利用して安定した高信頼度予測を特定し、追加のモデル学習なしに反復ごとに複数のトークンをマスク解除することで、生成品質を維持しつつ推論速度を大幅に向上させる新しいサンプリング手法「KLASS」を提案し、言語から画像・分子生成まで多様なドメインで最先端の性能を示したものである。

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, Youngrok Park, Se-Young Yun2026-03-09🤖 cs.LG

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

この論文は、視覚・気候・地理データを統合して推論する大規模ベンチマーク「FireScope-Bench」と、強化学習および視覚的監督を活用して推論プロセスを伴う高解像度の野火リスク予測モデル「FireScope」を提案し、言語ベースの推論が視覚生成モデルの汎化性能と解釈可能性を向上させることを実証しています。

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

EgoCogNav: Cognition-aware Human Egocentric Navigation

この論文は、人間のナビゲーションにおける認知的・経験的要因を考慮し、知覚された経路の不確実性を潜在状態として予測するマルチモーダルなナビゲーションフレームワーク「EgoCogNav」と、実世界での多様なナビゲーション行動を捉えた新しいデータセット「CEN」を提案するものです。

Zhiwen Qiu, Ziang Liu, Wenqian Niu, Tapomayukh Bhattacharjee, Saleh Kalantari2026-03-09🤖 cs.LG

SPINE: Token-Selective Test-Time Reinforcement Learning with Entropy-Band Regularization

本論文は、推論モデルのテスト時適応において、多数決に基づく報酬が回答の短縮や性能低下を招く問題を解決するため、推論の分岐点となる高エントロピーのトークンのみを対象とした選択的な更新とエントロピー帯域正則化を導入した「SPINE」という新しいフレームワークを提案し、ラベルなしで安定した性能向上を実現することを示しています。

Jianghao Wu, Yasmeen George, Jin Ye, Yicheng Wu, Daniel F. Schmidt, Jianfei Cai2026-03-09🤖 cs.LG

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

この論文は、拡散モデルの微調整における報酬過最適化と多様性の低下を解決するため、再パラメータ化されたソフト Q 関数の方策勾配を用いた KL 正則化強化学習手法「SQDF」を提案し、割引因子や一貫性モデル、オフポリシー再生バッファなどの革新により、高報酬と自然な多様性の両立を実現したことを述べています。

Hyeongyu Kang, Jaewoo Lee, Woocheol Shin, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.AI

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

本論文は、強化学習による推論モデルの多様性欠如を解決するため、正解を保持した目標分布をα\alpha-ダイバージェンスで近似し、精度と多様性のトレードオフを制御する新しい手法を提案し、Lean 定理証明ベンチマークでcoverage 軸において既存手法を上回る性能を達成したことを示しています。

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

本論文は、複雑な背景における小物体検出の課題を解決するため、入力適応型のスパース自己注意機構、ノルム保存型アップサンプリング、および周波数領域での反復精化を組み合わせた DFIR-DETR を提案し、NEU-DET と VisDrone データセットで高い検出精度を達成したことを報告しています。

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

Two-dimensional RMSD projections for reaction path visualization and validation

この論文は、反応経路の構造変化を可視化し異なる計算手法の最適化履歴を比較可能にするため、反応物と生成物からのパーミュテーション補正された RMSD を基にした 2 次元射影と勾配強化ガウス過程を用いたエネルギー面マッピングという新しい手法を提案し、複数の化学反応系におけるその有効性を検証したものである。

Rohit Goswami2026-03-09🔬 cond-mat.mtrl-sci