A Distributed Gaussian Process Model for Multi-Robot Mapping

この論文は、局所的な経験と計算のみを用いて大域関数を学習する分散ガウス過程モデル「DistGP」を提案し、動的接続環境や非同期学習に対応しながら、中央集権的バッチ学習と同等の性能を達成し、既存の分散手法よりも高い精度とロバスト性を示すことを実証しています。

Seth Nabarro, Mark van der Wilk, Andrew J. Davison2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

農業ビジョン分野におけるモデルの汎化性能向上を目指し、複数のチームが独立して収集した多様なフィールドデータを用いた「AgrI Challenge」というデータ中心のコンペティション枠組みと、クロスチーム検証(CTV)という評価手法を提案し、単一ソース学習の限界とマルチソース協調学習の有効性を示した。

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

この論文は、ネステッドドロップアウトを活用して拡散モデルや正規化フローなどの生成モデルに可変複雑性を導入し、圧縮センシングや画像復元などの逆問題において、固定複雑性のベースラインよりも低い再構成誤差を達成することを示しています。

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting

本論文は、複数の予測時間軸における冗長な計算を削減しつつ、スパースな事象監視下で確率的な空間分布を生成する長期的な山火事リスク予測を実現するために、早期の去ノイズ段階を共有し後段で分岐する階層的拡散モデル「N-Tree Diffusion」を提案し、実世界のデータセットを用いた評価で精度向上と推論コストの削減を実証したものです。

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

本論文は、1 億パラメータ未満の「極小モデル」領域におけるスケーリング則を初めて実証し、モデルサイズの変化に伴う誤分類パターンの転換や、中規模モデルで最も誤った確率が高いという_calibration_の逆説的現象を明らかにし、エッジ AI 向けにはターゲットサイズでの検証が不可欠であることを示しています。

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

本論文は、ユーザー位置情報を用いてチャネル状態情報(CSI)の推定を不要とし、階層型マルチエージェント強化学習(HMARL)を採用することで、ミリ波通信におけるビームフォーカスの制御効率とスケーラビリティを大幅に向上させる新たな枠組みを提案しています。

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

この論文は、リソースが限られたインド諸語の機械翻訳における品質推定(QE)の課題を解決するため、閉鎖型および開放型の大規模言語モデル(LLM)を対象にプロンプト手法を比較し、中間層への低ランク適応(ALOPE および LoRMA)を導入することで、特に高リスク領域において頑健な品質推定を実現する方法を提案し、関連データとコードを公開したことを報告しています。

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Sparsity and Out-of-Distribution Generalization

この論文は、世界が区別された特徴を通じて提示され、オッカムの剃刀によって特徴数が少ない「疎な」仮説が選好されるという前提に基づき、訓練分布とテスト分布が関連特徴上で十分に重なり合っていれば、疎な仮説が分布外(OOD)でも一般化することを証明し、従来のサンプル複雑性の境界を OOD 文脈に拡張する原理的な枠組みを提案しています。

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

本論文は、マルチタスク学習における勾配バランス調整とモデル学習の階層的構造を双レベル最適化問題として捉え、ゼロ次最適化法を用いて効率的に解く新たなアルゴリズム「MARIGOLD」を提案し、その有効性を広範な実験で実証したものである。

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval

この論文は、HIPAA や NERC-CIP などの法的枠組みへの適合性を確保しつつ、大規模言語モデルの非透明性や手動ルールの限界を克服するため、決定論的エンコーダーと透明なファジー閾値を用いて、自動判断の精度と監査可能性を両立する法的コンプライアンス分類および証拠検索システムを提案するものである。

Rian Atri2026-03-10🤖 cs.LG

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

この論文は、線形オートエンコーダ型推薦システムにおけるハイパーパラメータb>0b>0の解を導出可能にする「Decoupled Expected Quadratic Loss (DEQL)」を提案し、効率的なアルゴリズムと実証実験を通じて、従来のb=0b=0の手法よりも優れた推薦性能を達成できることを示しています。

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

この論文は、継続学習における「文脈チャネル容量」という情報理論的枠組みを提唱し、パラメータを状態ではなく関数値として再定義する条件付き再生アーキテクチャ(ハイパーネットワーク)が、忘却をゼロにするための必要条件を満たすことを示すことで、忘却のメカニズムを統一的に説明し、アーキテクチャ設計の重要性を強調しています。

Ran Cheng2026-03-10🤖 cs.LG

DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation

この論文は、検索と訪問という異なる性質のアクションの特性を分析し、それぞれに適した推論アプローチを採用する「DualSpec」という異種推測フレームワークを提案することで、深層研究エージェントの推論速度を最大 3.28 倍に向上させつつ精度を維持する手法を提示しています。

Shuzhang Zhong, Baotong Lu, Qi Chen, Chuanjie Liu, Fan Yang, Meng Li2026-03-10🤖 cs.LG

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

本論文は、潜在交絡因子に起因する相関的学習の限界を克服し、ニューラル制御関数を用いてトランスフォーマーの隠れ状態に操作変数推定を直接組み込むことで、分布外での頑健な因果的時系列モデルを実現する「OrthoFormer」を提案し、その理論的保証と実験的有効性を示すものである。

Charles Luo2026-03-10🤖 cs.LG

Generalization in Online Reinforcement Learning for Mobile Agents

本論文は、モバイル GUI エージェントの汎化性能評価を目的とした新たなベンチマーク「AndroidWorld-Generalization」と、GRPO を活用したスケーラブルな強化学習システムを提案し、教師あり微調整ベースラインを上回る性能向上と、未見のタスクやアプリに対する汎化における課題を明らかにしたものです。

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

本論文は、学習プロセスに合わせてサンプルの重要性を動的に判断し、損失と不確実性の複合報酬に基づいてデータ選択を最適化するエンドツーエンドの「Data Agent」を提案し、ImageNet-1k や MMLU などのタスクにおいて性能を維持しつつトレーニングコストを 50% 以上削減できることを実証しています。

Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

この論文は、累積コストの予測を通じて潜在状態空間のダイナミクスを学習するコスト駆動型表現学習アプローチ(明示的学習と MuZero に類似した暗黙的学習の 2 手法)を用いて、無限時間不変線形二次ガウス(LQG)制御において、近最適な表現関数と制御器の有限サンプル保証を確立し、その解析に新たな確率過程の持久励起性を証明することを示しています。

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

本論文は、大規模言語モデルの微調整における安全性の逸脱を防ぐため、有害なデータが含まれていなくても安全性に関連する少数のトークンに対するモデルの確信度を参照モデルと一致させるように制約をかける新たなフレームワーク「PACT」を提案し、タスク適応性を損なうことなく安全性を維持することを目的としています。

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG