cs.LG 件の論文 | Gist.Science

Reverse Distillation: Consistently Scaling Protein Language Model Representations

この論文は、自然言語処理やコンピュータビジョンとは異なりスケーリングが不安定なタンパク質言語モデル（PLM）に対し、小規模モデルの表現を大規模モデルの埋め込みの最初の次元に一致させる「Reverse Distillation」というフレームワークを提案し、これにより埋め込み次元を固定したままモデルサイズが大きくなるほど性能が向上し、ProteinGym ベンチマークで SOTA 性能を達成することを示しています。

Darius Catrina, Christian Bepler, Samuel Sledzieski, Rohit Singh2026-03-10🤖 cs.LG

A Lightweight MPC Bidding Framework for Brand Auction Ads

本論文は、ブランド広告の安定したユーザー行動と迅速なフィードバックという特性を活用し、複雑な機械学習モデルに依存せずオンライン等方回帰を用いて入札から支出・成約までの単調な関係を構築する軽量なモデル予測制御（MPC）フレームワークを提案し、実装の容易さとコスト効率の向上を実現するものである。

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan Wang2026-03-10🤖 cs.LG

Hide and Find: A Distributed Adversarial Attack on Federated Graph Learning

この論文は、連合グラフ学習の脆弱性を突くため、学習時にデータを隠蔽的に変位させ、学習後にその情報を基に効率的に敵対的摂動を生成する「Hide and Find」方式の分散型敵対的攻撃手法「FedShift」を提案し、既存手法を上回る攻撃成功率と防御回避能力、および 90% 以上の時間削減を実現したことを示しています。

Jinshan Liu, Ken Li, Jiazhe Wei, Bin Shi, Bo Dong2026-03-10🤖 cs.LG

Uncertainty-Gated Generative Modeling

この論文は、金融時系列予測における過信を抑制し、レジームシフトやショックに対するロバスト性を向上させるため、不確実性を内部制御信号として表現・伝播・生成の各段階でゲート制御する「不確実性ゲート型生成モデル（UGGM）」を提案し、NYISO における MSE 63.5% の削減などの顕著な成果を示したものです。

Xingrui Gu, Haixi Zhang2026-03-10🤖 cs.LG

Using GPUs And LLMs Can Be Satisfying for Nonlinear Real Arithmetic Problems

GPU 加速と大規模言語モデル（LLM）を組み合わせた新しい SMT ソルバー「GANRA」を開発し、非線形実数算術問題の求解において、既存の最先端手法を大幅に凌駕する性能向上を実現しました。

Christopher Brix, Julia Walczak, Nils Lommen, Thomas Noll2026-03-10🤖 cs.LG

Breaking Training Bottlenecks: Effective and Stable Reinforcement Learning for Coding Models

本論文は、現代のコード生成モデルが抱えるトレーニングのボトルネックを解決するため、条件付き切り捨てマスクや多様性に基づく温度選択などの3つの革新を導入した「MicroCoder-GRPO」手法と、より高品質なデータセットおよび評価フレームワークを提案し、LiveCodeBench v6 において基線モデルを大幅に上回る性能向上とトレーニングに関する34の洞察を明らかにしたものである。

Zongqian Li, Shaohan Huang, Zewen Chi, Yixuan Su, Lexin Zhou, Li Dong, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

Lindbladian Learning with Neural Differential Equations

この論文は、複数の過渡的な時間におけるパウリ測定データを最大尤度法で解析し、ニューラル微分方程式を補助的に用いて非凸な損失関数の最適化を可能にすることで、ノイズに対して頑健かつ効率的に量子オープンシステムのリンブリアン（散逸を含むダイナミクス生成子）を学習する手法を提案しています。

Timothy Heightman, Roman Aseguinolaza Gallo, Edward Jiang, JRM Saavedra, Antonio Acín, Marcin Płodzien2026-03-10⚛️ quant-ph

Scaling Data Difficulty: Improving Coding Models via Reinforcement Learning on Fresh and Challenging Problems

本論文は、LLM ベースの予測・較正・選択フレームワークを用いた自動難易度フィルタリングを含む 4 段階のデータ処理パイプラインを提案し、これにより構築された高品質な競合プログラミングデータセット「MicroCoder」が、既存のデータセットと比較してコード生成モデルの学習効率と難問に対する性能を大幅に向上させることを実証しています。

Zongqian Li, Tengchao Lv, Shaohan Huang, Yixuan Su, Qinzheng Sun, Qiufeng Yin, Ying Xin, Scarlett Li, Lei Cui, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

ProgAgent:A Continual RL Agent with Progress-Aware Rewards

本論文は、ラベル付けされていない専門家動画からタスクの進捗を推定して報酬を学習し、敵対的更新と高速な JAX 基盤を統合することで、連続学習における忘却を抑制し、複雑な操作タスクの習得を可能にする「ProgAgent」という強化学習エージェントを提案しています。

Jinzhou Tan, Gabriel Adineera, Jinoh Kim2026-03-10🤖 cs.LG

Vision Transformers that Never Stop Learning

この論文は、Vision Transformer における学習能力の低下（可塑性の喪失）のメカニズムを解明し、従来のパラメータ再初期化では効果がなく、勾配方向を適応的に再構成する幾何学的な最適化手法「ARROW」が可塑性の維持と新タスクへの適応性能向上に有効であることを示しています。

Caihao Sun, Mingqi Yuan, Shiyuan Wang, Jiayu Chen2026-03-10🤖 cs.LG

Toward Global Intent Inference for Human Motion by Inverse Reinforcement Learning

本論文は、逆強化学習を用いて単一の時間変化するコスト関数が、被験者や姿勢に依存せず人間の到達運動を高精度に予測・説明できることを実証し、この種の運動を支配する統一的な最適性原理の存在を支持しています。

Sarmad Mehrdad, Maxime Sabbah, Vincent Bonnet, Ludovic Righetti2026-03-10🤖 cs.LG

Neural Precoding in Complex Projective Spaces

この論文は、グローバル位相の冗長性を排除して幾何学的整合性を高める複素射影空間（CPS）に基づく深層学習フレームワークを提案し、MU-MISO システムの precoding 性能と汎化能力を大幅に向上させることを示しています。

Zaid Abdullah, Merouane Debbah, Symeon Chatzinotas, Bjorn Ottersten2026-03-10🤖 cs.LG

Learning embeddings of non-linear PDEs: the Burgers' equation

本論文は、物理情報ニューラルネットワーク（PINN）に多ヘッド構造と主成分分析を組み合わせることで、粘性バース方程式の解空間を低次元の埋め込み空間として効率的に表現し、その物理的解釈性を保ちながら主要なダイナミクスを捉える手法を提案するものである。

Pedro Tarancón-Álvarez, Leonid Sarieddine, Pavlos Protopapas, Raul Jimenez2026-03-10🤖 cs.LG

Fusion Complexity Inversion: Why Simpler Cross View Modules Outperform SSMs and Cross View Attention Transformers for Pasture Biomass Regression

この論文は、限られた農業データにおいて、複雑なクロスビューアテンションや SSM よりも単純な畳み込みモジュールの方が優れており、バックボーンモデルの質こそが予測精度を決定する主要因であることを示しています。

Mridankan Mandal2026-03-10🤖 cs.LG

← 前へ次へ →

cs.LG