Reverse Distillation: Consistently Scaling Protein Language Model Representations

この論文は、自然言語処理やコンピュータビジョンとは異なりスケーリングが不安定なタンパク質言語モデル(PLM)に対し、小規模モデルの表現を大規模モデルの埋め込みの最初の次元に一致させる「Reverse Distillation」というフレームワークを提案し、これにより埋め込み次元を固定したままモデルサイズが大きくなるほど性能が向上し、ProteinGym ベンチマークで SOTA 性能を達成することを示しています。

Darius Catrina, Christian Bepler, Samuel Sledzieski, Rohit Singh2026-03-10🤖 cs.LG

A Lightweight MPC Bidding Framework for Brand Auction Ads

本論文は、ブランド広告の安定したユーザー行動と迅速なフィードバックという特性を活用し、複雑な機械学習モデルに依存せずオンライン等方回帰を用いて入札から支出・成約までの単調な関係を構築する軽量なモデル予測制御(MPC)フレームワークを提案し、実装の容易さとコスト効率の向上を実現するものである。

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan Wang2026-03-10🤖 cs.LG

Hide and Find: A Distributed Adversarial Attack on Federated Graph Learning

この論文は、連合グラフ学習の脆弱性を突くため、学習時にデータを隠蔽的に変位させ、学習後にその情報を基に効率的に敵対的摂動を生成する「Hide and Find」方式の分散型敵対的攻撃手法「FedShift」を提案し、既存手法を上回る攻撃成功率と防御回避能力、および 90% 以上の時間削減を実現したことを示しています。

Jinshan Liu, Ken Li, Jiazhe Wei, Bin Shi, Bo Dong2026-03-10🤖 cs.LG

Uncertainty-Gated Generative Modeling

この論文は、金融時系列予測における過信を抑制し、レジームシフトやショックに対するロバスト性を向上させるため、不確実性を内部制御信号として表現・伝播・生成の各段階でゲート制御する「不確実性ゲート型生成モデル(UGGM)」を提案し、NYISO における MSE 63.5% の削減などの顕著な成果を示したものです。

Xingrui Gu, Haixi Zhang2026-03-10🤖 cs.LG

Breaking Training Bottlenecks: Effective and Stable Reinforcement Learning for Coding Models

本論文は、現代のコード生成モデルが抱えるトレーニングのボトルネックを解決するため、条件付き切り捨てマスクや多様性に基づく温度選択などの3つの革新を導入した「MicroCoder-GRPO」手法と、より高品質なデータセットおよび評価フレームワークを提案し、LiveCodeBench v6 において基線モデルを大幅に上回る性能向上とトレーニングに関する34の洞察を明らかにしたものである。

Zongqian Li, Shaohan Huang, Zewen Chi, Yixuan Su, Lexin Zhou, Li Dong, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

Lindbladian Learning with Neural Differential Equations

この論文は、複数の過渡的な時間におけるパウリ測定データを最大尤度法で解析し、ニューラル微分方程式を補助的に用いて非凸な損失関数の最適化を可能にすることで、ノイズに対して頑健かつ効率的に量子オープンシステムのリンブリアン(散逸を含むダイナミクス生成子)を学習する手法を提案しています。

Timothy Heightman, Roman Aseguinolaza Gallo, Edward Jiang, JRM Saavedra, Antonio Acín, Marcin Płodzien2026-03-10⚛️ quant-ph

Scaling Data Difficulty: Improving Coding Models via Reinforcement Learning on Fresh and Challenging Problems

本論文は、LLM ベースの予測・較正・選択フレームワークを用いた自動難易度フィルタリングを含む 4 段階のデータ処理パイプラインを提案し、これにより構築された高品質な競合プログラミングデータセット「MicroCoder」が、既存のデータセットと比較してコード生成モデルの学習効率と難問に対する性能を大幅に向上させることを実証しています。

Zongqian Li, Tengchao Lv, Shaohan Huang, Yixuan Su, Qinzheng Sun, Qiufeng Yin, Ying Xin, Scarlett Li, Lei Cui, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

Learning embeddings of non-linear PDEs: the Burgers' equation

本論文は、物理情報ニューラルネットワーク(PINN)に多ヘッド構造と主成分分析を組み合わせることで、粘性バース方程式の解空間を低次元の埋め込み空間として効率的に表現し、その物理的解釈性を保ちながら主要なダイナミクスを捉える手法を提案するものである。

Pedro Tarancón-Álvarez, Leonid Sarieddine, Pavlos Protopapas, Raul Jimenez2026-03-10🤖 cs.LG

Transferable Optimization Network for Cross-Domain Image Reconstruction

本論文は、大規模かつ多様なデータから学習した汎用的な特徴抽出器と、限られたデータで訓練するタスク固有のドメインアダプターを二段階のバイレベル最適化で組み合わせる転移学習フレームワークを提案し、これにより限られたデータでも高品質な MR 画像再構成を実現することを示しています。

Yunmei Chen, Chi Ding, Xiaojing Ye2026-03-10🤖 cs.LG

Gradient Iterated Temporal-Difference Learning

本論文は、移動目標の勾配を計算することで半勾配法と競合する学習速度を実現し、Atari ゲームなど多様なベンチマークで勾配 TD 法の学習速度と安定性を両立させた「Gradient Iterated Temporal-Difference learning」を提案し、その有効性を示したものである。

Théo Vincent, Kevin Gerhardt, Yogesh Tripathi, Habib Maraqten, Adam White, Martha White, Jan Peters, Carlo D'Eramo2026-03-10🤖 cs.LG

Guess & Guide: Gradient-Free Zero-Shot Diffusion Guidance

この論文は、拡散モデルを用いたベイズ逆問題において、勾配計算を不要とする軽量な尤度代理モデルを提案することで、推論コストを大幅に削減しつつ最高レベルの性能を実現する「Guess & Guide」と呼ばれるゼロショット手法を提示するものである。

Abduragim Shtanchaev, Albina Ilina, Yazid Janati, Arip Asadulaev, Martin Takác, Eric Moulines2026-03-10🤖 cs.LG

An Interpretable Generative Framework for Anomaly Detection in High-Dimensional Financial Time Series

この論文は、複雑な時系列依存性と進化する横断面構造を有する高次元金融時系列における構造的な不安定性を検出するために、予測不一致、再構成の劣化、潜在歪み、ボラティリティのシフトなどの信号を統合し、経済的に整合的な要因レベルの帰属を可能にする解釈可能な生成フレームワーク「ReGEN-TAD」を提案するものである。

Waldyn G Martinez2026-03-10🤖 cs.LG

Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

本論文は、視点を問わない部分観測条件下での頑健な把持を実現するため、自然言語指示に基づき視覚言語モデルと点雲補完技術を活用して安全な把持動作を生成するエンドツーエンドのパイプラインを提案し、実ロボットによる実験で既存手法を大幅に上回る成功率を達成したことを報告しています。

Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo Becker2026-03-10🤖 cs.LG

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

この論文は、生物学的な睡眠と記憶の再活性化に着想を得た「睡眠リプレイ統合(SRC)」という手法を提案し、教師あり再学習なしに人工ニューラルネットワークの過信問題を解決し、信頼性の高い確率推定を実現することを示しています。

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG