cs.LG 件の論文 | Gist.Science

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

この論文は、NVIDIA Omniverse を活用したアルジェ国際空港のデジタルツインに基づく合成データ生成パイプラインを提案し、限られた実データのアノテーションを合成データと組み合わせることで、手作業を 25〜35% 削減しつつも、高密度で重なり合う手荷物カートの検出において実データのみを使用する場合と同等以上の精度を達成できることを実証しています。

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

非凸複合最適化問題における統計的異質性とバイアス付き圧縮の課題に対処するため、非滑正則項を局所的に処理しつつ通信効率を最大化する新規アルゴリズム「FedCEF」を提案し、理論的な収束保証と極端な圧縮率下での高い精度を実証した。

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang Shi2026-03-10🤖 cs.LG

Partial Differential Equations in the Age of Machine Learning: A Critical Synthesis of Classical, Machine Learning, and Hybrid Methods

この論文は、偏微分方程式の数値解法における古典的手法と機械学習アプローチを、それぞれの認識論的基盤（演繹的誤差保証対統計的近似）に基づき批判的に比較検討し、両者の相補性を活かしたハイブリッド手法の設計原則や将来の技術的展望を体系的に論じています。

Mohammad Nooraiepour, Jakub Wiktor Both, Teeratorn Kadeethum, Saeid Sadeghnejad2026-03-10🤖 cs.LG

Beyond Surrogates: A Quantitative Analysis for Inter-Metric Relationships

この論文は、オフライン指標の改善がオンライン性能に直結しない「指標の不一致」という課題を解決するため、ベイズ最適集合と後悔転移を用いて異なる評価指標間の定量的な関係を統一的に理論化し、オフラインとオンラインの目標を整合させる評価システムの設計を可能にする枠組みを提案しています。

Yuanhao Pu, Defu Lian, Enhong Chen2026-03-10🤖 cs.LG

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

本論文は、アプリケーションやシステムデータを活用した機械学習駆動およびデータ認識型のマイクロアーキテクチャ手法（強化学習に基づくデータプリフェッチや意味的特性の活用など）を提案し、従来のデータ非依存な設計の限界を克服することで、メモリボトルネックを緩和しパフォーマンスとエネルギー効率を大幅に向上させることを示しています。

Rahul Bera2026-03-10🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

本論文は、メモリー、通信、計算の各側面を横断する統合最適化と並列化手法を導入し、数千の GPU クラスターで数十億から数兆パラメータ規模の混合専門家（MoE）モデルの効率的なトレーニングを可能にする、生産環境対応のオープンソースフレームワーク「Megatron Core」の技術とシステム設計を詳述しています。

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

Global Convergence of Average Reward Constrained MDPs with Neural Critic and General Policy Parameterization

この論文は、ニューラルネットワークを用いたクリティックと一般的な方策パラメータ化を備えた平均報酬制約付きマルコフ決定過程（CMDP）に対して、混合時間オラクルを必要とせず、NTK 理論に基づく原始双対自然アクタクリティックアルゴリズムのグローバル収束性と累積制約違反率を初めて証明したものである。

Anirudh Satheesh, Pankaj Kumar Barman, Washim Uddin Mondal, Vaneet Aggarwal2026-03-10🤖 cs.LG

Step-Size Decay and Structural Stagnation in Greedy Sparse Learning

本論文は、スパース学習における過剰なステップサイズ減衰が特徴の相干性により低次元の現実問題であっても構造的な停滞を引き起こすことを理論的に示し、数値実験でこれを裏付けています。

Pablo M. Berná2026-03-10🤖 cs.LG

Deep Incentive Design with Differentiable Equilibrium Blocks

本論文は、ゲームに依存しない微分可能な均衡ブロック（DEB）をモジュールとして用いる「深層インセンティブ設計（DID）」フレームワークを提案し、契約設計や機械スケジューリングなど多様なインセンティブ設計課題に対して、単一のニューラルネットワークで広範なゲーム規模にわたる均衡を効率的に学習・解決できることを示しています。

Vinzenz Thoma, Georgios Piliouras, Luke Marris2026-03-10🤖 cs.LG

Reverse Distillation: Consistently Scaling Protein Language Model Representations

この論文は、自然言語処理やコンピュータビジョンとは異なりスケーリングが不安定なタンパク質言語モデル（PLM）に対し、小規模モデルの表現を大規模モデルの埋め込みの最初の次元に一致させる「Reverse Distillation」というフレームワークを提案し、これにより埋め込み次元を固定したままモデルサイズが大きくなるほど性能が向上し、ProteinGym ベンチマークで SOTA 性能を達成することを示しています。

Darius Catrina, Christian Bepler, Samuel Sledzieski, Rohit Singh2026-03-10🤖 cs.LG

A Lightweight MPC Bidding Framework for Brand Auction Ads

本論文は、ブランド広告の安定したユーザー行動と迅速なフィードバックという特性を活用し、複雑な機械学習モデルに依存せずオンライン等方回帰を用いて入札から支出・成約までの単調な関係を構築する軽量なモデル予測制御（MPC）フレームワークを提案し、実装の容易さとコスト効率の向上を実現するものである。

Yuanlong Chen, Bowen Zhu, Bing Xia, Yichuan Wang2026-03-10🤖 cs.LG

Hide and Find: A Distributed Adversarial Attack on Federated Graph Learning

この論文は、連合グラフ学習の脆弱性を突くため、学習時にデータを隠蔽的に変位させ、学習後にその情報を基に効率的に敵対的摂動を生成する「Hide and Find」方式の分散型敵対的攻撃手法「FedShift」を提案し、既存手法を上回る攻撃成功率と防御回避能力、および 90% 以上の時間削減を実現したことを示しています。

Jinshan Liu, Ken Li, Jiazhe Wei, Bin Shi, Bo Dong2026-03-10🤖 cs.LG

Uncertainty-Gated Generative Modeling

この論文は、金融時系列予測における過信を抑制し、レジームシフトやショックに対するロバスト性を向上させるため、不確実性を内部制御信号として表現・伝播・生成の各段階でゲート制御する「不確実性ゲート型生成モデル（UGGM）」を提案し、NYISO における MSE 63.5% の削減などの顕著な成果を示したものです。

Xingrui Gu, Haixi Zhang2026-03-10🤖 cs.LG

Using GPUs And LLMs Can Be Satisfying for Nonlinear Real Arithmetic Problems

GPU 加速と大規模言語モデル（LLM）を組み合わせた新しい SMT ソルバー「GANRA」を開発し、非線形実数算術問題の求解において、既存の最先端手法を大幅に凌駕する性能向上を実現しました。

Christopher Brix, Julia Walczak, Nils Lommen, Thomas Noll2026-03-10🤖 cs.LG

Breaking Training Bottlenecks: Effective and Stable Reinforcement Learning for Coding Models

本論文は、現代のコード生成モデルが抱えるトレーニングのボトルネックを解決するため、条件付き切り捨てマスクや多様性に基づく温度選択などの3つの革新を導入した「MicroCoder-GRPO」手法と、より高品質なデータセットおよび評価フレームワークを提案し、LiveCodeBench v6 において基線モデルを大幅に上回る性能向上とトレーニングに関する34の洞察を明らかにしたものである。

Zongqian Li, Shaohan Huang, Zewen Chi, Yixuan Su, Lexin Zhou, Li Dong, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

Lindbladian Learning with Neural Differential Equations

この論文は、複数の過渡的な時間におけるパウリ測定データを最大尤度法で解析し、ニューラル微分方程式を補助的に用いて非凸な損失関数の最適化を可能にすることで、ノイズに対して頑健かつ効率的に量子オープンシステムのリンブリアン（散逸を含むダイナミクス生成子）を学習する手法を提案しています。

Timothy Heightman, Roman Aseguinolaza Gallo, Edward Jiang, JRM Saavedra, Antonio Acín, Marcin Płodzien2026-03-10⚛️ quant-ph

Scaling Data Difficulty: Improving Coding Models via Reinforcement Learning on Fresh and Challenging Problems

本論文は、LLM ベースの予測・較正・選択フレームワークを用いた自動難易度フィルタリングを含む 4 段階のデータ処理パイプラインを提案し、これにより構築された高品質な競合プログラミングデータセット「MicroCoder」が、既存のデータセットと比較してコード生成モデルの学習効率と難問に対する性能を大幅に向上させることを実証しています。

Zongqian Li, Tengchao Lv, Shaohan Huang, Yixuan Su, Qinzheng Sun, Qiufeng Yin, Ying Xin, Scarlett Li, Lei Cui, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

ProgAgent:A Continual RL Agent with Progress-Aware Rewards

本論文は、ラベル付けされていない専門家動画からタスクの進捗を推定して報酬を学習し、敵対的更新と高速な JAX 基盤を統合することで、連続学習における忘却を抑制し、複雑な操作タスクの習得を可能にする「ProgAgent」という強化学習エージェントを提案しています。

Jinzhou Tan, Gabriel Adineera, Jinoh Kim2026-03-10🤖 cs.LG

Vision Transformers that Never Stop Learning

この論文は、Vision Transformer における学習能力の低下（可塑性の喪失）のメカニズムを解明し、従来のパラメータ再初期化では効果がなく、勾配方向を適応的に再構成する幾何学的な最適化手法「ARROW」が可塑性の維持と新タスクへの適応性能向上に有効であることを示しています。

Caihao Sun, Mingqi Yuan, Shiyuan Wang, Jiayu Chen2026-03-10🤖 cs.LG

Toward Global Intent Inference for Human Motion by Inverse Reinforcement Learning

本論文は、逆強化学習を用いて単一の時間変化するコスト関数が、被験者や姿勢に依存せず人間の到達運動を高精度に予測・説明できることを実証し、この種の運動を支配する統一的な最適性原理の存在を支持しています。

Sarmad Mehrdad, Maxime Sabbah, Vincent Bonnet, Ludovic Righetti2026-03-10🤖 cs.LG

← 前へ次へ →