cs.LG 件の論文 | Gist.Science

Scaling Strategy, Not Compute: A Stand-Alone, Open-Source StarCraft II Benchmark for Accessible Reinforcement Learning Research

この論文は、スタークラフト II のフルゲームとミニゲームの中間に位置し、経済メカニズムを排除して長距離移動と戦闘の戦術的スキルに焦点を当てた、計算コストを抑えたオープンソースの新しい RL ベンチマーク「Two-Bridge Map Suite」を提案するものである。

Sourav Panda, Shreyash Kale, Tanmay Ambadkar, Abhinav Verma, Jonathan Dodge2026-03-10🤖 cs.LG

Valid Feature-Level Inference for Tabular Foundation Models via the Conditional Randomization Test

本論文は、TabPFN と条件付ランダム化検定（CRT）を組み合わせることで、モデルの再学習やパラメトリックな仮定を必要とせず、非線形かつ相関のある設定においても有限サンプルで有効な特徴量レベルの仮説検定と p 値を提供する手法を提案しています。

Mohamed Salem2026-03-10🤖 cs.LG

CapTrack: Multifaceted Evaluation of Forgetting in LLM Post-Training

本論文では、LLM のファインチューニングによる「忘却」を単なる知識の喪失ではなく行動やユーザー体験の劣化として再定義し、この多面的な評価を行うためのフレームワーク「CapTrack」を提案するとともに、大規模な実証研究を通じて忘却がロバスト性やデフォルト行動にも及ぶこと、および指示微調整が最も大きなドリフトを引き起こす一方で、好適化はより保守的で一部能力の回復に寄与することを明らかにしています。

Lukas Thede, Stefan Winzeck, Zeynep Akata, Jonathan Richard Schwarz2026-03-10🤖 cs.LG

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

この論文は、培養を不要とし、深層学習と画像拡張技術を用いて数秒で水質安全性を判定する低コストなシステム「DeepScope」を開発し、実地試験で高い精度を達成したことを報告しています。

Sanjay Srinivasan2026-03-10🤖 cs.LG

Consensus is Not Verification: Why Crowd Wisdom Strategies Fail for LLM Truthfulness

外部検証が不可能な領域において、複数のモデルからの回答を集約する「群衆の知恵」戦略は、誤答の相関性や自信スコアの信頼性不足により、推論コストを増大させても真実性の向上につながらず、むしろ共通の誤解を強化するだけであり、検証可能な領域とは異なる推論時スケーリングの限界を示している。

Yegor Denisov-Blanch, Joshua Kazdan, Jessica Chudnovsky, Rylan Schaeffer, Sheng Guan, Soji Adeshina, Sanmi Koyejo2026-03-10🤖 cs.LG

OptiRoulette Optimizer: A New Stochastic Meta-Optimizer for up to 5.3x Faster Convergence

本論文は、トレーニング中に最適化手法を動的に選択する新しい確率的メタ最適化手法「OptiRoulette」を提案し、複数の画像分類タスクにおいて単一の AdamW ベースラインと比較して最大 5.3 倍の収束速度向上と高精度達成を実現したことを報告しています。

Stamatis Mastromichalakis2026-03-10🤖 cs.LG

Correlation Analysis of Generative Models

この論文は、拡散モデルとフローマッチングを統一的な線形方程式で表現し、既存モデルにおけるノイズデータと予測ターゲット間の相関が弱いことが学習プロセスに悪影響を及ぼす可能性を理論的に示しています。

Zhengguo Li, Chaobing Zheng, Wei Wang2026-03-10🤖 cs.LG

Annealed Co-Generation: Disentangling Variables via Progressive Pairwise Modeling

この論文は、高次元拡散モデルの代わりに低次元拡散モデルを組み合わせる「Annealed Co-Generation（ACG）」フレームワークを提案し、因果変数をペアごとに学習して共有変数を介して結合する三段階のアニーリングプロセスにより、科学的タスクにおける多変量共生成の計算負荷とデータ不均衡を解決し、一貫性のある生成を実現することを示しています。

Hantao Zhang, Jieke Wu, Mingda Xu, Xiao Hu, Yingxuan You, Pascal Fua2026-03-10🤖 cs.LG

RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models

この論文は、マルチモデルシステムにおけるコストと性能のトレードオフを最適化するため、誤分類リスクを厳密に制御しつつ最適な大規模言語モデルの集合を動的に選択する新しい手法「RACER」を提案し、その理論的保証と高い精度を実証しています。

Sai Hao, Hao Zeng, Hongxin Wei, Bingyi Jing2026-03-10🤖 cs.LG

Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

この論文は、自己回帰モデルと拡散モデルを連続的な潜在軌道として統合し、生成の確信度に応じて両者のバランスを動的に調整することで、推論速度を維持しつつ高い生成品質と推論能力を実現する新しい大規模言語モデル「Evo」を提案しています。

Junde Wu, Minhao Hu, Jiayuan Zhu, Yuyuan Liu, Tianyi Zhang, Kang Li, Jingkun Chen, Jiazhen Pan, Min Xu, Yueming Jin2026-03-10🤖 cs.LG

Distilling and Adapting: A Topology-Aware Framework for Zero-Shot Interaction Prediction in Multiplex Biological Networks

この論文は、ドメイン固有の基盤モデル、トポロジー意識型グラフトークナイザー、教師-生徒型知識蒸留を組み合わせることで、未見のエンティティに対するゼロショット相互作用予測を可能にする新しいマルチプレックス生物ネットワーク用フレームワークを提案し、最先端の手法を上回る性能を実証したものである。

Alana Deng, Sugitha Janarthanan, Yan Sun, Zihao Jing, Pingzhao Hu2026-03-10🤖 cs.LG

Not all tokens are needed(NAT): token efficient reinforcement learning

この論文は、大規模言語モデルの強化学習において、Horvitz-Thompson 再重み付けを用いて生成トークンの一部のみで偏りのない勾配を推定する「NAT（Not All Tokens Are Needed）」フレームワークを提案し、計算コストやメモリ使用量を削減しながらフルトークン学習と同等の性能を達成することを示しています。

Hejian Sang, Yuanda Xu, Zhengze Zhou, Ran He, Zhipeng Wang2026-03-10🤖 cs.LG

GraphSkill: Documentation-Guided Hierarchical Retrieval-Augmented Coding for Complex Graph Reasoning

この論文は、技術文書の階層構造を活用した階層的検索と自動テストケース生成による自己デバッグを組み合わせたエージェント型フレームワーク「GraphSkill」を提案し、複雑なグラフ推論タスクにおけるコード生成の精度向上と推論コストの削減を実現するものです。

Fali Wang, Chenglin Weng, Xianren Zhang, Siyuan Hong, Hui Liu, Suhang Wang2026-03-10🤖 cs.LG

Reward Under Attack: Analyzing the Robustness and Hackability of Process Reward Models

本論文は、LLM 推論パイプラインの中核を担うプロセス報酬モデル（PRM）が、敵対的攻撃に対して脆弱であり、実際には推論の正しさを検証するのではなく文章の流暢さを検出する傾向にあることを示し、その脆弱性を定量化するための診断フレームワークと評価ツールキットを提案しています。

Rishabh Tiwari, Aditya Tomar, Udbhav Bamba, Monishwaran Maheswaran, Heng Yang, Michael W. Mahoney, Kurt Keutzer, Amir Gholami2026-03-10🤖 cs.LG

From ARIMA to Attention: Power Load Forecasting Using Temporal Deep Learning

本論文は、PJM の電力消費データを用いた短期負荷予測の比較検討を通じて、ARIMA、LSTM、BiLSTM、Transformer 各モデルの性能を評価し、自己注意機構に基づく Transformer モデルが MAPE 3.8% の最高精度と堅牢性を示したことを報告しています。

Suhasnadh Reddy Veluru, Sai Teja Erukude, Viswa Chaitanya Marella2026-03-10🤖 cs.LG

Advances in GRPO for Generation Models: A Survey

この論文は、生成モデルの人間嗜好やタスク目標への整合を可能にする「Flow-GRPO」の手法論的進歩と、画像・動画・音声・3D など多様な生成タスクへの応用展開を包括的にレビューし、その将来の課題を概説する調査論文である。

Zexiang Liu, Xianglong He, Yangguang Li2026-03-10🤖 cs.LG

Exploration Space Theory: Formal Foundations for Prerequisite-Aware Location-Based Recommendation

この論文は、知識空間理論を位置情報推薦に応用し、訪問地点間の前提依存関係を格子論的に定式化した「探索空間理論（EST）」を提案し、その数学的構造に基づいて構造的妥当性が保証された推薦システム（ESRS）を構築することを目的としています。

Madjid Sadallah2026-03-10🤖 cs.LG

Pavement Missing Condition Data Imputation through Collective Learning-Based Graph Neural Networks

本論文は、センサー誤差や非定期的な点検により生じる舗装状態データの欠損を、隣接区間の特性と観測区間間の依存関係の両方を学習する集団学習ベースのグラフ畳み込みネットワークを用いて高精度に補完する手法を提案し、テキサス州交通省のデータを用いた実証実験でその有効性を示したものである。

Ke Yu, Lu Gao2026-03-10🤖 cs.LG

Grouter: Decoupling Routing from Representation for Accelerated MoE Training

この論文は、MoE（Mixture-of-Experts）モデルの構造最適化と重みの更新を分離する「Grouter」という事前ルーティング手法を提案し、高品質な構造を固定ルーターとして活用することで、トレーニングの収束速度と品質を大幅に向上させ、スケーラブルな MoE 訓練のパラダイムを確立したことを示しています。

Yuqi Xu, Rizhen Hu, Zihan Liu, Mou Sun, Kun Yuan2026-03-10🤖 cs.LG

T-REX: Transformer-Based Category Sequence Generation for Grocery Basket Recommendation

本論文は、オンライン生鮮食品ショッピングにおける反復的な購入パターンや複雑なアイテム関係といった課題に対処するため、動的シーケンス分割、適応的ポジショナルエンコーディング、カテゴリレベルモデリングという 3 つの革新を導入し、BERT4Rec などの既存手法よりも優れた次回の買い物かご予測を実現するトランスフォーマーベースのモデル「T-REX」を提案するものである。

Soroush Mokhtari, Muhammad Tayyab Asif, Sergiy Zubatiy2026-03-10🤖 cs.LG

← 前へ次へ →