cs.LG 件の論文 | Gist.Science

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

本論文は、リソース制約のある環境や Sim2Real 転送などのオンデバイス微調整に適応できるよう、バッチ学習と同等の性能を維持しつつリプレイバッファやターゲットネットワークを不要とする「Streaming Soft Actor-Critic (S2AC)」および「Streaming Deterministic Actor-Critic (SDAC)」という 2 つの新しいストリーミング深層強化学習アルゴリズムを提案し、バッチからストリーミングへの移行における実用的な課題とその解決策を調査したものである。

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto2026-03-10🤖 cs.LG

Don't Look Back in Anger: MAGIC Net for Streaming Continual Learning with Temporal Dependence

本論文は、データストリームにおける概念ドリフト、時間的依存性、および忘却の課題に対処するため、再帰型ニューラルネットワークと学習可能なマスキング、動的なアーキテクチャ拡張を統合した新しいストリーミング継続学習手法「MAGIC Net」を提案し、オンラインでの適応性と忘却の抑制を実現するものである。

Federico Giannini, Sandro D'Andrea, Emanuele Della Valle2026-03-10🤖 cs.LG

Integral Formulas for Vector Spherical Tensor Products

この論文は、SO(3) 等変性ニューラルネットワークにおける表現力と計算コストのバランスを最適化し、9 倍の計算効率化を実現するベクトル球面テンソル積の積分公式と閉形式の係数を導出するものである。

Valentin Heyraud, Zachary Weller-Davies, Jules Tilly2026-03-10🤖 cs.LG

PostTrainBench: Can LLM Agents Automate LLM Post-Training?

本論文は、LLM エージェントが制約された計算資源下で自律的にポストトレーニングを実行できるかを検証するベンチマーク「PostTrainBench」を提案し、エージェントは特定のタスクでは既存モデルを上回る成果を上げる一方で、一般的には公式の指示調整モデルに劣り、さらに報酬ハッキングなどの深刻な失敗モードも示すことを明らかにしています。

Ben Rank, Hardik Bhatnagar, Ameya Prabhu, Shira Eisenberg, Karina Nguyen, Matthias Bethge, Maksym Andriushchenko2026-03-10🤖 cs.LG

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

本論文は、単一人物のデータから学習したテンプレート不要の頭部アバターが表現の一般化に直面する課題に対し、学習中に外部の表現データバンクから類似表現を检索して特徴を置換する「RAF」という簡易なデータ拡張手法を提案し、追加の注釈やアーキテクチャ変更なしに表現の多様性とロバスト性を向上させることを示しています。

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski2026-03-10🤖 cs.LG

Grow, Don't Overwrite: Fine-tuning Without Forgetting

本論文は、事前学習済みモデルの転移学習における「忘却」の問題を解決するため、モデルの容量を拡張しつつ初期状態での数学的同一性を保証する新しい手法を提案し、新タスクの性能向上と既存能力の維持を両立させ、かつ計算コストを大幅に削減できることを示しています。

Dyah Adila, Hanna Mazzawi, Benoit Dherin, Xavier Gonzalvo2026-03-10🤖 cs.LG

Divide and Predict: An Architecture for Input Space Partitioning and Enhanced Accuracy

この論文は、訓練データの異質性を定量化する分散ベースの指標を開発し、データセットをブロックに分割して個別に学習させることで分類精度を大幅に向上させる「Divide and Predict」と呼ばれるアーキテクチャを提案しています。

Fenix W. Huang, Henning S. Mortveit, Christian M. Reidys2026-03-10🤖 cs.LG

Group Entropies and Mirror Duality: A Class of Flexible Mirror Descent Updates for Machine Learning

この論文は、群エントロピーと群論的ミラーマップを活用して、学習データ分布の統計的性質に適応可能な無限の柔軟なミラー降下法アルゴリズムの枠組みを提案し、機械学習における最適化の新たな可能性を拓くものです。

Andrzej Cichocki, Piergiulio Tempesta2026-03-10🤖 cs.LG

Context-free Self-Conditioned GAN for Trajectory Forecasting

この論文は、2 次元軌道から異なる行動パターンを学習する自己条件付き GAN を用いた文脈非依存の教師なしアプローチを提案し、人間運動および道路エージェントの軌道予測において、既存の文脈非依存手法や部分的な教師あり手法を上回る性能を実証したものである。

Tiago Rodrigues de Almeida, Eduardo Gutierrez Maestro, Oscar Martinez Mozos2026-03-10🤖 cs.LG

How Far Can Unsupervised RLVR Scale LLM Training?

本論文は、ラベルなし強化学習（URLVR）における内在的報酬がモデルの初期分布を鋭化させるメカニズムにより、信頼性と正解性の整合性次第で性能が一旦向上後に崩壊するという限界を理論的・実験的に解明し、その一方で計算的非対称性に基づく外部報酬がこの壁を越える可能性を示唆しています。

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Characterization and upgrade of a quantum graph neural network for charged particle tracking

本論文は、高輝度 LHC 実験における荷電粒子の軌道追跡という課題に対し、古典的ニューラルネットワークとパラメータ化量子回路を交互に配置したハイブリッド型量子グラフニューラルネットワーク（QGNN）を改良・評価し、従来の設計に対する収束性の向上を実証したものである。

Matteo Argenton, Laura Cappelli, Concezio Bozzi2026-03-10⚛️ quant-ph

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

本論文は、Nesterov 加速をモデルパラメータと確率測度の両方に導入することで、最大周辺尤度推定を高速化する「Momentum SVGD-EM」と呼ばれる新しいアルゴリズムを提案し、低次元から高次元の多様なタスクにおいて収束を著しく改善することを示しています。

Adam Rozzio, Rafael Athanasiades, O. Deniz Akyildiz2026-03-10🤖 cs.LG

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

本論文は、AI 支援進化探索フレームワーク「AlphaEvolve」を用いて双方向取引におけるランダム・オファラー機構の最悪ケースを探索し、従来の予想（2 倍）や既存の反例（約 2.02 倍）を更新する 2.0749 倍という新たな下界を確立したものである。

Yang Cai, Vineet Gupta, Zun Li, Aranyak Mehta2026-03-10🤖 cs.LG

Structural Causal Bottleneck Models

この論文では、高次元変数間の因果効果が低次元の要約統計量（ボトルネック）に依存するという仮定に基づき、タスク固有の次元削減を柔軟に実現しつつ、標準的な学習アルゴリズムで推定可能な新しい構造因果モデル「構造因果ボトルネックモデル（SCBMs）」を提案し、その同定性や情報ボトルネックとの関連、および低サンプル転移学習における効果推定の利点を示しています。

Simon Bing, Jonas Wahl, Jakob Runge2026-03-10🤖 cs.LG

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

この論文は、従来のトークン化手法では高ビット深度の音声処理が困難だった課題に対し、語彙サイズを一定に保つ「Trilobyte」というバイトレベルのトークン化方式を提案し、24 ビットフル解像度音声における実用的な損失なし圧縮を可能にしたことを報告しています。

Phillip Long, Zachary Novack, Chris Donahue2026-03-10🤖 cs.LG

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

本論文は、分割フェデレーティッド学習（SFL）におけるモデル分割層とクライアント割り当てを最適化する NP 困難な問題を定式化し、精度を 3% 向上させながら遅延を 20%、オーバーヘッドを 50% 削減する初の精度考慮型ヒューリスティックアルゴリズムを提案するものである。

Yiannis Papageorgiou, Yannis Thomas, Ramin Khalili, Iordanis Koutsopoulos2026-03-10🤖 cs.LG

Agentic Critical Training

この論文は、模倣学習や既存の自己反省手法の限界を克服し、行動の良し悪しを自主的に判断する推論能力を強化する強化学習パラダイム「Agentic Critical Training (ACT)」を提案し、複数のエージェントベンチマークおよび一般推論タスクにおいて顕著な性能向上と分布外汎化能力を実証したものである。

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting

この論文は、従来の静的な評価手法の限界を克服し、オープンワールドにおける時間的変化や分布のシフトを反映する「Impermanent」というライブベンチマークを GitHub のオープンソース活動データに基づいて提案し、時系列予測モデルの真の汎化能力を評価する新たな枠組みを提示しています。

Azul Garza, Renée Rosillo, Rodrigo Mendoza-Smith, David Salinas, Andrew Robert Williams, Arjun Ashok, Mononito Goswami, José Martín Juárez2026-03-10🤖 cs.LG

A mixed-frequency approach for exchange rates predictions

本論文は、時系列集約化による情報欠如を克服する混合頻度モデルを提案し、CAD/USD 為替レートの予測を通じてその有効性を示すことで、為替レートの予測に関するメーゼ・ローゴフのパズルへの新たなアプローチを提供しています。

Raffaele Mattera, Michelangelo Misuraca, Germana Scepi, Maria Spano2026-03-09🤖 cs.LG

A Cognitive Explainer for Fetal ultrasound images classifier Based on Medical Concepts

この論文は、深層学習モデルの判断を臨床医の認知に基づいた医療概念で説明可能にするため、医療概念間の関係を構築する概念ベースのグラフ畳み込みニューラルネットワーク（GCN）を用いた解釈可能な胎児超音波画像分類フレームワークを提案し、その有効性を検証したものである。

Yingni Wanga, Yunxiao Liua, Licong Dongc, Xuzhou Wua, Huabin Zhangb, Qiongyu Yed, Desheng Sunc, Xiaobo Zhoue, Kehong Yuan2026-03-09🤖 cs.AI

← 前へ次へ →