cs.LG 件の論文 | Gist.Science

Hindsight Credit Assignment for Long-Horizon LLM Agents

この論文は、長期タスクにおけるスパースな報酬によるクレジット割り当ての課題を解決するため、LLM 自体を事後批評として活用してステップレベルの Q 値を精緻化する「HCAPO」という新しいフレームワークを提案し、WebShop や ALFWorld などのベンチマークにおいて既存の GRPO 法を上回る性能向上を実現したことを報告しています。

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng Li2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

本論文は、群 $G$ が空間 $M$ に推移的に作用する際、 $X \times M$ 上の $G$ 不変関数が $M$ の isotropy 部分群 $H$ が $X$ に作用する不変関数に還元可能であることを示し、これにより任意の群作用と均質な条件空間に対応する等変ニューラルフィールドの構造的制約を解消する手法を提案しています。

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

On the Formal Limits of Alignment Verification

この論文は、AI アライメントの検証が「健全性」「一般性」「計算効率性」の 3 つの性質を同時に満たすことは不可能であり、いずれかの妥協が必要であることを示す「トリレンマ」を証明し、実用的な保証が可能な領域を特定している。

Ayushi Agarwal2026-03-11🤖 cs.LG

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

この論文は、低次元部分空間における特異値分解を用いた幾何学的構造の保持と、高信頼度サンプルに焦点を当てた蒸留戦略を導入することで、カタストロフィック・フォージングを抑制し、生涯模倣学習における知識転移と性能を飛躍的に向上させる「SPREAD」と呼ばれるフレームワークを提案しています。

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman Moghadam2026-03-11🤖 cs.LG

Micro-Diffusion Compression -- Binary Tree Tweedie Denoising for Online Probability Estimation

この論文は、適応統計モデルの予測確率をバイアスから補正し、圧縮効率を向上させるために、バイナリ木構造を用いた微拡散去雑音層をオンライン圧縮システム「Midicoth」に統合した手法を提案するものである。

Roberto Tacconelli2026-03-11🤖 cs.LG

Multi-level meta-reinforcement learning with skill-based curriculum

この論文は、複雑な意思決定問題を自然な階層構造で圧縮し、スキルベースのカリキュラム学習を通じてタスクを分解・転移させることで、効率的な多レベルメタ強化学習を実現する手法を提案しています。

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)2026-03-11🤖 cs.AI

The Temporal Markov Transition Field

本論文は、非定常な時系列データにおいて従来のマルコフ遷移場（MTF）が持つ動的レジームの時間的変化の情報を失うという課題を解決するため、時系列を複数の時間的チャンクに分割して局所的な遷移行列を推定し、各チャンクのダイナミクスを反映した新しい画像表現「Temporal Markov Transition Field（TMTF）」を提案し、その定義、性質、数値例、バイアス - バランスのトレードオフ、および幾何学的解釈を体系的に論じています。

Michael Leznik2026-03-11🤖 cs.LG

SoftJAX & SoftTorch: Empowering Automatic Differentiation Libraries with Informative Gradients

本論文は、JAX および PyTorch における硬い演算の勾配問題を解決し、最適化に有用な滑らかな勾配を提供するオープンソースライブラリ「SoftJAX」と「SoftTorch」を提案し、その実用性をベンチマークとケーススタディで実証したものである。

Anselm Paulus, A. René Geist, Vít Musil, Sebastian Hoffmann, Onur Beker, Georg Martius2026-03-11🤖 cs.LG

Are Expressive Encoders Necessary for Discrete Graph Generation?

この論文は、トランスフォーマーなどの高表現力なバックボーンに依存する従来のアプローチを見直し、残差接続を備えたモジュール型メッセージパスフレームワーク「GenGNN」を提案することで、離散グラフ生成において高い有効性を維持しつつ推論速度を大幅に向上させることを実証しています。

Jay Revolinsky, Harry Shomer, Jiliang Tang2026-03-11🤖 cs.AI

MASEval: Extending Multi-Agent Evaluation from Models to Systems

この論文は、LLM ベースのマルチエージェントシステムの評価においてモデルだけでなくシステム全体の構成要素（トポロジーやオーケストレーションなど）を包括的に評価する新しいフレームワーク「MASEval」を提案し、フレームワークの選択がモデルの選択と同様に性能に大きな影響を与えることを示しています。

Cornelius Emde, Alexander Rubinstein, Anmol Goel, Ahmed Heakl, Sangdoo Yun, Seong Joon Oh, Martin Gubri2026-03-11🤖 cs.AI

Expressivity-Efficiency Tradeoffs for Hybrid Sequence Models

本論文は、ハイブリッドシーケンスモデル（トランスフォーマーと状態空間モデルの組み合わせ）が、非ハイブリッドモデルでは大規模なパラメータや作業メモリを必要とする特定のタスクにおいて、理論的に小規模かつ効率的に解決可能であることを証明し、実験的にもパラメータ数最大 6 倍のモデルを上回る性能や優れた汎化性を実証したものである。

John Cooper, Ilias Diakonikolas, Mingchen Ma, Frederic Sala2026-03-11🤖 cs.LG

APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model

本論文は、事前学習された視覚言語モデルと回帰ヘッドを用いて古典的ナビゲーションプランナーのパラメータを予測・学習する「APPLV」を提案し、従来の手法や直接行動を出力する VLA モデルよりも、未知環境での一般化性とナビゲーション性能を向上させることを実証しています。

Yuanjie Lu, Beichen Wang, Zhengqi Wu, Yang Li, Xiaomin Lin, Chengzhi Mao, Xuesu Xiao2026-03-11🤖 cs.LG

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study

地下の私有 5G 環境における実測実験により、従来のチャネル中心のモデルがリンク層の適応性を過小評価しスループットを過大予測する傾向にあることが示され、通信認識型ロボットの計画には実測データに基づくデータ駆動型アプローチが不可欠であることが明らかにされました。

Nils Jörgensen2026-03-11🤖 cs.LG

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

この論文は、ハイブリッド情報システムにおける高次元空間での計算コストとノイズ問題を解決するため、オブジェクト間の結合距離に基づき正規および楽観的モードで動作する新しい特徴量選択モデル「FSbuHD」を提案し、UCI データセットを用いた実験で既存手法を上回る効率性と有効性を示したものである。

Mohammad Hossein Safarpour, Seyed Mohammad Alavi, Mohammad Izadikhah, Hossein Dibachi2026-03-11🤖 cs.AI

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

本論文は、濃度不等式と多重検出補正を組み合わせ、ソースドメインのリスクプロファイルを用いてデータ不足環境での選択的予測の信頼区間を改善する「転移情報ベッティング（TIB）」を提案し、9 つの境界ファミリーを 4 つのベンチマークで包括的に評価した研究です。

Abhinaba Basu2026-03-11🤖 cs.AI

← 前へ次へ →

cs.LG