Hindsight Credit Assignment for Long-Horizon LLM Agents

この論文は、長期タスクにおけるスパースな報酬によるクレジット割り当ての課題を解決するため、LLM 自体を事後批評として活用してステップレベルの Q 値を精緻化する「HCAPO」という新しいフレームワークを提案し、WebShop や ALFWorld などのベンチマークにおいて既存の GRPO 法を上回る性能向上を実現したことを報告しています。

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng Li2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

本論文は、群GGが空間MMに推移的に作用する際、X×MX \times M上のGG不変関数がMMの isotropy 部分群HHXXに作用する不変関数に還元可能であることを示し、これにより任意の群作用と均質な条件空間に対応する等変ニューラルフィールドの構造的制約を解消する手法を提案しています。

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

この論文は、低次元部分空間における特異値分解を用いた幾何学的構造の保持と、高信頼度サンプルに焦点を当てた蒸留戦略を導入することで、カタストロフィック・フォージングを抑制し、生涯模倣学習における知識転移と性能を飛躍的に向上させる「SPREAD」と呼ばれるフレームワークを提案しています。

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman Moghadam2026-03-11🤖 cs.LG

The Temporal Markov Transition Field

本論文は、非定常な時系列データにおいて従来のマルコフ遷移場(MTF)が持つ動的レジームの時間的変化の情報を失うという課題を解決するため、時系列を複数の時間的チャンクに分割して局所的な遷移行列を推定し、各チャンクのダイナミクスを反映した新しい画像表現「Temporal Markov Transition Field(TMTF)」を提案し、その定義、性質、数値例、バイアス - バランスのトレードオフ、および幾何学的解釈を体系的に論じています。

Michael Leznik2026-03-11🤖 cs.LG

SoftJAX & SoftTorch: Empowering Automatic Differentiation Libraries with Informative Gradients

本論文は、JAX および PyTorch における硬い演算の勾配問題を解決し、最適化に有用な滑らかな勾配を提供するオープンソースライブラリ「SoftJAX」と「SoftTorch」を提案し、その実用性をベンチマークとケーススタディで実証したものである。

Anselm Paulus, A. René Geist, Vít Musil, Sebastian Hoffmann, Onur Beker, Georg Martius2026-03-11🤖 cs.LG

Are Expressive Encoders Necessary for Discrete Graph Generation?

この論文は、トランスフォーマーなどの高表現力なバックボーンに依存する従来のアプローチを見直し、残差接続を備えたモジュール型メッセージパスフレームワーク「GenGNN」を提案することで、離散グラフ生成において高い有効性を維持しつつ推論速度を大幅に向上させることを実証しています。

Jay Revolinsky, Harry Shomer, Jiliang Tang2026-03-11🤖 cs.AI

MASEval: Extending Multi-Agent Evaluation from Models to Systems

この論文は、LLM ベースのマルチエージェントシステムの評価においてモデルだけでなくシステム全体の構成要素(トポロジーやオーケストレーションなど)を包括的に評価する新しいフレームワーク「MASEval」を提案し、フレームワークの選択がモデルの選択と同様に性能に大きな影響を与えることを示しています。

Cornelius Emde, Alexander Rubinstein, Anmol Goel, Ahmed Heakl, Sangdoo Yun, Seong Joon Oh, Martin Gubri2026-03-11🤖 cs.AI

Expressivity-Efficiency Tradeoffs for Hybrid Sequence Models

本論文は、ハイブリッドシーケンスモデル(トランスフォーマーと状態空間モデルの組み合わせ)が、非ハイブリッドモデルでは大規模なパラメータや作業メモリを必要とする特定のタスクにおいて、理論的に小規模かつ効率的に解決可能であることを証明し、実験的にもパラメータ数最大 6 倍のモデルを上回る性能や優れた汎化性を実証したものである。

John Cooper, Ilias Diakonikolas, Mingchen Ma, Frederic Sala2026-03-11🤖 cs.LG

APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model

本論文は、事前学習された視覚言語モデルと回帰ヘッドを用いて古典的ナビゲーションプランナーのパラメータを予測・学習する「APPLV」を提案し、従来の手法や直接行動を出力する VLA モデルよりも、未知環境での一般化性とナビゲーション性能を向上させることを実証しています。

Yuanjie Lu, Beichen Wang, Zhengqi Wu, Yang Li, Xiaomin Lin, Chengzhi Mao, Xuesu Xiao2026-03-11🤖 cs.LG

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study

地下の私有 5G 環境における実測実験により、従来のチャネル中心のモデルがリンク層の適応性を過小評価しスループットを過大予測する傾向にあることが示され、通信認識型ロボットの計画には実測データに基づくデータ駆動型アプローチが不可欠であることが明らかにされました。

Nils Jörgensen2026-03-11🤖 cs.LG

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

この論文は、ハイブリッド情報システムにおける高次元空間での計算コストとノイズ問題を解決するため、オブジェクト間の結合距離に基づき正規および楽観的モードで動作する新しい特徴量選択モデル「FSbuHD」を提案し、UCI データセットを用いた実験で既存手法を上回る効率性と有効性を示したものである。

Mohammad Hossein Safarpour, Seyed Mohammad Alavi, Mohammad Izadikhah, Hossein Dibachi2026-03-11🤖 cs.AI

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

本論文は、濃度不等式と多重検出補正を組み合わせ、ソースドメインのリスクプロファイルを用いてデータ不足環境での選択的予測の信頼区間を改善する「転移情報ベッティング(TIB)」を提案し、9 つの境界ファミリーを 4 つのベンチマークで包括的に評価した研究です。

Abhinaba Basu2026-03-11🤖 cs.AI

FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data

FedLECC は、非 IID データ環境におけるフェデレーテッドラーニングの効率とスケーラビリティを向上させるため、ラベル分布の類似性に基づくクラスタリングと局所損失の指標を組み合わせて、少量かつ情報量の多いクライアントを賢明に選択する軽量な戦略を提案し、実験により精度向上と通信オーバーヘッドの大幅な削減を実証しています。

Daniel M. Jimenez-Gutierrez, Giovanni Giunta, Mehrdad Hassanzadeh, Aris Anagnostopoulos, Ioannis Chatzigiannakis, Andrea Vitaletti2026-03-11🤖 cs.AI

Quantifying Memorization and Privacy Risks in Genomic Language Models

この論文は、ゲノム言語モデル(GLM)が訓練データから特定の配列を記憶するリスクを定量化し、プライバシー漏洩や規制遵守の課題に対処するため、困惑度ベースの検出、カナリア配列の抽出、メンバーシップ推論の 3 つのアプローチを統合した包括的な評価フレームワークを提案し、その有効性を検証したものである。

Alexander Nemecek, Wenbiao Li, Xiaoqian Jiang, Jaideep Vaidya, Erman Ayday2026-03-11🤖 cs.LG

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

本論文は、非微分可能なスコアベースの選択に依存する既存手法の限界を克服し、連続的に緩和されたベルヌーイゲートを用いて重みを固定したまま勾配降下法で最適化を行うことで、強 Lottery チケットを効率的に発見し、Edge-Popup 手法の約 2 倍のスパース化を達成する初の完全微分可能なアプローチを提案するものである。

Itamar Tsayag, Ofir Lindenbaum2026-03-11🤖 cs.AI

Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning

この論文は、臨床ガイドラインと視覚言語モデルを統合し、画像特徴・概念・診断を同時に学習して構造化された臨床ナラティブを生成する「MedCBR」という新しい概念ベースの推論フレームワークを提案し、医療画像診断の精度と解釈可能性を大幅に向上させることを示しています。

Mohamed Harmanani, Bining Long, Zhuoxin Guo, Paul F. R. Wilson, Amirhossein Sabour, Minh Nguyen Nhat To, Gabor Fichtinger, Purang Abolmaesumi, Parvin Mousavi2026-03-11🤖 cs.LG

Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

この論文は、物理ネットワークとデジタルツインからのデータ収集比率を最適化し、強化学習を用いて基地局のアンテナ傾斜角を調整する階層的強化学習フレームワークを提案し、ユーザーのデータレート最大化と遅延制約の両立を実現する手法を提示しています。

Hanzhi Yu, Hasan Farooq, Julien Forgeat, Shruti Bothe, Kristijonas Cyras, Md Moin Uddin Chowdhury, Mingzhe Chen2026-03-11🤖 cs.LG