Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

この論文は、感度に基づく剪定メカニズムを活用して量子化と剪定を組み合わせることで、リザーバーコンピューティングのハードウェア効率を大幅に向上させながら精度を維持する圧縮フレームワークを提案し、FPGA 実装における検証結果を示しています。

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco Platzner2026-03-11🤖 cs.AI

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

この論文は、AI 推論におけるブロックスケーリング回路の必要性を排除し、IEEE 754 標準に比べて面積・消費電力・遅延を大幅に削減する「AetherFloat」と呼ばれる新しい浮動小数点アーキテクチャファミリーを提案し、特に 8 ビット形式(AF8)がブロックスケーリング不要な形式として機能し、16 ビット形式(AF16)が bfloat16 の代替として機能することを示しています。

Keita Morisaki2026-03-11🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

この論文は、従来の数値解法では困難であった非線形性やマルチスケールダイナミクスを持つニューロンモデルにおいて、物理情報ニューラルネットワーク(PINN)を用いて不完全かつノイズの多い電位観測データから生体物理パラメータと非観測状態変数を同時に高精度に推定する堅牢な手法を提案し、その有効性を示したものである。

Changliang Wei, Yangyang Wang, Xueyu Zhu2026-03-11🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

本論文は、多変量時系列の交換性を保証する理論的枠組みに基づき、変数間の順序依存性を排除し、局所ダイナミクスとグローバルな相互作用に分解することで、予測・分類・異常検出において最先端の性能と構造的なスケーラビリティを実現する「VI 2D Mamba」という新しいアーキテクチャを提案しています。

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

この論文は、長期タスクにおけるスパースな報酬によるクレジット割り当ての課題を解決するため、LLM 自体を事後批評として活用してステップレベルの Q 値を精緻化する「HCAPO」という新しいフレームワークを提案し、WebShop や ALFWorld などのベンチマークにおいて既存の GRPO 法を上回る性能向上を実現したことを報告しています。

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng Li2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

本論文は、群GGが空間MMに推移的に作用する際、X×MX \times M上のGG不変関数がMMの isotropy 部分群HHXXに作用する不変関数に還元可能であることを示し、これにより任意の群作用と均質な条件空間に対応する等変ニューラルフィールドの構造的制約を解消する手法を提案しています。

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

この論文は、低次元部分空間における特異値分解を用いた幾何学的構造の保持と、高信頼度サンプルに焦点を当てた蒸留戦略を導入することで、カタストロフィック・フォージングを抑制し、生涯模倣学習における知識転移と性能を飛躍的に向上させる「SPREAD」と呼ばれるフレームワークを提案しています。

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman Moghadam2026-03-11🤖 cs.LG

The Temporal Markov Transition Field

本論文は、非定常な時系列データにおいて従来のマルコフ遷移場(MTF)が持つ動的レジームの時間的変化の情報を失うという課題を解決するため、時系列を複数の時間的チャンクに分割して局所的な遷移行列を推定し、各チャンクのダイナミクスを反映した新しい画像表現「Temporal Markov Transition Field(TMTF)」を提案し、その定義、性質、数値例、バイアス - バランスのトレードオフ、および幾何学的解釈を体系的に論じています。

Michael Leznik2026-03-11🤖 cs.LG

SoftJAX & SoftTorch: Empowering Automatic Differentiation Libraries with Informative Gradients

本論文は、JAX および PyTorch における硬い演算の勾配問題を解決し、最適化に有用な滑らかな勾配を提供するオープンソースライブラリ「SoftJAX」と「SoftTorch」を提案し、その実用性をベンチマークとケーススタディで実証したものである。

Anselm Paulus, A. René Geist, Vít Musil, Sebastian Hoffmann, Onur Beker, Georg Martius2026-03-11🤖 cs.LG

Are Expressive Encoders Necessary for Discrete Graph Generation?

この論文は、トランスフォーマーなどの高表現力なバックボーンに依存する従来のアプローチを見直し、残差接続を備えたモジュール型メッセージパスフレームワーク「GenGNN」を提案することで、離散グラフ生成において高い有効性を維持しつつ推論速度を大幅に向上させることを実証しています。

Jay Revolinsky, Harry Shomer, Jiliang Tang2026-03-11🤖 cs.AI

MASEval: Extending Multi-Agent Evaluation from Models to Systems

この論文は、LLM ベースのマルチエージェントシステムの評価においてモデルだけでなくシステム全体の構成要素(トポロジーやオーケストレーションなど)を包括的に評価する新しいフレームワーク「MASEval」を提案し、フレームワークの選択がモデルの選択と同様に性能に大きな影響を与えることを示しています。

Cornelius Emde, Alexander Rubinstein, Anmol Goel, Ahmed Heakl, Sangdoo Yun, Seong Joon Oh, Martin Gubri2026-03-11🤖 cs.AI

Expressivity-Efficiency Tradeoffs for Hybrid Sequence Models

本論文は、ハイブリッドシーケンスモデル(トランスフォーマーと状態空間モデルの組み合わせ)が、非ハイブリッドモデルでは大規模なパラメータや作業メモリを必要とする特定のタスクにおいて、理論的に小規模かつ効率的に解決可能であることを証明し、実験的にもパラメータ数最大 6 倍のモデルを上回る性能や優れた汎化性を実証したものである。

John Cooper, Ilias Diakonikolas, Mingchen Ma, Frederic Sala2026-03-11🤖 cs.LG

APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model

本論文は、事前学習された視覚言語モデルと回帰ヘッドを用いて古典的ナビゲーションプランナーのパラメータを予測・学習する「APPLV」を提案し、従来の手法や直接行動を出力する VLA モデルよりも、未知環境での一般化性とナビゲーション性能を向上させることを実証しています。

Yuanjie Lu, Beichen Wang, Zhengqi Wu, Yang Li, Xiaomin Lin, Chengzhi Mao, Xuesu Xiao2026-03-11🤖 cs.LG

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study

地下の私有 5G 環境における実測実験により、従来のチャネル中心のモデルがリンク層の適応性を過小評価しスループットを過大予測する傾向にあることが示され、通信認識型ロボットの計画には実測データに基づくデータ駆動型アプローチが不可欠であることが明らかにされました。

Nils Jörgensen2026-03-11🤖 cs.LG

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

この論文は、ハイブリッド情報システムにおける高次元空間での計算コストとノイズ問題を解決するため、オブジェクト間の結合距離に基づき正規および楽観的モードで動作する新しい特徴量選択モデル「FSbuHD」を提案し、UCI データセットを用いた実験で既存手法を上回る効率性と有効性を示したものである。

Mohammad Hossein Safarpour, Seyed Mohammad Alavi, Mohammad Izadikhah, Hossein Dibachi2026-03-11🤖 cs.AI