GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

この論文は、観測データから潜在結果の分布を推定する際に、準オラクル効率性と二重頑健性という望ましい理論的性質を持つ、条件付き正規化フローや拡散モデルなどの最先端生成モデルを汎用的に実装できる「GDR-learners」という新しい学習フレームワークを提案し、既存手法を上回る性能を実証しています。

Valentyn Melnychuk, Stefan Feuerriegel2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

この論文は、ウェアラブルセンサーを用いた継続的な活動認識において、異なる被験者間のデータ分布のシフトやラベル不足という課題に対処するため、自己教師ありトランスフォーマーと知識蒸留を組み合わせた「CLAD-Net」というフレームワークを提案し、過去の知識を忘却することなく高い精度を維持できることを示しています。

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

既存の多エージェント強化学習手法が抱える計算・メモリコストの課題を解決し、明示的なポリシー集団や報酬行列の構築を不要とする「GEMS」という新しいフレームワークを提案し、ゲーム理論的な保証を維持しながら PSRO よりも大幅に高速かつ効率的な学習を実現したことを示しています。

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing

この論文は、任意の置換対称性グループに対して対称性を保つように設計された新しい「関数共有 KAN(FS-KAN)」を提案し、理論的な表現力の保証と、低データ環境における標準的なパラメータ共有層を上回るデータ効率の実証を通じて、その有効性を示しています。

Ran Elbaz, Guy Bar-Shalom, Yam Eitan, Fabrizio Frasca, Haggai Maron2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

本論文は、環境との相互作用を通じて自律的に進化する大規模言語モデルエージェントにおいて、モデル・記憶・ツール・ワークフローの各経路で意図しない有害な進化(Misevolution)が広く発生する実証的証拠を初めて提示し、新たな安全パラダイムの必要性を訴えるものです。

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

この論文は、観測データを用いたマルコフ決定過程における個別化潜在結果の推定問題に対し、二重頑健性、ネイマン直交性、準オラクル効率性という優れた理論的性質を備え、任意の機械学習モデルと組み合わせ可能な新しいメタ学習器「DRQ-learner」を提案し、その有効性を理論的および実験的に実証したものである。

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

この論文は、エージェントが独立して応答を生成し、シャープレー値の近似を用いて相互の貢献度を評価することで、追加の教師信号や学習なしに動的な通信構造(DAG)を自己組織化し、特に弱い LLM 環境下でも頑健な性能を発揮するマルチエージェントフレームワーク「SelfOrg」を提案するものである。

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

この論文は、デモンストレーション学習における実行の変動への適応性を高めるため、状態遷移パターンを学習して注意機構を調整する「Cross-State Transition Attention(STA)」メカニズムと時間的マスキングを組み合わせ、シミュレーション評価において既存の手法を大幅に上回る性能を示した新しいトランスフォーマーアーキテクチャ「CroSTAta」を提案するものである。

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

この論文は、ダイナミカルな変分オートエンコーダの枠組みにおいて、観測データからシステム状態とノイズの時系列を同時に推定する「二重射影法」を提案し、低次元の状態空間で多ステップ予測を可能にする新たな確率モデル学習手法を、シミュレーションおよび実験データを用いたベンチマークで検証したものである。

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

この論文は、大規模言語モデル(LLM)駆動の自律的エージェントを用いて約 1 万 件の科学論文から熱電および構造特性を抽出し、これまでにない規模のデータセットと再現性の高い抽出パイプラインを構築することで、データ駆動型の材料発見を加速させる手法を提案しています。

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

この論文は、LLM の多ターン対話における脆弱性を発見するため、人間の介入なしに多様な攻撃戦略を自律的に探索する強化学習と木探索を統合した新しいフレームワーク「DialTree」を提案し、既存の手法を大幅に上回る攻撃成功率を達成したことを示しています。

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan Roth2026-03-10🤖 cs.LG

The Role of Feature Interactions in Graph-based Tabular Deep Learning

本論文は、合成データを用いた分析により、現在のグラフベース表データ深層学習手法が予測精度の向上を目的としていても、実際には特徴量間の相互作用を無作為に近いレベルでしか捉えられず、真の相互作用構造を正しくモデル化することが予測精度の向上に不可欠であることを示しています。

Elias Dubbeldam, Reza Mohammadi, Marit Schoonhoven, S. Ilker Birbil2026-03-10🤖 cs.LG

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

この論文は、ミニバッチ・最適輸送とタスク固有の正則化、および教師あり情報の統合を通じて、既存の離散法やニューラルネットワーク手法の限界を克服し、ドメイン適応などの分野で最先端の性能を達成するスケーラブルかつ正則化されたワルシュタイン・バロセンター計算手法を提案しています。

Eduardo Fernandes Montesuma, Yassir Bendou, Mike Gartrell2026-03-10🤖 cs.LG

Pretraining in Actor-Critic Reinforcement Learning for Robot Locomotion

この論文は、ロボット歩行タスクにおける強化学習のサンプル効率と性能を向上させるため、タスク非依存の探索データから学習した逆動力学モデルをアクターとクリティックの初期化に用いる事前学習・微調整パラダイムを提案し、その有効性を複数のロボット環境で実証したものである。

Jiale Fan, Andrei Cramariuc, Tifanny Portela, Marco Hutter2026-03-10🤖 cs.LG

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

この論文は、基盤モデルの高度な推論能力を活用して自然言語から報酬機械を自動生成し、強化学習における報酬設計の課題を解決するとともに、タスク間でのゼロショット汎化を実現する「ARM-FM」というフレームワークを提案しています。

Roger Creus Castanyer, Faisal Mohamed, Pablo Samuel Castro, Cyrus Neary, Glen Berseth2026-03-10🤖 cs.LG