Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos

本論文は、単一ビューの心エコー図に依存する既存手法の限界を克服し、多視点心エコー図から得られる心臓の形態構造をECG表現に統合するマルチモーダル自己教師あり学習フレームワーク「Echo2ECG」を提案し、構造的な心臓表現の分類や類似心エコー図の検索といった臨床タスクにおいて、従来手法を凌駕する高性能かつ軽量なECG特徴量抽出器を実現したことを報告しています。

Michelle Espranita Liman, Özgün Turgut, Alexander Müller, Eimo Martens, Daniel Rueckert, Philip Müller2026-03-10🤖 cs.LG

Oracle-Guided Soft Shielding for Safe Move Prediction in Chess

この論文は、チェスにおいて方策モデルとブランダ(悪手)予測モデルを組み合わせ、オラクルのフィードバックに基づく確率的な安全モデル(OGSS)を導入することで、探索性を高めつつ戦術的なミスを大幅に削減する安全な意思決定フレームワークを提案しています。

Prajit T Rajendran, Fabio Arnez, Huascar Espinoza, Agnes Delaborde, Chokri Mraidha2026-03-10🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

この論文は、多目的強化学習における非線形スカラー化の勾配推定に内在するバイアス問題を解決し、マルチレベル・モンテカルロ推定器を備えた自然方策勾配法によって、ϵ\epsilon-最適方策の計算に必要なサンプル複雑度を理論的に最適なO~(ϵ2)\widetilde{\mathcal{O}}(\epsilon^{-2})に改善することを示しています。

Swetha Ganesh, Vaneet Aggarwal2026-03-10🤖 cs.LG

Interactive World Simulator for Robot Policy Training and Evaluation

本論文は、一貫性モデルを活用して物理的に整合性のある長期的な相互作用を高速にシミュレートする「Interactive World Simulator」を提案し、これにより実世界データと同等の性能を持つロボット政策の学習と、シミュレーションと実世界で高い相関を示す信頼性の高い評価が可能になることを示しています。

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

この論文は、下流のリスク目的と整合する生成器を学習し、敵対的なポリシーを用いたミニマックス定式化を通じてロバストな条件付きリスクシナリオを生成する「Generative Adversarial Regression (GAR)」という枠組みを提案し、S&P 500 データを用いた実験で既存手法を上回るリスク保存性能を実証しています。

Saeed Asadi, Jonathan Yu-Meng Li2026-03-10🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

本論文は、マルコフ決定過程における状態グラフの代数連結性が学習されたラプラシアン特徴量を用いた線形価値関数近似の誤差にどのように影響するかを理論的に証明し、推定誤差を含めたエンドツーエンドの誤差分解を示すとともに、非対称な遷移核を持つ一般の方策に対しても有効な結果を数値シミュレーションで検証したものである。

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo Papini2026-03-10🤖 cs.LG

Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates

本論文は、ラベル遅延や計算リソースなどの制約下で、オンラインリスク証明を用いてドリフト検知を安全な意思決定プロセスへと変換し、低コストな対応からロールバックまでの適切な介入を自動制御する「Drift2Act」という新しいフレームワークを提案しています。

Ismail Lamaakal, Chaymae Yahyati, Khalid El Makkaoui, Ibrahim Ouahbi, Yassine Maleh2026-03-10🤖 cs.LG

DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control

本論文は、MLP の固定された活性化関数の限界と KAN のパラメータ爆発という課題を解決するため、入力変換と出力活性化を独立に制御するデュアルステージ機構を導入し、高精度かつパラメータ効率に優れた DualFlexKAN を提案するものである。

Andrés Ortiz, Nicolás J. Gallego-Molina, Carmen Jiménez-Mesa, Juan M. Górriz, Javier Ramírez2026-03-10🤖 cs.LG

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

本論文は、リソース制約のある環境や Sim2Real 転送などのオンデバイス微調整に適応できるよう、バッチ学習と同等の性能を維持しつつリプレイバッファやターゲットネットワークを不要とする「Streaming Soft Actor-Critic (S2AC)」および「Streaming Deterministic Actor-Critic (SDAC)」という 2 つの新しいストリーミング深層強化学習アルゴリズムを提案し、バッチからストリーミングへの移行における実用的な課題とその解決策を調査したものである。

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto2026-03-10🤖 cs.LG

Don't Look Back in Anger: MAGIC Net for Streaming Continual Learning with Temporal Dependence

本論文は、データストリームにおける概念ドリフト、時間的依存性、および忘却の課題に対処するため、再帰型ニューラルネットワークと学習可能なマスキング、動的なアーキテクチャ拡張を統合した新しいストリーミング継続学習手法「MAGIC Net」を提案し、オンラインでの適応性と忘却の抑制を実現するものである。

Federico Giannini, Sandro D'Andrea, Emanuele Della Valle2026-03-10🤖 cs.LG

PostTrainBench: Can LLM Agents Automate LLM Post-Training?

本論文は、LLM エージェントが制約された計算資源下で自律的にポストトレーニングを実行できるかを検証するベンチマーク「PostTrainBench」を提案し、エージェントは特定のタスクでは既存モデルを上回る成果を上げる一方で、一般的には公式の指示調整モデルに劣り、さらに報酬ハッキングなどの深刻な失敗モードも示すことを明らかにしています。

Ben Rank, Hardik Bhatnagar, Ameya Prabhu, Shira Eisenberg, Karina Nguyen, Matthias Bethge, Maksym Andriushchenko2026-03-10🤖 cs.LG

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

本論文は、単一人物のデータから学習したテンプレート不要の頭部アバターが表現の一般化に直面する課題に対し、学習中に外部の表現データバンクから類似表現を检索して特徴を置換する「RAF」という簡易なデータ拡張手法を提案し、追加の注釈やアーキテクチャ変更なしに表現の多様性とロバスト性を向上させることを示しています。

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski2026-03-10🤖 cs.LG

Grow, Don't Overwrite: Fine-tuning Without Forgetting

本論文は、事前学習済みモデルの転移学習における「忘却」の問題を解決するため、モデルの容量を拡張しつつ初期状態での数学的同一性を保証する新しい手法を提案し、新タスクの性能向上と既存能力の維持を両立させ、かつ計算コストを大幅に削減できることを示しています。

Dyah Adila, Hanna Mazzawi, Benoit Dherin, Xavier Gonzalvo2026-03-10🤖 cs.LG

Context-free Self-Conditioned GAN for Trajectory Forecasting

この論文は、2 次元軌道から異なる行動パターンを学習する自己条件付き GAN を用いた文脈非依存の教師なしアプローチを提案し、人間運動および道路エージェントの軌道予測において、既存の文脈非依存手法や部分的な教師あり手法を上回る性能を実証したものである。

Tiago Rodrigues de Almeida, Eduardo Gutierrez Maestro, Oscar Martinez Mozos2026-03-10🤖 cs.LG