cs.LG 件の論文 | Gist.Science

Reasoning as Compression: Unifying Budget Forcing via the Conditional Information Bottleneck

この論文は、推論プロセスを「条件付き情報ボトルネック（CIB）」の枠組みで再定義し、意味的コストに基づく強化学習目的関数を導入することで、思考連鎖（CoT）の冗長性を削減しつつ論理と精度を維持する新しい手法を提案しています。

Fabio Valerio Massoli, Andrey Kuzmin, Arash Behboodi2026-03-10🤖 cs.LG

MUSA-PINN: Multi-scale Weak-form Physics-Informed Neural Networks for Fluid Flow in Complex Geometries

複雑な幾何学形状における流体流れの求解において、標準的な PINN が抱える収束の難しさを解決するため、階層的な制御体積上の積分保存則に基づく多スケール弱形式アプローチ「MUSA-PINN」を提案し、TPMS 幾何学における相対誤差を最大 93% 削減しつつ質量保存を維持する手法を開発した。

Weizheng Zhang, Xunjie Xie, Hao Pan, Xiaowei Duan, Bingteng Sun, Qiang Du, Lin lu2026-03-10🤖 cs.LG

Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning

この論文は、物理法則を遵守するラグランジュ神経回路網（LNN）をモデルベース強化学習の Dyna フレームワークに統合し、状態推定に基づく最適化手法を用いることで、従来のブラックボックス手法よりも高速かつ正確な動的モデル学習を実現することを提案しています。

Shreya Das, Kundan Kumar, Muhammad Iqbal, Outi Savolainen, Dominik Baumann, Laura Ruotsalainen, Simo Särkkä2026-03-10🤖 cs.LG

STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching

本論文は、エネルギー保存則を維持するラグランジュニューラルネットワークと、複雑な確率的な相互作用を捉える条件付きフローマッチングを統合した「STRIDE」という動的学習フレームワークを提案し、不確実な環境下でのロボット制御における長期予測精度と接触力予測の大幅な改善を実現したことを示しています。

Prakrut Kotecha, Ganga Nair B, Shishir Kolathaya2026-03-10🤖 cs.LG

X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection

本論文は、生成モデル内部の音声・映像クロスアテンション機構が持つ微細な整合性情報を DDIM 逆変換を通じて抽出する「X-AVDT」という堅牢なディープフェイク検出器と、多様な生成手法を網羅する新たなデータセット「MMDF」を提案し、既存手法を大幅に上回る汎化性能を実証したものである。

Youngseo Kim, Kwan Yun, Seokhyeon Hong, Sihun Cha, Colette Suhjung Koo, Junyong Noh2026-03-10🤖 cs.LG

NN-OpInf: an operator inference approach using structure-preserving composable neural networks

本論文は、スナップショットデータから局所的な演算子構造（歪対称性や勾配保存など）を保持しつつ、異種演算子の加法合成により複雑な非多項式非線形性を捉える、構造保存型の構成可能ニューラルネットワークを用いた非侵入型低次元モデル化手法「NN-OpInf」を提案し、従来の多項式ベースの手法や既存のニューラルネットワーク手法と比較して、精度・安定性・頑健性の向上を実証しています。

Eric Parish, Anthony Gruber, Patrick Blonigan, Irina Tezaur2026-03-10🤖 cs.LG

Pareto-Optimal Anytime Algorithms via Bayesian Racing

この論文は、最適化アルゴリズムの比較において事前の最適値や正規化を不要とし、時間軸上のパレート最適性をベイズ推論を用いた適応的サンプリング（PolarBear）によって効率的に特定する新しいフレームワークを提案しています。

Jonathan Wurth, Helena Stegherr, Neele Kemper, Michael Heider, Jörg Hähner2026-03-10🤖 cs.LG

Efficient Credal Prediction through Decalibration

本論文は、信頼性の高い不確実性表現を必要とする安全クリティカルな環境において、従来のアンサンブル手法に比べて計算コストが大幅に低く、TabPFN や CLIP などの大規模モデルにも適用可能な「デキャリブレーション」と呼ばれる効率的な手法を提案し、これにより_credal_集合（確率分布の凸集合）を用いた予測を可能にしたものである。

Paul Hofman, Timo Löhr, Maximilian Muschalik, Yusuf Sale, Eyke Hüllermeier2026-03-10🤖 cs.LG

Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos

本論文は、単一ビューの心エコー図に依存する既存手法の限界を克服し、多視点心エコー図から得られる心臓の形態構造をECG表現に統合するマルチモーダル自己教師あり学習フレームワーク「Echo2ECG」を提案し、構造的な心臓表現の分類や類似心エコー図の検索といった臨床タスクにおいて、従来手法を凌駕する高性能かつ軽量なECG特徴量抽出器を実現したことを報告しています。

Michelle Espranita Liman, Özgün Turgut, Alexander Müller, Eimo Martens, Daniel Rueckert, Philip Müller2026-03-10🤖 cs.LG

Oracle-Guided Soft Shielding for Safe Move Prediction in Chess

この論文は、チェスにおいて方策モデルとブランダ（悪手）予測モデルを組み合わせ、オラクルのフィードバックに基づく確率的な安全モデル（OGSS）を導入することで、探索性を高めつつ戦術的なミスを大幅に削減する安全な意思決定フレームワークを提案しています。

Prajit T Rajendran, Fabio Arnez, Huascar Espinoza, Agnes Delaborde, Chokri Mraidha2026-03-10🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

この論文は、多目的強化学習における非線形スカラー化の勾配推定に内在するバイアス問題を解決し、マルチレベル・モンテカルロ推定器を備えた自然方策勾配法によって、 $\epsilon$ -最適方策の計算に必要なサンプル複雑度を理論的に最適な $\widetilde{\mathcal{O}}(\epsilon^{-2})$ に改善することを示しています。

Swetha Ganesh, Vaneet Aggarwal2026-03-10🤖 cs.LG

Towards Effective and Efficient Graph Alignment without Supervision

この論文は、教師なしグラフアライメントにおいて、局所情報と大域情報のミスマッチを解消し、最適輸送の計算複雑度を立方から二次に削減しながら精度と効率を大幅に向上させる新たな手法「GlobAlign」およびその高速版「GlobAlign-E」を提案するものです。

Songyang Chen, Youfang Lin, Yu Liu, Shuai Zheng, Lei Zou2026-03-10🤖 cs.LG

The Neural Compass: Probabilistic Relative Feature Fields for Robotic Search

この論文は、ラベルなしの観測データから物体間の共起関係を学習する確率的相対特徴場モデル「ProReFF」を提案し、これを用いた探索エージェントが Matterport3D 環境において既存の手法より 20% 効率的に動作し、人間の性能の 80% に達することを示しています。

Gabriele Somaschini, Adrian Röfer, Abhinav Valada2026-03-10🤖 cs.LG

Interactive World Simulator for Robot Policy Training and Evaluation

本論文は、一貫性モデルを活用して物理的に整合性のある長期的な相互作用を高速にシミュレートする「Interactive World Simulator」を提案し、これにより実世界データと同等の性能を持つロボット政策の学習と、シミュレーションと実世界で高い相関を示す信頼性の高い評価が可能になることを示しています。

Yixuan Wang, Rhythm Syed, Fangyu Wu, Mengchao Zhang, Aykut Onol, Jose Barreiros, Hooshang Nayyeri, Tony Dear, Huan Zhang, Yunzhu Li2026-03-10🤖 cs.LG

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

この論文は、下流のリスク目的と整合する生成器を学習し、敵対的なポリシーを用いたミニマックス定式化を通じてロバストな条件付きリスクシナリオを生成する「Generative Adversarial Regression (GAR)」という枠組みを提案し、S&P 500 データを用いた実験で既存手法を上回るリスク保存性能を実証しています。

Saeed Asadi, Jonathan Yu-Meng Li2026-03-10🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

本論文は、マルコフ決定過程における状態グラフの代数連結性が学習されたラプラシアン特徴量を用いた線形価値関数近似の誤差にどのように影響するかを理論的に証明し、推定誤差を含めたエンドツーエンドの誤差分解を示すとともに、非対称な遷移核を持つ一般の方策に対しても有効な結果を数値シミュレーションで検証したものである。

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo Papini2026-03-10🤖 cs.LG

Trust via Reputation of Conviction

この論文は、知識・真実・信頼を数学的に定式化し、正しさや忠実さではなく独立した合意によって裏付けられる「確信」を信頼の基礎とし、AI エージェントを含む情報源の信頼性を評価するための評判の枠組みを構築することを提案しています。

Aravind R. Iyengar2026-03-10🤖 cs.LG

Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates

本論文は、ラベル遅延や計算リソースなどの制約下で、オンラインリスク証明を用いてドリフト検知を安全な意思決定プロセスへと変換し、低コストな対応からロールバックまでの適切な介入を自動制御する「Drift2Act」という新しいフレームワークを提案しています。

Ismail Lamaakal, Chaymae Yahyati, Khalid El Makkaoui, Ibrahim Ouahbi, Yassine Maleh2026-03-10🤖 cs.LG

DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control

本論文は、MLP の固定された活性化関数の限界と KAN のパラメータ爆発という課題を解決するため、入力変換と出力活性化を独立に制御するデュアルステージ機構を導入し、高精度かつパラメータ効率に優れた DualFlexKAN を提案するものである。

Andrés Ortiz, Nicolás J. Gallego-Molina, Carmen Jiménez-Mesa, Juan M. Górriz, Javier Ramírez2026-03-10🤖 cs.LG

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

本論文は、リソース制約のある環境や Sim2Real 転送などのオンデバイス微調整に適応できるよう、バッチ学習と同等の性能を維持しつつリプレイバッファやターゲットネットワークを不要とする「Streaming Soft Actor-Critic (S2AC)」および「Streaming Deterministic Actor-Critic (SDAC)」という 2 つの新しいストリーミング深層強化学習アルゴリズムを提案し、バッチからストリーミングへの移行における実用的な課題とその解決策を調査したものである。

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto2026-03-10🤖 cs.LG

← 前へ次へ →