FedPrism: Adaptive Personalized Federated Learning under Non-IID Data

FedPrism は、非 IID データ環境における連合学習の性能低下を解決するため、プリズム分解によるモデルの階層化と、一般モデルと専門モデルを動的に切り替えるデュアルストリーム設計を組み合わせ、汎用性と個人化のバランスを最適化する新しいフレームワークを提案しています。

Prakash Kumbhakar, Shrey Srivastava, Haroon R Lone2026-03-10🤖 cs.LG

FlowTouch: View-Invariant Visuo-Tactile Prediction

本論文は、視覚情報から触覚情報を予測する新しいモデル「FlowTouch」を提案し、物体の局所 3D メッシュとフローマッチング技術を活用することで、カメラ視点やセンサー固有の依存性を排除した視覚・触覚予測を実現し、シミュレーションから実世界への転移や新しいセンサーへの汎化、さらには把持安定性の予測への応用を可能にすることを示しています。

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

本論文は、離散潜在変数を持つ機械学習モデルにおける勾配推定量の分散を低減するため、ReinMax にラオ・ブラックウェル化と制御変量法を統合した「ReinMax-Rao」と「ReinMax-CV」を提案し、変分オートエンコーダの訓練における優れた性能を実証するとともに、数値積分の観点から勾配近似の新たな解釈を提示しています。

Daniel Wang, Thang D. Bui2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

この論文は、事前の校正飛行や専用機動を必要とせず、物理モデルとニューラルネットワークを拡張カルマンフィルタで統合し、自然勾配降下と等価なオンライン学習によって航空機の磁気干渉を飛行中にリアルタイムで補正する、完全適応型の磁気航法アーキテクチャを提案するものである。

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG

SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning

この論文は、グラフニューラルネットワーク(GNN)が学習データにおけるノイズとなる統計的相関(偽の相関)に依存して一般化性能が低下する問題を解決するため、ヒルベルト・シュミット独立基準(HSIC)を用いてこれらの相関を特定・抑制し、分布外(OOD)を含む様々な条件下で高い汎化性能を実現する新しいフレームワーク「SCL-GNN」を提案しています。

Yuxiang Zhang, Enyan Dai2026-03-10🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

本論文は、電子カルテの不規則な時間構造と複雑な疾患経過を考慮し、SNOMED 基準の医学概念と階層的注意機構を組み合わせた「TA-RNN-Medical-Hybrid」という新しい深層学習フレームワークを提案し、集中治療室における死亡率予測の精度向上と臨床的に意味のある解釈可能性の両立を実現したことを報告しています。

Zahra Jafari, Azadeh Zamanifar, Amirfarhad Farhadi2026-03-10🤖 cs.LG

PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints

この論文は、複雑な物理的制約を効率的な多面体再定式化に変換することで、最適化問題の複雑さと解の難易度を分離し、既存のソルバーによる高速かつ高品質な解決を可能にする新しい物理情報機械学習アプローチ「PolyFormer」を提案し、大規模な制約付き最適化タスクにおいて最大 6,400 倍の計算速度向上と 99.87% のメモリ削減を実現したことを示しています。

Yilin Wen, Yi Guo, Bo Zhao, Wei Qi, Zechun Hu, Colin Jones, Jian Sun2026-03-10🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

本論文は、状態空間が非有界である連続制御問題におけるガウス過程を用いた事後サンプリング強化学習(GP-PSRL)アルゴリズムのベイズ後悔を解析し、Borell-Tsirelson-Ibragimov-Sudakov 不等式の再帰的適用とチェイニング法を用いて、最大情報利得に依存する tight な O~(H3/2γT/HT)\widetilde{\mathcal{O}}(H^{3/2}\sqrt{\gamma_{T/H} T}) の後悔上限を導出することで、既存理論の限界を克服したことを示しています。

Hamish Flynn, Joe Watson, Ingmar Posner, Jan Peters2026-03-10🤖 cs.LG

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

この論文は、線形対角ネットワークにおけるシャープネス感知最小化(SAM)の暗黙的バイアスを研究し、特に深さL=2L=2のケースにおいて、初期値依存性や「逐次特徴増幅」と呼ばれる現象を通じて、無限時間収束の分析だけでは捉えられない動的な振る舞いが生じることを明らかにしています。

Chaewon Moon, Dongkuk Si, Chulhee Yun2026-03-10🤖 cs.LG

Graph-Instructed Neural Networks for parametric problems with varying boundary conditions

この論文は、境界条件が変化するパラメータ依存の偏微分方程式に対して、従来のモデル順序縮約法の限界を克服し、計算領域のパラメータ記述から解への効率的なマッピングを学習する「グラフ指示ニューラルネットワーク(GINN)」という新たな手法を提案し、その有効性を示すものである。

Francesco Della Santa, Sandra Pieraccini, Maria Strazzullo2026-03-10🤖 cs.LG

Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness

本論文は、大規模言語モデルと視覚言語モデルを用いて自動生成された概念マスクに基づき、ビジョン・トランスフォーマーの内部関連性マップを最適化することで、背景などの偽相関への依存を減らし、分布外データに対する頑健性と解釈可能性を向上させる新しいファインチューニング手法を提案し、その有効性を複数のベンチマークで実証したものである。

Yehonatan Elisha, Oren Barkan, Noam Koenigstein2026-03-10🤖 cs.LG

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

この論文は、拡散行列が既知でない連続時間線形定常確率微分方程式において、因果構造と観測共分散行列に基づいてドリフト係数の符号が一意に決定可能か(エッジ符号識別可能性)を判定する基準を導出し、古典的および新規の循環的因果構造に適用してその性質を明らかにするものである。

Gijs van Seeventer, Saber Salehkaleybar2026-03-10🤖 cs.LG

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

この論文は、デジタル病理におけるマルチインスタンス学習モデルのヒートマップの妥当性を検証する新たな枠組みを提案し、アテンションや勾配に基づく手法よりも摂動法や層別関連性伝播(LRP)などの説明手法がモデルの意思決定をより正確に反映し、生物学的な洞察をもたらすことを大規模ベンチマークと実証実験を通じて示しています。

Mina Jamshidi Idaji, Julius Hense, Tom Neuhäuser, Augustin Krause, Yanqing Luo, Oliver Eberle, Thomas Schnake, Laure Ciernik, Farnoush Rezaei Jafari, Reza Vahidimajd, Jonas Dippel, Christoph Walz, Frederick Klauschen, Andreas Mock, Klaus-Robert Müller2026-03-10🤖 cs.LG

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

本論文は、拡張動的モード分解(EDMD)を用いたクーマン演算子とウェーブレット変換の特徴をトランスフォーマーと組み合わせることで、心電図(ECG)の多クラス分類において、特に適切な辞書選択により従来のウェーブレット単独やハイブリッド手法を上回る性能を達成し、動的システム理論に基づく時系列分類の有効性を示したものである。

Sucheta Ghosh, Zahra Monfared2026-03-10🤖 cs.LG

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

この論文は、アテンション出力投影をパラメータ不要のウォルシュ・アダマール変換と軽量なアフィン再スケーリングに置き換えることで、モデルのパラメータ数とメモリ使用量を削減しつつ、標準ベンチマークで同等以上の性能を維持する効率的なトランスフォーマーアーキテクチャを提案しています。

Shubham Aggarwal, Lokendra Kumar2026-03-10🤖 cs.LG

Unifying On- and Off-Policy Variance Reduction Methods

この論文は、オンラインの差の平均推定量と最適な制御変量を用いたオフポリシー逆確率重み付け推定量、そして回帰調整手法と二重頑健推定量の間に形式的な等価性を確立し、A/B テストとオフポリシー評価の分野を統一的な視点で結びつけることで、両分野の実践者や研究者の理解を深めることを目指しています。

Olivier Jeunen2026-03-10🤖 cs.LG

Leaderboard Incentives: Model Rankings under Strategic Post-Training

本論文は、現在のベンチマークがモデル開発者にテストタスクへの過剰な最適化(benchmaxxing)を促し均衡が存在しないインセンティブ構造を生み出していることを示しつつ、最近提案された「tune-before-test」という評価プロトコルを用いることで、モデルの真の潜在品質に基づく唯一のナッシュ均衡を達成できることを理論的に証明しています。

Yatong Chen, Guanhua Zhang, Moritz Hardt2026-03-10🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

この論文は、不均衡データにおける過学習やノイズへの耐性を高めるため、局所的な勾配更新に代わって動的に重み付けされた過去の勾配履歴を統合する「重み付き分数ウェイリー積分」に基づく新たな最適化アルゴリズムを提案し、医療診断や金融詐欺検出において従来の最適化手法を大幅に凌駕する性能向上を実証したものである。

Gustavo A. Dorrego2026-03-10🤖 cs.LG