FedPrism: Adaptive Personalized Federated Learning under Non-IID Data
FedPrism は、非 IID データ環境における連合学習の性能低下を解決するため、プリズム分解によるモデルの階層化と、一般モデルと専門モデルを動的に切り替えるデュアルストリーム設計を組み合わせ、汎用性と個人化のバランスを最適化する新しいフレームワークを提案しています。
7103 件の論文
FedPrism は、非 IID データ環境における連合学習の性能低下を解決するため、プリズム分解によるモデルの階層化と、一般モデルと専門モデルを動的に切り替えるデュアルストリーム設計を組み合わせ、汎用性と個人化のバランスを最適化する新しいフレームワークを提案しています。
本論文は、視覚情報から触覚情報を予測する新しいモデル「FlowTouch」を提案し、物体の局所 3D メッシュとフローマッチング技術を活用することで、カメラ視点やセンサー固有の依存性を排除した視覚・触覚予測を実現し、シミュレーションから実世界への転移や新しいセンサーへの汎化、さらには把持安定性の予測への応用を可能にすることを示しています。
本論文は、離散潜在変数を持つ機械学習モデルにおける勾配推定量の分散を低減するため、ReinMax にラオ・ブラックウェル化と制御変量法を統合した「ReinMax-Rao」と「ReinMax-CV」を提案し、変分オートエンコーダの訓練における優れた性能を実証するとともに、数値積分の観点から勾配近似の新たな解釈を提示しています。
この論文は、事前の校正飛行や専用機動を必要とせず、物理モデルとニューラルネットワークを拡張カルマンフィルタで統合し、自然勾配降下と等価なオンライン学習によって航空機の磁気干渉を飛行中にリアルタイムで補正する、完全適応型の磁気航法アーキテクチャを提案するものである。
この論文は、大規模な金融言語モデルのバイアス検出における計算コストを削減するため、異なるモデル間でバイアス検出入力に共通パターンが存在することを実証し、他モデルの出力をガイドとして活用することで検出効率を大幅に向上させる手法を提案しています。
この論文は、グラフニューラルネットワーク(GNN)が学習データにおけるノイズとなる統計的相関(偽の相関)に依存して一般化性能が低下する問題を解決するため、ヒルベルト・シュミット独立基準(HSIC)を用いてこれらの相関を特定・抑制し、分布外(OOD)を含む様々な条件下で高い汎化性能を実現する新しいフレームワーク「SCL-GNN」を提案しています。
本論文は、電子カルテの不規則な時間構造と複雑な疾患経過を考慮し、SNOMED 基準の医学概念と階層的注意機構を組み合わせた「TA-RNN-Medical-Hybrid」という新しい深層学習フレームワークを提案し、集中治療室における死亡率予測の精度向上と臨床的に意味のある解釈可能性の両立を実現したことを報告しています。
この論文は、複雑な物理的制約を効率的な多面体再定式化に変換することで、最適化問題の複雑さと解の難易度を分離し、既存のソルバーによる高速かつ高品質な解決を可能にする新しい物理情報機械学習アプローチ「PolyFormer」を提案し、大規模な制約付き最適化タスクにおいて最大 6,400 倍の計算速度向上と 99.87% のメモリ削減を実現したことを示しています。
本論文は、状態空間が非有界である連続制御問題におけるガウス過程を用いた事後サンプリング強化学習(GP-PSRL)アルゴリズムのベイズ後悔を解析し、Borell-Tsirelson-Ibragimov-Sudakov 不等式の再帰的適用とチェイニング法を用いて、最大情報利得に依存する tight な の後悔上限を導出することで、既存理論の限界を克服したことを示しています。
この論文は、線形対角ネットワークにおけるシャープネス感知最小化(SAM)の暗黙的バイアスを研究し、特に深さのケースにおいて、初期値依存性や「逐次特徴増幅」と呼ばれる現象を通じて、無限時間収束の分析だけでは捉えられない動的な振る舞いが生じることを明らかにしています。
この論文は、境界条件が変化するパラメータ依存の偏微分方程式に対して、従来のモデル順序縮約法の限界を克服し、計算領域のパラメータ記述から解への効率的なマッピングを学習する「グラフ指示ニューラルネットワーク(GINN)」という新たな手法を提案し、その有効性を示すものである。
本論文は、大規模言語モデルと視覚言語モデルを用いて自動生成された概念マスクに基づき、ビジョン・トランスフォーマーの内部関連性マップを最適化することで、背景などの偽相関への依存を減らし、分布外データに対する頑健性と解釈可能性を向上させる新しいファインチューニング手法を提案し、その有効性を複数のベンチマークで実証したものである。
この論文は、拡散行列が既知でない連続時間線形定常確率微分方程式において、因果構造と観測共分散行列に基づいてドリフト係数の符号が一意に決定可能か(エッジ符号識別可能性)を判定する基準を導出し、古典的および新規の循環的因果構造に適用してその性質を明らかにするものである。
この論文は、デジタル病理におけるマルチインスタンス学習モデルのヒートマップの妥当性を検証する新たな枠組みを提案し、アテンションや勾配に基づく手法よりも摂動法や層別関連性伝播(LRP)などの説明手法がモデルの意思決定をより正確に反映し、生物学的な洞察をもたらすことを大規模ベンチマークと実証実験を通じて示しています。
本論文は、拡張動的モード分解(EDMD)を用いたクーマン演算子とウェーブレット変換の特徴をトランスフォーマーと組み合わせることで、心電図(ECG)の多クラス分類において、特に適切な辞書選択により従来のウェーブレット単独やハイブリッド手法を上回る性能を達成し、動的システム理論に基づく時系列分類の有効性を示したものである。
この論文は、アテンション出力投影をパラメータ不要のウォルシュ・アダマール変換と軽量なアフィン再スケーリングに置き換えることで、モデルのパラメータ数とメモリ使用量を削減しつつ、標準ベンチマークで同等以上の性能を維持する効率的なトランスフォーマーアーキテクチャを提案しています。
この論文は、時間系列分類問題に対して、入力空間における勾配ベースの最適化とソフトDTWに基づくk近傍法を統合することで、妥当性と分布の整合性を両立し、現実的な時間的構造を持つ反事実的説明を生成する新しい手法を提案し、その有効性を示したものである。
この論文は、オンラインの差の平均推定量と最適な制御変量を用いたオフポリシー逆確率重み付け推定量、そして回帰調整手法と二重頑健推定量の間に形式的な等価性を確立し、A/B テストとオフポリシー評価の分野を統一的な視点で結びつけることで、両分野の実践者や研究者の理解を深めることを目指しています。
本論文は、現在のベンチマークがモデル開発者にテストタスクへの過剰な最適化(benchmaxxing)を促し均衡が存在しないインセンティブ構造を生み出していることを示しつつ、最近提案された「tune-before-test」という評価プロトコルを用いることで、モデルの真の潜在品質に基づく唯一のナッシュ均衡を達成できることを理論的に証明しています。
この論文は、不均衡データにおける過学習やノイズへの耐性を高めるため、局所的な勾配更新に代わって動的に重み付けされた過去の勾配履歴を統合する「重み付き分数ウェイリー積分」に基づく新たな最適化アルゴリズムを提案し、医療診断や金融詐欺検出において従来の最適化手法を大幅に凌駕する性能向上を実証したものである。