FedEU: Evidential Uncertainty-Driven Federated Fine-Tuning of Vision Foundation Models for Remote Sensing Image Segmentation
FedEU は、証拠に基づく不確実性推定とクライアント固有の特徴埋め込みを活用して、分散環境におけるリモートセンシング画像セグメンテーションの信頼性と適応性を向上させる新しい連合学習フレームワークを提案するものです。
3898 件の論文
FedEU は、証拠に基づく不確実性推定とクライアント固有の特徴埋め込みを活用して、分散環境におけるリモートセンシング画像セグメンテーションの信頼性と適応性を向上させる新しい連合学習フレームワークを提案するものです。
この論文は、拡散モデルを用いたデータセット蒸留において、従来の後段のクロスアテンションに依存する手法が視覚的特徴を弱体化させる問題を解決するため、エンコーダと生成バックボーンの遷移段階でテキストと視覚の埋め込みを早期に融合する「EVLF」手法を提案し、セマンティックに忠実かつ視覚的に整合性の高い合成データを生成して下流タスクの精度向上を実現することを示しています。
この論文は、LiDAR とカメラのデータ破損に対して頑健な 3D 物体検出を実現するため、マルチモーダル BEV 特徴をモダリティ不変部分とモダリティ固有部分に分解・再結合し、破損タイプに応じた 3 つのエキスパートを適応的に融合する「Multi-Modal Decouple and Recouple Network」を提案し、nuScenes ベンチマークで清潔なデータおよびあらゆる種類の破損データにおいて既存モデルを上回る性能を達成したことを報告するものです。
本論文は、実世界の劣化(モーションブラーや低照度)に直面したスナップショット圧縮イメージングにおいて、単なる「再構成」から「復元」へと目標を転換し、RobustSCI およびその拡張版 RobustSCI-C を提案することで、劣化した測定値から本来の鮮明なシーンを回復する新たな手法とベンチマークを確立したものである。
この論文は、LiDAR からカメラモデルへ深度情報を転送する際に深度と無関係なノイズの影響を軽減し、実世界の摂動に対する頑健性を高めるため、カメラから物体までの「光線」に沿って深度知識を蒸留する新しい手法「RayD3D」を提案し、複数の BEV 検出モデルにおいて既存の手法を上回る性能を達成したことを報告しています。
この論文は、ドキュメント理解におけるレイアウト認知と証拠に基づく段階的推論を統合し、グローバルなレイアウト事前知識と視覚的意味連鎖(VSC)を用いて推論過程を構造化・強化する新しいフレームワーク「DocCogito」を提案し、複数のベンチマークで最先端の性能を達成したことを示しています。
本論文は、発掘資料の継続的な追加に伴う新たな文字種の学習と多様な書風への対応という課題を解決するため、埋め込み辞書マッチングとスクリプト条件付き注入モジュールを備えた「AMR-CCR」フレームワークと、それを評価するための新しいベンチマーク「EvoCON」を提案するものです。
本論文は、解剖学的構造の複雑性や多様性に対処するため、微分可能な骨格化モジュールを備えた形状オートエンコーダと潜在空間拡散モデルを組み合わせた高忠実度かつ効率的な医療形状生成フレームワークを提案し、大規模な MedSDF データセットを用いた実験で既存手法を上回る性能を達成したことを示しています。
本論文は、Tweedie の公式を用いて「Drifting モデル」がガウス平滑化分布におけるスコアマッチングの原理と厳密に等価であることを示し、拡散モデルや DMD との理論的関係を明らかにするとともに、ラプラス核に対する誤差評価も提供しています。
本論文は、AIGC 技術の進展に伴うディープフェイクの検出課題に対し、人間の鑑定プロセスを模倣した推論データセットの構築、偽造潜在空間分布の捕捉、および強化学習を用いた自己進化戦略を統合することで、高精度かつ信頼性の高い説明付きディープフェイク顔画像識別を実現する「EvolveReason」を提案するものです。
本論文は、フリーハンドスケッチをラスター画像やストローク系列ではなく構造化グラフとして直接モデル化する「SketchGraphNet」を提案し、344 万点のスケッチを含む大規模ベンチマーク「SketchGraph」上で、補助的な位置・構造エンコーディングを不要としながら、メモリ効率と精度を両立した認識を実現したことを報告しています。
本論文は、X 線 C アームシステムを用いたガイドワイヤやカテーテルなどの任意形状の連続体ロボットの 3 次元再構成において、画像セグメンテーションと幾何学的制約を組み合わせた新しいフレームワーク「ACCURATE」を提案し、1.0mm 未満の平均絶対誤差で高精度な再構成を実現することを示しています。
この論文は、単眼 UAV 画像から小車両などのセマンティックなアンカーを用いて絶対メトリクススケールを復元し、これを物理的制約として衛星画像のスケール適応型切り出しに適用することで、実世界のスケール曖昧性下における UAV から衛星へのクロスビュー地理定位の頑健性を大幅に向上させる幾何学的枠組みを提案しています。
この論文は、長編のテキストと画像を交互に生成する際に視覚履歴の蓄積が品質劣化を招くという課題を特定し、モデル内部の関連性に基づいて不要な視覚情報を動的に排除する「UniLongGen」という推論戦略を提案することで、長期生成の安定性と忠実度を大幅に向上させることを示しています。
この論文は、単一の参照画像から高品質な手書き画像を生成する拡散モデル「CONSTANT」を提案し、スタイルを離散トークンとしてモデル化するスタイル感知量子化、トークンの意味的分離を促す対照的学習、および潜在空間におけるマルチスケールパッチの整合性確保により、既存手法を上回る多言語対応のスタイル適応性と画像品質を実現したことを述べています。
DreamSAC は、ハミルトニアンに基づく好奇心ボーナスを用いた対称性探索戦略と、生データから物理的保存則を学習する自己教師ありコントラスト学習を組み合わせた世界モデルを導入することで、統計的相関ではなく物理法則を習得し、未知の物理特性への外挿一般化を飛躍的に向上させる手法を提案しています。
本論文は、自律運転シミュレーション向けに、既存の基礎モデル VGGT を拡張し、空間座標と外観属性の回帰を分離するハイブリッド・ガウス予測ヘッドと、速度モデリングによる静的・動的 4D 合成戦略を導入することで、従来のシーン別最適化と同等の高精度を維持しつつ、都市環境の大規模な 4D 空間をリアルタイムで再構築する高速なフィードフォワードフレームワーク「ReconDrive」を提案するものである。
この論文は、期待自由エネルギー(EFE)に基づく能動的な時間サンプリングと不確実性を考慮した適応学習を組み合わせた新しいフレームワークを提案し、低振幅かつノイズの多い条件下でも頑健なマイクロジェスチャー認識を実現するものです。
既存の概念カスタマイズ手法が抱える元モデルの能力低下という課題を解決するため、ターゲット概念の暗黙的ガイダンスと元の条件予測を分離する学習目標と適応的ガイダンススケールを導入し、高忠実度のカスタマイズと元モデルの性能維持を両立させる「PureCC」を提案する論文です。
この論文は、腫瘍の進化と治療反応の共進化ダイナミクスを捉えるために、次ステップの治療予測と将来の MRI 生成を統合した新しい脳膠芽腫ワールドモデル「Brain-WM」を提案し、その Y 字型の混合トランスフォーマーアーキテクチャと多時間点マスク整合目的関数によって、治療計画の精度と MRI 生成の質を大幅に向上させたことを報告しています。