UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors
本論文は、既知の劣化モデルに依存せず、多粒度劣化認識モジュールと潜在拡散モデルに基づく劣化耐性プロキシステップを組み合わせた「UnfoldLDM」を提案し、ブラインド画像復元における過平滑化バイアスを解消して高品質な復元を実現する手法を提示しています。
8314 件の論文
本論文は、既知の劣化モデルに依存せず、多粒度劣化認識モジュールと潜在拡散モデルに基づく劣化耐性プロキシステップを組み合わせた「UnfoldLDM」を提案し、ブラインド画像復元における過平滑化バイアスを解消して高品質な復元を実現する手法を提示しています。
本論文は、海面下で GNSS 信号が受信できない marine ロボットに対し、複数のドローンによる視覚検出、GNSS 三角測量、および信頼度重み付き拡張カルマンフィルタを統合したリアルタイム安定追跡システムを提案し、ドローン間の追跡 ID 整合アルゴリズムによるグローバル一貫性を確保することで、複雑な環境下でも高精度かつロバストな追跡を実現することを示しています。
本論文は、現実的な攻撃成功率モデルを統合した確率的な「(k, ε)-不安定性」の概念を導入することで、従来厳しすぎる仮定に依存していた SmoothLLM の防御証明を、より実用的で信頼性の高いものへと改良する枠組みを提案しています。
本論文は、大規模モデルの推論能力を活用して「都市 - 地区 - グリッド」の階層構造を計画し、ユーザー定義と無限の拡張を可能にする自律的な 3D 都市生成フレームワーク「Yo'City」を提案し、その卓越した性能を実証するものです。
本論文は、物理や検出器の設計に着想を得たアテンションマスクをトランスフォーマーに組み込むことで、建設中の KM3NeT/ORCA 望遠鏡における低エネルギーニュートリノの再構成と分類の精度を向上させ、異なる構成間での微調整における検出器間の有用な情報の保持を実証したものである。
この論文は、心理的原理(特に「足がかり効果」)に基づく大規模な多ターン対話型ジャイルブレイク攻撃を自動化するパイプラインを提案し、GPT 系モデルが会話履歴に脆弱である一方で Gemini 2.5 Flash が極めて高い耐性を示すなど、主要 LLM 間の安全性に顕著な差があることを実証しています。
この論文では、3 人以上のプレイヤーからなる非退化な正規形ゲームにおいて、すべての進化安定戦略を計算するアルゴリズムを提示しています。
本論文は、既存手法の限界を克服し、外部知識を効率的に取り込む新しい検索拡張型去重拡散モデル「RadDiff」を提案し、タンパク質逆折り畳みタスクにおいて既存手法を大幅に上回る性能とスケーラビリティを実証したものである。
この論文は、3D マイクロ CT スキャンから得られた 2D 画像を用いて有孔虫の種を分類する高精度な深層学習フレームワーク「ForamDeepSlice」を提案し、95.64% のテスト精度を達成するとともに、実用的なデプロイを可能にするインタラクティブなダッシュボードを開発したことを報告しています。
この論文は、統計的相関に依存する従来の予測モデルの限界を克服し、事前学習された因果基礎モデルを「What-if」シミュレーターとして統合することで、故障の根本原因を特定し介入効果を定量化して生産ラインの OEE を最適化する処方箋保全フレームワークを提案しています。
本論文は、強化学習における可塑性の喪失問題を解決し、性能低下を伴わずに学習能力を回復させるため、アクティブなネットワークとオフポリシー学習を行うパッシブなネットワークを交互に切り替える「AltNet」という双子ネットワーク手法を提案し、高次元制御タスクにおいて既存手法を上回る性能を実証したものである。
この論文は、入力依存のノイズ分散を可能にする「二重ランダム化平滑化」フレームワークを提案し、従来のグローバル分散の限界を克服して小・大半径の両方において高い頑健性を達成する手法を提示しています。
この論文は、エージェント型ソフトウェアシステムの意思決定過程を構造的に解析する「Graphectory」を導入し、その分析に基づいて実行中のエージェントをリアルタイムで監視・介入させることで、問題解決率の向上と実行経路の効率化を実現する手法を提案しています。
この論文は、非加法的な現実世界の報酬構造や高次元のスパース性を扱うために、単一化された非線形説明フレームワーク「疎性等方性シャプレー回帰(SISR)」を提案し、単調変換の学習とスパース性制約を同時に実行することで、既存のシャプレー値の歪みを解消し、理論的保証と高い実用性を両立させることを示しています。
本論文は、事前学習済みデコーダ型言語モデルに「プランナーによる潜在ワークスペース」と「同期マルチストリーム出力プロトコル」を組み合わせた「並列デコーダ・トランスフォーマ(PDT)」を提案し、外部のオーケストレーションに依存せず、モデル内部で並列タスク分解と生成の同期を可能にする新しいアーキテクチャを示しています。
オフロード環境における道路ネットワーク抽出の課題を解決するため、大規模なオフロードデータセット「WildRoad」を公開し、従来のノード中心アプローチの限界を克服する経路中心のフレームワーク「MaGRoad」を提案し、高い精度と高速推論を実現する研究です。
本論文は、スパースオートエンコーダと勾配ベースの可視化手法を統合し、深層学習モデルの内部特徴を「発見・検証・制御」する SALVE 枠組みを提案することで、モデルの透明性と制御性を高める新たな手法を提示しています。
本論文は、LLM エージェントの事前学習後の適応を「エージェント側」と「ツール側」の 4 つのパラダイムに分類する統一的な枠組みを提示し、事後学習、記憶、スキルに関する研究を包括的にレビューするとともに、そのトレードオフや評価手法、および将来の課題を論じています。
本論文は、エピソード横断的なトレーニングとリフレクションによるコンテキスト内方策適応という 2 つの主要な構成要素を備えたメタ強化学習フレームワーク「LaMer」を提案し、これにより言語エージェントが環境からのフィードバックに基づいて能動的に探索し、従来の強化学習ベースラインよりも Sokoban や Webshop などのタスクで顕著な性能向上と汎化能力を実現することを示しています。
本論文は、拡散モデルの事前知識と形状からの陰影(SfS)の手がかりを組み合わせ、推論時に自己教師ありで再照明を行う「Re-Depth Anything」を提案し、Depth Anything V2 や V3 の推定深度をラベルなしで高精度かつリアルに洗練させる手法を提示するものである。