Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners
この論文は、環境変化への対応において既存の計画を更新する従来のアプローチに代わり、高速な漸近最適性を持つ計画アルゴリズムを用いて独立した問題を連続的に解くことで、より効率的に高品質な経路を生成できることを示しています。
3447 件の論文
この論文は、環境変化への対応において既存の計画を更新する従来のアプローチに代わり、高速な漸近最適性を持つ計画アルゴリズムを用いて独立した問題を連続的に解くことで、より効率的に高品質な経路を生成できることを示しています。
本論文は、軽量な身体ランドマーク検出と適切な部分集合の選択、およびスプライン補間による欠損値の補完を組み合わせることで、LIBRAS の孤立した手話認識において、既存の最先端手法と同等以上の精度を維持しつつ処理時間を 5 倍以上短縮できることを実証しています。
この論文は、事前学習済み Stable Diffusion モデルの特徴量を活用し、トレーニング不要な k-NN による検出とコンパクトな分類器によるソース特定を可能にする軽量かつデータ効率の高いフレームワーク「FRIDA」を提案し、GenImage ベンチマークにおいて未見の生成モデルに対する検出とソース特定において最先端の性能を達成したことを報告しています。
本論文は、人間の実演における能動的な頭部運動と視覚探索を捉え、記憶拡張ポリシーを用いて半ヒューマノイドロボットに転送する「EgoMI」というフレームワークを提案し、手と目の協調学習によって人間とロボットの身体性のギャップを克服し、強固な模倣学習を実現することを示しています。
既存の単眼 3D 物体検出器が抱える属性間の幾何学的整合性の欠如を解消するため、予測された 3D 境界ボックスと正解との空間的整合性、および画像平面上での 3D ボックスの 2D 投影と検出枠との整合性を強制する「Spatial-Projection Alignment(SPAN)」手法を提案し、既存の検出器に容易に統合可能な形で性能を大幅に向上させることを実証した。
本論文は、大規模視覚言語モデル(LVLM)における既存の敵対的攻撃が抱える制御性の限界を、パッチ特徴の曖昧さではなく、より局所的で分離された意味情報を保持する「値特徴(Value Features)」を標的にすることで克服し、テキスト指示に基づく精密な意味操作を可能にする新しい手法「V-Attack」を提案するものである。
この論文は、ロボティクスにおける 3D 視覚表現学習の課題を解決するため、状態遷移のダイナミクスを生成拡散プロセスとしてモデル化し、動作や幾何学的再構成の教師信号なしに自己教師ありで学習するフレームワーク「AFRO」を提案し、シミュレーションおよび実世界タスクにおいて既存手法を上回る成功率とスケーラビリティを実証したものである。
この論文は、視覚と聴覚の両方の感覚を統合した世界モデルの概念を初めて定義し、専用データセット「AVW-4k」と新しいモデル「AV-CDiT」を提案することで、マルチモーダルな未来予測と音声視覚ナビゲーションタスクの性能向上を実現するものです。
この論文は、古典的なベンチマークインスタンスの構造を突くことで極めて短時間で最適解が得られることを示し、これらのインスタンスが現在では TSPTW-M 問題の評価基準として適切でなくなったと結論付けています。
VGGT やなどの多視点 3D モデルが抱える計算コストの課題に対し、グローバル注意機構の役割を分析し、学習不要の 2 段階加速手法を提案することで、精度を維持しつつ最大 10 倍の推論高速化を実現する論文です。
本論文は、ロボットの物理的特性に適合した操作ポリシーを学習し、人間のデモンストレーションの単なる模倣を超えて多様なロボット形態に対応するよう、ユニファイド形態表現(UMR)と動的強化学習を組み合わせた「UniBYD」という統一フレームワークを提案し、その有効性を新規ベンチマーク「UniManip」を用いて実証したものである。
この論文は、拡散モデルの強化学習における「好意モード崩壊(多様性の欠如)」を定量化する新しいベンチマーク「DivGenBench」を提案し、報酬モデルの埋め込み空間内で方向性補正を行う「方向性分離アライメント(D²-Align)」という手法により、多様性を維持しつつ人間の好みに優れた生成を実現することを示しています。
本論文は、大規模プログラムの形式検証におけるスケーラビリティ課題を解決するため、静的解析と大規模言語モデル(LLM)を協調させ、潜在的なランタイムエラーに基づいて検証単位を優先的に選定・合成するモジュール型フレームワーク「Preguss」を提案し、千行を超える実世界プログラムにおいて人間の手間を最大 88.9% 削減する高い自動化を実現したことを示しています。
本論文は、顔偽造検出における汎化性能の向上を目指し、因果表現学習の観点から「低ランクの誤ったバイアス」を低ランク部分空間として特定し、その直交補空間を学習することで偽造痕跡に特化した検出器 SeLop を提案し、極めて少ない学習パラメータで最先端の性能を実現したことを報告しています。
この論文は、GDPR に基づくプライバシー・バイ・デザイン(PbD)の実装において、組織の目標に合致する要件工学手法を評価するための「目標中心アプローチ」を提案し、プロセス特性だけでなく組織目標に基づいた評価の重要性を指摘するものである。
本論文は、無線秘匿通信の厳格な検出理論制約下での LLM 能力を評価する新たなベンチマーク「CovertComBench」を提案し、概念理解やコード生成では高い性能を示すものの、セキュリティ保証に必要な高度な数学的導出においては大幅な性能不足があることを明らかにし、信頼性の高い無線 AI システム構築には外部ツールの活用が不可欠であると結論付けています。
この論文は、拡散モデルや自己回帰モデルなど多様な生成モデルが共有する最終的なアーキテクチャ成分を悪用して実画像を「汚染」し、その特徴を学習させることで、未見の生成モデルに対しても高い汎化性能(平均精度 98.83%)を実現する AI 生成画像検出手法を提案しています。
本論文は、推論過程で参照bounding boxの明示を強制し、大域・局所キャプションとの整合性を報酬として活用する強化学習フレームワーク「RegionReasoner」と、それを評価するための新しいベンチマーク「RegionDial-Bench」を提案し、検出・セグメンテーションタスクにおける多段階視覚推論の精度と空間的根拠付けを大幅に向上させることを示しています。
本論文は、Rényi 微分プライバシー(RDP)プロファイルを-微分プライバシーに変換する際、単一次数の RDP プライバシー領域の交差に基づく変換則が、すべての有効な RDP プロファイルと第 1 種誤り率に対して最適であることを証明し、RDP 保証のみから導き出せるプライバシーの限界を確立しました。
この論文は、長期動画生成におけるエラー蓄積の問題を、トレーニング不要で初期フレームを基準にサンプリング経路を補正する「Test-Time Correction(TTC)」という手法により解決し、既存のテスト時間最適化法よりも安定した高品質な 30 秒動画生成を実現することを提案しています。