Systematic Evaluation of Novel View Synthesis for Video Place Recognition
本論文は、5 つの公開データベースと 7 つの画像類似度手法を用いた体系的な評価を通じて、合成された新規視点画像がビデオ場所認識(VPR)の性能向上に寄与し、特に視点の変化量よりも追加する画像の数やデータセットの画像タイプが重要であることを示しています。
864 件の論文
本論文は、5 つの公開データベースと 7 つの画像類似度手法を用いた体系的な評価を通じて、合成された新規視点画像がビデオ場所認識(VPR)の性能向上に寄与し、特に視点の変化量よりも追加する画像の数やデータセットの画像タイプが重要であることを示しています。
本論文は、スプリングマスモデルを用いて斜面での着地不安定を解析し、接地角度の調整と離陸前の微小トルク付与という簡易な制御手法により、低コストロボットでも急斜面での安定したホッピングを実現できることを示しています。
この論文は、凸多面体同士の厳密な距離計算に基づいて支持超平面を導出する手法を用い、非線形ダイナミクスを持つロボットが複雑な環境で安全かつ高速に経路計画を行うための反復凸最適化フレームワークを提案しています。
この論文は、個々のシーン最適化や後処理を必要とせず、単一のフォワードパスでシミュレーション対応の連続三角形表面を直接予測し、ロボット工学やシミュレーション向けの高忠実度 3 次元再構成を実現する「FTSplat」と呼ばれる新しいフードフォワード三角形スプラッティングネットワークを提案するものです。
この論文は、飛行制御と把持制御を単一の軽量ニューラルネットワークで統合し、2 段階学習戦略により 60 分未満のトレーニングで実機において最大 1.5 m/s の高速飛行で 84% の把持成功率を達成する深層強化学習ベースの「Swooper」システムを提案しています。
この論文は、2025 年に発表された新型クアッドコプター「Crazyflie Brushless」の動的モデルを構築し、その精度を検証するとともに、強化学習を用いたアクロバット飛行制御のシミュレーションから実機への転移を成功させ、プロジェクト全体をオープンソース化して研究者の活用を促進したことを報告しています。
この論文は、連続的な並進変位を極座標のヤコビアンを用いて解析的にマージナル化し、センサーに依存しない物理量として定義された不確実性パラメータを備えた学習不要の確率的占有 BEV 符号化「PROBE」を提案し、多様な LiDAR センサーおよびセッション条件下で手動設計および教師ありベースラインと競合する、あるいはそれらを凌駕する 3 次元場所認識性能を達成したことを報告しています。
本論文は、各ストラットに取り付けた IMU から得られる重力に対する傾斜角情報のみを用いたエネルギー最小化手法により、外部センサーに依存せず大規模なテンセグリティマニピュレータの形状を高精度に推定できることを、20 本のストラットを持つ 5 層構造の実験を通じて実証したものである。
この論文は、奥行き情報や幾何学的較正を意図的に排除し、VR 遠隔操作による少量のデータで VLA ポリシーを微調整することで、複雑な環境下でのイチゴ収穫タスクにおいて 74.0% の成功率を達成した初の研究を紹介しています。
本論文は、磁気ナビゲーションロボットの研究・設計・ベンチマークを促進するための初の汎用オープンソースシミュレータ「MagRobot」を提案し、その直感的な GUI、多様な医療応用への対応、および実験による高精度な検証と、気管支鏡や血管内治療などの具体的な使用例を通じてその有効性を示しています。
この論文は、現実世界の複雑な環境におけるヒューマノイドロボットの移動を研究するために、VR を活用して 348 件の歩行軌跡と多様な障害物環境を含む新規データセット「Moving Through Clutter (MTC)」および評価ベンチマークを提案するものです。
この論文は、オフロード走行という長期的かつ報酬信号が希薄な課題に対処するため、教師あり軌道と探索軌道を組み合わせた新しい方策勾配手法「TADPO」を提案し、シミュレーションから実車へのゼロショット転移に成功した RL ベースの全スケールオフロード走行システムを世界で初めて実装したことを報告しています。
本論文は、視覚的バイアスにより言語指示を無視する「言語的盲目性」という VLA モデルの欠陥を特定し、再学習なしで推論時に注意機構を再調整する IGAR 手法を提案することで、矛盾する指示下でのロボットの誤作動を効果的に防止することを示しています。
この論文は、自律走行 VLA モデルにおける探索の欠如という課題を解決するため、実行可能軌道の拡張と多様性を意識したサンプリング・報酬設計を組み合わせたフレームワーク「Curious-VLA」を提案し、Navsim ベンチマークで最先端の性能を達成したことを報告しています。
本論文は、ブロックチェーン技術を活用してロボットの行動の透明性と説明責任を確保し、自律的なタスク遂行と報酬の自動再投資を可能にする分散型ロボット組織「RODEO」の枠組みを提案し、実験を通じてその有効性を実証したものである。
本論文は、ロボティクスや自動運転で収集された既存の全方向 RGB-LiDAR ログを、歪み補正や効率的なサンプリング、マルチモーダル登録などの処理を経て 3D ガウススプラッティング(3DGS)の初期化資産へと変換し、高品質なデジタルツイン構築を可能にするパイプラインを提案するものです。
本論文は、大規模言語モデル駆動の身体性ナビゲーションエージェントが直面する破滅的忘却の問題を解決するため、タスク共有知識とタスク固有知識を効率的に学習・統合する新しいフレームワーク「Uni-Walker」を提案し、多様なタスクや指示スタイルにわたる生涯学習を実現するものです。
この論文は、既存のロボットデータから大規模モデルを教師として用いたデータセット構築手法を提案し、パラメータ効率型微調整(PEFT)により 40 億パラメータの小型ビジョン言語モデルを訓練することで、計算リソースを大幅に削減しつつ最先端の閉鎖型モデルに匹敵する 87% の成功率でロボットタスク計画用の行動木を生成する手法を確立したことを示しています。
本論文は、視線ノイズや動的環境下でも最小 3 回の瞬きで対象物を安定して特定する「Sticky-Glance」アルゴリズムとマルチモーダル共有制御を導入し、障害を持つ人々のロボット協働における意図認識の堅牢性と効率性を大幅に向上させた研究です。
この論文は、資産の明示的な宣言、体系的な脆弱性の列挙、およびハザード駆動型の合成データ生成に基づき、古典的な安全工学と現代の機械学習パイプラインを統合したロボットの物理的安全性フレームワークを提案しています。