Fine-Tuning Robot Policies While Maintaining User Privacy
この論文は、ロボットがユーザーの好みに合わせた動作を学習する際にプライバシーを保護するため、各ユーザー固有の鍵を用いてネットワーク重みを数学的に変換し、正しい鍵を持つユーザーのみがパーソナライズされた動作を実行できるようにする、モデル非依存のフレームワーク「PRoP」を提案しています。
867 件の論文
この論文は、ロボットがユーザーの好みに合わせた動作を学習する際にプライバシーを保護するため、各ユーザー固有の鍵を用いてネットワーク重みを数学的に変換し、正しい鍵を持つユーザーのみがパーソナライズされた動作を実行できるようにする、モデル非依存のフレームワーク「PRoP」を提案しています。
本論文は、カテゴリレベルの事前知識と学習されたセマンティックキーポイントを用いて、100 マイクロ秒未満で形状と姿勢を推定し、固有値問題に基づく自己無撞着場反復法により大域的最適性の証明を可能にする高速な局所ソルバーを提案するものです。
本論文は、実世界環境でのリセット困難性やデータ不足といった課題を解決するため、物理的に整合性の高い世界モデルと VLM による即座のフィードバック機構を活用し、少量のデモンストレーションから視覚言語行動(VLA)モデルを安全かつ効率的に強化学習で微調整する「RehearseVLA」というフレームワークを提案しています。
この論文は、部分観測性と長期的な時間軸が要求される実世界のロボット制御において、各レイヤーに構造化された外部メモリを備え、LRU 方式による更新・書き換えメカニズムを通じて長期依存関係を効果的に学習し、合成タスクから視覚観測を伴う複雑なロボット操作タスクに至るまで、既存の手法を大幅に上回る性能を達成する「ELMUR」と呼ばれるトランスフォーマーアーキテクチャを提案するものである。
本論文は、視覚言語モデルに外部ツールによる正確な幾何学計算を可能にする「TIGeR」フレームワークと大規模データセットを提案し、ロボット操作においてセンチメートルレベルの精度を実現する新しいアプローチを提示しています。
LaViRA は、言語・視覚・ロボットの行動を階層的に分解し、マルチモーダル大規模言語モデルの強みを活用することで、事前学習なしに未知の連続環境における視覚言語ナビゲーションを可能にするゼロショットフレームワークです。
本論文は、ゼロショット視覚言語モデル(VLM)の空間推論能力を補完するため、3D 幾何学的事前知識を視覚入力に統合するマルチモーダル視覚注釈(MVA)と、探索履歴に基づく適応的決定策(ADM)を提案し、複雑な 3D 環境における無人航空機(UAV)のタスク指向ナビゲーションの成功率と効率を大幅に向上させる SoraNav フレームワークを提示するものです。
本論文は、FMCW リダからのドップラー速度情報を活用して動的物体を補正・予測し、外部センサーや較正を必要とせずに動的環境におけるロバストなオドメトリを実現する「Dynamic-ICP」という新規登録フレームワークを提案し、複数のデータセットで既存手法を上回る性能を実証しています。
この論文は、変形特性を学習した力 - 変形モデルと連続時間 B スプライン運動学モデルを統合し、ニュートンの第二法則に基づいて視覚加速度と変形誘起加速度を関連付けることで、非剛体ロボットシステムにおけるモノキュラー状態推定を可能にし、メトリックスケールや重力の回復といった従来未解決の問題を解決する手法を提案しています。
本論文は、動的に更新されるクラス埋め込みベクトルを備えた階層的予測符号化 RNN「CERNet」を提案し、単一のモデルでロボットの運動生成、リアルタイムな行動認識、および認識の信頼性推定を統合的に実現することを示しています。
この論文は、複数のエージェントがレースという高レベルの目標のみで競合する強化学習を通じて、物理的限界を押し広げる機敏な飛行や戦略的行動が自然に出現し、従来の個別学習や報酬設計に依存する方法よりも複雑な環境での実世界への転移性能と一般化能力が向上することを示しています。
本論文は、シミュレーションにおける故障注入と実機でのオンライン状態推定モジュールを組み合わせることで、関節のロックや電源喪失などのハードウェア故障に耐性を持つ二足歩行制御を実現する学習フレームワーク「TOLEBI」を提案し、実世界での適用性を検証したものである。
本論文は、外部モーションキャプチャに依存せず、接触時のみ有効化する接触整合性ファクターを備えた拡張視覚慣性オドメトリと、画像ベースの視覚サーボ制御およびハイブリッド力・運動制御を組み合わせることで、接触を伴う複雑なタスクを自律的に実行可能な完全オンボードのドローン操作パイプラインを提案し、その実用性を示したものである。
本論文は、記号的推論の長期タスクへの堅牢性と視覚的グラウンディングを統合し、長期にわたるロボットタスク・モーション計画における誤差蓄積を軽減する階層的な世界モデル(H-WM)を提案するものである。
本論文は、モデルパラメータの更新なしにテスト時に相互作用から物理法則を学習し、仮説を検証してから適用する「PhysMem」フレームワークを提案し、これにより VLM ロボットプランナーが環境変化に適応して物体操作の成功率を大幅に向上させることを示しています。
FlowCorrect は、VR 経由で人間が与える稀疏な相対的修正のみを用いて、再学習なしに生成フロー方策をデプロイ時に適応させ、ロボット操作の失敗を効率的に修正するインタラクティブな手法です。
本論文は、Jetson Orin などの組み込みハードウェア上で完全オフラインかつ 150.5ms の低遅延で動作する量子化されたオンデバイス型視覚言語行動(VLA)モデル「LiteVLA-Edge」を提案し、組み込みロボットにおける実用的なデプロイパスを実証するものである。
この論文は、実世界の地形データと強化学習に基づく適応的ナビゲーション戦略を統合したマルチエージェントシミュレーション枠組みを提案し、起伏に富んだ景観における考古学的移動や輸送戦略の復元を可能にするものである。
本論文は、大規模な疑似教師あり事前学習、シミュレーションに基づく教師あり微調整、そして強化学習という 3 段階のトレーニング手法を採用し、動画拡散モデルから物理的に整合性の高い 4 次元世界表現を学習する「Phys4D」を提案し、従来の外観中心のモデルを超えた細かな物理的整合性と生成性能の実現を示しています。
本論文は、都市峡谷などの過酷な環境下でのリアルタイム運用を可能にするために、ファクターグラフ最適化を用いた GNSS と IMU の疎結合統合アーキテクチャを提案し、バッチ処理法との精度・可用性・計算効率のトレードオフを詳細に分析したものである。