NaviGait: Navigating Dynamically Feasible Gait Libraries using Deep Reinforcement Learning
この論文は、軌道最適化の構造と強化学習の適応性を階層的に統合した「NaviGait」を提案し、オフラインで生成された歩行ライブラリからの選択と最小限の変形を通じて、参照運動への忠実性と外乱に対するロバスト性を両立させつつ、強化学習の報酬設計を簡素化し訓練を高速化する新しい二足歩行制御フレームワークを提示しています。
666 件の論文
この論文は、軌道最適化の構造と強化学習の適応性を階層的に統合した「NaviGait」を提案し、オフラインで生成された歩行ライブラリからの選択と最小限の変形を通じて、参照運動への忠実性と外乱に対するロバスト性を両立させつつ、強化学習の報酬設計を簡素化し訓練を高速化する新しい二足歩行制御フレームワークを提示しています。
本論文は、拡散ビジョモーターポリシーを基盤とした実世界強化学習フレームワーク「RL-100」を提案し、模倣学習と強化学習を統合して 1000 回の試行で 100% の成功率を達成し、人間を超える性能と高い汎用性・頑健性を示したことを報告しています。
本論文は、2D エンコーダの限界を克服し、RGB 画像から強力な 3D 幾何学的事前知識を抽出してアクションヘッドに注入する新たなパラダイム「FALCON」を提案し、シミュレーションおよび実世界タスクにおいて最先端の性能と高い汎用性を達成したことを報告しています。
この論文は、環境変化への対応において既存の計画を更新する従来のアプローチに代わり、高速な漸近最適性を持つ計画アルゴリズムを用いて独立した問題を連続的に解くことで、より効率的に高品質な経路を生成できることを示しています。
この論文は、離散的な人間 - 物体相互作用表現と自然言語を統合した新しいフレームワーク「SynHLMA」を提案し、可動部を持つ物体に対する言語指示に基づく一連の巧みな把持動作を生成・予測・補間することを可能にするものである。
本論文は、人間の実演における能動的な頭部運動と視覚探索を捉え、記憶拡張ポリシーを用いて半ヒューマノイドロボットに転送する「EgoMI」というフレームワークを提案し、手と目の協調学習によって人間とロボットの身体性のギャップを克服し、強固な模倣学習を実現することを示しています。
本論文は、拡散方策(DP)の学習分布を維持しつつ動的環境で形式的な安全性を保証する「経路整合性安全フィルタリング(PACS)」を提案し、実世界タスクにおいて従来の反応的安全アプローチを大幅に上回る安全性とタスク成功率を実現することを示しています。
この論文は、ロボティクスにおける 3D 視覚表現学習の課題を解決するため、状態遷移のダイナミクスを生成拡散プロセスとしてモデル化し、動作や幾何学的再構成の教師信号なしに自己教師ありで学習するフレームワーク「AFRO」を提案し、シミュレーションおよび実世界タスクにおいて既存手法を上回る成功率とスケーラビリティを実証したものである。
本論文は、ロボットの物理的特性に適合した操作ポリシーを学習し、人間のデモンストレーションの単なる模倣を超えて多様なロボット形態に対応するよう、ユニファイド形態表現(UMR)と動的強化学習を組み合わせた「UniBYD」という統一フレームワークを提案し、その有効性を新規ベンチマーク「UniManip」を用いて実証したものである。
本論文は、ArUco マーカー認識、オプティカルフロー解析、および IMU データ処理を統合した融合フレームワークを採用し、モジュール型自己再構成ロボット「SnailBot」の協調タスクにおける堅牢で高精度な相対位置推定を実現するシステムの設計と実装、ならびにその有効性を示す実験結果を報告するものである。
本論文は、外部磁場による誘起されたヒステリシス収縮を利用し、非対称な接触・分離運動を通じて低レイノルズ数環境で自律的に推進し、単一の磁場による個別制御も可能にする、3 つの磁性ビーズと弾性リンクからなるマイクロスイマーの設計・最適化とその医療応用への可能性を提案しています。
この論文は、生物学的な蝶の飛行力学を模倣し、26 グラムの軽量で柔軟な構造を持つ自律制御可能なロボット「AirPulse」を開発することで、従来のドローンでは困難とされていた低周波・大振幅の羽ばたきによる振動環境下での安定した飛行を実現したことを報告しています。
本論文は、圧電素子と圧電抵抗素子を組み合わせたハイブリッド触覚センシングと学習ベースの手法を用いて、多指ロボットハンドの把持中に発生するすべりを 50ms 未満の遅延で検知・制御し、内部力を最適化することで把持の安定化を実現する手法を提案しています。
本論文は、RGB と深度の両モダリティ間の分布の不一致と最適化の偏りを解消する「異種二重パッチ最適化スキーム」と「勾配レベルのモダリティバランス戦略」を備えたマルチモーダル敵対的品質ポリシー(MAQP)を提案し、人間とロボットの相互作用における安全な把持を実現するものである。
この論文は、トレーニング時に特権的な 4 次元情報(3D 点の軌跡予測)を活用して VLA モデルに物理的な世界動態の理解を付与する「Pri4R」を提案し、推論時のオーバーヘッドなしにロボット操作タスクの性能を大幅に向上させることを示しています。
この論文は、近隣ロボット間の空間的距離を明示的に組み込んだ新しい通信メカニズム「RMHA」を提案し、高密度環境における分散型多ロボット経路計画の成功率を大幅に向上させることを示しています。
この論文は、低次元部分空間における特異値分解を用いた幾何学的構造の保持と、高信頼度サンプルに焦点を当てた蒸留戦略を導入することで、カタストロフィック・フォージングを抑制し、生涯模倣学習における知識転移と性能を飛躍的に向上させる「SPREAD」と呼ばれるフレームワークを提案しています。
この論文は、高齢者が日常生活支援を行う社会ロボットからの視線手がかりを若年層と比較してどのように知覚するかを調査し、加齢に伴う変化を考慮した適応的な非言語キューの設計に貢献することを目的としています。
本論文は、大規模言語モデル(LLM)と記号プランナーを組み合わせ、環境からタスクに関連する情報のみを抽出して計画の複雑さを軽減する「Scale-Plan」フレームワークと、その評価用の新ベンチマーク「MAT2-THOR」を提案し、異種多ロボットチームにおける長期的タスク計画の拡張性と信頼性を向上させたものである。
本論文は、視覚言語モデルを用いた階層的なマッサージロボット「HMR-1」を提案し、12,190 枚の画像と 17 万 4,177 組の QA ペアからなるマルチモーダルデータセット「MedMassage-12K」および評価ベンチマークを構築することで、医療分野における身体知能の課題を解決し、実機実験を通じてその実用性を検証したものです。