Lifelong Language-Conditioned Robotic Manipulation Learning
本論文は、従来の言語条件付きロボット操作学習における旧技能の忘却(カタストロフィック・フォージング)を抑制しつつ、新技能の継続的学習と汎化を実現する新たなフレームワーク「SkillsCrafter」を提案し、その有効性を示したものである。
867 件の論文
本論文は、従来の言語条件付きロボット操作学習における旧技能の忘却(カタストロフィック・フォージング)を抑制しつつ、新技能の継続的学習と汎化を実現する新たなフレームワーク「SkillsCrafter」を提案し、その有効性を示したものである。
本論文は、高レベルの推論を行う VLM と高速な実行を行う VLA を、異常検知時に動的に制御権を切り替える軽量な「Critic」システムで統合し、長期にわたる複雑なロボット操作タスクの堅牢性と自律性を飛躍的に向上させる「Critic in the Loop」という新しいフレームワークを提案しています。
この論文は、視覚言語モデル(VLM)による意味推論、多モーダル知覚、およびデジタルツイン技術を活用し、変形する衣類と異物の認識・分類を可能にする自律的なテキスタイル選別ロボットシステムの開発とその実用性を示したものである。
本論文は、リハビリテーションにおける協働ロボットの役割を、従来の反復運動訓練からセラピストと患者のセッション前後を含む広範な支援へと拡張し、治療へのアクセス向上とワークフローの最適化を目指す新たな研究の方向性を提案しています。
この論文は、リ群やリーマン多様体上の幾何学的構造を尊重しつつ、滑らかな曲線から接線成分と法線成分を組み合わせてリアルタイムで安定した動的システムを構築する「CDSM」という新しい枠組みを提案し、その有効性を理論的解析とロボット実装を通じて実証しています。
本論文は、自動運転アルゴリズムの検証において、物理的な車両と仮想シミュレーション環境を同期させる車両-in-theループ(ViL)およびデジタルツイン技術を活用し、中央集約型 E/E アーキテクチャ(中央車載サーバー)上のソフトウェアを、個々の ECU や中間層を介さずに直接実行・評価できる安全かつ再現性の高いテストフレームワークを提案しています。
本論文は、環境からのフィードバックを用いた反復的な微調整により、高レベルの計画と低レベルの制御の能力ギャップを自律的に埋め、CALVIN ベンチマークにおいて最先端の性能を達成する階層的拡散方策フレームワーク「HD-ExpIt」を提案するものである。
本論文は、代理潜在空間クリティックを排除し、元の動作空間の Q 勾配を微分可能な 1 ステップ MeanFlow ポリシーを通じて直接逆伝播させる「Latent Policy Steering (LPS)」を提案することで、オフライン強化学習におけるデータ分布からの逸脱とハイパーパラメータ調整の難しさを克服し、ロボットタスクにおいて最先端の性能を実現する手法を提示しています。
本論文は、剛体と連続体の接続を明示的な拘束条件なしに扱い、幾何学的非線形・大変形・大回転条件下でも有効な、拘束フリーの幾何学的正確なコンチニュアム並列ロボットの静的モデルを提案し、その有効性をプロトタイプによる実験で検証したものである。
本論文は、最適化ベースの把持合成と計画ベースのデモンストレーション生成を組み合わせたデータ生成パイプラインにより 2000 万フレームの合成データセット「UltraDexGrasp-20M」を構築し、これを用いて訓練されたシンプルな把持ポリシーが、実世界での新規物体に対する普遍的な両手器用把持において 81.2% の成功率を達成する零ショットシミュレーションから実機への転移を実現したことを報告しています。
本論文は、CT 画像から患者固有の耳介解剖構造を再構築し、コッセル棒モデルと摩擦接触を統合した微分可能なシミュレーションパイプラインを開発することで、ロボット支援による人工内耳埋め込み手術における接触力の制御、ロックや座屈の防止、および挿入深さの向上を実現する接触感知型の計画手法を提案するものである。
本論文は、狭い視野や自己遮蔽の問題を克服し、ロボットが頻繁な再位置決めなしに広範囲の作業空間で物体を操作できるよう、360 度の LiDAR 点群を処理するエンドツーエンドの 3 次元視覚運動方策「Omni-Manip」を提案するものである。
この論文は、高密度な 3D 再構築やモデルの微調整を必要とせず、視覚言語事前知識モデルを「ナビゲーションフロンティア」を介して統合することで、ゼロショットで汎用的なオープンワールドナビゲーションを実現するトレーニングフリーのフレームワーク「OpenFrontier」を提案するものです。
この論文は、非線形ダイナミクスを学習された線形深層クープマン作用素に置き換えることで、モデル予測経路積分(MPPI)制御の計算効率を大幅に向上させ、実時間制御を可能にする「MPPI-DK」という新しいフレームワークを提案し、シミュレーションおよび四足歩行ロボットの実機実験でその有効性を検証したものである。
本論文は、RANSAC に代わり特徴対応の互換性グラフにおける最大クリーク探索を用いた決定論的アルゴリズム「CliReg」を提案し、3D LiDAR SLAM におけるループクロージャ検出の精度と頑健性を向上させることを示しています。
ROScopter は、ROS 2 のモジュール性を活用して ROSflight 2.0 と連携し、研究者がシミュレーションおよびハードウェア環境で研究コードを迅速にテストできるよう設計された、軽量かつ修正容易なマルチローター自律飛行システムである。
本論文は、人間の全身制御における推論効率と動的な四肢協調の安定性を向上させるため、物理情報を考慮したマルチブレイン潜在フローマッチングと強健な追跡を用いた意味運動意図ガイド型の VLA フレームワーク「PhysiFlow」を提案し、その有効性を実験で実証したものである。
この論文は、観測をわずか 8 トークンに圧縮する離散トークナイザー「CompACT」を提案し、世界モデルを用いた意思決定計画の計算コストを劇的に削減しながら、実時間制御への実用的な展開を可能にすることを示しています。
本論文は、時間変化する流れ下でのマイクロロボットによる細胞押し操作において、接触状態に基づいて学習された残差ポリシーをモデル予測制御(MPC)に統合するハイブリッド制御手法を提案し、実験により非定常流れに対するロバスト性と追跡精度の向上を実証したものである。
この論文は、視覚言語行動モデル(VLA)の内部表現を線形分類器で観測し、最適制御に基づく最小限の線形介入によってロボットの動作をリアルタイムで意図通りに誘導する手法を提案し、微調整なしでユーザーの好みに合わせた適応が可能であることをシミュレーションで実証しています。