On the Strengths and Weaknesses of Data for Open-set Embodied Assistance
この論文は、Overcooked 環境で生成した合成データを用いて LLaMA ベースのモデルを微調整し、未知のユーザー行動や新しい設定に対する「オープンセット修正支援」能力を評価することで、多様なシナリオ、マルチモーダルな接地、欠陥推論を網羅したデータセットが、オープンセット支援知能の実現に不可欠であることを示しています。
866 件の論文
この論文は、Overcooked 環境で生成した合成データを用いて LLaMA ベースのモデルを微調整し、未知のユーザー行動や新しい設定に対する「オープンセット修正支援」能力を評価することで、多様なシナリオ、マルチモーダルな接地、欠陥推論を網羅したデータセットが、オープンセット支援知能の実現に不可欠であることを示しています。
本論文は、農業操作における視覚模倣学習の汎化性を向上させるため、タスク関連領域と非関連領域を区別してそれぞれ適切な拡張を行う「DRAIL」という新しいフレームワークを提案し、ロボット実験を通じてその有効性を実証したものである。
この論文は、ロボットの操作タスクにおける構造的な空間関係の学習を強化するため、双曲幾何空間を活用した自己教師ありマルチビュー事前学習フレームワーク「HyperMVP」と大規模 3D データセット「3D-MOV」を提案し、実世界を含む複数のベンチマークで既存手法を上回る性能を実証しています。
本論文は、自然言語による根拠(ラショナル)を因果信号として活用し、分布外環境や新規タスクにおけるスパurious 特徴への依存を排除して強固な報酬学習を実現する軽量フレームワーク「ReCouPLe」を提案し、その有効性を示しています。
この論文は、長期記憶を必要とする非マルコフ的タスクにおいて、作業記憶とエピソード記憶を備えた非マルコフ的視覚運動方策「VPWEM」を提案し、拡散方策と組み合わせて実時間制約内で長期的な文脈情報を効率的に活用することで、既存の最先端手法を上回る性能を実現したことを示しています。
この論文は、可動カメラによる視点変化下でも有効な 3D 物体の視点一貫性敵対テクスチャ最適化手法を提案し、可視モーションポリシーの脆弱性を包括的に検証するとともに、実世界での適用可能性を実証したものである。
本論文は、局所化誤差や動的障害物の軌道予測誤差などの不確実性を考慮しつつ、円や楕円などの単純な幾何学的近似を排して多角形ロボットと障害物間の衝突リスクを直接扱うことで、狭い環境における軌道計画の過度な保守性を軽減し、航行効率を向上させる「U-OBCA」という新しい確率的最適化フレームワークを提案し、理論解析、数値シミュレーション、実世界実験を通じてその有効性を検証したものである。
本論文は、異種センサーを備えたロボット群が双方向の幾何学的制約なしに局所化を達成できるよう、相互測距とオドメトリのみを用いたデータ駆動型の適応推定器と、弱連結有向トポロジー下で動作する分散姿勢結合戦略を提案し、実機実験でその有効性を検証したものである。
本論文は、産業用室内環境におけるクレーン搭載型LiDARからの人物検出・追跡を目的として、専用データセットを構築し、VoxelNeXtやSECONDなどの検出器を適応させることで、実用的な性能とリアルタイム性を示した研究である。
この論文は、モデリングが困難なソフトロボットの遠隔操作を可能にするため、Microsoft HoloLens 2 と物理シミュレーションに基づく観測器を組み合わせた拡張現実インターフェースを開発し、PETER 型空気圧マニピュレータを用いた検証でロボットの長さの約 5% の誤差で位置推定が達成可能であることを示しています。
この論文は、視覚言語モデル(VLM)を用いて接触許容性を直接推論し、点群に基づいた最適化を行う新たなナビゲーション計画手法「DCT」を提案し、可動障害物のある複雑な環境におけるロボットの効率的かつ堅牢な移動を実現することを示しています。
本論文は、異なるカメラ構成間での空間的事前知識の不一致が汎化を阻害する要因であることを特定し、空間認識型特徴変調とカメラ認識型データ拡張を導入することで、未知のマルチカメラ構成への強力な転移性能を実現する汎用的な 3D 物体検出フレームワーク「CoIn3D」を提案しています。
本論文は、季節や環境変化に左右されにくい自律農業ロボットの長期運用を実現するため、ブドウの幹や支柱を恒久的なランドマークとして活用し、低コストセンサーと onboard 計算で高精度なセマンティックマッピングを行う「VinePT-Map」フレームワークを提案し、多季節の実証実験でその有効性を示したものである。
本論文は、幾何学的基盤モデル(VGGT)を活用し、ボクセル重なりと情報利得に基づく適応的なキーフレーム選択モジュール「SIGMA」と結合多視点 Sim(3) 最適化を導入することで、単眼 SLAM における姿勢推定と密な再構成の両方で最先端の性能を達成する「AIM-SLAM」を提案するものです。
本論文は、物理ベースのシミュレーションとガウススプラッティングによる効率的な視覚補正を統合し、実世界とシミュレーションのギャップを克服してロボティクスにおける高精度なデジタルツインを実現する「GaussTwin」を提案し、その有効性を Franka Research 3 プラットフォームでの実験で実証しています。
この論文は、深層学習に基づく知覚の不確実性を検知して自律制御と遠隔操作を動的に切り替える「知覚的共有自律」の概念を提案し、その実装システム「SPIRIT」が、深層学習の失敗時にも頑健なロボット操作を実現することを示しています。
この論文は、ロボティクスにおける強化学習の報酬設計の難しさを解決するため、タスク固有の目的と行動特性を分離し、まずタスクのみで学習させた後に行動関連の報酬項を導入する「2 段階報酬カリキュラム」を提案し、DeepMind Control Suite や ManiSkill3 などの環境で既存手法を大幅に上回る性能とロバスト性を示したことを報告しています。
本論文は、長期のロボット操作タスクにおいて従来の拡散方策が抱える時間的モデリングの課題を解決し、SEGA モジュールを統合することで、より少ないパラメータで長期的な視覚情報を効率的に処理し、RoboTwin 2.0 ベンチマークで最先端の性能を達成する「SeedPolicy」を提案するものです。
この論文は、人間の認知に着想を得て、タスクの複雑さに応じて即座に行動するか推論するか、あるいは異常検知時に実行を中止するかを動的に選択する適応型フレームワークを提案し、視覚情報のみを用いることで少量のデータでも高い精度でタスク複雑性を検出できることを実証しています。
本論文は、従来の言語条件付きロボット操作学習における旧技能の忘却(カタストロフィック・フォージング)を抑制しつつ、新技能の継続的学習と汎化を実現する新たなフレームワーク「SkillsCrafter」を提案し、その有効性を示したものである。