NeuralRemaster: Phase-Preserving Diffusion for Structure-Aligned Generation
本論文は、拡散モデルのノイズ過程で位相成分を保持し振幅のみをランダム化することで、アーキテクチャの変更なしに幾何学的整合性を保つ構造整合生成を実現する「位相保存拡散(Phase-Preserving Diffusion)」を提案し、画像・動画の再レンダリングやシミュレーションから実世界への転移タスクにおいて高い性能を示すことを示しています。
864 件の論文
本論文は、拡散モデルのノイズ過程で位相成分を保持し振幅のみをランダム化することで、アーキテクチャの変更なしに幾何学的整合性を保つ構造整合生成を実現する「位相保存拡散(Phase-Preserving Diffusion)」を提案し、画像・動画の再レンダリングやシミュレーションから実世界への転移タスクにおいて高い性能を示すことを示しています。
この論文は、非微分可能な経路を任意の精度で微分可能関数に近似し、曲率を系統的に制御することで、リアルタイム実装が可能かつ既存の追跡アルゴリズムと互換性のある効率的な経路生成手法(モリフィケーション)を提案するものである。
本論文は、従来の「追尾後に降下」という受動的なアプローチを転換し、ドローンと着陸プラットフォームが双方向に協調して最適な姿勢を調整・同期させることで、動的環境下での自律着陸の効率性、精度、堅牢性を飛躍的に向上させる新しいフレームワークを提案しています。
本論文は、LLM の推論能力と PDDL ベースの古典的プランナー、そして行動木を統合した「EmboTeam」フレームワークを提案し、異種ロボットチームによる長期的なタスク実行の成功率を大幅に向上させることを示しています。
本論文は、単一のオペレーターによる監視下で、 Points of Interest(POI)に基づく統一ミッション抽象化と多層自律構造を活用し、ロボット間の能力に応じた動的タスク割り当てを可能にする「MOSAIC」というモジュール型スケーラブル自律枠組みを提案し、月面探査を模倣した異種ロボットチームの実地実験において、1 台の故障にもかかわらず高いタスク達成率と自律性を維持したことを実証しています。
本論文は、物理相互作用と背景更新を分離する「解離された動的予測」の原理に基づき、既存の高密度トランスフォーマーモデルに比べ推論速度を約 9 倍向上させつつ、ナビゲーションや操作タスクなど多様な領域で成功率を高める効率的な世界モデル「DDP-WM」を提案するものである。
この論文は、視覚的遮蔽を本質的な情報不足として捉え、タスク完了に必要な情報を能動的に収集する「探索的・焦点型操作(EFM)」という新たな問題を定義し、その解決策として片腕で能動的視覚を、もう片腕で力覚を統合する「両腕能動知覚(BAP)」戦略と、それを検証するためのベンチマーク「EFM-10」およびデータセット「BAPData」を提案しています。
この論文は、人間の能動的知覚に着想を得て、事前学習済みマルチビュー・マスクドオートエンコーダーの表現を活用し、ラベルなしで動的に最も情報量の多い視点を選択する「MAE-Select」という新たなフレームワークを提案し、単一カメラシステムのパフォーマンスを向上させ、場合によってはマルチカメラシステムを上回ることを実証しています。
本論文は、閉ループ逆運動学(CLIK)を無限次元領域に拡張し、微分可能なニューラル演算子を用いてアクチュエーションから形状へのマッピングを学習することで、従来困難だった軟体ロボットのタスク遂行を可能にする新しい手法を提案しています。
この論文は、脚部ロボットが歩行中の身体感覚データから地盤強度を推定しリアルタイムで地形マップを作成することで、車輪型ローバーが砂地やクレーターなどの危険な惑星環境を安全に探索できるよう支援する「スカウト - ローバー協調」フレームワークを提案し、アナログミッションを通じてその有効性を検証したものである。
本論文は、環境特徴を注意機構を通じて学習し、収縮性に基づく安定性保証により GNSS 測定共分散の時間的滑らかさと適応性を両立させる「LACE」と呼ばれる学習ベースの枠組みを提案し、自律レーシングにおける状態推定精度の向上を実証したものである。
本論文は、Apple Watch の慣性センサーとカスタムグローブの静電容量センサーを対数尤度比で融合する解釈可能なマルチモーダル手法を提案し、視覚ベースの手法に匹敵する精度で計算コストを削減しつつ、ドローンや移動ロボットの安全な遠隔操作を実現する新しいデータセットとフレームワークを提示しています。
本論文は、調和 UV マッピングとスケーリングされたグループ畳み込みニューラルネットワークを用いて接触フィードバックを処理する強化学習エージェントを提案し、変形性物体による 3D 表面の拭き取りタスクにおける経路計画の精度と効率を向上させ、実機での実証実験に成功したことを報告するものである。
この論文は、非線形ロボットの制御をデータ駆動で学習したクープマン線形モデルと安全集合アルゴリズムを統合し、追従と安全性の制約を単一の二次計画問題として解くことで、実時間での安全な全身制御を実現する手法を提案し、実機実験でその有効性を検証したものである。
本論文は、混合交通環境におけるボトルネック渋滞を緩和するため、CAV と HDV の相互作用を局所・大域的に認識し、安全行動を補正するマルチエージェント強化学習に基づく「二重相互作用認識協調制御戦略(DIACC)」を提案し、交通効率と適応性の大幅な向上を実証したものである。
GAIDE は、ロボットの空間構造と身体特性をグラフとして表現し、トランスフォーマーに基づくニューラルサンプリングにアテンションマスキングを統合することで、高次元の動作計画問題におけるサンプリング効率と成功率を向上させる手法です。
本論文は、勾配更新やデモンストレーション、報酬設計を必要とせず、視覚観察と構造化されたエピソード結果に基づいて実行可能な Python コードを反復的に書き換えることで、ロボット把持タスクにおける失敗を自己診断・修正し、高成功率を達成する「Act-Observe-Rewrite(AOR)」というマルチモーダル LLM ベースのフレームワークを提案し、その有効性を検証したものである。
この論文は、GPU やネットワーク接続を必要とせず、低電力のエッジハードウェア上で動作する完全自律的な四足歩行ロボット(Boston Dynamics Spot)のナビゲーションシステムを開発し、地下鉱山という過酷な環境下で 20 回の試行すべてにおいて 100% の成功率を達成したことを報告するものです。
この論文は、シミュレーションにおける触覚センサーの現実的なモデリングが困難であるという課題に対し、実世界で収集した特権的な触覚データを用いて強化学習された操作ポリシーを蒸留する「PTLD」という手法を提案し、これにより触覚情報を活用した巧みな把持タスクの成功率を大幅に向上させることを示しています。
本論文は、高自由度アームの関節空間における逆運動学解の多様性による計画失敗や非効率な経路生成の問題を解決するため、複数の目標姿勢を並列に探索する「Many-RRT*」を提案し、従来の手法と比較して経路コストを大幅に削減しつつ成功率を 100% まで向上させることを実証したものである。