cs.RO 件の論文 | Gist.Science

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

この論文は、部分的観測性と報酬の希薄性という課題に直面する分散型マルチエージェント強化学習において、異種エージェント間の協調を促進するために、グラフニューラルネットワークを活用した新しい内在的報酬メカニズム「CoHet」を提案し、複数のベンチマークで最先端の手法を上回る性能を実証したものである。

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

この論文は、制御バリア関数と微分可能最適化を用いたデータ駆動型アプローチを提案し、自律走行や配送などのマルチエージェント相互作用において、他者の安全を確保するためにエージェントが自身の制御をどの程度調整するか（責任配分）を学習・定量化する手法を提示しています。

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Open-World Task and Motion Planning via Vision-Language Model Genereated Constraints

この論文は、視覚言語モデル（VLM）を用いて離散および連続的な制約を生成し、従来のタスク・モーションプランニング（TAMP）システムと統合する「OWL-TAMP」を提案することで、自然言語で指定された複雑な長期的なロボット操作タスクを現実世界でも解決可能にしたことを示しています。

Nishanth Kumar, William Shen, Fabio Ramos, Dieter Fox, Tomás Lozano-Pérez, Leslie Pack Kaelbling, Caelan Reed GarrettWed, 11 Ma💻 cs

Image Compression Using Novel View Synthesis Priors

本論文は、事前のミッション情報とニューラルビュー合成モデルを活用し、勾配降下法で潜在表現を最適化することで、水中 ROV の帯域幅制限下でも高品質な画像伝送を可能にする新たな画像圧縮手法を提案し、人工海洋水槽での実験により既存手法を上回る圧縮率と画質、および新規物体への頑健性を実証したものである。

Luyuan Peng, Mandar Chitre, Hari Vishnu, Yuen Min Too, Bharath Kalyan, Rajat Mishra, Soo Pieng TanWed, 11 Ma⚡ eess

Morphological-Symmetry-Equivariant Heterogeneous Graph Neural Network for Robotic Dynamics Learning

本論文は、ロボットの運動構造と形態的対称性を単一のグラフネットワークに統合し、高い汎用性と効率性を実現する「MS-HGNN」と呼ばれる新しい異種グラフニューラルネットワークを提案し、その対称性等変性を実証的に検証したものである。

Fengze Xie, Sizhe Wei, Yue Song, Yisong Yue, Lu GanWed, 11 Ma🤖 cs.LG

CuriousBot: Interactive Mobile Exploration via Actionable 3D Relational Object Graph

この論文は、従来の能動知覚に依存する移動ロボット探索の限界を克服し、多様な物体間関係を符号化する「3D 関係オブジェクトグラフ」を導入することで、大規模かつ複雑な環境下での能動的な物体操作を伴う探索を可能にするシステムを提案し、その有効性と汎用性を検証したものである。

Yixuan Wang, Leonor Fermoselle, Tarik Kelestemur, Jiuguang Wang, Yunzhu LiWed, 11 Ma🤖 cs.LG

Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics

この論文は、人間の視覚には映らずロボットや AR デバイスにのみ検出可能な「iMarkers」という新しい目印を提案し、そのハードウェア設計、オープンソースの検出アルゴリズム、および従来の目印との比較評価を通じて、その環境への非侵襲性と多様なロボット応用における有効性を示しています。

Ali Tourani, Deniz Isinsu Avsar, Hriday Bavle, Jose Luis Sanchez-Lopez, Jan Lagerwall, Holger VoosWed, 11 Ma💻 cs

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

この論文は、視覚と固有受容感覚に基づいて可変性線形物体（DLO）の物理パラメータの事後分布を推定し、これをドメインランダム化に活用することで、シミュレーションで学習した制御ポリシーを微調整なしで実世界にゼロショット展開可能にする統合フレームワークを提案しています。

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

本論文は、大規模言語モデル（LLM）を既存の経路計画アルゴリズムの事後処理アドバイザーとして活用し、幻覚を抑制する戦略を組み合わせることで、多様な地形におけるコスト効率の高い経路計画を可能にする「LLM-Advisor」というフレームワークを提案し、その有効性を検証した研究です。

Ling Xiao, Toshihiko YamasakiWed, 11 Ma🤖 cs.AI

Physics-Conditioned Grasping for Stable Tool Use

本論文は、タスク誘発トルクによる工具の滑りや回転を抑制し、実世界での成功率を向上させるため、タスク条件付き軌道に沿って相互作用のワレンスを最小化するグリップを選択する「iTuP」と「SDG-Net」を提案し、工具使用には知覚だけでなくワレンス感知に基づくグリップ選択が不可欠であることを実証しています。

Noah Trupin, Zixing Wang, Ahmed H. QureshiWed, 11 Ma💻 cs

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

この論文は、ロボットや人間など異なるエンボディメントからのデータを光フローを用いて事前学習した世界モデルと価値関数を活用し、ターゲットとなるロボットの実証データのみで微調整を行う「潜在ポリシー・ステアリング（LPS）」手法を提案し、低データ量環境でもビヘイビア・クローンベースの視覚運動ポリシーを大幅に改善することを示しています。

Yiqi Wang, Mrinal Verghese, Jeff SchneiderWed, 11 Ma🤖 cs.AI

You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation

この論文は、単一の RGB 画像から未見の物体カテゴリの 9 自由度姿勢を推定する新たな単一段階のトランスフォーマーベースの手法「YOPO」を提案し、追加データや深度情報なしで既存の RGB 専用手法を凌駕する性能を達成したことを報告しています。

Hakjin Lee, Junghoon Seo, Jaehoon SimWed, 11 Ma💻 cs

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

本論文は、通信や中央制御なしに、複数の足型ロボットが物体を物理的接触のみで挟み、持ち上げ、移動させることを可能にする階層的方策と報酬設計を提案し、シミュレーションおよび実機実験でその有効性を示すものである。

Bikram Pandit, Aayam Kumar Shrestha, Alan FernWed, 11 Ma💻 cs

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

本論文は、大規模な汎用ロボットポリシーの研究を支援するために、シミュレーションと実世界のロボットを統一的に扱うモジュラーかつ軽量なエコシステム「Robot Control Stack (RCS)」を提案し、その設計原則と VLA や RL ポリシー開発における有用性を評価したものである。

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian WalterWed, 11 Ma🤖 cs.LG

Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS)

この論文は、人手に依存するサンゴの産卵計測の課題を解決し、大規模なサンゴ礁の修復を可能にするため、低コストなカメラと人間によるラベル付けを組み合わせた物体検出技術を用いて、サンゴの産卵と幼生を自動的に検出・分類・計数する「CSLICS」と呼ばれるシステムを提案し、その有効性を検証したものです。

Dorian Tsai, Christopher A. Brunner, Riki Lamont, F. Mikaela Nordborg, Andrea Severati, Java Terry, Karen Jackel, Matthew Dunbabin, Tobias Fischer, Scarlett RaineWed, 11 Ma💻 cs

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

この論文は、追加の学習なしに複数の事前学習済みロボット方策の分布スコアを凸結合してテスト時に合成する「General Policy Composition (GPC)」を提案し、理論的根拠と実証実験を通じて、個々の方策単体よりも優れた制御性能と適応性の向上を実現することを示しています。

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. LuoWed, 11 Ma🤖 cs.LG

cs.RO