Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

この論文は、部分的観測性と報酬の希薄性という課題に直面する分散型マルチエージェント強化学習において、異種エージェント間の協調を促進するために、グラフニューラルネットワークを活用した新しい内在的報酬メカニズム「CoHet」を提案し、複数のベンチマークで最先端の手法を上回る性能を実証したものである。

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

この論文は、制御バリア関数と微分可能最適化を用いたデータ駆動型アプローチを提案し、自律走行や配送などのマルチエージェント相互作用において、他者の安全を確保するためにエージェントが自身の制御をどの程度調整するか(責任配分)を学習・定量化する手法を提示しています。

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Open-World Task and Motion Planning via Vision-Language Model Genereated Constraints

この論文は、視覚言語モデル(VLM)を用いて離散および連続的な制約を生成し、従来のタスク・モーションプランニング(TAMP)システムと統合する「OWL-TAMP」を提案することで、自然言語で指定された複雑な長期的なロボット操作タスクを現実世界でも解決可能にしたことを示しています。

Nishanth Kumar, William Shen, Fabio Ramos, Dieter Fox, Tomás Lozano-Pérez, Leslie Pack Kaelbling, Caelan Reed GarrettWed, 11 Ma💻 cs

Image Compression Using Novel View Synthesis Priors

本論文は、事前のミッション情報とニューラルビュー合成モデルを活用し、勾配降下法で潜在表現を最適化することで、水中 ROV の帯域幅制限下でも高品質な画像伝送を可能にする新たな画像圧縮手法を提案し、人工海洋水槽での実験により既存手法を上回る圧縮率と画質、および新規物体への頑健性を実証したものである。

Luyuan Peng, Mandar Chitre, Hari Vishnu, Yuen Min Too, Bharath Kalyan, Rajat Mishra, Soo Pieng TanWed, 11 Ma⚡ eess

CuriousBot: Interactive Mobile Exploration via Actionable 3D Relational Object Graph

この論文は、従来の能動知覚に依存する移動ロボット探索の限界を克服し、多様な物体間関係を符号化する「3D 関係オブジェクトグラフ」を導入することで、大規模かつ複雑な環境下での能動的な物体操作を伴う探索を可能にするシステムを提案し、その有効性と汎用性を検証したものである。

Yixuan Wang, Leonor Fermoselle, Tarik Kelestemur, Jiuguang Wang, Yunzhu LiWed, 11 Ma🤖 cs.LG

Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics

この論文は、人間の視覚には映らずロボットや AR デバイスにのみ検出可能な「iMarkers」という新しい目印を提案し、そのハードウェア設計、オープンソースの検出アルゴリズム、および従来の目印との比較評価を通じて、その環境への非侵襲性と多様なロボット応用における有効性を示しています。

Ali Tourani, Deniz Isinsu Avsar, Hriday Bavle, Jose Luis Sanchez-Lopez, Jan Lagerwall, Holger VoosWed, 11 Ma💻 cs

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

この論文は、視覚と固有受容感覚に基づいて可変性線形物体(DLO)の物理パラメータの事後分布を推定し、これをドメインランダム化に活用することで、シミュレーションで学習した制御ポリシーを微調整なしで実世界にゼロショット展開可能にする統合フレームワークを提案しています。

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

本論文は、大規模言語モデル(LLM)を既存の経路計画アルゴリズムの事後処理アドバイザーとして活用し、幻覚を抑制する戦略を組み合わせることで、多様な地形におけるコスト効率の高い経路計画を可能にする「LLM-Advisor」というフレームワークを提案し、その有効性を検証した研究です。

Ling Xiao, Toshihiko YamasakiWed, 11 Ma🤖 cs.AI

Physics-Conditioned Grasping for Stable Tool Use

本論文は、タスク誘発トルクによる工具の滑りや回転を抑制し、実世界での成功率を向上させるため、タスク条件付き軌道に沿って相互作用のワレンスを最小化するグリップを選択する「iTuP」と「SDG-Net」を提案し、工具使用には知覚だけでなくワレンス感知に基づくグリップ選択が不可欠であることを実証しています。

Noah Trupin, Zixing Wang, Ahmed H. QureshiWed, 11 Ma💻 cs

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

この論文は、ロボットや人間など異なるエンボディメントからのデータを光フローを用いて事前学習した世界モデルと価値関数を活用し、ターゲットとなるロボットの実証データのみで微調整を行う「潜在ポリシー・ステアリング(LPS)」手法を提案し、低データ量環境でもビヘイビア・クローンベースの視覚運動ポリシーを大幅に改善することを示しています。

Yiqi Wang, Mrinal Verghese, Jeff SchneiderWed, 11 Ma🤖 cs.AI

You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation

この論文は、単一の RGB 画像から未見の物体カテゴリの 9 自由度姿勢を推定する新たな単一段階のトランスフォーマーベースの手法「YOPO」を提案し、追加データや深度情報なしで既存の RGB 専用手法を凌駕する性能を達成したことを報告しています。

Hakjin Lee, Junghoon Seo, Jaehoon SimWed, 11 Ma💻 cs

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

本論文は、大規模な汎用ロボットポリシーの研究を支援するために、シミュレーションと実世界のロボットを統一的に扱うモジュラーかつ軽量なエコシステム「Robot Control Stack (RCS)」を提案し、その設計原則と VLA や RL ポリシー開発における有用性を評価したものである。

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian WalterWed, 11 Ma🤖 cs.LG

Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS)

この論文は、人手に依存するサンゴの産卵計測の課題を解決し、大規模なサンゴ礁の修復を可能にするため、低コストなカメラと人間によるラベル付けを組み合わせた物体検出技術を用いて、サンゴの産卵と幼生を自動的に検出・分類・計数する「CSLICS」と呼ばれるシステムを提案し、その有効性を検証したものです。

Dorian Tsai, Christopher A. Brunner, Riki Lamont, F. Mikaela Nordborg, Andrea Severati, Java Terry, Karen Jackel, Matthew Dunbabin, Tobias Fischer, Scarlett RaineWed, 11 Ma💻 cs

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

この論文は、追加の学習なしに複数の事前学習済みロボット方策の分布スコアを凸結合してテスト時に合成する「General Policy Composition (GPC)」を提案し、理論的根拠と実証実験を通じて、個々の方策単体よりも優れた制御性能と適応性の向上を実現することを示しています。

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. LuoWed, 11 Ma🤖 cs.LG

Connectivity Maintenance and Recovery for Multi-Robot Motion Planning

この論文は、障害物に満ちた環境における多ロボットシステムの接続維持と回復を可能にするため、高次制御バリア関数と制御リアプノフ関数を用いたリアルタイムのベジェ曲線ベースの MPC-CLF-CBF 運動計画アルゴリズムを提案し、シミュレーションおよび 8 機の Crazyflie による物理実験でその有効性を検証したものである。

Yutong Wang, Lishuo Pan, Yichun Qu, Tengxiang Wang, Nora AyanianWed, 11 Ma💻 cs

NavSpace: How Navigation Agents Follow Spatial Intelligence Instructions

本論文は、ナビゲーションエージェントの空間知能を体系的に評価する新しいベンチマーク「NavSpace」と、それにおいて既存モデルを上回る性能を示す新しいナビゲーションモデル「SNav」を提案するものである。

Haolin Yang, Yuxing Long, Zhuoyuan Yu, Zihan Yang, Minghan Wang, Jiapeng Xu, Yihan Wang, Ziyan Yu, Wenzhe Cai, Lei Kang, Hao DongWed, 11 Ma🤖 cs.AI

Exploring Single Domain Generalization of LiDAR-based Semantic Segmentation under Imperfect Labels

本論文は、LiDAR 3D セマンティックセグメンテーションにおけるドメイン一般化と不完全ラベルという未解決課題に焦点を当て、既存手法の限界を克服し、信頼性に基づく双視点フレームワーク「DuNe」を提案することで、複数のデータセットにおいて最先端の性能を達成したことを報告しています。

Weitong Kong, Zichao Zeng, Di Wen, Jiale Wei, Kunyu Peng, June Moh Goo, Jan Boehm, Rainer StiefelhagenWed, 11 Ma🤖 cs.LG

Asset-Centric Metric-Semantic Maps of Indoor Environments

この論文は、大規模言語モデル(LLM)による高度な推論と計画を可能にするため、物体レベルの詳細なメッシュとシーンレベルの文脈を両立させた新しいメトリック意味マップを提案し、既存手法よりも精度が高く、LLM やシミュレーション環境でのナビゲーションへの有効性を示しています。

Christopher D. Hsu, Pratik ChaudhariWed, 11 Ma💻 cs