Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

이 논문은 부분 관측성과 희소한 보상 신호 하에서 분산형 환경에 있는 이종 다중 에이전트의 협력을 향상시키기 위해 그래프 신경망 (GNN) 기반의 내재적 보상을 활용하는 'CoHet' 알고리즘을 제안하고, 이를 통해 기존 최첨단 방법보다 우수한 성능을 입증합니다.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

이 논문은 제어 장벽 함수와 미분 가능 최적화를 기반으로 한 데이터 중심 접근법을 통해 다중 에이전트 상호작용에서 안전성을 보장하기 위해 에이전트가 얼마나 자신의 행동을 조정하는지 (책임 할당) 를 학습하고 해석 가능한 정량적 통찰을 제공하는 방법을 제시합니다.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

Open-World Task and Motion Planning via Vision-Language Model Genereated Constraints

이 논문은 비전 - 언어 모델이 생성한 이산적 및 연속적 제약 조건을 작업 및 운동 계획 (TAMP) 시스템에 통합하여 자연어 기반의 복잡한 장기 로봇 조작 과제를 해결하는 'OWL-TAMP'라는 새로운 접근법을 제안하고 그 유효성을 실험을 통해 입증합니다.

Nishanth Kumar, William Shen, Fabio Ramos, Dieter Fox, Tomás Lozano-Pérez, Leslie Pack Kaelbling, Caelan Reed GarrettWed, 11 Ma💻 cs

CuriousBot: Interactive Mobile Exploration via Actionable 3D Relational Object Graph

이 논문은 모바일 로봇의 능동적 상호작용을 통한 환경 탐사 한계를 극복하기 위해 다양한 물체 관계를 인코딩한 3D 관계 객체 그래프를 제안하고, 이를 기반으로 한 시스템이 기존 비전 - 언어 모델 기반 방법보다 다양한 장면과 물체에서 뛰어난 일반화 성능을 보임을 입증합니다.

Yixuan Wang, Leonor Fermoselle, Tarik Kelestemur, Jiuguang Wang, Yunzhu LiWed, 11 Ma🤖 cs.LG

Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics

이 논문은 로봇과 증강현실 장치에만 감지되어 인간의 시야를 방해하지 않는 새로운 형태의 비가시성 표지자 'iMarkers'를 제안하고, 그 하드웨어 설계와 오픈소스 소프트웨어 알고리즘을 통해 다양한 로봇 시나리오에서의 효과성과 적응성을 입증합니다.

Ali Tourani, Deniz Isinsu Avsar, Hriday Bavle, Jose Luis Sanchez-Lopez, Jan Lagerwall, Holger VoosWed, 11 Ma💻 cs

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

이 논문은 가소성 선형 물체 (DLO) 의 물리적 매개변수에 대한 확률적 추정을 통해 시뮬레이션과 현실 간의 차이를 해소하고, 이를 기반으로 학습된 제어가 추가 미세 조정 없이도 실제 환경에서 성공적으로 적용될 수 있는 통합된 Real2Sim2Real 프레임워크를 제안합니다.

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

이 논문은 다양한 지형에서의 비용 효율적 경로 계획 문제를 해결하기 위해 기존 플래너를 수정하지 않고 LLM 을 후처리 어드바이저로 활용하는 'LLM-Advisor' 프레임워크와 새로운 평가 데이터셋을 제안하며, 이를 통해 기존 최선 경로 알고리즘의 비용 효율성을 상당 부분 개선할 수 있음을 입증합니다.

Ling Xiao, Toshihiko YamasakiWed, 11 Ma🤖 cs.AI

Physics-Conditioned Grasping for Stable Tool Use

이 논문은 도구의 사용 중 발생하는 관성 충격과 지렛대 효과로 인한 미끄러짐을 방지하기 위해, 작업 궤적에 따른 토크와 미끄러짐을 예측하여 최적의 그립을 선택하는 '역 도구 사용 계획 (iTuP)' 프레임워크와 실시간 점수화 네트워크 (SDG-Net) 를 제안하여 실제 로봇의 도구 사용 성공률을 크게 향상시켰다고 요약할 수 있습니다.

Noah Trupin, Zixing Wang, Ahmed H. QureshiWed, 11 Ma💻 cs

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

이 논문은 다양한 신체 구조의 데이터를 광학 흐름을 통해 통합하여 세계 모델을 사전 학습한 후, 이를 타겟 로봇의 소량 데이터로 미세 조정하고 가치 함수를 활용해 행동 복제 정책을 최적화함으로써 저데이터 환경에서 로봇 시각-운동 정책의 성능을 획기적으로 향상시키는 '잠재 정책 조종 (LPS)' 방법을 제안합니다.

Yiqi Wang, Mrinal Verghese, Jeff SchneiderWed, 11 Ma🤖 cs.AI

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

이 논문은 대규모 일반화 정책 기반의 로봇 학습 연구를 지원하기 위해 시뮬레이션과 실제 환경 간 전환을 원활하게 하는 경량화되고 모듈화된 로봇 제어 스택 (RCS) 을 제안하고, 그 아키텍처 설계 원리와 VLA 및 RL 정책 개발 과정에서의 유용성과 성능을 평가합니다.

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian WalterWed, 11 Ma🤖 cs.LG

Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS)

이 논문은 대보초와 같은 산호초 생태계의 복원을 위해 인공 부양 및 유생 건강 모니터링에 필수적인 산란 계수 과정을 자동화하여 노동 시간을 획기적으로 단축하고 정확도를 높인 저비용 모듈형 카메라 시스템 'CSLICS'를 제안하고 그 유효성을 입증합니다.

Dorian Tsai, Christopher A. Brunner, Riki Lamont, F. Mikaela Nordborg, Andrea Severati, Java Terry, Karen Jackel, Matthew Dunbabin, Tobias Fischer, Scarlett RaineWed, 11 Ma💻 cs

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

이 논문은 추가적인 학습 없이 기존 확산 또는 플로우 기반 로봇 정책들의 분포 점수를 결합하여 테스트 시간에 새로운 정책을 구성하는 '일반 정책 조합 (GPC)' 방법을 제안하고, 이를 통해 개별 정책보다 우수한 성능을 달성할 수 있음을 이론적 근거와 실험을 통해 입증합니다.

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. LuoWed, 11 Ma🤖 cs.LG

NavSpace: How Navigation Agents Follow Spatial Intelligence Instructions

이 논문은 내비게이션 에이전트의 공간 지능을 체계적으로 평가하기 위해 'NavSpace' 벤치마크를 제안하고, 이를 통해 기존 모델들의 한계를 드러내며 새로운 공간 지능 내비게이션 모델인 'SNav'를 개발하여 우수한 성능을 입증했습니다.

Haolin Yang, Yuxing Long, Zhuoyuan Yu, Zihan Yang, Minghan Wang, Jiapeng Xu, Yihan Wang, Ziyan Yu, Wenzhe Cai, Lei Kang, Hao DongWed, 11 Ma🤖 cs.AI

Exploring Single Domain Generalization of LiDAR-based Semantic Segmentation under Imperfect Labels

이 논문은 LiDAR 기반 3D 의미 분할에서 노이즈가 있는 라벨과 도메인 일반화 문제를 동시에 해결하기 위해 제안된 듀얼 뷰 프레임워크 'DuNe'를 소개하며, 기존 방법들의 한계를 극복하고 여러 데이터셋에서 최첨단 성능을 입증합니다.

Weitong Kong, Zichao Zeng, Di Wen, Jiale Wei, Kunyu Peng, June Moh Goo, Jan Boehm, Rainer StiefelhagenWed, 11 Ma🤖 cs.LG