RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

이 논문은 인간 숙련도 수준의 신뢰성과 효율성을 갖춘 실세계 로봇 조작을 위해 모방 학습과 강화 학습을 통합하고 증류 기법을 통해 실시간 제어를 가능하게 한 'RL-100' 프레임워크를 제안하며, 다양한 실물 로봇 작업에서 100% 성공률을 기록하고 인간 개입 없이도 장기적으로 안정적으로 작동하는 것을 입증했습니다.

Kun Lei, Huanyu Li, Dongjie Yu, Zhenyu Wei, Lingxiao Guo, Zhennan Jiang, Ziyu Wang, Shiyu Liang, Huazhe XuWed, 11 Ma🤖 cs.AI

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

이 논문은 2D 인코더의 공간적 한계를 극복하고 RGB 만으로 강력한 3D 기하학적 사전 지식을 제공하며, 언어 추론을 보존하기 위해 공간 토큰을 행동 헤드로만 주입하는 새로운 패러다임인 FALCON 을 제안하여 다양한 시뮬레이션 및 실세계 작업에서 최첨단 성능을 달성함을 보여줍니다.

Zhengshen Zhang, Hao Li, Yalun Dai, Zhengbang Zhu, Lei Zhou, Chenchen Liu, Dong Wang, Francis E. H. Tay, Sijin Chen, Ziwei Liu, Yuxiao Liu, Xinghang Li, Pan ZhouWed, 11 Ma🤖 cs.AI

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

이 논문은 변화하는 환경에서 기존 계획을 업데이트하는 대신, 빠른 거의-확률적 점근 최적 (ASAO) 알고리즘을 사용하여 독립적인 문제 해결을 반복함으로써 실시간 재계획을 더 효율적으로 수행할 수 있음을 보여줍니다.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. GammellWed, 11 Ma💻 cs

SynHLMA:Synthesizing Hand Language Manipulation for Articulated Object with Discrete Human Object Interaction Representation

이 논문은 자연어 지시를 기반으로 관절형 물체의 변형과 장기 조작 시퀀스를 고려하여 손 그립을 생성하는 새로운 프레임워크 'SynHLMA'를 제안하고, 이를 통해 HAOI 생성, 예측, 보간 작업 및 로봇 그리핑 적용에서 최첨단 성능을 입증합니다.

Wang zhi, Yuyan Liu, Liu Liu, Li Zhang, Ruixuan Lu, Dan GuoWed, 11 Ma🤖 cs.AI

From Demonstrations to Safe Deployment: Path-Consistent Safety Filtering for Diffusion Policies

이 논문은 확산 정책 (Diffusion Policies) 의 학습 분포를 유지하면서 실시간으로 안전성을 보장하기 위해 경로 일관성 기반의 안전 필터링 (PACS) 을 제안하며, 이를 통해 기존 안전 기법 대비 작업 성공률을 크게 향상시키고 동적 환경에서 공식적인 안전 보장을 달성함을 보여줍니다.

Ralf Römer, Julian Balletshofer, Jakob Thumm, Marco Pavone, Angela P. Schoellig, Matthias AlthoffWed, 11 Ma⚡ eess

Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning

본 논문은 로봇 조작 작업의 성능 향상을 위해 상태-행동-상태 동역학을 모델링하고 명시적 기하학적 재구성을 배제하여 자기지도식 3D 표현을 학습하는 새로운 프레임워크인 AFRO 를 제안하고, 이를 통해 다양한 시뮬레이션 및 실세계 작업에서 기존 방법보다 우수한 조작 성공률을 달성함을 보여줍니다.

Qiwei Liang, Boyang Cai, Minghao Lai, Sitong Zhuang, Tao Lin, Yan Qin, Yixuan Ye, Jiaming Liang, Renjing XuWed, 11 Ma💻 cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

이 논문은 다양한 로봇 형태에 맞춰 인간 시연의 모방을 넘어 적응적 탐색을 가능하게 하는 통합 강화학습 프레임워크 'UniBYD'와 이를 평가하기 위한 새로운 벤치마크 'UniManip'을 제안하여, 기존 최첨단 방법 대비 성공률을 44.08% 향상시켰음을 보여줍니다.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Magnetically Driven Elastic Microswimmers: Exploiting Hysteretic Collapse for Autonomous Propulsion and Independent Control

이 논문은 외부 자기장의 진폭 변화에 따른 히스테리시스 붕괴 현상을 이용해 비가역적 접촉과 분리를 유도하여 저 레이놀즈 수 환경에서 순항하는 자기 구동 탄성 마이크로 스위머의 원리를 제안하고, 진화 최적화를 통해 성능을 향상시키며 단일 자기장으로 다중 로봇의 독립적 제어가 가능함을 보여줍니다.

Theo Lequy, Andreas M. MenzelWed, 11 Ma🔬 physics.app-ph

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

이 논문은 훈련 시 3D 포인트 트랙 예측을 위한 특권 4D 정보를 활용하여 VLA 모델이 물리적 상호작용의 시공간적 역학을 내재적으로 학습하도록 함으로써 추론 시 추가 비용 없이 로봇 조작 성능을 크게 향상시키는 'Pri4R' 방법을 제안합니다.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong KimWed, 11 Ma🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

이 논문은 기존 학습 기반 통신 방식의 공간적 무관심 문제를 해결하기 위해 쌍별 맨해튼 거리를 주시 가중치 계산에 명시적으로 통합한 '관계 강화 멀티헤드 어텐션 (RMHA)'을 제안하여, 고밀도 환경에서 로봇 간 협업을 극대화하고 대규모 군집으로의 제로샷 일반화 성능을 획기적으로 향상시켰습니다.

Sayang Mu, Xiangyu Wu, Bo AnWed, 11 Ma🤖 cs.AI

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

이 논문은 기존 방법의 한계를 극복하고 저차원 부분공간에서 기하학적 구조를 보존하는 SPREAD 프레임워크를 제안함으로써, 평생 모방 학습에서 새로운 기술 습득과 기존 지식 유지 간의 균형을 이루며 재앙적 망각을 방지하고 최첨단 성능을 달성합니다.

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman MoghadamWed, 11 Ma🤖 cs.LG

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

이 논문은 자연어 지시에서 작업 관련 정보를 추출하여 불필요한 정보를 필터링하고 구조화된 그래프 탐색을 통해 효율적인 장기 계획 생성을 가능하게 하는 확장 가능한 다중 로봇 팀 작업 계획 프레임워크인 'Scale-Plan'을 제안하고, 이를 통해 기존 LLM 기반 접근법의 한계를 극복하고 신뢰성과 확장성을 향상시켰음을 보여줍니다.

Piyush Gupta, Sangjae Bae, Jiachen Li, David IseleWed, 11 Ma🤖 cs.AI

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

이 논문은 의료용 시각 - 언어 모델 기반의 계층적 마사지 로봇 프레임워크를 제안하고, 이를 평가하기 위한 대규모 멀티모달 데이터셋 MedMassage-12K 와 벤치마크를 구축하여 실증 실험을 통해 그 유효성을 입증했습니다.

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng ZhangWed, 11 Ma💻 cs