cs.RO 편의 논문 | Gist.Science

ICLR: In-Context Imitation Learning with Visual Reasoning

이 논문은 시뮬레이션 및 실제 환경에서 복잡한 작업의 성공률과 일반화 성능을 향상시키기 위해, 예상되는 로봇 궤적을 이미지 공간의 시각적 추론 흔적으로 증강하고 이를 행동 예측과 통합 학습하는 새로운 프레임워크인 '시각적 추론이 포함된 컨텍스트 모방 학습 (ICLR)'을 제안합니다.

Toan Nguyen, Weiduo Yuan, Songlin Wei, Hui Li, Daniel Seita, Yue Wang2026-03-10💻 cs

ACCURATE: Arbitrary-shaped Continuum Reconstruction Under Robust Adaptive Two-view Estimation

이 논문은 X-ray 영상 기반의 임의 형태를 가진 가늘고 긴 연성 로봇 (예: 가이드와이어, 카테터) 의 3D 재구성을 위해, 이미지 분할 신경망과 기하학적制약을 결합한 ACCURATE 프레임워크를 제안하여 오차 1.0mm 미만의 높은 정확도와 복잡한 변형 및 가려짐에 대한 강인성을 달성했다고 요약할 수 있습니다.

Yaozhi Zhang, Shun Yu, Yugang Zhang, Yang Liu2026-03-10💻 cs

ReconDrive: Fast Feed-Forward 4D Gaussian Splatting for Autonomous Driving Scene Reconstruction

이 논문은 자율주행 시나리오에서 기존 4D 가우스 스플래팅의 느린 최적화 문제와 기존 피드포워드 방식의 낮은 화질을 해결하기 위해, VGGT 기반의 하이브리드 가우스 예측 헤더와 정적 - 동적 4D 구성 전략을 도입한 'ReconDrive'를 제안하여 빠르고 고품질의 4D 장면 재구성을 가능하게 합니다.

Haibao Yu, Kuntao Xiao, Jiahang Wang, Ruiyang Hao, Yuxin Huang, Guoran Hu, Haifang Qin, Bowen Jing, Yuntian Bo, Ping Luo2026-03-10💻 cs

Approximate Imitation Learning for Event-based Quadrotor Flight in Cluttered Environments

이 논문은 시뮬레이션에서 이벤트 카메라 데이터 렌더링의 계산 비용을 줄이기 위해 '근사 모방 학습 (Approximate Imitation Learning)' 프레임워크를 제안하여, 단일 이벤트 카메라만으로 복잡한 환경에서 최대 9.8m/s 의 속도로 드론을 비행할 수 있는 엔드 - 투 - 엔드 신경망 제어 정책을 개발했습니다.

Nico Messikommer, Jiaxu Xing, Leonard Bauersfeld, Marco Cannici, Elie Aljalbout, Davide Scaramuzza2026-03-10💻 cs

FeasibleCap: Real-Time Embodiment Constraint Guidance for In-the-Wild Robot Demonstration Collection

이 논문은 헤드셋이나 실제 로봇 하드웨어 없이도 그리퍼 인핸드 (gripper-in-hand) 데이터 수집 과정에서 실시간으로 도달 가능성, 관절 속도 제한, 충돌을 검증하여 실행 가능한 데모만 수집할 수 있도록 하는 'FeasibleCap' 시스템을 제안합니다.

Zi Yin, Fanhong Li, Yun Gui, Jia Liu2026-03-10💻 cs

Model-Based and Neural-Aided Approaches for Dog Dead Reckoning

이 논문은 생체 개와 로봇 개 모두에 적용 가능한 저비용 관성 센서 기반 위치 추정 방법인 '개 사선 항법 (DDR)'을 제안하며, DogMotion 장치로 수집한 데이터와 로봇 개 데이터를 통해 신경망 기반 방법이 기존 모델 기반 방법보다 10% 미만의 절대 거리 오차로 더 뛰어난 성능을 보임을 입증했습니다.

Gal Versano. Itai Savin, Itzik Klein2026-03-10💻 cs

SMAT: Staged Multi-Agent Training for Co-Adaptive Exoskeleton Control

이 논문은 인간의 보행 적응 과정을 단계적으로 반영한 '단계적 다중 에이전트 훈련 (SMAT)' 방식을 제안하여, 개별 사용자 재학습 없이도 다양한 피험자에게 일관된 보조와 양의 기계적 에너지를 제공하는 적응형 외골격 제어 정책을 성공적으로 개발하고 실험적으로 검증했습니다.

Yifei Yuan, Ghaith Androwis, Xianlian Zhou2026-03-10🤖 cs.LG

GeoLoco: Leveraging 3D Geometric Priors from Visual Foundation Model for Robust RGB-Only Humanoid Locomotion

이 논문은 시각 기반 모델 (VFM) 의 3D 기하학적 사전 지식을 활용하여 단일 RGB 이미지만으로 인간형 로봇의 강인한 보행 제어를 가능하게 하고, 시뮬레이션에서 실제 Unitree G1 로봇으로의 제로샷 전이 성공을 입증한 'GeoLoco' 프레임워크를 제안합니다.

Yufei Liu, Xieyuanli Chen, Hainan Pan, Chenghao Shi, Yanjie Chen, Kaihong Huang, Zhiwen Zeng, Huimin Lu2026-03-10💻 cs

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

이 논문은 시뮬레이션 기반 강화학습을 통해 인간 보행 시 생물학적 관절 모멘트를 감소시키는 외골격 제어 정책을 학습하고, 오픈소스 보행 데이터를 통해 훈련된 제어 네트워크의 토크 예측 정확도와 생체 역학적 일관성을 정량적으로 검증하는 프레임워크를 제시합니다.

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

PanoDP: Learning Collision-Free Navigation with Panoramic Depth and Differentiable Physics

이 논문은 4 개 시야의 팬로라마 깊이 정보와 미분 가능한 물리 기반 학습 신호를 결합하여, 부분 관측 하의 복잡한 환경에서도 단일 시야나 물리 가이드가 없는 기존 방법보다 충돌 없이 안전한 항해를 가능하게 하는 'PanoDP'라는 새로운 학습 프레임워크를 제안합니다.

Hao Zhong, Pei Chi, Jiang Zhao, Shenghai Yuan, Xuyang Gao, Thien-Minh Nguyen, Lihua Xie2026-03-10💻 cs

TempoFit: Plug-and-Play Layer-Wise Temporal KV Memory for Long-Horizon Vision-Language-Action Manipulation

TempoFit 는 학습이 필요 없는 레이어별 FIFO 키/값 메모리 및 프레임 간격 시간 편향을 활용하여 기존 비마르코프 장기 작업 환경에서 시각-언어-동작 (VLA) 정책의 추론 성능을 향상시키는 플러그 앤 플레이 방식의 시간적 메모리 솔루션입니다.

Jun Sun, Boyu Yang, Jiahao Zhang, Ning Ma, Chencheng Wu, Siqing Zhang, Yiou Huang, Qiufeng Wang, Shan Liang, Yaran Chen2026-03-10💻 cs

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

이 논문은 장기적 작업과 지속적 학습을 위한 기존 VLA 모델의 한계를 극복하기 위해, 기술 가이드 혼합 전문가 (SG-MoE) 를 활용한 확장 가능한 원자 기술 라이브러리와 유연한 라우팅 인코더를 통해 작업 계획, 원자 기술 추상화, 정밀 행동을 통합적으로 생성하는 'AtomicVLA' 프레임워크를 제안하고 그 우수성을 입증합니다.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs

Multi-Agent Off-World Exploration for Sparse Evidence Discovery via Gaussian Belief Mapping and Dual-Domain Coverage

이 논문은 희귀한 증거 탐지를 위해 가우시안 믿음 매핑과 이중 영역 커버리지를 기반으로 한 다중 에이전트 정보 경로 계획 프레임워크를 제안하며, 시뮬레이션된 달 환경에서 기존 방법보다 위험 인식과 제한된 통신 조건 하에서 더 뛰어난 탐지 성능과 안전성을 입증합니다.

Zhuoran Qiao, Tianxin Hu, Thien-Minh Nguyen, Shenghai Yuan2026-03-10💻 cs

DAISS: Phase-Aware Imitation Learning for Dual-Arm Robotic Ultrasound-Guided Interventions

본 논문은 초음파 유도 하의 바늘 삽입과 같은 비대칭적인 양손 협동 작업을 위해, 실시간 초음파 피드백과 위상 인식 모방 학습을 결합한 듀얼 암 로봇 시스템 DAISS 를 제안하고 제한된 전문가 시연 데이터로부터 정밀한 제어 전략을 학습할 수 있음을 입증합니다.

Feng Li, Pei Liu, Shiting Wang, Ning Wang, Zhongliang Jiang, Nassir Navab, Yuan Bi2026-03-10💻 cs

Low-Cost Teleoperation Extension for Mobile Manipulators

이 논문은 스마트폰, 리드 암, 발 페달 등 저비용 상용 하드웨어를 활용하여 고비용 장비 없이도 직관적이고 몰입감 있는 전체 신체 제어 및 시각적 피드백을 제공하는 오픈소스 모바일 양손 매니퓰레이터 원격조작 프레임워크를 제안하고, 이를 통해 키보드 기반 제어 대비 작업 수행 능력 향상과 인지 부하 감소를 입증했습니다.

Danil Belov, Artem Erkhov, Yaroslav Savotin, Tatiana Podladchikova, Pavel Osinenko2026-03-10💻 cs

UniUncer: Unified Dynamic Static Uncertainty for End to End Driving

이 논문은 정적 및 동적 환경 요소에 대한 불확실성을 통합적으로 추정하고 이를 계획 과정에 반영하여 종단간 자율주행의 신뢰성과 성능을 향상시키는 경량화된 프레임워크 'UniUncer'를 제안합니다.

Yu Gao, Jijun Wang, Zongzheng Zhang, Anqing Jiang, Yiru Wang, Yuwen Heng, Shuo Wang, Hao Sun, Zhangfeng Hu, Hao Zhao2026-03-10💻 cs

RoboPCA: Pose-centered Affordance Learning from Human Demonstrations for Robot Manipulation

이 논문은 인간 시연으로부터 3D 공간 정보와 손-물체 상호작용 패턴을 자동으로 추출하는 'Human2Afford' 파이프라인을 통해 구축된 데이터로, 접촉 영역과 접촉 자세를 instruction 에 기반하여 동시에 예측하는 'RoboPCA' 프레임워크를 제안하여 로봇 조작의 일반화 성능을 향상시킵니다.

Zhanqi Xiao, Ruiping Wang, Xilin Chen2026-03-10💻 cs

C $^2$ -Explorer: Contiguity-Driven Task Allocation with Connectivity-Aware Task Representation for Decentralized Multi-UAV Exploration

이 논문은 제한된 통신 환경에서 다중 UAV 탐사의 효율성을 극대화하기 위해, 연결성 인식 작업 표현과 연속성 기반 작업 할당 기법을 도입한 분산형 프레임워크인 C $^2$ -Explorer 를 제안하며, 이를 통해 탐사 시간과 이동 거리를 기존 최첨단 방법 대비 각각 43.1% 와 33.3% 단축하는 성과를 입증했습니다.

Xinlu Yan, Mingjie Zhang, Yuhao Fang, Yanke Sun, Jun Ma, Youmin Gong, Boyu Zhou, Jie Mei2026-03-10💻 cs

AeroPlace-Flow: Language-Grounded Object Placement for Aerial Manipulators via Visual Foresight and Object Flow

이 논문은 사전 정의된 좌표나 특정 작업 훈련 없이 자연어 지시를 통해 물체의 3D 기하학적 추론과 비전 예측을 결합하여 드론 매니퓰레이터가 언어 기반의 정확한 물체 배치를 수행할 수 있도록 하는 'AeroPlace-Flow' 프레임워크를 제안합니다.

Sarthak Mishra, Rishabh Dev Yadav, Naveen Nair, Wei Pan, Spandan Roy2026-03-10💻 cs

Directing the Robot: Scaffolding Creative Human-AI-Robot Interaction

이 논문은 로봇과 AI 를 단순히 자율적 존재가 아닌 인간의 창의성을 지속 가능하게 지원하고 통제할 수 있도록 돕는 '발판 (scaffolding)'으로 재정의하여, 인간이 실행 감독자로서 의도를 설정하고 AI 가 이를 로봇의 행동으로 매개하는 새로운 상호작용 패러다임을 제안합니다.

Jordan Aiko Deja, Isidro Butaslac, Nicko Reginio Caluya, Maheshya Weerasinghe2026-03-10💻 cs

← 이전 다음 →

cs.RO