Relational Semantic Reasoning on 3D Scene Graphs for Open World Interactive Object Search

이 논문은 오픈 월드 환경에서 객체 간 관계와 맥락을 이해하여 탐색을 효율화하기 위해, 대형 언어 모델의 관계적 지식을 경량 모델로 증류하여 3D 장면 그래프 기반의 실시간 상호작용적 객체 탐색 방법인 SCOUT 을 제안하고, 새로운 벤치마크 SymSearch 를 통해 그 유효성을 입증합니다.

Imen Mahdi, Matteo Cassinelli, Fabien Despinoy, Tim Welschehold, Abhinav Valada2026-03-09🤖 cs.AI

Contact-Grounded Policy: Dexterous Visuotactile Policy with Generative Contact Grounding

이 논문은 시뮬레이션과 실제 로봇에서 수집한 원격 조작 데이터를 바탕으로, 예측된 로봇 상태와 촉각 피드백을 일관성 매핑을 통해 제어기 실행 가능 목표로 변환함으로써 정교한 다관절 조작을 가능하게 하는 '접촉 기반 정책 (Contact-Grounded Policy)'을 제안합니다.

Zhengtong Xu, Yeping Wang, Ben Abbatematteo, Jom Preechayasomboon, Sonny Chan, Nick Colonnese, Amirhossein H. Memar2026-03-09💻 cs

Vision-Language System using Open-Source LLMs for Gestures in Medical Interpreter Robots

이 논문은 의료 통역 로봇을 위해 오픈 소스 LLM 과 프라이버시 보호형 비전 - 언어 프레임워크를 활용하여 임상 대화의 의도를 감지하고 자연스러운 제스처를 생성하는 시스템을 제안하며, 새로운 데이터셋을 통해 높은 정확도와 인간적인 제스처 생성 성능을 입증했습니다.

Thanh-Tung Ngo, Emma Murphy, Robert J. Ross2026-03-09💻 cs

Safe-Night VLA: Seeing the Unseen via Thermal-Perceptive Vision-Language-Action Models for Safety-Critical Manipulation

이 논문은 가시광선으로는 감지할 수 없는 열적 정보를 통합하고 제어 장벽 함수를 통해 안전성을 보장함으로써, 비정형 환경에서의 안전하고 견고한 로봇 조작을 가능하게 하는 멀티모달 프레임워크인 'Safe-Night VLA'를 제안하고 실증합니다.

Dian Yu, Qingchuan Zhou, Bingkun Huang, Majid Khadiv, Zewen Yang2026-03-09💻 cs

EmboAlign: Aligning Video Generation with Compositional Constraints for Zero-Shot Manipulation

이 논문은 비전 - 언어 모델 (VLM) 이 생성한 구조화된 공간 제약 조건을 활용하여 사전 학습된 비디오 생성 모델의 물리적으로 비현실적인 출력과 기하학적 재매핑 오차를 보정함으로써, 별도의 작업별 학습 데이터 없이도 로봇 조작의 성공률을 획기적으로 향상시키는 'EmboAlign' 프레임워크를 제안합니다.

Gehao Zhang, Zhenyang Ni, Payal Mohapatra, Han Liu, Ruohan Zhang, Qi Zhu2026-03-09💻 cs

Multi-Robot Trajectory Planning via Constrained Bayesian Optimization and Local Cost Map Learning with STL-Based Conflict Resolution

이 논문은 신호 시계열 논리 (STL) 명세와 운동역학적 제약을 고려한 다중 로봇 경로 계획 문제를 해결하기 위해, 국소 비용 지도 학습을 위한 제약 조건 베이지안 최적화 기반 트리 탐색 (cBOT) 과 STL 기반 충돌 해결을 통합한 2 단계 프레임워크를 제안하고 실제 수면 차량 실험을 통해 그 유효성을 입증합니다.

Sourav Raxit, Abdullah Al Redwan Newaz, Jose Fuentes, Paulo Padrao, Ana Cavalcanti, Leonardo Bobadilla2026-03-09💻 cs

Task-Level Decisions to Gait Level Control: A Hierarchical Policy Approach for Quadruped Navigation

이 논문은 시뮬레이션과 현실 간의 격차와 환경 변화에 따른 불안정성을 해결하기 위해, 고수준의 의사결정과 저수준의 보행 제어를 연결하는 계층적 정책 아키텍처 'TDGC'를 제안하여 다양한 지형에서의 네비게이션 성공률을 향상시키는 방법을 제시합니다.

Sijia Li, Haoyu Wang, Shenghai Yuan, Yizhuo Yang, Thien-Minh Nguyen2026-03-09💻 cs

OpenHEART: Opening Heterogeneous Articulated Objects with a Legged Manipulator

이 논문은 다양한 관절형 물체의 개폐를 위해 핸들 및 패널 기하학을 저차원 특징으로 인코딩하는 SAFE 와 관절 정보를 추정하는 ArtIEst 를 도입하여, 보행형 매니퓰레이터의 이종 관절형 물체 조작을 위한 강인하고 샘플 효율적인 프레임워크를 제안합니다.

Seonghyeon Lim, Hyeonwoo Lee, Seunghyun Lee, I Made Aswin Nahrendra, Hyun Myung2026-03-09💻 cs

Terrain characterization and locomotion adaptation in a small-scale lizard-inspired robot

이 논문은 다양한 깊이의 입자 매질을 극복하기 위해 관절 토크와 같은 고유 감각 신호를 기반으로 입자 깊이를 추정하고, 이를 선형 피드백 제어기에 반영하여 소형 도마뱀 로봇 (SILA Bot) 의 지형 적응 주행 성능을 획기적으로 향상시킨 통합 프레임워크를 제시합니다.

Duncan Andrews, Landon Zimmerman, Evan Martin, Joe DiGennaro, Baxi Chong2026-03-09💻 cs

Expert Knowledge-driven Reinforcement Learning for Autonomous Racing via Trajectory Guidance and Dynamics Constraints

이 논문은 자율 레이싱 환경에서 학습 불안정성과 안전성 문제를 해결하기 위해 전문가 주행 궤적과 제어 장벽 함수 기반의 동역학 제약을 결합한 'TraD-RL' 방법을 제안하며, 이를 통해 주행 속도와 안정성을 동시에 향상시키는 것을 입증했습니다.

Bo Leng, Weiqi Zhang, Zhuoren Li, Lu Xiong, Guizhe Jin, Ran Yu, Chen Lv2026-03-09💻 cs

DexEMG: Towards Dexterous Teleoperation System via EMG2Pose Generalization

이 논문은 시각 기반 시스템이나 기계식 외골격의 한계를 극복하고, 표면 근전도 (sEMG) 신호를 실시간으로 손 동작으로 변환하는 'EMG2Pose' 신경망과 강건한 손 재할당 알고리즘을 통해 개인별 재보정 없이도 다양한 환경에서 고도화된 원격 조작이 가능한 경량·저비용 시스템 'DexEMG'를 제안합니다.

Qianyou Zhao, Wenqiao Li, Chiyu Wang, Kaifeng Zhang2026-03-09💻 cs

AnyCamVLA: Zero-Shot Camera Adaptation for Viewpoint Robust Vision-Language-Action Models

이 논문은 추가 데이터나 미세 조정 없이 실시간으로 테스트 시 카메라 관점을 학습 설정에 맞춰 가상으로 변환하는 제로샷 적응 프레임워크를 제안하여, 시점 변화에 강한 비전 - 언어 - 행동 모델을 구축하는 방법을 제시합니다.

Hyeongjun Heo, Seungyeon Woo, Sang Min Kim, Junho Kim, Junho Lee, Yonghyeon Lee, Young Min Kim2026-03-09💻 cs

Systematic Evaluation of Novel View Synthesis for Video Place Recognition

이 논문은 5 개의 공개 데이터베이스와 7 가지 이미지 유사성 방법을 활용하여 비디오 장소 인식 (VPR) 에서 합성된 새로운 시점의 효과를 체계적으로 평가한 결과, 소규모 추가 시에는 시점 변화가 인식 성능을 향상시키지만 대규모 추가 시에는 추가된 뷰의 수와 데이터셋의 이미지 유형이 시점 변화 크기보다 더 중요한 영향을 미친다는 것을 밝혔습니다.

Muhammad Zawad Mahmud, Samiha Islam, Damian Lyons2026-03-09💻 cs

Iterative Convex Optimization with Control Barrier Functions for Obstacle Avoidance among Polytopes

이 논문은 다면체 로봇이 다면체 장애물을 정확히 피하기 위해 지지 초평면을 기반으로 선형 이산 제어 장벽 함수를 유도하고, 이를 반복적 볼록 최적화 프레임워크에 통합하여 비선형 동역학 시스템의 실시간 안전 제어 및 궤적 계획을 가능하게 하는 새로운 방법을 제안합니다.

Shuo Liu, Zhe Huang, Calin A. Belta2026-03-09💻 cs