VISO: Robust Underwater Visual-Inertial-Sonar SLAM with Photometric Rendering for Dense 3D Reconstruction

이 논문은 스테레오 카메라, IMU, 3D 소나를 융합하고 외부 파라미터 보정 및 광도 렌더링 기법을 도입하여 수중 환경에서 강인한 6 자유도 국소화와 고품질 밀도 3D 재구성을 실현하는 'VISO'라는 SLAM 시스템을 제안합니다.

Shu Pan, Simon Archieri, Ahmet Cinar, Jonatan Scharff Willners, Ignacio Carlucho, Yvan Petillot2026-03-09💻 cs

(MGS)2^2-Net: Unifying Micro-Geometric Scale and Macro-Geometric Structure for Cross-View Geo-Localization

이 논문은 UAV 의 지리 위치 추정에서 oblique aerial view 와 orthographic satellite view 간의 기하학적 불일치를 해결하기 위해, 수직 파사드 노이즈를 필터링하는 매크로 기하 구조 필터링과 깊이 기반의 미세 기하 스케일 적응 모듈을 통합한 (MGS)2^2-Net 을 제안하여 University-1652 와 SUES-200 데이터셋에서 최첨단 성능을 달성함을 보여줍니다.

Minglei Li, Mengfan He, Chunyu Li, Chao Chen, Xingyu Shao, Ziyang Meng2026-03-09💻 cs

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

이 논문은 독점 로봇 인터페이스 없이도 시간 동기화된 다중 모달 데이터를 수집할 수 있는 오픈소스 시스템 'MiDAS'와 이를 통해 구축된 로봇 보조 최소 침습 수술용 데이터셋을 소개하며, 비침습적 센서 기반의 동작 인식 성능이 독점 텔레메트리와 유사함을 입증했습니다.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

Beyond Imitation: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

이 논문은 시뮬레이션과 현실 데이터를 혼합한 강화학습 기반 공동 학습 (RL-Co) 프레임워크를 제안하여, 기존 지도 미세 조정 방식의 한계를 극복하고 VLA 모델의 실세계 작업 성공률과 일반화 성능을 크게 향상시키는 방법을 제시합니다.

Liangzhi Shi, Shuaihang Chen, Feng Gao, Yinuo Chen, Kang Chen, Tonghe Zhang, Hongzhi Zang, Weinan Zhang, Chao Yu, Yu Wang2026-03-09💻 cs

Learning Robust Control Policies for Inverted Pose on Miniature Blimp Robots

이 논문은 고충실도 시뮬레이션 환경 구축, 도메인 랜덤화 기반의 개선된 TD3 알고리즘을 활용한 제어 정책 학습, 그리고 시뮬레이션과 현실 간의 격차를 해소하는 매핑 계층 도입이라는 세 단계 프레임워크를 통해 소형 블림프 로봇이 현실 세계에서 역전 자세를 안정적으로 달성하고 유지할 수 있도록 하는 강인한 제어 정책을 제안합니다.

Yuanlin Yang, Lin Hong, Fumin Zhang2026-03-09💻 cs

ProFocus: Proactive Perception and Focused Reasoning in Vision-and-Language Navigation

이 논문은 기존 방법의 비효율적인 지각과 비집중적 추론 문제를 해결하기 위해 LLM 과 VLM 의 협업을 통해 능동적 지각과 집중적 추론을 통합한 훈련 없는 프레임워크 'ProFocus'를 제안하며, R2R 과 REVERIE 벤치마크에서 제로샷 성능을 최고 수준으로 달성했습니다.

Wei Xue, Mingcheng Li, Xuecheng Wu, Jingqun Tang, Dingkang Yang, Lihua Zhang2026-03-09💻 cs

Digital-Twin Losses for Lane-Compliant Trajectory Prediction at Urban Intersections

이 논문은 V2X 환경의 신호등 교차로에서 차량과 인프라의 협력적 인식을 활용하고, 디지털 트윈의 제약 조건을 반영한 새로운 '트윈 손실 (twin loss)'을 도입하여 교통 규칙 위반과 충돌을 줄이면서도 정확한 다중 에이전트 궤적 예측을 가능하게 하는 시스템을 제안합니다.

Kuo-Yi Chao, Erik Leo Haß, Melina Gegg, Jiajie Zhang, Ralph Raßhofer, Alois Christian Knoll2026-03-09💻 cs

TEGA: A Tactile-Enhanced Grasping Assistant for Assistive Robotics via Sensor Fusion and Closed-Loop Haptic Feedback

이 논문은 EMG 기반 의도-힘 추론과 비전-촉각 센서 융합을 통해 실시간 진동 촉각 피드백을 제공하는 폐루프 보조 원격 조작 프레임워크인 TEGA 를 제안하여, 상지 장애인이 다양한 물체를 안정적으로 조작할 수 있도록 힘 조절을 용이하게 함을 보여줍니다.

Hengxu You, Tianyu Zhou, Fang Xu, Kaleb Smith, Eric Jing Du2026-03-09💻 cs

PRISM: Personalized Refinement of Imitation Skills for Manipulation via Human Instructions

이 논문은 자연어 지시와 인간 피드백을 활용하여 시뮬레이션된 조작 작업에서 모방 학습 정책을 강화 학습으로 정제하는 'PRISM' 프레임워크를 제안함으로써, 새로운 목표와 제약 조건에 대한 정책의 재사용성과 데이터 효율성을 높이고 배포 강건성을 개선하는 방법을 제시합니다.

Arnau Boix-Granell, Alberto San-Miguel-Tello, Magí Dalmau-Moreno, Néstor García2026-03-09🤖 cs.AI

From Decoupled to Coupled: Robustness Verification for Learning-based Keypoint Detection with Joint Specifications

이 논문은 기존 방법론이 개별적으로 검증하여 보수적인 결과를 초래했던 한계를 극복하고, 혼합 정수 선형 계획법 (MILP) 을 활용하여 모든 키포인트 간의 상호 의존성과 결합된 편차를 동시에 검증함으로써 학습 기반 키포인트 검출기의 강건성을 최초로 보장하는 새로운 프레임워크를 제안합니다.

Xusheng Luo, Changliu Liu2026-03-09🤖 cs.LG

RACAS: Controlling Diverse Robots With a Single Agentic System

이 논문은 자연어 기반의 협력적 에이전트 아키텍처인 RACAS 를 제안하여, 소스 코드나 모델 재학습 없이 다양한 로봇 플랫폼 간에 고수준 자율 행동을 가능하게 함으로써 로봇 프로토타이핑의 장벽을 획기적으로 낮췄음을 보여줍니다.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

RFM-HRI : A Multimodal Dataset of Medical Robot Failure, User Reaction and Recovery Preferences for Item Retrieval Tasks

이 논문은 의료 환경에서 로봇의 다양한 실패 유형에 대한 사용자의 다중 모달 반응과 복구 선호도를 체계적으로 분석하기 위해 고안된 'RFM-HRI'라는 새로운 다중 모달 데이터셋을 소개하고, 실패가 사용자의 정서와 통제감에 미치는 부정적 영향을 규명하여 안전이 중요한 로봇 상호작용의 실패 감지 및 복구 방법론 개발에 기여합니다.

Yashika Batra, Giuliano Pioldi, Promise Ekpo, Arman Sayatqyzy, Purnjay Maruur, Shalom Otieno, Kevin Ching, Angelique Taylor2026-03-09💻 cs

Relational Semantic Reasoning on 3D Scene Graphs for Open World Interactive Object Search

이 논문은 오픈 월드 환경에서 객체 간 관계와 맥락을 이해하여 탐색을 효율화하기 위해, 대형 언어 모델의 관계적 지식을 경량 모델로 증류하여 3D 장면 그래프 기반의 실시간 상호작용적 객체 탐색 방법인 SCOUT 을 제안하고, 새로운 벤치마크 SymSearch 를 통해 그 유효성을 입증합니다.

Imen Mahdi, Matteo Cassinelli, Fabien Despinoy, Tim Welschehold, Abhinav Valada2026-03-09🤖 cs.AI