RehearseVLA: Simulated Post-Training for VLAs with Physically-Consistent World Model

이 논문은 물리적 상호작용의 한계와 데이터 부족 문제를 해결하기 위해 물리적으로 일관된 세계 모델과 비전 - 언어 기반 반사기를 활용한 시뮬레이션 기반 강화학습 프레임워크 'RehearseVLA'를 제안하며, 이를 통해 소수의 전문가 시연만으로 VLA 모델의 성능을 크게 향상시킬 수 있음을 보여줍니다.

Junjin Xiao, Yandan Yang, Xinyuan Chang + 5 more2026-03-05💻 cs

LaViRA: Language-Vision-Robot Actions Translation for Zero-Shot Vision Language Navigation in Continuous Environments

LaViRA 는 고수준 계획, 중수준 지각, 저수준 제어를 계층적으로 분해하여 다양한 규모의 멀티모달 대규모 언어 모델 (MLLM) 의 강점을 활용함으로써, 사전 학습 없이도 미지의 환경에서 자연어 지시를 따라 이동하는 제로샷 비전 - 언어 내비게이션의 성능을 획기적으로 향상시킵니다.

Hongyu Ding, Ziming Xu, Yudong Fang + 6 more2026-03-05💻 cs

SoraNav: Adaptive UAV Task-Centric Navigation via Zeroshot VLM Reasoning

이 논문은 3D 공간 추론이 부족한 제로샷 VLM 의 한계를 극복하기 위해 3D 기하학적 사전 지식을 시각 입력에 통합하는 다중 모달 시각 주석 (MVA) 과 탐사 기록을 기반으로 한 적응형 의사결정 (ADM) 전략을 제안하여, 무인 항공기 (UAV) 의 자연어 기반 자율 항법을 혁신적으로 개선한 'SoraNav' 프레임워크를 소개합니다.

Hongyu Song, Rishabh Dev Yadav, Cheng Guo + 1 more2026-03-05💻 cs

Metric, inertially aligned monocular state estimation via kinetodynamic priors

이 논문은 다층 퍼셉트론을 활용한 변형 - 힘 모델과 연속 시간 B-스플라인 운동학 모델을 통합하여 강체 가정을 위반하는 유연한 로봇 시스템에서도 견고한 상태 추정과 단안 시각 오도메트리에서 일반적으로 해결하기 어려운 척도 및 중력 복원을 가능하게 하는 새로운 방법을 제시합니다.

Jiaxin Liu, Min Li, Wanting Xu + 3 more2026-03-05💻 cs

Agile Flight Emerges from Multi-Agent Competitive Racing

이 논문은 다중 에이전트 간 경쟁과 희소한 '경쟁 승리'라는 고수준 목표만으로 강화학습을 통해 에이전트가 물리적 한계를 넘나드는 민첩한 비행과 전략적 행동을 스스로 습득하며, 기존 단일 에이전트 훈련 방식보다 시뮬레이션에서 실세계로의 전이 성능과 일반화 능력이 뛰어나다는 것을 증명합니다.

Vineet Pasumarti, Lorenzo Bianchi, Antonio Loquercio2026-03-05🤖 cs.AI

TOLEBI: Learning Fault-Tolerant Bipedal Locomotion via Online Status Estimation and Fallibility Rewards

이 논문은 시뮬레이션에서 다양한 고장을 학습하고 실시간 상태 추정 모듈을 통해 실제 로봇에 적용하는 TOLEBI 프레임워크를 제안하여, 인간형 로봇의 보행 중 발생할 수 있는 하드웨어 고장 및 외부 방해 요인을 견딜 수 있는 최초의 학습 기반 내결함성 locomotion 방법을 제시합니다.

Hokyun Lee, Woo-Jeong Baek, Junhyeok Cha + 1 more2026-03-05💻 cs

FlowCorrect: Efficient Interactive Correction of Generative Flow Policies for Robotic Manipulation

이 논문은 배포 시 발생하는 분포 변화로 인한 실패를 인간이 제공하는 희소하고 상대적인 수정 명령을 통해 재학습 없이 실시간으로 보정할 수 있는 모듈형 상호작용 학습 방법인 FlowCorrect 를 제안하고, 실제 로봇 작업에서 높은 성공률과 기존 성능 유지 효과를 입증합니다.

Edgar Welte, Yitian Shi, Rosa Wolf + 2 more2026-03-05🤖 cs.LG

Phys4D: Fine-Grained Physics-Consistent 4D Modeling from Video Diffusion

본 논문은 비디오 확산 모델에서 물리적으로 일관된 4D 세계 표현을 학습하기 위해 3 단계 훈련 패러다임 (대규모 의사지도 사전 학습, 시뮬레이션 기반 지도 미세 조정, 시뮬레이션 기반 강화 학습) 을 도입하고, 기존 외관 기반 모델보다 정교한 물리 일관성을 달성하는 'Phys4D'를 제안합니다.

Haoran Lu, Shang Wu, Jianshu Zhang + 9 more2026-03-05🤖 cs.AI

Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization

이 논문은 Factor Graph Optimization(FGO) 프레임워크를 활용한 GNSS 와 IMU 의 느슨한 결합 아키텍처를 제안하여, 도시 환경에서 실시간 운영과 서비스 가용성을 향상시키는 대신 위치 정확도가 일부 저하되는 정확도, 가용성, 계산 효율성 간의 트레이드오프를 분석합니다.

Radu-Andrei Cioaca, Cristian Rusu, Paul Irofti + 3 more2026-03-05🤖 cs.LG