MEM: Multi-Scale Embodied Memory for Vision Language Action Models

이 논문은 로봇이 장기적 추상 개념과 단기적 구체적 사건을 모두 포착할 수 있도록 텍스트 기반 장기 기억과 비디오 기반 단기 기억을 결합한 'MEM(Multi-Scale Embodied Memory)'을 제안하여, 15 분까지 이어지는 복잡한 장기 작업 수행과 맥락에 따른 지능적 전략 적응을 가능하게 합니다.

Marcel Torne, Karl Pertsch, Homer Walke + 14 more2026-03-05🤖 cs.LG

UrbanHuRo: A Two-Layer Human-Robot Collaboration Framework for the Joint Optimization of Heterogeneous Urban Services

이 논문은 배달과 도시 감지라는 이질적인 도시 서비스를 공동 최적화하기 위해 인간과 로봇의 협력을 위한 2 층 프레임워크인 'UrbanHuRo'를 제안하고, 이를 통해 감지 커버리지와 배달원 소득을 각각 29.7% 와 39.2% 향상시키며 지연 주문을 획기적으로 줄인다는 것을 입증했습니다.

Tonmoy Dey, Lin Jiang, Zheng Dong + 1 more2026-03-05🤖 cs.AI

Large-Language-Model-Guided State Estimation for Partially Observable Task and Motion Planning

이 논문은 부분 관측 가능한 환경에서 작업 및 운동 계획 문제를 해결하기 위해 대규모 언어 모델 (LLM) 의 상식 추론 능력을 활용하여 상태 추정을 개선한 'CoCo-TAMP' 프레임워크를 제안하며, 이를 통해 시뮬레이션 및 실제 환경에서 계획 및 실행 시간을 크게 단축하는 성과를 입증했습니다.

Yoonwoo Kim, Raghav Arora, Roberto Martín-Martín + 3 more2026-03-05🤖 cs.AI

HALyPO: Heterogeneous-Agent Lyapunov Policy Optimization for Human-Robot Collaboration

이 논문은 인간과 로봇 간의 합리적 격차로 인한 학습 불안정성을 해결하기 위해, 매 단계의 Lyapunov 감소 조건을 정책 파라미터 공간에 적용하여 분산 정책 학습의 안정성을 보장하는 'HALyPO'를 제안하고 이를 통해 인간 - 로봇 협업의 일반화 및 강건성을 향상시켰음을 보여줍니다.

Hao Zhang, Yaru Niu, Yikai Wang + 2 more2026-03-05🤖 cs.AI

RAGNav: A Retrieval-Augmented Topological Reasoning Framework for Multi-Goal Visual-Language Navigation

이 논문은 다중 목표 시각 - 언어 내비게이션에서 공간 환각과 계획 편향을 해결하기 위해 저수준 토폴로지 지도와 고수준 의미적 숲을 통합한 '이중 기반 메모리' 시스템을 도입하여, 앵커 기반 조건부 검색과 토폴로지 이웃 점수 전파 메커니즘을 통해 목표 간 도달성 추론 및 순차적 계획 효율성을 극대화한 RAGNav 프레임워크를 제안합니다.

Ling Luo, Qiangian Bai2026-03-05🤖 cs.AI

Interaction-Aware Whole-Body Control for Compliant Object Transport

이 논문은 비정형 환경에서의 협동 물체 운반을 위해 상체의 상호작용 실행과 하체의 지지 제어를 구조적으로 분리하고, 시뮬레이션 기반 강화학습과 비대칭 교사 - 학생 증류법을 통해 proprioception 만으로 작동하는 생체모방형 상호작용 지향 전신 제어 (IO-WBC) 를 제안하여 안정적이고 순응적인 물체 운반을 가능하게 합니다.

Hao Zhang, Yves Tseng, Ding Zhao + 1 more2026-03-05🤖 cs.AI

Cognition to Control - Multi-Agent Learning for Human-Humanoid Collaborative Transport

이 논문은 인간의 의도를 접촉 안정성과 물리적 제약 하의 전신 운동으로 변환하기 위해, 비전 - 언어 - 행동 (VLA) 기반의 상황 인식, 분산형 다중 에이전트 강화학습을 통한 고차원적 의사결정, 그리고 전신 제어 계층을 통합한 '인지에서 제어 (C2C)' 계층적 프레임워크를 제안하여 인간 - 휴머노이드 협업 운반의 성공률과 견고성을 향상시킵니다.

Hao Zhang, Ding Zhao, H. Eric Tseng2026-03-05🤖 cs.AI

Pretrained Vision-Language-Action Models are Surprisingly Resistant to Forgetting in Continual Learning

이 논문은 사전 훈련된 대규모 비전 - 언어 - 행동 (VLA) 모델이 기존 작은 모델에 비해 단순한 경험 재생 (Experience Replay) 만으로도 과거 기술의 망각에 놀라울 정도로 강건하며, 성능 저하 중에도 관련 지식을 유지하여 미세 조정을 통해 빠르게 재학습할 수 있음을 보여줍니다.

Huihan Liu, Changyeon Kim, Bo Liu + 2 more2026-03-05🤖 cs.AI

Self-adapting Robotic Agents through Online Continual Reinforcement Learning with World Model Feedback

이 논문은 DreamerV3 기반의 세계 모델 예측 잔차를 활용하여 분포 외 이벤트를 감지하고 자동 미세 조정을 수행함으로써, 생물학적 영감을 받아 배포 중에도 스스로 적응하고 개선할 수 있는 온라인 지속적 강화 학습 로봇 에이전트 프레임워크를 제안하고 검증합니다.

Fabian Domberg, Georg Schildbach2026-03-05🤖 cs.AI

SaFeR: Safety-Critical Scenario Generation for Autonomous Driving Test via Feasibility-Constrained Token Resampling

이 논문은 자율주행 시스템 평가를 위해 물리적 실현 가능성과 행동적 현실성을 유지하면서 적대적 위험 시나리오를 생성하는 새로운 방법론인 SaFeR 을 제안하며, 이를 통해 기존 접근법의 한계를 극복하고 Waymo 및 nuPlan 데이터셋에서 우수한 성능을 입증했습니다.

Jinlong Cui, Fenghua Liang, Guo Yang + 2 more2026-03-05🤖 cs.AI

PRAM-R: A Perception-Reasoning-Action-Memory Framework with LLM-Guided Modality Routing for Adaptive Autonomous Driving

이 논문은 LLM 기반의 모달리티 라우팅과 계층적 기억 모듈을 통합한 PRAM-R 프레임워크를 제안하여, 자율주행 시 불필요한 센서 활성화를 줄이면서도 복잡한 도시 환경에서 정밀한 주행 성능을 유지하는 적응형 다중 모달 인식 시스템을 제시합니다.

Yi Zhang, Xian Zhang, Saisi Zhao + 4 more2026-03-05🤖 cs.AI

VANGUARD: Vehicle-Anchored Ground Sample Distance Estimation for UAVs in GPS-Denied Environments

본 논문은 GPS 가 차단된 환경에서 자율 항공 로봇이 절대적 거리 척도를 회복하기 위해 차량을 지상 샘플 거리 (GSD) 추정을 위한 앵커로 활용하는 경량화 결정론적 도구인 VANGUARD 를 제안하며, 이를 통해 대규모 언어 모델 기반 에이전트의 공간적 환각을 줄이고 안전한 물리적 추론을 가능하게 함을 보여줍니다.

Yifei Chen, Xupeng Chen, Feng Wang + 2 more2026-03-05🤖 cs.AI

RoboCasa365: A Large-Scale Simulation Framework for Training and Benchmarking Generalist Robots

이 논문은 가정용 모바일 매니퓰레이션 로봇의 일반화 능력을 체계적으로 평가하고 연구하기 위해 365 가지 일상 작업, 2,500 개의 다양한 주방 환경, 그리고 방대한 인간 및 합성 시연 데이터를 포함한 대규모 시뮬레이션 벤치마크 'RoboCasa365'를 제안하고 이를 통해 일반 로봇 정책의 성능에 영향을 미치는 핵심 요인들을 분석합니다.

Soroush Nasiriany, Sepehr Nasiriany, Abhiram Maddukuri + 1 more2026-03-05🤖 cs.AI