Fine-Tuning Robot Policies While Maintaining User Privacy
이 논문은 로봇이 사용자의 개인적 취향을 반영하도록 미세 조정하면서도 외부 에이전트로부터 학습된 데이터를 보호하기 위해, 각 사용자의 고유 키를 이용해 로봇 정책의 가중치를 수학적으로 변환하는 'PRoP'이라는 모델-중립 프레임워크를 제안합니다.
867 편의 논문
이 논문은 로봇이 사용자의 개인적 취향을 반영하도록 미세 조정하면서도 외부 에이전트로부터 학습된 데이터를 보호하기 위해, 각 사용자의 고유 키를 이용해 로봇 정책의 가중치를 수학적으로 변환하는 'PRoP'이라는 모델-중립 프레임워크를 제안합니다.
이 논문은 카테고리 수준의 객체 사전 정보와 RGB-D 이미지를 활용하여 1 밀리초 미만의 시간 내에 객체의 모양과 자세를 추정하고 전역 최적성 증명을 제공하는 초고속 국소 솔버를 제안합니다.
이 논문은 물리적 상호작용의 한계와 데이터 부족 문제를 해결하기 위해 물리적으로 일관된 세계 모델과 비전 - 언어 기반 반사기를 활용한 시뮬레이션 기반 강화학습 프레임워크 'RehearseVLA'를 제안하며, 이를 통해 소수의 전문가 시연만으로 VLA 모델의 성능을 크게 향상시킬 수 있음을 보여줍니다.
ELMUR 은 각 레이어가 LRU 기반의 외부 메모리를 통해 장기 의존성을 효과적으로 관리하도록 설계된 트랜스포머 아키텍처로, 부분 관측성과 긴 시간 범위를 가진 복잡한 로봇 제어 및 의사결정 과제에서 기존 방법론을 크게 능가하는 성능을 입증했습니다.
이 논문은 비전 - 언어 모델이 외부 도구를 활용해 정밀한 기하학적 계산을 수행할 수 있도록 하는 TIGeR 프레임워크와 대규모 데이터셋을 제안하여 로봇 조작 작업에서 센티미터 단위의 정밀도를 달성했다고 요약할 수 있습니다.
LaViRA 는 고수준 계획, 중수준 지각, 저수준 제어를 계층적으로 분해하여 다양한 규모의 멀티모달 대규모 언어 모델 (MLLM) 의 강점을 활용함으로써, 사전 학습 없이도 미지의 환경에서 자연어 지시를 따라 이동하는 제로샷 비전 - 언어 내비게이션의 성능을 획기적으로 향상시킵니다.
이 논문은 3D 공간 추론이 부족한 제로샷 VLM 의 한계를 극복하기 위해 3D 기하학적 사전 지식을 시각 입력에 통합하는 다중 모달 시각 주석 (MVA) 과 탐사 기록을 기반으로 한 적응형 의사결정 (ADM) 전략을 제안하여, 무인 항공기 (UAV) 의 자연어 기반 자율 항법을 혁신적으로 개선한 'SoraNav' 프레임워크를 소개합니다.
이 논문은 FMCW 라이다의 도플러 속도를 활용하여 동적 환경에서도 강건한 오도메트리를 가능하게 하는 'Dynamic-ICP'라는 새로운 정합 프레임워크를 제안하고, 기존 방법들보다 회전 안정성과 이동 정확도를 크게 향상시킴을 실험을 통해 입증합니다.
이 논문은 다층 퍼셉트론을 활용한 변형 - 힘 모델과 연속 시간 B-스플라인 운동학 모델을 통합하여 강체 가정을 위반하는 유연한 로봇 시스템에서도 견고한 상태 추정과 단안 시각 오도메트리에서 일반적으로 해결하기 어려운 척도 및 중력 복원을 가능하게 하는 새로운 방법을 제시합니다.
이 논문은 인간과 상호작용하는 로봇을 위해 단일 계층적 예측 부호화 순환 신경망 (CERNet) 을 통해 실시간 운동 생성, 관찰 행동의 의도 인식, 그리고 인식 신뢰도 추정을 통합한 모델을 제안하고 인간형 로봇 실험을 통해 그 유효성을 입증합니다.
이 논문은 다중 에이전트 간 경쟁과 희소한 '경쟁 승리'라는 고수준 목표만으로 강화학습을 통해 에이전트가 물리적 한계를 넘나드는 민첩한 비행과 전략적 행동을 스스로 습득하며, 기존 단일 에이전트 훈련 방식보다 시뮬레이션에서 실세계로의 전이 성능과 일반화 능력이 뛰어나다는 것을 증명합니다.
이 논문은 시뮬레이션에서 다양한 고장을 학습하고 실시간 상태 추정 모듈을 통해 실제 로봇에 적용하는 TOLEBI 프레임워크를 제안하여, 인간형 로봇의 보행 중 발생할 수 있는 하드웨어 고장 및 외부 방해 요인을 견딜 수 있는 최초의 학습 기반 내결함성 locomotion 방법을 제시합니다.
이 논문은 외부 모션 캡처 없이 onboard 센서만으로 접촉 인식 비전 - 관성 주행 추정 (VIO) 과 이미지 기반 시각 서보, 하이브리드 힘 - 운동 제어를 결합하여 UAV 의 접촉 기반 작업 정확도와 안정성을 크게 향상시킨 완전 onboard 인식 - 제어 파이프라인을 제안합니다.
이 논문은 심볼릭 추론의 장기적 견고성과 시각적 기반을 통합하여 장거리 작업에서 오류 누적을 완화하고 로봇의 실행을 강화하는 계층적 세계 모델 (H-WM) 을 제안합니다.
이 논문은 모델 파라미터를 업데이트하지 않고도 실시간 상호작용을 통해 물리 원리를 학습하고 가설을 검증하여 적용함으로써 VLM 로봇 플래너의 객체 조작 능력을 향상시키는 'PhysMem'이라는 메모리 프레임워크를 제안합니다.
이 논문은 배포 시 발생하는 분포 변화로 인한 실패를 인간이 제공하는 희소하고 상대적인 수정 명령을 통해 재학습 없이 실시간으로 보정할 수 있는 모듈형 상호작용 학습 방법인 FlowCorrect 를 제안하고, 실제 로봇 작업에서 높은 성공률과 기존 성능 유지 효과를 입증합니다.
이 논문은 제트슨 오린 하드웨어에서 4 비트 양자화와 llama.cpp 런타임을 활용하여 오프라인으로 6.6Hz 의 저지연 추론이 가능한 임베디드 로봇용 경량화 온디바이스 VLA 파이프라인인 LiteVLA-Edge 를 제안합니다.
이 논문은 강화 학습 기반의 적응형 탐색 전략과 실제 지형 데이터를 결합한 다중 에이전트 시뮬레이션 프레임워크를 제안하여, 불규칙한 지형 환경에서 고고학적 이동 패턴과 다양한 운송 수단의 상호작용을 효율적으로 재현하고 분석하는 방법을 제시합니다.
본 논문은 비디오 확산 모델에서 물리적으로 일관된 4D 세계 표현을 학습하기 위해 3 단계 훈련 패러다임 (대규모 의사지도 사전 학습, 시뮬레이션 기반 지도 미세 조정, 시뮬레이션 기반 강화 학습) 을 도입하고, 기존 외관 기반 모델보다 정교한 물리 일관성을 달성하는 'Phys4D'를 제안합니다.
이 논문은 Factor Graph Optimization(FGO) 프레임워크를 활용한 GNSS 와 IMU 의 느슨한 결합 아키텍처를 제안하여, 도시 환경에서 실시간 운영과 서비스 가용성을 향상시키는 대신 위치 정확도가 일부 저하되는 정확도, 가용성, 계산 효율성 간의 트레이드오프를 분석합니다.