DreamToNav: Generalizable Navigation for Robots via Generative Video Planning
이 논문은 자연어 지시를 정밀한 시각적 설명으로 변환하고 생성형 비디오 모델을 통해 로봇의 행동을 '꿈꾸어' 계획함으로써, 다양한 이동 플랫폼에서 장애물 회피 및 목표 지향 항해가 가능한 새로운 자율 로봇 프레임워크인 DreamToNav 를 제안합니다.
864 편의 논문
이 논문은 자연어 지시를 정밀한 시각적 설명으로 변환하고 생성형 비디오 모델을 통해 로봇의 행동을 '꿈꾸어' 계획함으로써, 다양한 이동 플랫폼에서 장애물 회피 및 목표 지향 항해가 가능한 새로운 자율 로봇 프레임워크인 DreamToNav 를 제안합니다.
이 논문은 LiDAR 기반 ICP 등록과 포즈 그래프 최적화를 약한 지도 신호로 활용하여 지면 정보에 의존하지 않는 자기지도 학습을 통해 다양한 환경에서 강건한 관성 주행 (Inertial Odometry) 을 가능하게 하는 'KISS-IMU' 프레임워크를 제안합니다.
이 논문은 비전 기반 모델 (VFM) 의 강력한 3D 기하학적 사전 지식을 계층적 특징 어댑터를 통해 3D 가우스 스플래팅에 통합함으로써 자율주행의 3D 시맨틱 오큐번시 예측 정확도를 획기적으로 향상시킨 VG3S 프레임워크를 제안합니다.
이 논문은 소량의 실세계 데이터를 활용해 분석적 시뮬레이터를 보정하고 그래프 신경망 기반의 미분 가능 시뮬레이터를 구축함으로써, 복잡한 접촉 역학을 정밀하게 모델링하고 로봇 제어 정책 학습의 효율성을 극대화하는 Few-Shot Real-to-Sim 프레임워크를 제안합니다.
이 논문은 가변적인 관측 길이를 가진 자율주행 환경에서 과거 데이터의 누락을 보충하고 장기적 운동 패턴을 지식 증류로 전이하는 'TaPD' 프레임워크를 제안하여, 특히 짧은 관측 데이터에서도 기존 방법들보다 뛰어난 궤적 예측 성능을 달성함을 보여줍니다.
이 논문은 대규모 언어 모델의 자기회귀 능력을 활용하여 3D 객체 추적을 시공간적 의미 시퀀스 생성 문제로 재정의함으로써, 기존 폐쇄집합 기반 방법론의 한계를 극복하고 미지의 객체에 대한 일반화 성능을 획기적으로 향상시킨 'NOVA'라는 새로운 패러다임을 제안합니다.
이 논문은 인공 호수의 수중 식생 관리 효율성을 높이기 위해 위성 데이터로 관심 지역을 식별하고 무인 수상 차량 (USV) 의 SONAR 로 정밀 매핑을 수행하는 인간 - 로봇 협업 기반의 2 단계 잡초 수확 접근법을 제안합니다.
이 논문은 3D 시맨틱 오큐팬시 예측에서 발생하는 레이블 노이즈 문제를 해결하기 위해, 기존 2D 기법의 한계를 극복하고 신뢰할 수 있는 감독 신호를 구축하는 새로운 벤치마크 'OccNL'과 이중 소스 부분 레이블 추론을 활용한 'DPR-Occ' 프레임워크를 제안합니다.
이 논문은 바퀴형 이동 매니퓰레이터의 장기 작업 데이터 수집 병목 현상을 해결하기 위해, 원격 조종과 능동 시연 모드를 동일한 운동학적 인터페이스로 통합하여 확장 가능한 데이터 수집을 가능하게 하는 이모달 프레임워크 'SuperSuit'를 제안합니다.
이 논문은 고비용의 실차 실험을 대체할 수 있는 오픈소스 기반의 ETSI 표준 준수 1:10 스케일 자율주행 미니카 플랫폼을 제안하고, 이를 통해 교차로 충돌 경고 (ICW) 애플리케이션의 실현 가능성을 입증합니다.
이 논문은 제한된 통신과 계산 자원 하에서 다중 매니퓰레이터의 협동 운반 시 안전성을 보장하기 위해 계층적 이벤트 트리거 제어 장벽 함수 (CBF) 를 활용한 분산 제어 프레임워크를 제안하고, 실제 Franka 매니퓰레이터 실험 및 시뮬레이션을 통해 그 유효성을 입증합니다.
이 논문은 다양한 로봇 간 전이 학습을 위해 단순한 데이터 양의 증가보다는 시나리오, 작업, 궤적을 다른 구현체에 맞춰 정렬한 '데이터 유추 (data analogies)'가 형태적 변화에 훨씬 더 효과적임을 시뮬레이션과 실증 실험을 통해 입증하고, 이를 통해 실제 환경에서의 성공률을 평균 22.5% 향상시켰다고 요약할 수 있습니다.
이 논문은 기존 VLA 기반 비전 - 언어 내비게이션 모델을 재학습 없이 플러그 앤 플레이 방식으로 적용하여, 시공간적 토큰 가지치기를 통해 계산 비용을 줄이면서도 장기 내비게이션의 정확도와 실시간성을 동시에 확보하는 효율적인 프레임워크를 제안합니다.
이 논문은 제어 장벽 함수와 안전 운동 통로를 통합한 새로운 '제어 장벽 통로' 개념을 제안하여, 안전성과 반응성 간의 균형을 유지하면서 자율 시스템이 안전하고 지속적으로 목표 지점을 선택하며 미지의 환경을 탐색할 수 있도록 합니다.
이 논문은 기하학적 형태, 재료 분포, 구동 방식을 단일 저차원 매개변수 공간에 통합하는 부드러운 디자인 임베딩을 제안하여, 기존 신경망이나 볼록 기반 방법보다 효율적으로 소프트 로봇의 공설계를 최적화할 수 있음을 입증합니다.
이 논문은 악천후에서도 광학 센서의 한계를 극복하기 위해 단일 회전 라이다를 활용하여 지도 학습 및 반복 주행 (Teach-and-Repeat) 방식을 통해 29Hz 의 실시간 속도로 0.117m 의 정밀한 위치 추정이 가능한 'CFEAR-TR' 시스템을 제안합니다.
이 논문은 밀집된 작물 수확을 위해 방향 조건부 가림 추론과 방향 인식 그래프 신경 아키텍처를 활용하여 고추 식물의 장기를 연결하는 장면 그래프를 학습하고, 이를 통해 과일을 수확할 때 방해되는 잎을 효과적으로 식별하는 SG-DOR 프레임워크를 제안합니다.
이 논문은 중력이 낮은 천체 탐사를 위해 두 개의 반응 휠과 하나의 구동기로만 균형 잡기, 표적 점프, 착지 및 자기 복귀가 가능한 0.33m 크기의 경량 단족 로봇을 제안합니다.
이 논문은 단일 광선 가정을 위반하는 확산형 LiDAR 의 특성으로 인해 기존 캘리브레이션 방법이 적용되지 않는 문제를 해결하기 위해, 스캔된 후방 반사 패치를 이용해 각 LiDAR 픽셀의 발자국과 상대적 공간 감도를 RGB 이미지 평면에서 추정하여 교차 모드 정렬 및 융합을 위한 명시적 대응 관계를 구축하는 간단한 공간 캘리브레이션 절차를 제안합니다.
이 논문은 인간 시연으로부터 심볼릭 및 서브심볼릭 시간적 제약을 통합적으로 학습하여 양손 로봇 조작을 위한 실행 가능한 시간 매개변수 계획을 생성하는 새로운 접근법을 제시합니다.