cuRoboV2: Dynamics-Aware Motion Generation with Depth-Fused Distance Fields for High-DoF Robots
본 논문은 B-스플라인 궤적 최적화, GPU 네이티브 TSDF/ESDF 관측 파이프라인, 그리고 확장 가능한 GPU 네이티브 전신 계산을 통해 단일 암부터 고 DoF 휴머노이드까지 안전하고 역동적으로 동작하는 통합 모션 생성 프레임워크인 cuRoboV2 를 제안합니다.
867 편의 논문
본 논문은 B-스플라인 궤적 최적화, GPU 네이티브 TSDF/ESDF 관측 파이프라인, 그리고 확장 가능한 GPU 네이티브 전신 계산을 통해 단일 암부터 고 DoF 휴머노이드까지 안전하고 역동적으로 동작하는 통합 모션 생성 프레임워크인 cuRoboV2 를 제안합니다.
이 논문은 고차원의 의미론적 이해와 저차원의 안전 제어 간의 격차를 해소하기 위해, 라플라스 유도장 변조 포아송 안전 함수를 활용한 'Safe-SAGE' 프레임워크를 제안하여 로봇이 환경의 맥락에 따라 차별화된 안전 마진으로 동적 환경을 안전하게 탐색할 수 있도록 합니다.
로보포켓 (RoboPocket) 은 증강현실 기반의 원격 추론과 비동기 온라인 파인튜닝을 통해 물리적 로봇 없이 스마트폰만으로 로봇 정책의 취약점을 실시간으로 식별하고 데이터를 효율적으로 수집하여 시뮬레이션 효율성을 극대화하는 새로운 시스템입니다.
이 논문은 LiDAR 가 탑재된 주 UAV 와 카메라만 장착된 소형 보조 UAV 간의 협력적 항법을 통해 비주얼 - 관성 오도메트리 (VIO) 의 드리프트를 보정하고 정밀한 상대 위치 추정 및 안내를 가능하게 하는 새로운 방법을 제안하고 실험적으로 검증합니다.
본 논문은 자율주행 강화학습의 핵심 요소인 보상 함수의 설계 격차를 안전, 편안함, 진행, 교통법규 준수라는 네 가지 범주로 분석하여 기존 연구의 한계를 지적하고, 맥락을 고려한 구조화된 보상 및 검증 프레임워크와 같은 향후 연구 방향을 제안합니다.
이 논문은 맞춤형 입자 필터와 가우시안 프로세스 암시적 표면을 통합한 베이지안 프레임워크를 제안하여, 로봇이 능동적 촉각을 통해 물체의 클래스와 자세를 인식하고 미지의 물체 형태를 재구성하며 기존 지식을 전이 학습하는 방법을 제시합니다.
이 논문은 강화학습 에이전트의 기억 능력을 체계적으로 평가하기 위해 작업 분류 체계를 제안하고, 다양한 시나리오를 아우르는 MIKASA-Base 와 테이블탑 로봇 조작을 위한 32 개의 과제로 구성된 MIKASA-Robo 벤치마크를 소개합니다.
이 논문은 비전 - 언어 모델, 비전 - 언어 - 행동 모델, 텍스트 - 3D 생성 모델을 활용하여 로봇이 필요한 도구를 스스로 설계하고 제작한 뒤 이를 활용해 작업을 수행하는 '진화 6.0'이라는 새로운 자율 로봇 시스템을 제안하고 그 성능을 평가한 내용을 담고 있습니다.
이 논문은 LLM 기반 로봇의 안전성을 확보하기 위해 환경에 맞는 안전 규칙을 생성하는 '루트 오브 트러스트' LLM 과 시간 논리 제어 합성을 결합한 2 단계 방어 아키텍처인 'RoboGuard'를 제안하며, 이를 통해 악의적 공격 하에서도 로봇의 위험 행동을 92% 이상에서 3% 미만으로 획기적으로 줄였음을 입증합니다.
이 논문은 3D 환경에서 UAV 의 경로 계획을 위해 학습 기반 깊이 인식과 미분 가능한 궤적 최적화를 통합하여 전문가 데이터 없이도 SWAP 제약 하에 일반화 가능성과 해석 가능성을 갖춘 자기지도 학습 접근법을 제안하고, 시뮬레이션 및 실세계 실험을 통해 기존 최첨단 방법 대비 위치 추적 오차 31.33% 감소 및 제어 노력 49.37% 절감 효과를 입증했습니다.
이 논문은 자율주행의 신뢰성을 높이기 위해 차량, 보행자, 자전거 등 모든 교통 참여자의 상호작용 및 운동학적 사전 지식을 통합하고, DG-SFM 규칙 기반 점수를 통해 상호작용의 해석 가능성을 높이며 물리적으로 실행 가능한 궤적 예측을 가능하게 하는 TPK 모델을 제안합니다.
이 논문은 안전이 중요한 다중 모달 환경에서 OOD 검출 및 분할을 위해 이론적 근거를 바탕으로 한 매우 간단하고 빠른 'Feature Mixing' 방법론과 새로운 CARLA-OOD 데이터셋을 제안하여 기존 방법 대비 10 배에서 370 배의 속도 향상과 함께 최첨단 성능을 달성함을 보여줍니다.
이 논문은 C++ 과 YARP 에 의존하지 않고 Python 만으로 humanoid 로봇 iCub 의 물리 기반 시뮬레이션과 다양한 난이도의 학습 연습을 제공하여 초보자도 인간형 로봇의 기초를 쉽게 배울 수 있도록 한 오픈소스 프레임워크 'pyCub'을 소개합니다.
이 논문은 강화학습 기반 정책 사전지식을 활용하여 Q-가이드된 스타인 변분 추론을 통해 다양한 해를 명시적으로 보존하면서 모델 예측 제어의 샘플 효율성과 견고성을 향상시킨 Q-SVMPC 방법을 제안합니다.
이 논문은 시각 표현에서 직접 잠재 행위로 흐르는 비노이즈·비조건부 흐름 매칭 프레임워크인 VITA 를 제안하여, 시각 조건부 모듈의 반복적 처리를 제거함으로써 추론 속도를 1.5~2 배 향상시키면서도 최첨단 성능을 달성함을 보여줍니다.
이 논문은 Multimodal Large Language Models(MLLM) 를 활용하여 자연어 지시와 3D 장면 재구성을 결합하고, 효율적인 3D 관련성 필드 및 다중 뷰 집계 기법을 통해 20 초 이내에 정밀한 3D 그립 위치를 도출하는 'Point2Act'를 제안합니다.
이 논문은 시각 입력 없이 로봇 팔 전체 표면에 부착된 민감한 피부의 촉각 피드백을 활용하여 물체를 탐색하고 잡는 새로운 방법을 제안하며, 이는 시야가 제한된 농업 환경 등 다양한 분야에서 적용 가능한 6 배 빠른 탐색 속도와 높은 성공률을 입증합니다.
본 논문은 사영 기하 대수를 기반으로 한 새로운 기하학적 방법과 '사면체-점 (TP)' 모델을 제안하여 로봇의 관성 파라미터 식별을 위한 기본 파라미터를 자동으로 분석하는 효율적이고 강력한 알고리즘을 개발하고 이를 다양한 로봇 시스템에서 검증했습니다.
이 논문은 다양한 이벤트 기반 로컬라이제이션 방법론과 데이터셋 간의 비교를 용이하게 하기 위해 단일 명령어로 설치 및 실행이 가능한 통합 프레임워크 'Event-LAB'를 제안하고, 이를 통해 시각적 장소 인식 (VPR) 과 SLAM 파이프라인을 체계적으로 평가하여 일관된 이벤트 이미지 생성 매개변수의 중요성을 입증합니다.
본 논문은 embodied intelligence 를 위한 액션 기반 비디오 객체 분할 작업에서 텍스트 프롬프트 및 마스크 주석의 라벨 노이즈 문제를 최초로 다루기 위해 ActiSeg-NL 벤치마크를 구축하고, 병렬 마스크 헤드 메커니즘 (PMHM) 을 포함한 다양한 노이즈 학습 전략의 성능을 분석하여 노이즈 유형별 실패 모드와 강건성 특성을 규명했습니다.