Risk-Aware Reinforcement Learning for Mobile Manipulation
이 논문은 분포 강화 학습과 모방 학습을 결합하여, 동적 환경에서 이동형 매니퓰레이터가 egocentric 깊이 관측을 기반으로 위험 감수성을 조절하며 최악의 경우 성능을 향상시키는 위험 인식 비주얼 모션 정책을 최초로 개발하고 검증했습니다.
864 편의 논문
이 논문은 분포 강화 학습과 모방 학습을 결합하여, 동적 환경에서 이동형 매니퓰레이터가 egocentric 깊이 관측을 기반으로 위험 감수성을 조절하며 최악의 경우 성능을 향상시키는 위험 인식 비주얼 모션 정책을 최초로 개발하고 검증했습니다.
이 논문은 오픈 월드 환경에서 이동 로봇의 안전성을 위해 시점 및 자세 변형을 위한 도메인 증대와 사후 보정을 통해 분포 변화에 강건한 웨이포인트 예측과 불확실성 추정을 가능하게 하는 'ELLIPSE'라는 증거 기반 학습 방법을 제안하고 실세계 계단 주행 실험을 통해 그 유효성을 입증합니다.
이 논문은 불확실한 환경 상호작용 하에서 계층적 우선순위와 비가환성을 고려한 위험 인식 규칙서를 제안하여, 시스템 궤적이 환경에 미치는 영향을 명시적으로 모델링하고 일관된 궤적 평가 순위를 보장하며 자율 주행 사례를 통해 설명 가능성을 증진하는 새로운 형식주의를 제시합니다.
이 논문은 장기적·과거 의존적 로봇 조작 작업을 평가하기 위해 16 가지 과제로 구성된 대규모 표준 벤치마크 'RoboMME'와 다양한 메모리 증강 VLA 모델들을 제안하고, 메모리 표현의 효과는 작업에 따라 크게 달라짐을 실험을 통해 입증합니다.
이 논문은 상업용 드론 (Flyability Elios 3) 을 개조하여 실시간 센서 데이터와 다중 주파수 제어 아키텍처를 통해 비정형 산업 환경에서 완전 자율적으로 접촉식 초음파 비파괴 검사 (NDT) 를 수행하는 통합 시스템을 제안하고 실험을 통해 그 유효성을 입증합니다.
이 논문은 주의 기반 그래프 신경망과 전역 경로 계획을 통합하여 동적 환경에서 다중 로봇의 충돌을 효과적으로 방지하고 성공률을 높이는 새로운 'GIANT' 모델을 제안하고 그 우수성을 입증합니다.
이 논문은 대규모 C++ 로봇공학 라이브러리 (OMPL) 의 Python 바인딩 생성 과정에서 LLM 을 활용하여 인간 전문가가 개입하는 워크플로우를 제시하고, 이를 통해 생성된 바인딩이 기존 솔루션과 동등한 성능을 유지하면서도 유지보수 부담을 줄일 수 있음을 입증합니다.
이 논문은 자율 주차 시스템이 다른 차량의 운동 이력을 기반으로 명시적으로 주차 의도를 예측함으로써 기존 방법들보다 예측 정확도, 사회적 수용성, 작업 완료율을 모두 향상시킨다는 것을 입증합니다.
이 논문은 불확실성이 존재하는 부분 관측 환경에서 언어, 제스처, 시각 정보를 통합하여 모호한 지시를 해석하고 목표 물체를 탐색하는 모듈식 POMDP 시스템인 LEGS-POMDP 를 제안하며, 시뮬레이션 및 실제 로봇 실험을 통해 기존 단일 모달리티 방법보다 뛰어난 성능을 입증합니다.
이 논문은 로봇의 전체 표면을 덮을 수 있는 3D 프린팅 모듈형 인공 피부 'GenTact-Prox'를 개발하여 접촉을 사전에 예측하고, 로봇 중심의 감지 가능 공간인 '주변감각 공간 (Perisensory Space)'을 매핑하는 데이터 기반 프레임워크를 제시합니다.
이 논문은 탈착 가능한 관절을 가진 모듈형 로봇의 기계적 고장 위험을 줄이면서도 이동성을 유지하기 위해 NSGA-III 알고리즘을 활용한 다목적 최적화 프레임워크를 제안하고, 다양한 환경에서의 보행 생성과 구조적 무결성 보장을 실험을 통해 입증했습니다.
이 논문은 각도 및 측면 오차를 수동 정렬 기하학적 구조로 보상하여 모듈형 재구성 로봇의 자동 도구 교환 신뢰성을 확보하고, 이를 검증한 실험 결과를 제시합니다.
본 논문은 시뮬레이션된 용암 동굴 환경에서 로봇의 자세 데이터 (특히 피치 표준편차) 를 기반으로 지형을 98% 이상의 정확도로 분류하여, 다양한 지형을 극복하기 위한 적응형 정책 스위칭의 실현 가능성을 입증했습니다.
본 논문은 중앙 제어 없이 로봇들이 자율적으로 팀을 구성하고, 대규모 언어 모델 (LLM) 을 활용하여 각 팀이 탐사 목표를 결정하는 새로운 분산 탐사 방법을 제안하고 시뮬레이션을 통해 그 유효성을 검증합니다.
이 논문은 비선형 유체 역학과 히스테리시스 같은 복잡한 동역학을 분석적 모델 없이 신경망 기반의 순방향 동역학 모델과 모방 학습을 결합한 데이터 기반 제어 프레임워크를 통해 자기 구동 어류형 로봇의 정밀한 경로 추종 성능을 달성하는 방법을 제안하고 검증합니다.
이 논문은 확산 모델의 로그 가능도 계산 문제를 해결하기 위해 정책 반복과 확산 과정을 정렬하여 단순한 가우스 확률 평가만으로 온-정책 강화학습을 가능하게 하는 새로운 '조건부 근접 정책 최적화 (CPPO)' 방법을 제안하고, 이를 통해 다중 모드 행동을 생성하며 다양한 벤치마크에서 우수한 성능을 입증합니다.
이 논문은 합성 데이터 환경에서 다양한 상호작용 보조 데이터를 기반으로 미세 조정된 멀티모달 모델이 새로운 사용자 행동과 미지의 작업 구성에 대해 어떻게 일반화되는지 분석하여, 개방형 수정 보조 능력을 달성하기 위해 필요한 데이터의 특성과 핵심 요소에 대한 통찰을 제공합니다.
이 논문은 농작물의 외관 다양성과 배경 변화로 인한 일반화 한계를 극복하기 위해, 작업 관련 영역은 도메인 지식을 반영하여 증강하고 비관련 영역은 무작위화하는 '이중 영역 증강 (DRAIL)' 프레임워크를 제안하여 농업 로봇 조작의 견고성과 일반화 성능을 향상시켰음을 보여줍니다.
이 논문은 로봇 조작 작업의 견고한 공간 인식 능력을 향상시키기 위해 유클리드 공간의 한계를 극복하는 쌍곡선 다중 뷰 사전 학습 프레임워크인 HyperMVP 와 대규모 3D 데이터셋 3D-MOV 를 제안하고, 이를 통해 다양한 시나리오에서 기존 기법보다 우수한 성능을 입증합니다.
이 논문은 자연어 논거를 인과 신호로 활용하여 희소 이진 피드백의 인과적 혼란을 해결하고, 새로운 작업에서도 추가 데이터나 모델 미세 조정 없이 선호도 지식을 효과적으로 전이하여 성능을 크게 향상시키는 경량 프레임워크 'ReCouPLe'를 제안합니다.