Residual Control for Fast Recovery from Dynamics Shifts
이 논문은 고정된 기본 제어 정책의 안정성을 유지하면서 강화학습 기반의 잔여 제어 채널을 통해 동적 변화에 대한 실시간 회복 시간을 획기적으로 단축하는 'Stability Alignment Gate'를 포함한 새로운 아키텍처를 제안합니다.
864 편의 논문
이 논문은 고정된 기본 제어 정책의 안정성을 유지하면서 강화학습 기반의 잔여 제어 채널을 통해 동적 변화에 대한 실시간 회복 시간을 획기적으로 단축하는 'Stability Alignment Gate'를 포함한 새로운 아키텍처를 제안합니다.
이 논문은 복잡한 환경에서 이동하는 다리가 많은 로봇의 자율성을 향상시키기 위해 생체 모방 그라디언트 강성 안테나를 개발하여, 촉각 피드백을 기반으로 장애물 충돌 상태를 실시간으로 감지하고 기동 모드를 선택함으로써 시야나 전역 정보 없이도 좁은 공간에서의 안정적인 주행과 매복 탈출을 가능하게 했음을 보여줍니다.
이 논문은 로봇의 보행 중 proprioception(고유수용감각) 으로 측정된 접촉력을 기반으로 가우시안 프로세스와 입자 저항력 이론을 결합한 '역 저항력 이론 (I-RFT)'을 제안하여, 다양한 보행 패턴과 발 모양에서도 정밀하게 지반의 기계적 특성을 추정하고 불확실성을 정량화하여 로봇의 효율적인 탐사 및 보행 전략 수립을 가능하게 한다는 내용입니다.
이 논문은 MO-IRL 알고리즘을 활용하여 피험자와 자세에 구애받지 않는 단일 시간 가변 비용 함수가 인간 도달 운동의 최적성 원리를 설명하고 기존 방법보다 평균 27% 낮은 오차로 운동 궤적을 정확하게 예측할 수 있음을 입증합니다.
이 논문은 다단계 롤아웃 시 일관성을 유지하고 추론 효율성을 높이기 위해 구조 사전학습, 행동 조건 일관성 (ACC) 후학습, 그리고 추론 일관 상태 증류 (ICSD) 를 도입한 계획 기반 이미지 목표 탐색을 위한 모바일 월드 모델 (MWM) 을 제안합니다.
이 논문은 공간 활용도와 작업 시간 간의 균형을 고려하여 선호도 기반 강화 학습을 통해 44% 의 작업 시간 단축을 이루면서도 적재 밀도를 유지하는 새로운 3D 박스 적재 알고리즘 'STEP'을 제안합니다.
이 논문은 불확실한 환경에서 인간과 로봇이 협력할 때 발생하는 지식 격차와 잠재적 의도를 해결하기 위해, 불확실성 완화와 의도 추론이라는 두 가지 모드를 통합한 새로운 인간 - 기계 공동 계획 시스템을 제안하며, 이를 통해 상호작용 비용과 작업 실행 시간을 크게 단축하는 효과를 입증했습니다.
이 논문은 드론의 환경 불확실성 해결을 위해 인간과의 제어 인계 대신 LLM 기반의 능동적 정보 추적을 통해 지식 격차를 최소화하는 'MINT' 프레임워크를 제안하고, 시뮬레이션 및 실제 배포를 통해 복잡한 수색 구조 작업의 성공률 향상과 인간 개입 빈도 감소를 입증했습니다.
이 논문은 물리 기반 블레이드 요소 모델과 학습 기반 잔류 힘 추정기를 통합하고 온라인 적응 메커니즘을 적용하여, 바람과 근접 벽면 환경에서의 항공 조종기 (Aerial Manipulator) 가 비선형 공기역학적 교란을 효과적으로 보상하고 견고한 접촉 작업을 수행할 수 있도록 하는 제어 프레임워크를 제안합니다.
이 논문은 최적 계획과 강화 학습 간의 간극을 해소하기 위해 강화 학습의 결정론적 변형을 개발하고, 비용 최소화 및 무한 시간 범위 조건 하에서 가치 반복 및 다익스트라 알고리즘과의 성능을 비교 분석하며, 할인 요인이 목표 달성에 미치는 영향과 진정한 비용 (truecost) 최적화의 중요성을 수학적으로 규명합니다.
이 논문은 가시성 제한과 부분 관측이 있는 혼란스러운 환경에서도 자연어 명령에 따라 안전하고 실행 가능한 6 자유도 집기를 보장하기 위해, VLM 기반의 객체 인식과 깊이 보상을 통한 점구름 완성을 결합한 종단간 그립 파이프라인을 제안하고 실제 4 족 보행 로봇을 통해 기존 방식 대비 집기 성공률을 30% 에서 90% 로 획기적으로 향상시켰음을 입증합니다.
이 논문은 SAM3 와 Depth Anything 3 를 활용하여 작업 관련 개체의 의미론적 및 기하학적 정보를 표준화된 이미지로 변환하는 '작업 인식 관찰 인터페이스'를 제안함으로써, 정책 수정 없이도 시각적 외관 변화에 대한 비약적인 강인성을 확보하는 visuomotor 정책 학습 방법을 제시합니다.
이 논문은 전이 엔트로피를 활용하여 원격 제어 로봇 아바타와의 대화 중 로봇의 행동이 인간의 반응에 미치는 영향을 분석함으로써, 인간 - 로봇 상호작용 시스템의 설계와 적응성을 향상시키는 방법을 제시합니다.
이 논문은 기존 이질적인 로봇 제어 정책들의 장점을 활용하고 실행 경험을 기반으로 학습 없이 최적의 정책을 동적으로 선택하는 'RoboRouter' 프레임워크를 제안하여, 시뮬레이션 및 실제 환경에서 개별 정책보다 성공률을 크게 향상시키는 것을 보여줍니다.
본 논문은 대규모 VLM 의 추론 능력과 경량 모델의 효율성을 결합하여 추론과 동작 계획을 분리한 'NaviDriveVLM'을 제안함으로써, nuScenes 벤치마크에서 기존 대규모 VLM 기반 시스템보다 우수한 종단간 운동 계획 성능을 달성했다고 요약할 수 있습니다.
이 논문은 시계열적 동적 민감도를 고려하여 실시간 킨매틱 프로시를 기반으로 비트 폭을 동적으로 할당하는 'DyQ-VLA' 프레임워크를 제안함으로써, embodied Vision-Language-Action 모델의 메모리 사용량을 30.9% 로 줄이면서도 성능을 99.5% 유지하고 추론 속도를 크게 향상시킵니다.
이 논문은 외부 추적 장치 없이 사전 CT 데이터와 실시간 내시경 영상만을 활용하여 장기 및 단기 에이전트와 세계 모델 비평가를 통해 분기점에서의 의사결정을 최적화하는 순수 비전 기반 자율 기관지경 로봇 항법 프레임워크를 제안하고, 이를 통해 생체 외 및 생체 내 실험에서 숙련된 전문의 수준의 성능을 입증했습니다.
이 논문은 희소 LiDAR 고도 매핑과 밀집한 위험 발걸음 페널티를 통합한 단일 단계 학습 프레임워크를 통해, 인간형 로봇이 사다리와 같은 복잡한 지형에서 안전하고 방향에 구애받지 않는 보행이 가능하도록 하는 방법을 제안합니다.
이 논문은 CMA-ES 기반의 궤적 최적화 프레임워크를 제안하여 수중 비구동 메커니즘과 연성 로봇의 구조적 및 유체역학적 매개변수를 동시에 식별함으로써, 별도의 재조정 없이도 고충실도 시뮬레이션과 실제 환경 간 일관성을 달성하는 통합 모델링 방법을 제시합니다.
본 논문은 시각적 노이즈와 물리적 연속성 문제를 해결하여 다양한 VLA 모델의 추론 속도를 최대 1.73 배 향상시키고 오버헤드를 5~7% 로 최소화하는 새로운 엣지 - 클라우드 협력 추론 프레임워크 RAPID 를 제안합니다.