Ask, Reason, Assist: Robot Collaboration via Natural Language and Temporal Logic
이 논문은 중앙 집중식 할당자 없이 이질적인 로봇 팀이 자연어와 신호 시간 논리 (STL) 기반의 LLM 을 활용하여 충돌을 해결하고 최적의 협력 로봇을 선정함으로써 시스템 전체 작업 완료 시간을 최소화하는 분산 협업 프로토콜을 제안합니다.
864 편의 논문
이 논문은 중앙 집중식 할당자 없이 이질적인 로봇 팀이 자연어와 신호 시간 논리 (STL) 기반의 LLM 을 활용하여 충돌을 해결하고 최적의 협력 로봇을 선정함으로써 시스템 전체 작업 완료 시간을 최소화하는 분산 협업 프로토콜을 제안합니다.
이 논문은 1 인칭 시점의 관측 노이즈를 고려한 최초의 벤치마크인 'EgoTraj-Bench'와 이를 기반으로 역사적 관측 데이터를 정제하고 미래 궤적을 예측하는 이중 스트림 모델 'BiFlow'를 제안하여, 인간 중심 환경에서의 로봇 내비게이션 신뢰성을 획기적으로 향상시켰습니다.
이 논문은 이기종 에이전트들이 독립적인 작업을 수행할 때 충돌 없는 경로를 효율적으로 생성하기 위해 Conflict-Based Search(CBS) 를 표준 프로토콜로 활용하여 다양한 단일 에이전트 계획 알고리즘을 통합하는 방법을 제시합니다.
이 논문은 로봇의 현재 시야를 넘어 장기적인 관측을 3D 잠재 지도로 통합하여 전역적 공간 및 시간 추론 능력을 향상시키고, 기존 이미지 기반 정책보다 모바일 매니퓰레이션 작업의 성공률을 높이는 'Seeing the Bigger Picture (SBP)'라는 엔드투엔드 정책 학습 접근법을 제안합니다.
이 논문은 다양한 손의 형태를 인식하고 소량의 데이터로 적응할 수 있는 새로운 엔드 - 투 - 엔드 프레임워크인 MachaGrasp 을 제안하여, 고차원 관절 제어의 복잡성을 줄이면서도 다양한 다관절 손에서 높은 성공률과 실시간 추론 속도를 달성하는 정교한 그리핑 생성 방법을 소개합니다.
이 논문은 강화학습 정책이 학습 단계에서 제어 장벽 함수 (CBF) 를 내재화하여 안전 필터 없이도 안전한 탐색과 빠른 수렴을 가능하게 하는 'CBF-RL' 프레임워크를 제안하고, 이를 통해 Unitree G1 휴머노이드 로봇의 실제 환경에서의 안전성을 입증합니다.
이 논문은 복잡한 장애물 환경에서 안전성을 보장하면서도 기존 거리 기반 제어 장벽 함수보다 덜 보수적인 제어를 가능하게 하는 '최소 제한적 초평면 제어 장벽 함수 (Least Restrictive Hyperplane CBF)'를 제안하고, 초평면의 방향을 최적화하여 원하는 제어 입력에 더 근접한 안전한 제어를 달성하는 방법을 제시합니다.
이 논문은 시각적 언어 모델 (VLM) 이 상태 탐색을 안내하고 백트래킹을 수행하며, 물리 시뮬레이터와 결합된 하이브리드 상태 트리를 활용하여 장기적 작업에서 기존 방법 대비 성공률과 계획 효율성을 획기적으로 개선하는 새로운 운동역학적 작업 및 운동 계획 (TAMP) 프레임워크를 제안합니다.
이 논문은 PVDF 와 정전용량 방식을 결합한 다중 모달 촉각 손가락 'SpikeATac'을 개발하고, 이를 강화학습과 결합하여 취약한 물체의 손 안 조작 (in-hand manipulation) 이라는 난제를 해결하는 새로운 접근법을 제시합니다.
이 논문은 고전적인 Runge-Kutta 적분 기법을 기반으로 한 새로운 직접 원뿔 보정 알고리즘을 제안하며, 이를 통해 기존 인기 알고리즘을 유도하고 고차 알고리즘 생성 절차를 제시합니다.
이 논문은 블랙박스 로봇 정책의 내부 구조 없이 관찰 가능한 실행 궤적을 신호 시간 논리 (STL) 규격과 비교하여 평가하는 '규제자 주도' 접근법을 제안하며, 이를 통해 다양한 시나리오에서 로봇의 안전성 만족도를 크게 향상시키는 것을 입증했습니다.
이 논문은 3D 가우스 스플래팅을 활용해 한 팔이 최적의 시점을 찾아 3D 모델을 구축하고 다른 팔이 이를 기반으로 행동을 수행하는 'ObAct'라는 새로운 능동적 비전 모방 학습 프레임워크를 제안하며, 이를 통해 가려짐이 없는 학습 분포에 가까운 관측을 확보하여 기존 정적 카메라 설정보다 훨씬 강력한 양손 로봇 정책을 구현함을 보여줍니다.
이 논문은 가정용 환경에 국한된 기존 데이터셋의 한계를 극복하기 위해 자동화된 프로시저럴 콘텐츠 생성 (PCG) 프레임워크와 방대한 3D 자산 라이브러리를 활용하여 복잡한 슈퍼마켓 환경을 생성하고, 이를 기반으로 장기적 작업 수행 능력을 평가하는 새로운 벤치마크를 제안하는 확장 가능한 시뮬레이션 플랫폼 'MarketGen'을 소개합니다.
이 논문은 VAE 기반의 잠재 공간에서 고수준 의도와 저수준 운동학을 분리하고 단일 디노이징 단계를 통해 추론 속도를 최대 10 배 향상시키면서도 nuPlan 벤치마크에서 학습 기반 계획 방법 중 최상의 폐루프 성능을 달성하는 'LAP(LAtent Planner)' 프레임워크를 제안합니다.
이 논문은 강화학습 기반의 글로벌 가이드, 최소비용 흐름을 활용한 리밸런싱, 그리고 지역적 할당 문제를 결합한 GRAND 라는 계층적 알고리즘을 제안하여 대규모 로봇 군집의 생애 주기 픽업 및 배송 (MAPD) 작업에서 2024 년 우승 스케줄러 대비 최대 10% 의 처리량 향상과 실시간 실행을 동시에 달성했습니다.
이 논문은 다양한 계절, 식생 성장 단계, 지형 및 기상 조건에서 실제 포도원 환경의 국소화 및 매핑 성능을 평가하기 위해 이종 LiDAR, AHRS, RTK-GPS, 카메라 등 다양한 센서 데이터를 통합한 대규모 다중 시점 데이터셋인 TEMPO-VINE 을 소개합니다.
이 논문은 구조적 일관성이 필요한 작업에 적합하도록 입력 위상 정보를 보존하고 크기만 무작위화하는 위상 보존 확산 (Phase-Preserving Diffusion, Ï-PD) 을 제안하여, 기존 확산 모델의 아키텍처 변경 없이도 구조 정렬 생성 및 시뮬레이션에서 현실로의 전이 성능을 향상시킵니다.
이 논문은 비미분 가능한 경로 (예: 웨이포인트 연결) 를 미분 가능한 함수로 근사하고 곡률을 체계적으로 제한하는 몰리피케이션 (mollification) 기법을 제안하여, 실시간 제어에 적합한 효율적이고 매끄러운 경로 생성을 가능하게 합니다.
이 논문은 이동 플랫폼이 착륙 표적로서 수동적으로 기능하는 기존 방식을 넘어, 플랫폼이 적극적으로 표면을 기울여 최적의 착륙 자세를 제공하고 드론이 시간 최적 궤적을 생성하는 양방향 협력 프레임워크를 제안함으로써 동적 환경에서의 UAV 착륙 효율성과 정밀성을 획기적으로 향상시켰습니다.
이 논문은 대형 언어 모델 (LLM) 의 추론 능력을 PDDL 기반의 행동 트리 및 반응형 제어에 통합하여 이종 로봇 팀의 장기적 협업 작업 성공률을 기존 대비 55% 로 획기적으로 향상시킨 'EmboTeam' 프레임워크와 새로운 벤치마크 'MACE-THOR'를 제안합니다.