Hyperbolic Multiview Pretraining for Robotic Manipulation
이 논문은 로봇 조작 작업의 견고한 공간 인식 능력을 향상시키기 위해 유클리드 공간의 한계를 극복하는 쌍곡선 다중 뷰 사전 학습 프레임워크인 HyperMVP 와 대규모 3D 데이터셋 3D-MOV 를 제안하고, 이를 통해 다양한 시나리오에서 기존 기법보다 우수한 성능을 입증합니다.
864 편의 논문
이 논문은 로봇 조작 작업의 견고한 공간 인식 능력을 향상시키기 위해 유클리드 공간의 한계를 극복하는 쌍곡선 다중 뷰 사전 학습 프레임워크인 HyperMVP 와 대규모 3D 데이터셋 3D-MOV 를 제안하고, 이를 통해 다양한 시나리오에서 기존 기법보다 우수한 성능을 입증합니다.
이 논문은 자연어 논거를 인과 신호로 활용하여 희소 이진 피드백의 인과적 혼란을 해결하고, 새로운 작업에서도 추가 데이터나 모델 미세 조정 없이 선호도 지식을 효과적으로 전이하여 성능을 크게 향상시키는 경량 프레임워크 'ReCouPLe'를 제안합니다.
이 논문은 로봇 제어에서 장기 기억이 필요한 비마르코프 과제를 해결하기 위해, 최근 관측을 단기 작업 기억으로 유지하고 과거 경험을 고정된 에피소드 기억 토큰으로 압축하는 Transformer 기반 메모리 압축기를 도입한 비마르코프 비주얼 모션 정책 VPWEM 을 제안하며, 이를 통해 기존 최첨단 모델보다 우수한 성능을 입증했습니다.
이 논문은 이동하는 카메라 시점에서 발생하는 원근 왜곡 문제를 해결하기 위해, 가시적 특징을 고려한 3D 적대적 텍스처 최적화 기법을 제안하여 동적 환경에서도 로봇의 시각-운동 정책을 효과적으로 교란할 수 있음을 입증합니다.
본 논문은 불확실성 하에서 다각형 로봇과 장애물 간의 충돌 위험을 명시적으로 고려하여 기존 방법의 과도한 보수성을 완화하고 협소한 환경에서의 항법 효율성을 향상시키는 'U-OBCA'라는 새로운 최적화 기반 충돌 회피 프레임워크를 제안합니다.
이 논문은 이종 센서를 가진 로봇 군집의 협력적 국소화 문제를 해결하기 위해, 제한된 측정 토폴로지에서도 작동하는 통합된 데이터 기반 적응형 상대 국소화 추정기와 분산 포지 결합 전략을 제안합니다.
이 논문은 오버헤드 크레인 LiDAR 를 활용한 산업용 실내 공간의 사람 탐지 및 추적을 위해 전용 데이터셋을 구축하고, VoxelNeXT 와 SECOND 와 같은 3D 탐지기를 적응시켜 근거리에서 0.97 의 높은 평균 정밀도를 달성함과 동시에 실시간 추적 가능성을 입증했습니다.
이 논문은 모델링의 어려움으로 인해 활용되지 않았던 연성 로봇을 위해 마이크로소프트 홀로렌스 2 와 물리 기반 관측기를 결합한 증강현실 원격 제어 시스템을 제안하고, 모듈형 공압 매니퓰레이터 PETER 를 통해 약 5% 의 오차로 효과적인 상호작용이 가능함을 검증했습니다.
이 논문은 가시성 - 언어 모델 (VLM) 을 활용하여 직접적인 점군 인식을 통해 이동 가능 또는 변형 가능한 장애물과의 접촉을 허용하는 새로운 모션 플래닝 방법인 DCT 를 제안하고, 이를 통해 복잡한 환경에서 기존 방법보다 뛰어난 적응성과 효율성을 입증했습니다.
이 논문은 다양한 카메라 구성에서 발생하는 공간적 사전 지식의 불일치를 해결하기 위해 공간 인식 특징 변조 (SFM) 와 카메라 인식 데이터 증강 (CDA) 을 도입하여 새로운 플랫폼으로의 일반화 성능을 획기적으로 향상시킨 범용 다중 카메라 3D 객체 감지 프레임워크인 CoIn3D 를 제안합니다.
이 논문은 계절적 변화와 시각적 유사성으로 인한 자율 로봇의 장기 작물 환경 운용 난제를 해결하기 위해 포도나무 줄기와 지지대를 영구적인 랜드마크로 활용하는 'VinePT-Map'이라는 의미 지도 프레임워크를 제안하고, 다양한 계절에 걸친 실증 실험을 통해 그 견고성과 정확성을 입증합니다.
이 논문은 VGGT 기반의 밀도 점지도 예측과 선택적 정보 및 기하학적 인식 다중 뷰 적응 (SIGMA) 모듈을 통해 키프레임 우선순위를 동적으로 조정하고, 다중 뷰 Sim(3) 최적화를 통해 포즈 추정 및 밀도 재구성의 정확도를 획기적으로 개선한 AIM-SLAM 을 제안합니다.
본 논문은 물리 기반 시뮬레이션과 가우스 스플래팅을 결합하여 실시간으로 물리적 정합성을 유지하며 시각적 보정을 수행하는 'GaussTwin'을 제안함으로써, 로봇 조작의 추적 정확도와 강인성을 향상시키고 폐루프 상호작용을 지원하는 통합된 디지털 트윈을 구현했습니다.
이 논문은 딥러닝 기반 인식의 불확실성을 활용하여 자율성과 원격 조종 간에 동적으로 전환하는 '지각적 공유 자율성 (Perceptive Shared Autonomy)' 개념을 제안하고, 이를 통해 딥러닝의 불확실성 하에서도 강인한 로봇 조작이 가능한 'SPIRIT' 시스템을 개발하여 성능과 신뢰성을 동시에 향상시켰음을 보여줍니다.
이 논문은 로봇 제어 강화학습에서 작업 목표와 행동 특성을 분리하여 2 단계 보상 커리큘럼을 제안함으로써, 복잡한 보상 함수 설계의 어려움을 해결하고 기존 방법보다 더 강력하고 견고한 정책을 학습할 수 있음을 입증합니다.
이 논문은 긴 시간 범위의 로봇 조작 작업을 위해 시간적 정보를 효율적으로 압축하고 필터링하는 자기 진화 게이트 어텐션 (SEGA) 모듈을 도입하여 기존 확산 정책의 한계를 극복하고, 대규모 모델보다 훨씬 적은 파라미터로 뛰어난 성능을 달성하는 'SeedPolicy'를 제안합니다.
이 논문은 비전-언어-행동 (VLA) 모델의 추론 시 복잡성을 동적으로 감지하여 단순 작업은 즉시 수행하고, 모호한 상황은 추론하며, 이상 징후가 감지되면 실행을 중단하는 '행동, 사고, 중단' 적응형 프레임워크를 제안합니다.
이 논문은 기존 기술의 망각을 방지하고 새로운 기술을 효율적으로 습득하기 위해 조작 기술 적응과 특수성 집합 메커니즘을 도입한 'SkillsCrafter'라는 새로운 로봇 조작 프레임워크를 제안합니다.
이 논문은 VLM(고수준 추론) 과 VLA(저수준 실행) 의 장점을 결합하고 경량화된 비전 기반 '비평가'가 예외 상황에 따라 두 시스템을 동적으로 전환하도록 하여, 장기적 로봇 조작 작업의 견고성과 자율성을 획기적으로 향상시킨 'Critic in the Loop' 프레임워크를 제안합니다.
이 논문은 RGB-D 센서, 촉각 피드백, 충돌 인식 모션 플랜닝을 갖춘 디지털 트윈 기반 양팔 로봇 시스템과 시각 언어 모델 (VLM) 을 통합하여, 변형 가능한 의류와 이물질을 실시간으로 분류 및 식별하는 자동화된 텍스타일 선별 시스템의 실현 가능성을 입증했습니다.