VISO: Robust Underwater Visual-Inertial-Sonar SLAM with Photometric Rendering for Dense 3D Reconstruction
이 논문은 스테레오 카메라, IMU, 3D 소나를 융합하고 외부 파라미터 보정 및 광도 렌더링 기법을 도입하여 수중 환경에서 강인한 6 자유도 국소화와 고품질 밀도 3D 재구성을 실현하는 'VISO'라는 SLAM 시스템을 제안합니다.
864 편의 논문
이 논문은 스테레오 카메라, IMU, 3D 소나를 융합하고 외부 파라미터 보정 및 광도 렌더링 기법을 도입하여 수중 환경에서 강인한 6 자유도 국소화와 고품질 밀도 3D 재구성을 실현하는 'VISO'라는 SLAM 시스템을 제안합니다.
이 논문은 탁한 수중 환경에서 3D 소나와 관성 항법 장치 (INS) 를 결합하여 오도메트리 드리프트를 효과적으로 보정하고 정밀한 대규모 3D 지도를 생성하는 InsSo3D 라는 SLAM 프레임워크를 제안합니다.
이 논문은 UAV 의 지리 위치 추정에서 oblique aerial view 와 orthographic satellite view 간의 기하학적 불일치를 해결하기 위해, 수직 파사드 노이즈를 필터링하는 매크로 기하 구조 필터링과 깊이 기반의 미세 기하 스케일 적응 모듈을 통합한 (MGS)-Net 을 제안하여 University-1652 와 SUES-200 데이터셋에서 최첨단 성능을 달성함을 보여줍니다.
이 논문은 심층 강화학습을 기반으로 한 APEX 시스템을 제안하여, 인간형 로봇이 다중 기술을 조화롭게 전환하며 0.8m 높이의 고단계를 안전하게 오르고 내리는 지각 기반 적응형 이동 능력을 실현함을 보여줍니다.
이 논문은 독점 로봇 인터페이스 없이도 시간 동기화된 다중 모달 데이터를 수집할 수 있는 오픈소스 시스템 'MiDAS'와 이를 통해 구축된 로봇 보조 최소 침습 수술용 데이터셋을 소개하며, 비침습적 센서 기반의 동작 인식 성능이 독점 텔레메트리와 유사함을 입증했습니다.
이 논문은 시뮬레이션과 현실 데이터를 혼합한 강화학습 기반 공동 학습 (RL-Co) 프레임워크를 제안하여, 기존 지도 미세 조정 방식의 한계를 극복하고 VLA 모델의 실세계 작업 성공률과 일반화 성능을 크게 향상시키는 방법을 제시합니다.
이 논문은 고충실도 시뮬레이션 환경 구축, 도메인 랜덤화 기반의 개선된 TD3 알고리즘을 활용한 제어 정책 학습, 그리고 시뮬레이션과 현실 간의 격차를 해소하는 매핑 계층 도입이라는 세 단계 프레임워크를 통해 소형 블림프 로봇이 현실 세계에서 역전 자세를 안정적으로 달성하고 유지할 수 있도록 하는 강인한 제어 정책을 제안합니다.
이 논문은 레이블이 없는 대규모 로봇 상호작용 로그에서 소수의 예시만으로 작업 중심의 데이터 세그먼트를 효율적으로 추출하여 로봇 학습용 데이터 부족 문제를 해결하는 경량 Few-Shot 검색 프레임워크 'ROSER'를 제안합니다.
이 논문은 대형 언어 모델 (LLM) 과 드로잉 로봇을 통합하여 인간과 기계가 대화와 스케치를 통해 실시간으로 상호작용하며 시각적 스토리텔링을 함께 창조하는 'Companion' 시스템을 제시하고, 전문가 평가를 통해 이 시스템이 독특한 미학적 정체성과 전시 가치를 지닌 예술적 협력자임을 입증했습니다.
이 논문은 embodied agent(로봇, 인간 등) 의 물리적 제약과 도달 가능성을 고려하여 의미론적 일관성과 상호작용 가능성을 모두 갖춘 3D 실내 레이아웃을 생성하는 새로운 프레임워크인 'RoboLayout'을 제안합니다.
이 논문은 기존 방법의 비효율적인 지각과 비집중적 추론 문제를 해결하기 위해 LLM 과 VLM 의 협업을 통해 능동적 지각과 집중적 추론을 통합한 훈련 없는 프레임워크 'ProFocus'를 제안하며, R2R 과 REVERIE 벤치마크에서 제로샷 성능을 최고 수준으로 달성했습니다.
이 논문은 V2X 환경의 신호등 교차로에서 차량과 인프라의 협력적 인식을 활용하고, 디지털 트윈의 제약 조건을 반영한 새로운 '트윈 손실 (twin loss)'을 도입하여 교통 규칙 위반과 충돌을 줄이면서도 정확한 다중 에이전트 궤적 예측을 가능하게 하는 시스템을 제안합니다.
이 논문은 EMG 기반 의도-힘 추론과 비전-촉각 센서 융합을 통해 실시간 진동 촉각 피드백을 제공하는 폐루프 보조 원격 조작 프레임워크인 TEGA 를 제안하여, 상지 장애인이 다양한 물체를 안정적으로 조작할 수 있도록 힘 조절을 용이하게 함을 보여줍니다.
이 논문은 자연어 지시와 인간 피드백을 활용하여 시뮬레이션된 조작 작업에서 모방 학습 정책을 강화 학습으로 정제하는 'PRISM' 프레임워크를 제안함으로써, 새로운 목표와 제약 조건에 대한 정책의 재사용성과 데이터 효율성을 높이고 배포 강건성을 개선하는 방법을 제시합니다.
이 논문은 역과제 학습을 통해 새로운 조건에서도 일반화 가능한 로봇 제어 정책을 제안하며, 직접적인 지도 없이도 역과제를 성공적으로 수행할 수 있도록 forward 시연 데이터를 활용한 공동 학습 방식을 제시합니다.
이 논문은 기존 방법론이 개별적으로 검증하여 보수적인 결과를 초래했던 한계를 극복하고, 혼합 정수 선형 계획법 (MILP) 을 활용하여 모든 키포인트 간의 상호 의존성과 결합된 편차를 동시에 검증함으로써 학습 기반 키포인트 검출기의 강건성을 최초로 보장하는 새로운 프레임워크를 제안합니다.
이 논문은 자연어 기반의 협력적 에이전트 아키텍처인 RACAS 를 제안하여, 소스 코드나 모델 재학습 없이 다양한 로봇 플랫폼 간에 고수준 자율 행동을 가능하게 함으로써 로봇 프로토타이핑의 장벽을 획기적으로 낮췄음을 보여줍니다.
이 논문은 구동기 제한과 부분 구동 특성을 가진 연성 로봇의 작업 공간 제어 안정성을 보장하기 위해, 제어 리아푸노프 함수를 볼록 부등식 제약으로 활용하는 새로운 제어 프레임워크를 제안하고 다양한 시뮬레이션 환경에서 기존 방법보다 우수한 성능을 입증합니다.
이 논문은 의료 환경에서 로봇의 다양한 실패 유형에 대한 사용자의 다중 모달 반응과 복구 선호도를 체계적으로 분석하기 위해 고안된 'RFM-HRI'라는 새로운 다중 모달 데이터셋을 소개하고, 실패가 사용자의 정서와 통제감에 미치는 부정적 영향을 규명하여 안전이 중요한 로봇 상호작용의 실패 감지 및 복구 방법론 개발에 기여합니다.
이 논문은 오픈 월드 환경에서 객체 간 관계와 맥락을 이해하여 탐색을 효율화하기 위해, 대형 언어 모델의 관계적 지식을 경량 모델로 증류하여 3D 장면 그래프 기반의 실시간 상호작용적 객체 탐색 방법인 SCOUT 을 제안하고, 새로운 벤치마크 SymSearch 를 통해 그 유효성을 입증합니다.