VGGT-Det: Mining VGGT Internal Priors for Sensor-Geometry-Free Multi-View Indoor 3D Object Detection
이 논문은 정밀한 센서 보정 없이도 다중 뷰 실내 3D 객체 감지를 가능하게 하기 위해 VGGT 의 내부 시맨틱 및 기하학적 사전 지식을 활용하는 새로운 프레임워크 'VGGT-Det'을 제안하며, 주시 기반 쿼리 생성과 쿼리 주도 특징 집계 모듈을 통해 기존 최첨단 방법보다 ScanNet 과 ARKitScenes 데이터셋에서 성능을 크게 향상시킵니다.