DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting
이 논문은 대규모 자기지도 학습으로 훈련된 비전 기반 모델인 DINOv3 를 블루베리 수확 로봇의 시각 작업에 적용한 결과, 분할 작업에는 효과적이지만 검출 및 군집 인식에는 공간적 구조와 스케일 변이로 인해 한계가 있음을 규명하여, 이를 하류 작업의 공간 모델링과 정합된 의미적 백본으로 활용해야 함을 제시합니다.