DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting
本論文は、大規模自己教師あり学習で訓練された視覚基盤モデル DINOv3 を青果物収穫ロボット向けタスクに適用した評価を通じて、果実や傷のセグメンテーションには有効である一方、検出やクラスター検出には局所化や空間的集約のモデル化に課題があることを明らかにし、DINOv3 を果実スケールや集約構造に整合した下流タスクのセマンティックなバックボーンとして活用すべきことを示唆しています。