DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting
Diese Arbeit untersucht die Eignung des visuellen Basismodells DINOv3 als eingefrorener Backbone für die robotische Blaubeerenernte und zeigt, dass es zwar die Segmentierung durch stabile Repräsentationen verbessert, jedoch bei der Detektion von Früchten und Clustern aufgrund von Skalierungsvariationen und räumlichen Aggregationsmustern an Grenzen stößt.