DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting
Este trabajo evalúa DINOv3 como un backbone semántico para tareas de percepción visual en la cosecha robótica de arándanos, concluyendo que aunque mejora consistentemente la segmentación, su eficacia en la detección depende de modelos espaciales adaptados a la escala de la fruta y a las estructuras de agrupación.