DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting
Este trabalho avalia o modelo de visão DINOv3 como base para tarefas de percepção em robótica de colheita de mirtilos, concluindo que, embora seja eficaz para segmentação graças às suas representações estáveis, seu desempenho em detecção é limitado pela variação de escala e pela dificuldade em modelar aglomerados, sugerindo que ele deve ser utilizado como uma base semântica complementar a modelos espaciais especializados.