Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1
Cet article présente une approche à double pipeline utilisant des modèles de fondation (Grounding DINO 1.5, YOLOv11 et SAM 2.1) pour la segmentation d'images d'oiseaux, démontrant qu'un mode supervisé fine-tuné atteint des performances record (IoU 0,912) et qu'un mode zero-shot fonctionne efficacement sans données étiquetées, surpassant ainsi les réseaux de segmentation traditionnels.