Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1
この論文は、Grounding DINO 1.5 と YOLOv11 を検出器として、Segment Anything Model 2.1(SAM 2.1)を共有バックボーンに用いた二重パイプライン手法を提案し、鳥の画像セグメンテーションにおいてゼロショットおよび教師あり学習の両方で従来の手法を上回る性能を達成したことを報告しています。