Towards Visual Query Segmentation in the Wild
Cet article introduit la segmentation de requête visuelle (VQS) comme nouveau paradigme de localisation, accompagné du benchmark à grande échelle VQS-4K et de la méthode VQ-SAM, qui surpassent les approches existantes pour segmenter précisément toutes les occurrences d'un objet dans des vidéos non élaguées.