NoOVD: Novel Category Discovery and Embedding for Open-Vocabulary Object Detection
O artigo apresenta o NoOVD, um novo framework de treinamento que integra um mecanismo de auto-distilação baseado em modelos visão-linguagem congelados e componentes como K-FPN e R-RPN para superar as limitações na descoberta e detecção de categorias não vistas em tarefas de detecção de objetos com vocabulário aberto.