Unlocking ImageNet's Multi-Object Nature: Automated Large-Scale Multilabel Annotation
Dit artikel introduceert een geautomatiseerd, mensvrij proces dat de ImageNet-trainingset omzet naar een meervoudige-labeldataset met behulp van zelftoezichtende Vision Transformers, wat leidt tot robuustere modelrepresentaties en aanzienlijke prestatieverbeteringen op diverse benchmarks.