Vision-Encoder Behavioral Fingerprints of Image-to-Image Generative Models: A Training-Paradigm-Driven Taxonomy of Six Commercial APIs
Dieses Paper schlägt eine durch das Trainingsparadigma getriebene Taxonomie von sechs kommerziellen Image-to-Image-generativen Modellen vor und zeigt auf, dass diese sich basierend auf ihrer Reaktion auf inhaltsadaptive Sub-JND-adversarielle Perturbationen, gemessen via gefrorener DINOv2-Token-Distanzen, in zwei distinkte Verhaltenscluster unterteilen lassen – edit-trained versus sampling-time adapted.