VisionCreator: A Native Visual-Generation Agentic Model with Understanding, Thinking, Planning and Creation
Il paper presenta VisionCreator, un modello agenziale nativo per la generazione visiva che unifica comprensione, pensiero, pianificazione e creazione attraverso un framework end-to-end addestrato con dati sintetici di alta qualità e tecniche di specializzazione progressiva, dimostrando prestazioni superiori rispetto a modelli proprietari più grandi.