Uni-cot: Towards Unified Chain-of-Thought Reasoning Across Text and Vision
El paper presenta Uni-CoT, un marco de razonamiento de cadena de pensamiento unificado que combina comprensión y generación de imágenes mediante una estrategia de razonamiento de dos niveles para lograr un razonamiento multimodal coherente y eficiente con resultados de vanguardia en benchmarks de generación y edición de imágenes.