MICON-Bench: Benchmarking and Enhancing Multi-Image Context Image Generation in Unified Multimodal Models
Este trabalho apresenta o MICON-Bench, um benchmark abrangente para avaliar a geração de imagens em contexto multiimagem, juntamente com um novo mecanismo de reequilíbrio de atenção dinâmica (DAR) que melhora a coerência e reduz alucinações em modelos multimodais unificados.