Improving Text-to-Image Generation with Intrinsic Self-Confidence Rewards
O artigo apresenta o SOLACE, um framework de pós-treinamento para geração de texto-imagem que utiliza recompensas intrínsecas baseadas na autoconfiança do modelo para otimização não supervisionada, resultando em melhorias na geração composicional, renderização de texto e alinhamento, além de mitigar a exploração de recompensas quando combinado com sinais externos.