Improving Text-to-Image Generation with Intrinsic Self-Confidence Rewards
El artículo presenta SOLACE, un marco de post-entrenamiento que mejora la generación de imágenes a partir de texto mediante recompensas intrínsecas de autoconfianza derivadas de la capacidad del modelo para recuperar ruido inyectado, logrando así optimización no supervisada y mejoras en la alineación texto-imagen sin necesidad de anotaciones externas.