EditReward: A Human-Aligned Reward Model for Instruction-Guided Image Editing
O artigo apresenta o EditReward, um modelo de recompensa alinhado com preferências humanas e treinado em um grande conjunto de dados anotados por especialistas, que supera os métodos existentes em benchmarks e permite a seleção de dados de alta qualidade para aprimorar modelos de edição de imagem de código aberto.