CTRL-RAG: Contrastive Likelihood Reward Based Reinforcement Learning for Context-Faithful RAG Models
Dit paper introduceert CTRL-RAG, een nieuw hybride beloningssysteem dat gebruikmaakt van een contrastieve waarschijnlijkheidsbeloning om hallucinaties te verminderen en de contextgetrouwheid van Retrieval-Augmented Generation-modellen te verbeteren door de log-waarschijnlijkheidskloof tussen antwoorden met en zonder bewijsmateriaal te optimaliseren.