From Bandit Regret to FDR Control: Online Selective Generation with Adversarial Feedback Unlocking
Das Paper stellt ExSUL vor, ein neuartiges Online-Lernframework für die selektive Generierung, das durch eine innovative Konversionslemma und eine Strategie zur Freischaltung von Feedback auch unter adversariellen Bedingungen und mit nur teilweisem Benutzerfeedback eine kontrollierte False-Discovery-Rate bei gleichzeitiger hoher Antwortabdeckung erreicht.