Diffusion Controller: Framework, Algorithms and Parameterization
Die Arbeit stellt Diffusion Controller (DiffCon) vor, ein einheitliches regelungstheoretisches Framework, das reverse Diffusions-Sampling als stochastische Steuerung in LS-MDPs formuliert und daraus effiziente Reinforcement-Learning-Methoden sowie eine parametrisierte Seiten-Netzwerk-Architektur ableitet, die bei der Feinabstimmung von Diffusionsmodellen zu verbesserten Ergebnissen führt.