Landing with the Score: Riemannian Optimization through Denoising

Each language version is independently generated for its own context, not a direct translation.

Titel: Hoe je een perfecte route vindt op een onzichtbare berg zonder kaart

Stel je voor dat je een bergbeklimmer bent. Je doel is om zo laag mogelijk te komen (de "beste" oplossing vinden) op een berg die je niet kunt zien. Je weet alleen dat er een pad is, een laagliggend spoor waar alle andere beklimmers hebben gelopen. Dit pad is je manifold (een wiskundig oppervlak).

In de oude wereld van wiskunde en AI wisten de klimmers precies waar het pad lag. Ze hadden een gedetailleerde kaart. Ze konden elke stap zetten, controleren of ze op het pad bleven, en direct naar beneden lopen. Dit heet Riemanniaanse optimalisatie.

Maar wat als je die kaart kwijt bent? Wat als je alleen maar een hoop foto's hebt van mensen die ooit op dat pad hebben gelopen? Je ziet het pad niet zelf, je ziet alleen de mensen erop. Dit is het probleem dat deze paper oplost.

Hier is hoe de auteurs van ETH Zürich dit oplossen, vertaald naar alledaags taal:

1. Het geheim: De "Denoising Score" als magische kompas

De kern van hun idee is een slimme truc die ze halen uit de wereld van Diffusiemodellen (de technologie achter AI die prachtige plaatjes maakt, zoals DALL-E of Midjourney).

Stel je voor dat je een foto van een bergpad hebt, maar er zit veel ruis (zand en mist) overheen. Een AI kan die foto "ontruisen" (denoise) om het pad weer scherp te zien.

De Link: De auteurs ontdekten dat deze "ontruisingskracht" (de score function) precies doet wat een wiskundige kaart zou doen.
De Gradiënt (De richting): Als je op een willekeurige plek in de mist staat, zegt de AI: "Je bent een beetje uit het pad, loop in deze richting om er weer op te komen." Dit is als een magisch kompas dat je altijd terug naar het pad leidt.
De Hessian (Het oppervlak): De AI kan ook zeggen: "Het pad buigt hier een beetje naar links." Dit helpt je om niet van de rand te vallen, maar precies op het pad te blijven lopen.

Kortom: Ze gebruiken een AI die is getraind op "ruis" om de geometrie van het pad te reconstrueren, zonder dat ze het pad ooit expliciet hebben gezien.

2. De twee nieuwe methoden: DLF en DRGD

Op basis van dit magische kompas hebben ze twee nieuwe manieren bedacht om de berg af te dalen:

DLF (Denoising Landing Flow):
Dit is als een klimmer die een beetje "zweeft". Hij loopt niet direct recht naar beneden, maar laat zich ook een beetje "landen" op het pad. Als hij een beetje van het pad afdwaalt, trekt de AI hem er weer op terug (zoals een onzichtbare hand). Hij loopt een beetje rondjes, maar komt steeds dichter bij het laagste punt.
DRGD (Denoising Riemannian Gradient Descent):
Dit is de "stap-voor-stap" methode. Je zet een stap naar beneden, en direct daarna gebruikt de AI je positie om te corrigeren: "Oeps, je staat net iets naast het pad, schuif even bij." Je herhaalt dit tot je op het laagste punt bent.

3. Waarom is dit zo cool? (De Analogie van de Auto)

Stel je voor dat je een zelfrijdende auto hebt die een route moet vinden.

Oude manier: Je moet de wegenkaart van de stad hebben. Als de kaart niet bestaat, kun je niet rijden.
Nieuwe manier: Je hebt geen kaart nodig. Je hebt alleen duizenden foto's van auto's die eerder door de stad zijn gereden. Je AI kijkt naar die foto's, leert waar de weg ligt (zelfs als er gaten in zitten of als het regent), en stuurt je auto daarheen.

Dit is revolutionair omdat het werkt in situaties waar we de regels niet kennen, maar wel veel data hebben. Denk aan:

Vliegtuigvleugels: Ontwerpen van een vleugel die perfect vliegt, zonder de complexe luchtstroomformules uit je hoofd te kennen, maar wel met duizenden foto's van goede vleugels.
Ziekenhuizen: Het vinden van de beste behandelroute voor een patiënt, gebaseerd op data van duizenden andere patiënten, zonder dat we de exacte biologische wetten van het lichaam volledig begrijpen.

4. Wat zeggen de resultaten?

De auteurs hebben dit getest op simpele wiskundige problemen en op echte controleproblemen (zoals een unicycle-auto die een route moet volgen).

Ze konden routes vinden die beter waren dan alles wat in de trainingsdata zat.
De auto bleef veilig op het pad (de "manifold"), zelfs als de AI niet 100% perfect was.
Ze hoefden de AI niet opnieuw te trainen; ze gebruikten een bestaande AI en lieten die "denken" tijdens het optimaliseren.

Conclusie

Deze paper zegt eigenlijk: "Je hoeft niet de architect van de wereld te zijn om de beste route te vinden. Je hoeft alleen maar te weten waar mensen eerder zijn geweest."

Ze hebben een brug geslagen tussen de wiskunde van gladde oppervlakken en de moderne AI van beeldgeneratie. Het is alsof ze een magische bril hebben gevonden die ons laat zien waar het pad ligt, zelfs als het volledig in de mist verdwijnt.

Each language version is independently generated for its own context, not a direct translation.

Titel: Landing with the Score: Riemannian Optimization through Denoising

Auteurs: Andrey Kharitenko, Zebang Shen, Riccardo De Santi, Niao He, Florian Dörfler (ETH Zurich)

1. Probleemstelling

Traditionele Riemanniaanse optimalisatie richt zich op het minimaliseren van een objectief functie $f(x)$ over een expliciet bekende subvariëteit (manifold) $\mathcal{M}$ in een hoge-dimensionale ruimte. Methoden zoals Riemanniaanse gradiëntafstijging vereisen expliciete geometrische operaties, zoals projectie op de raakruimte (tangent space), retractie (terugbrengen naar de variëteit) en exponentiële afbeeldingen.

In veel moderne toepassingen van generatieve AI en data-gedreven besturing (bijv. ontwerp van vleugels, robotica, systeemidentificatie) is de variëteit $\mathcal{M}$ echter niet expliciet bekend. In plaats daarvan wordt deze impliciet gegeven door een verdeling van data ( $\mu_{data}$ ) die op de variëteit ligt (de "data manifold hypothesis"). Bestaande methoden kunnen hier niet direct worden toegepast omdat de geometrische operaties ontbreken. Het doel is om een optimalisatie-algoritme te ontwikkelen dat werkt met alleen steekproeven van deze data-verdeling, zonder de onderliggende manifold expliciet te hoeven modelleren of te leren als een parametrische kaart.

2. Methodologie

De kern van de voorgestelde aanpak is het verbinden van diffusiemodellen (score-based models) met Riemanniaanse optimalisatie.

A. De Link-functie en Geometrische Herwinning

De auteurs introduceren een "link-functie" $\ell_\sigma(x)$ gebaseerd op een geblurede versie van de data-verdeling:
$p_\sigma = \mathcal{N}(0, \sigma^2 I) * \mu_{data}$
$\ell_\sigma(x) = \frac{1}{2}\|x\|^2 + \sigma^2 \log p_\sigma(x)$

Ze bewijzen theoretisch dat in het regime van kleine ruis ( $\sigma \to 0$ ):

De gradiënt $\nabla \ell_\sigma(x)$ convergeert naar de projectie van $x$ op de dichtstbijzijnde punt op de manifold $\pi(x)$ .
De Hessiaan $\nabla^2 \ell_\sigma(x)$ convergeert naar de projectie op de raakruimte van de manifold ( $P_{T_x\mathcal{M}}$ ).

Dit betekent dat de scorefunctie van een diffusiemodel (die $\nabla \log p_\sigma$ benadert) en zijn Jacobiaan direct gebruikt kunnen worden om de essentiële geometrische operaties van Riemanniaanse optimalisatie te simuleren, zelfs zonder de manifold expliciet te kennen.

B. Gebruik van Pre-trained Score Netwerken

In plaats van de geometrie te leren, gebruiken de auteurs een reeds getraind score-netwerk $s(x, \sigma)$ (zoals in diffusion models).

De benaderde projectie wordt: $v(x) = x + \sigma^2 s(x, \sigma)$ .
De benaderde raakruimte-projectie wordt de Jacobiaan van $v(x)$ .

Dit maakt het mogelijk om bestaande, goed getrainde generatieve modellen te gebruiken voor optimalisatie zonder extra training van het netwerk zelf; alleen inferentie en backpropagatie t.o.v. de input zijn nodig.

C. Twee Nieuwe Algoritmen

Op basis van deze inzichten stellen de auteurs twee algoritmen voor:

Denoising Landing Flow (DLF):
Een continue dynamiek (stroom) die een "landing"-term toevoegt om de iteraten naar de manifold te trekken terwijl ze de objectief functie minimaliseren:
$\dot{x} = -v'(x)\nabla f(v(x)) + \eta(v(x) - x)$
Hierbij zorgt de term $\eta(v(x) - x)$ voor een "landing" op de manifold, terwijl de eerste term de gradiëntafstijging in de benaderde raakruimte uitvoert.
Denoising Riemannian Gradient Descent (DRGD):
Een gediscrreteerde versie die fungeert als een Riemanniaanse gradiëntafstijging met een benaderde retractie:
$x_{k+1} = v(x_k - \gamma_k v'(x_k)\nabla f(x_k))$
Hierbij fungeert $v$ als een benaderde retractie en $v'$ als de projectie.

3. Belangrijkste Bijdragen

Theoretische Link: Het aantonen dat de gradiënt en Hessiaan van de link-functie (gebaseerd op de score van een diffusiemodel) uniform convergeren naar de projectie op de manifold en de raakruimteprojectie naarmate $\sigma \to 0$ .
Eerste Score-gebaseerde Algoritmen: Introductie van DLF en DRGD als de eerste methoden die pre-trained score-functies gebruiken voor optimalisatie over data-manifolds.
Niet-asymptotische Garantieën: Het leveren van strikte convergentiebewijzen. De methoden garanderen dat de iteraten binnen een kleine afstand van de manifold blijven (ongeveer haalbaar) en dat de Riemanniaanse gradiëntnorm klein wordt (ongeveer optimaal), met fouten die schalen met $\mathcal{O}(\sigma)$ .
Inference-time Efficiency: De methoden vereisen geen extra training van het neurale netwerk. Als een score-netwerk al beschikbaar is voor een bepaalde taak (bijv. genereren van aerodynamische vormen), kan het direct worden gebruikt voor optimalisatie.

4. Resultaten en Experimenten

De auteurs testen hun methoden op twee soorten problemen:

Synthetisch Experiment (Orthogonale Groep $O(n)$ ):
- Optimalisatie op de manifold van orthogonale matrices.
- Resultaat: De methoden vinden oplossingen met een lagere kostfunctiewaarde dan de beste punten in de trainingsdata, wat aantoont dat het algoritme kan generaliseren buiten de steekproeven. De nauwkeurigheid verbetert naarmate $\sigma$ kleiner wordt.
Data-gedreven Besturing (Reference Tracking):
- Toepassing op het besturen van een dubbele slinger en een unicycle-car model (een niet-lineair dynamisch systeem).
- Doel: Het vinden van input-trajecten die een referentie-trajectorie volgen, waarbij de dynamiek alleen bekend is via een dataset van meettrajecten.
- Resultaat: De gegenereerde trajecten volgen de referentie aanzienlijk beter dan de beste trajecten uit de trainingsset. De gegenereerde oplossingen blijven dicht bij de "system behavior manifold" (de verzameling van fysiek haalbare trajecten), wat de effectiviteit van de "landing"-mechanismen bevestigt.

5. Betekenis en Toekomstperspectief

Dit werk vormt een brug tussen twee grote gebieden: generatieve AI (diffusiemodellen) en wiskundige optimalisatie (Riemanniaanse optimalisatie).

Paradigmaverschuiving: Het verschuift de focus van het expliciet modelleren van een manifold (via parametrische kaarten of auto-encoders) naar het benutten van de impliciete geometrie die al in een getraind generatief model zit opgesloten.
Praktische Toepassingen: Het opent de deur voor geavanceerd ontwerp en besturing in domeinen waar de fysieke beperkingen complex zijn en alleen via data bekend zijn (bijv. aerodynamisch ontwerp, materiaalwetenschap, robotica).
Efficiëntie: Omdat het algoritme puur op inferentie draait, is het zeer geschikt voor real-time toepassingen of situaties waar het opnieuw trainen van een model te duur is.

Kortom, de paper toont aan dat "denoising" (het verwijderen van ruis uit data) niet alleen gebruikt kan worden om nieuwe data te genereren, maar ook als een krachtig wiskundig gereedschap om geoptimaliseerde, haalbare oplossingen te vinden binnen de complexe structuren van real-world data.