VaSST: Variational Inference for Symbolic Regression using Soft Symbolic Trees

Dit paper introduceert VaSST, een schaalbaar probabilistisch kader voor symbolische regressie dat variatie-inferentie en zachte symbolische bomen gebruikt om de combinatorische zoekruimte efficiënt te benaderen en tegelijkertijd een principesvolle onzekerheidskwantificering mogelijk te maken.

Somjit Roy, Pritam Dey, Bani K. Mallick

Gepubliceerd 2026-03-02
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De Grote Droom: De Formule van het Universum vinden

Stel je voor dat je een detective bent die probeert te achterhalen hoe de natuur werkt. Je hebt een berg data (metingen van temperatuur, snelheid, zwaartekracht, etc.). Je doel is niet alleen om te voorspellen wat er volgende gebeurt, maar om de eigenlijke wet te vinden die dit regelt.

In de wetenschap noemen we dit Symbolische Regressie. Het is alsof je probeert de exacte wiskundige formule te vinden die een natuurkundige wet beschrijft, zoals $F = ma$ of de wet van Ohm, puur op basis van meetgegevens.

Het Probleem: Een doolhof van onmogelijke keuzes

Het probleem met het vinden van deze formules is dat er oneindig veel mogelijke combinaties zijn van getallen, letters en wiskundige tekens (+, -, sin, exp, etc.).

  • De oude methoden (zoals genetische algoritmen) gedragen zich als een blinde muis in een gigantisch doolhof. Ze proberen willekeurig paden uit, hopend dat ze de uitgang vinden. Dit kost enorm veel tijd en energie, en vaak vinden ze een "valkuil" (een formule die wel werkt, maar veel te ingewikkeld is).
  • De probabilistische methoden (die proberen de onzekerheid te meten) zijn vaak net zo traag omdat ze ook in dat doolhof moeten zoeken, maar dan met een zware rugzak aan.

De Oplossing: VaSST (De "Zachte" Benadering)

De auteurs van dit paper hebben VaSST bedacht. De naam staat voor Variational Inference for Symbolic Regression using Soft Symbolic Trees.

Laten we de kernideeën uitleggen met een analogie:

1. Van Houten Blokken naar Klei (Soft Symbolic Trees)

Stel je voor dat je een formule bouwt met houten blokken. Je kunt alleen kiezen tussen een vierkant blok of een rond blok. Je moet ze stap voor stap stapelen. Als je een fout maakt, moet je alles afbreken en opnieuw beginnen. Dat is hoe de oude methoden werken: discreet (alles of niets).

VaSST doet iets slimmers. Het vervangt die harde houten blokken door klei.

  • In plaats van te kiezen: "Is dit een plus-teken of een min-teken?", laat VaSST de klei eerst een beetje zacht en vloeibaar zijn.
  • De formule is dan een mengsel: "70% plus, 30% min".
  • Hierdoor kan de computer de formule niet meer stapelen, maar smelten en vervormen. Omdat de vorm nu zacht is, kan de computer een trapsgewijze afslag nemen (gradient-based optimization) om de perfecte vorm te vinden, net zoals een hiker die de beste route naar de top van een berg vindt door de helling te volgen, in plaats van willekeurig te springen.

2. Het "Zachte" Doolhof

Door de blokken zacht te maken, verandert het onmogelijke doolhof in een gladde heuvel. De computer kan nu heel snel en efficiënt de "diepste dalen" (de beste formules) vinden met wiskundige hulpmiddelen die normaal gesproken alleen voor neurale netwerken worden gebruikt.

3. De Kunst van het "Harder Maken" (Annealing)

Je kunt natuurlijk niet eeuwig met een zachte, vloeibare formule werken; je wilt een echte, harde formule voor de wetenschap.

  • VaSST gebruikt een trucje: het begint met heel zachte klei (veel variatie, veel exploratie).
  • Langzaam wordt de klei harder (verwarmen en laten afkoelen, net als metaal).
  • Uiteindelijk stolt de klei tot een stevig, duidelijk houten blok: een echte, leesbare wiskundige formule.

Waarom is VaSST zo goed?

  1. Snelheid: Omdat het "zachte" pad volgt, is het veel sneller dan de oude methoden die blindelings door het doolhof springen.
  2. Onzekerheid meten: VaSST is niet alleen slim, het is ook bescheiden. Het geeft niet één antwoord, maar een waaier van mogelijke antwoorden. Het zegt: "Ik denk dat dit de formule is, maar er is ook een kleine kans dat het dit is." Dit is cruciaal voor wetenschappers om te weten hoe betrouwbaar een ontdekking is.
  3. Geen rommel: VaSST is getraind om simpel te blijven (Ockhams scheermes). Het houdt van strakke, elegante formules en vermijdt onnodig ingewikkelde wiskundige rommel die vaak door andere methoden worden gegenereerd.

De Resultaten: De "Feynman" Test

De auteurs hebben VaSST getest op beroemde natuurkundige formules uit het werk van Richard Feynman (zoals de wet van Coulomb of Fourier's warmtewet).

  • De concurrenten (zoals genetische algoritmen of andere AI-methoden) faalden vaak of produceerden onbegrijpelijke, enorme formules die wel werkten, maar geen zin hadden.
  • VaSST vond de exacte, eenvoudige formules terug, zelfs als de data ruis (fouten) bevatte. Het deed dit bovendien veel sneller dan de beste bestaande methoden.

Samenvatting in één zin

VaSST is een slimme, snelle AI die wiskundige formules ontdekt door ze eerst als zachte, vervormbare klei te behandelen om de beste vorm te vinden, en ze daarna weer hard te maken tot een duidelijke, betrouwbare wetenschappelijke wet.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →