Suiren-1.0 Technical Report: A Family of Molecular Foundation Models

Dit artikel introduceert Suiren-1.0, een familie van moleculaire foundationmodellen die door middel van zelftoezicht, voortgezette training en conformatiecompressie-distillatie nauwkeurige voorspellingen voor diverse organische systemen mogelijk maakt en state-of-the-art resultaten behaalt op een reeks taken.

Oorspronkelijke auteurs: Junyi An, Xinyu Lu, Yun-Fei Shi, Li-Cheng Xu, Nannan Zhang, Chao Qu, Yuan Qi, Fenglei Cao

Gepubliceerd 2026-03-24
📖 4 min leestijd☕ Koffiepauze-leesvoer

Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat chemie een enorme bibliotheek is, maar dan eentje waar de boeken in twee totaal verschillende talen geschreven zijn.

  • Taal 1 (De 3D-structuur): Dit is hoe een molecuul er echt uitziet in de ruimte, als een complex, draaiend 3D-puzzelstukje. Dit is de taal van de natuurkunde. Het is extreem nauwkeurig, maar heel moeilijk te lezen en te schrijven.
  • Taal 2 (De 2D-tekening): Dit is hoe chemici moleculen op papier tekenen (of in een computer invoeren als een simpele reeks tekens, zoals een SMS-bericht). Dit is makkelijk te lezen, maar het mist de diepte en de echte vorm van het molecuul.

Tot nu toe hadden we twee soorten "slimme computers" (AI-modellen):

  1. De 3D-experts die de complexe ruimtelijke vorm begrijpen, maar te traag en duur zijn om op grote schaal te gebruiken.
  2. De 2D-experts die snel zijn en de tekeningen begrijpen, maar "blind" zijn voor de echte 3D-vorm, waardoor ze vaak fouten maken bij het voorspellen van hoe een stof zich gedraagt.

Suiren-1.0 is de nieuwe superheld die deze twee talen eindelijk samenbrengt. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. De Meester: Suiren-Base (De 3D-Architect)

Stel je Suiren-Base voor als een geniale architect die miljoenen uren heeft bestudeerd aan de echte, fysieke bouwplannen van moleculen (gemaakt met superkrachtige computers die de wetten van de kwantummechanica nabootsen).

  • Hij heeft 1,8 miljard "neuronen" (zoals hersencellen) en kan de meest complexe 3D-vormen perfect begrijpen.
  • Hij weet precies hoe atomen op elkaar reageren, net als een meesterbouwer die weet hoe een brug de wind moet weerstaan.
  • Het probleem: Hij is zo complex en zwaar dat hij niet direct in een gewone computer past voor dagelijkse taken.

2. De Leerling: Suiren-ConfAvg (De Slimme Vertaler)

Hier komt het magische deel: Conformation Compression Distillation (CCD).
Stel je voor dat de architect (Suiren-Base) een leerling heeft. De leerling (Suiren-ConfAvg) mag niet zelf de zware bouwwerkzaamheden doen, maar moet wel leren van de meester.

  • De leerling kijkt naar de simpele 2D-tekeningen (de SMS-berichten).
  • In plaats van alleen naar de lijnen te kijken, "droomt" de leerling (via een techniek die lijkt op het genereren van kunst) de volledige 3D-structuur die bij die tekening hoort.
  • De leerling leert zo: "Als ik deze 2D-tekening zie, dan moet ik onthouden dat dit molecuul in de echte wereld er zo uitziet en zo voelt."
  • Het resultaat is een lichtgewicht model dat snel is, maar diep in zijn "onderbewuste" de kennis van de 3D-architect draagt.

3. De Tweelingbroer: Suiren-Dimer (De Sfeer-expert)

Soms werken moleculen niet alleen, maar in paren (zoals twee mensen die hand in hand lopen). Suiren-Dimer is een variant die specifiek is getraind om te begrijpen hoe moleculen met elkaar omgaan, wat cruciaal is voor medicijnenontwikkeling.

Waarom is dit zo geweldig? (De Analoge Wereld)

Vroeger moest je voor elke nieuwe chemische vraag een dure, zware 3D-simulatie draaien (zoals het bouwen van een maquette van een heel gebouw om te zien of het niet instort). Dat duurde dagen.

Met Suiren-1.0 kun je nu gewoon een simpele tekening (of een SMS-bericht) invoeren. Het model pakt die tekening, roept zijn geheugen op van de 3D-wereld, en geeft je direct een antwoord over:

  • Zekerheid: Is dit materiaal veilig? (Bijv. ontploft het?)
  • Oplossing: Lost dit op in water? (Belangrijk voor medicijnen in je maag).
  • Energie: Hoeveel energie komt er vrij als je dit verbrandt?
  • Gedrag: Hoe stroomt dit als vloeistof?

De Resultaten in het Kort

De makers hebben Suiren-1.0 getest op meer dan 50 verschillende taken, van het voorspellen van kookpunten tot het vinden van nieuwe medicijnen.

  • Het slaat bijna alle andere modellen (zoals MoleBERT of Uni-Mol) op hun eigen terrein.
  • Het is sneller (geen zware 3D-berekeningen nodig voor elke vraag).
  • Het is nauwkeuriger (het maakt minder fouten omdat het de "echte" 3D-wetten kent).

Conclusie

Suiren-1.0 is als het geven van een fysicus-geest aan een snel schrijver. De schrijver kan razendsnel antwoorden geven op vragen over de wereld, maar hij heeft de diepe, fysieke kennis van de natuurkunde in zijn hoofd. Hierdoor kunnen wetenschappers sneller nieuwe materialen, medicijnen en batterijen ontwerpen, zonder vast te lopen in de complexiteit van de 3D-wereld.

De hele "bibliotheek" (de modellen en de testgegevens) is nu gratis openbaar gemaakt, zodat iedereen hiermee kan leren en bouwen.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →