SOLARIS: Speculative Offloading of Latent-bAsed Representation for Inference Scaling

Het paper introduceert SOLARIS, een innovatief kader dat door het vooraf berekenen van latent representaties voor toekomstige gebruiker-item-interacties de hoge rekentijd van complexe aanbevelingsmodellen ontkoppelt van de kritieke latency, waardoor Meta deze modellen nu efficiënt kan inzetten voor miljarden dagelijkse verzoeken met een meetbare omzetstijging.

Zikun Liu, Liang Luo, Qianru Li, Zhengyu Zhang, Wei Ling, Jingyi Shen, Zeliang Chen, Yaning Huang, Jingxian Huang, Abdallah Aboelela, Chonglin Sun, Feifan Gu, Fenggang Wu, Hang Qu, Huayu Li, Jill Pan, Kaidi Pei, Laming Chen, Longhao Jin, Qin Huang, Tongyi Tang, Varna Puvvada, Wenlin Chen, Xiaohan Wei, Xu Cao, Yantao Yao, Yuan Jin, Yunchen Pu, Yuxin Chen, Zijian Shen, Zhengkai Zhang, Dong Liang, Ellie Wen

Gepubliceerd 2026-04-15
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

🌟 Wat is SOLARIS? De "Super-Keuken" van Meta

Stel je voor dat Meta (Facebook, Instagram, WhatsApp) een enorme, supermoderne keuken heeft. In deze keuken werken twee soorten chefs:

  1. De "Grootmeester" (Foundation Model): Dit is een genie van een chef. Hij kan de allerbeste gerechten bedenken, maar hij is traag, kost veel geld om te onderhouden en heeft veel tijd nodig om een gerecht te bereiden. Hij is te duur om direct aan de deur te staan voor elke klant.
  2. De "Snelle Serveerders" (Vertical Models): Dit zijn de chefs die direct aan de deur staan. Ze moeten razendsnel een gerecht op tafel zetten voor de klant die wacht. Ze zijn snel, maar minder slim dan de Grootmeester.

Het probleem:
Vroeger probeerden de Snelle Serveerders te leren van de Grootmeester door alleen de uitslag van het gerecht te kopiëren (bijvoorbeeld: "Dit gerecht smaakt 8/10"). Dit heet "kennisdistillatie". Het probleem is dat je hierdoor veel informatie kwijtraakt. Het is alsof je alleen de foto van het gerecht ziet, maar niet de geur, de textuur of de ingrediënten. De Snelle Serveerders werden hierdoor niet echt beter.

Daarnaast was de Grootmeester te traag om direct te helpen als een klant iets bestelde. De klant zou te lang moeten wachten.

De oplossing: SOLARIS
Meta heeft SOLARIS bedacht. Dit is een slim systeem dat de Grootmeester laat werken terwijl niemand kijkt, zodat de Snelle Serveerders direct de beste informatie hebben.

🚀 Hoe werkt het? (De 3 Slimme Trucs)

1. De "Speculatieve" Voorbereiding (Zoals een restaurant dat vooruitkijkt)

Stel je voor dat een restaurant weet dat mensen die een pizza bestellen, vaak ook een cola drinken. In plaats van te wachten tot de klant de cola bestelt, zet de kok alvast een glas cola klaar.

SOLARIS doet precies dit:

  • Het systeem kijkt naar wat mensen waarschijnlijk gaan doen.
  • De Grootmeester berekent in de achtergrond (terwijl de serveerders rustig zijn) de perfecte "receptuur" (de embedding) voor deze waarschijnlijke bestellingen.
  • Deze recepturen worden opgeslagen in een koelkast (cache).
  • Het resultaat: Als een klant daadwerkelijk binnenkomt, hoeft de Snelle Serveerder niet te wachten op de Grootmeester. Hij pakt de al berekende receptuur uit de koelkast en gebruikt die direct. Dit kost geen extra tijd voor de klant.

2. De "Grote Familie" (Samenvoegen van kennis)

Soms is de Grootmeester niet in staat om voor iedere mogelijke combinatie van klant en product een recept te maken (er zijn te veel mensen en te veel producten).

  • Truc: Als er geen recept is voor "Juf Jansen en deze specifieke schoen", kijkt SOLARIS naar wat Juf Jansen eerder heeft gekocht, of wat andere mensen met een vergelijkbaar profiel hebben gekocht.
  • Het systeem maakt een gemiddeld recept op basis van wat Juf Jansen in de afgelopen 24 uur heeft gedaan, of wat haar "buren" (mensen met vergelijkbare interesses) hebben gedaan.
  • Zo krijgt de Snelle Serveerder toch een goed advies, zelfs als er geen exacte match was.

3. De "Kwaliteitscontrole" (Alleen de beste voorbereiden)

De Grootmeester kan niet alles tegelijk berekenen. SOLARIS gebruikt een slimme filter (een "Verifier").

  • Het systeem vraagt zich af: "Is deze klant waarschijnlijk geïnteresseerd in dit product?"
  • Als het antwoord "nee" is, wordt er geen tijd verspild aan het berekenen van een recept.
  • Als het antwoord "ja" is, wordt de Grootmeester ingeschakeld om de perfecte receptuur te maken.
  • Dit zorgt ervoor dat de dure rekenkracht wordt gebruikt voor de zaken die echt geld opleveren.

📈 Wat is het resultaat?

Door dit systeem in te zetten bij Meta's advertenties:

  • Sneller: Klanten hoeven niet te wachten, de advertenties verschijnen direct.
  • Slimmer: De Snelle Serveerders krijgen nu de "diepe kennis" van de Grootmeester, niet alleen de oppervlakkige antwoorden.
  • Meer winst: Omdat de advertenties beter passen bij wat mensen willen, klikken ze vaker. Meta heeft hierdoor 0,67% meer omzet gemaakt. Dat klinkt als een klein percentage, maar bij Meta betekent dat honderden miljoenen dollars extra per jaar.

🎯 Samenvattend in één zin

SOLARIS is als een slimme assistent die vooruitkijkt, de beste antwoorden van een super-slimme expert alvast opschrijft en die op het juiste moment aan de snelle verkoper geeft, zodat de klant nooit hoeft te wachten en altijd de beste service krijgt.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →