Thinking in Latents: Adaptive Anchor Refinement for Implicit Reasoning in LLMs

Het artikel introduceert AdaAnchor, een latent-reasoning-framework dat de nauwkeurigheid verbetert en de inferentiekosten verlaagt door stil iteratief rekenwerk uit te voeren via het adaptief verfijnen van ankervectoren, waarbij het aantal stappen automatisch wordt aangepast aan de moeilijkheidsgraad van het probleem.

Disha Sheshanarayana, Rajat Subhra Pal, Manjira Sinha, Tirthankar Dasgupta

Gepubliceerd 2026-03-17
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een slimme robot hebt die heel goed is in wiskundepuzzels. Tot nu toe deed deze robot zijn werk op twee manieren:

  1. De 'Praatpaal'-methode (CoT): De robot dacht hardop na. Hij schreef elke stap van zijn redenering op, alsof hij een verhaal vertelde. "Eerst tel ik dit op, dan trek ik dat af..." Dit gaf vaak het juiste antwoord, maar het kostte veel tijd en papier (of in dit geval: digitale ruimte en rekenkracht).
  2. De 'Stille Denker'-methode (Latent Reasoning): De robot dacht in zijn hoofd, zonder iets op te schrijven. Hij deed het antwoord direct. Dit was snel, maar soms gaf hij het verkeerde antwoord omdat hij te weinig tijd nam om echt na te denken.

De onderzoekers van dit paper hebben een nieuwe, slimme manier bedacht die het beste van beide werelden combineert. Ze noemen het AdaAnchor.

Hoe werkt AdaAnchor? (De Analogie van de Anker)

Stel je voor dat de robot een bootje is op een meer.

  • De Ankers: In plaats van te praten, heeft de robot een setje onzichtbare ankers (we noemen ze 'latent anchors') bij zich. Deze ankers zijn als een soort 'denk-spons'.
  • Het Duiken: Wanneer de robot een vraag krijgt, gooit hij deze ankers in het water van zijn eigen hersenen. Hij trekt ze omhoog, kijkt wat hij ziet, en duikt weer. Dit is het 'refineren' of verbeteren van de ankers.
  • Het Stille Denken: Tijdens dit duiken en trekken doet de robot zijn rekenwerk. Hij schrijft niets op. Hij denkt gewoon in zijn hoofd.

Het Magische Moment: De 'Stop-Op-Maat' Regeling

Het echte probleem bij eerdere stille denkers was dat ze een vast aantal keren moesten duiken.

  • Bij een makkelijk vraag (bijv. "2 + 2") duikten ze misschien 8 keer, terwijl 1 keer genoeg was. Dat was zonde van de tijd.
  • Bij een moeilijk vraag (bijv. een ingewikkelde algebra) moesten ze misschien 8 keer duiken, maar dat was niet genoeg; ze hadden er 10 nodig.

AdaAnchor lost dit op met een slimme sensor:

De robot kijkt continu naar zijn ankers.

  • Als de ankers nog steeds wild bewegen en veranderen, betekent dat: "Ik ben nog aan het denken, ik moet nog even doorgaan."
  • Als de ankers rustig worden en niet meer veranderen, betekent dat: "Ik heb het antwoord gevonden in mijn hoofd, ik kan stoppen!"

Dit noemen ze adaptief halteren.

  • Bij een makkelijk vraag stopt de robot na 2 of 3 duiken.
  • Bij een moeilijk vraag duikt hij 7 of 8 keer.
  • Hij gebruikt nooit meer energie dan nodig is.

Waarom is dit geweldig?

  1. Snelheid en Kosten: Omdat de robot niet hoeft te praten (geen lange tekstjes schrijft), is hij extreem snel en goedkoop. Hij bespaart tot wel 93% aan 'woorden' die hij moet genereren. Het is alsof je in plaats van een heel boek te schrijven, alleen de oplossing op een post-it note plakt.
  2. Slimmer dan vaststaande regels: Omdat hij zelf bepaalt wanneer hij stopt, is hij vaak accurater dan robots die een vast aantal stappen moeten doen. Hij geeft moeilijke problemen meer tijd en makkelijkere problemen minder tijd.
  3. Resultaat: In tests met wiskundepuzzels bleek AdaAnchor niet alleen sneller, maar ook tot 5% slimmer dan de oude methoden die een vast aantal stappen gebruikten.

Samenvattend

AdaAnchor is als een slimme student die niet hardop uitrekent op het bord (wat veel tijd kost), maar in zijn hoofd rekent met een setje ankers. Hij kijkt naar zijn eigen gedachten: zodra ze rustig worden en hij het antwoord voelt, stopt hij en schrijft hij alleen het eindresultaat op. Zo bespaart hij tijd, geld en energie, zonder in te leveren op de kwaliteit van het antwoord.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →