Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement

Dit paper introduceert CoFiCot, een adaptief framework dat de testtijd-berekening van LLM's optimaliseert door query's dynamisch te triageren op basis van moeilijkheidsgraad en vervolgens een stateful correctiecyclus toe te passen die granulaire foutlocatie combineert met globale logische coherentie.

Dongxu Zhang, Hongqiang Lin, Yiding Sun, Pengyu Wang, Qirui Wang, Ning Yang, Jihua Zhu

Gepubliceerd 2026-03-10
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Het Probleem: De "Eén Maat Past Alles"-Valstrik

Stel je voor dat je een superintelligente robot (een AI) hebt die wiskundepuzzels oplost. Tot nu toe hebben onderzoekers een simpele regel gevolgd: "Geef elke vraag dezelfde hoeveelheid tijd en energie."

Dit leidt tot twee rare situaties, zoals getoond in de illustraties van het paper:

  1. De Overdenker: Je vraagt de robot: "Wat is 2 + 2?"
    De robot weet het antwoord direct (4). Maar omdat de regel zegt "blijf denken tot je uitgeput bent", gaat hij twijfelen. Hij begint te fantaseren: "Misschien is het 3? Of 5? Nee, wacht..." Uiteindelijk verandert hij het juiste antwoord in een fout antwoord. Dit noemen ze overthinking (te veel nadenken).
  2. De Uitgeputte Denker: Je vraagt de robot: "Los deze complexe wiskundetoets op."
    De robot krijgt precies dezelfde hoeveelheid tijd als voor de som "2 + 2". Hij begint te rekenen, maar raakt halverwege de tijd op. Hij moet stoppen voordat hij klaar is. Het resultaat is een onvolledig en fout antwoord. Dit is onvoldoende verfijning.

Het paper stelt: Waarom behandelen we een simpele vraag en een moeilijke vraag precies hetzelfde?

De Oplossing: CoFiCot (De Slimme Chef)

De auteurs van dit paper hebben een nieuw systeem bedacht genaamd CoFiCot. Je kunt dit zien als een slimme chef-kok in een restaurant die beslist hoe hij een bestelling moet aanpakken.

In plaats van voor elke klant hetzelfde recept te volgen, doet CoFiCot drie dingen:

1. De Snelscan (De "Klassificatie")

Voordat de robot begint met het echte werk, kijkt hij eerst even snel naar de vraag. Hij gebruikt drie meetinstrumenten (zoals een metaalzoeker, een weegschaal en een voorspeller) om te bepalen hoe moeilijk de vraag is:

  • Is het antwoord al duidelijk? (Als alle robots die we het vragen hetzelfde antwoord geven, is het waarschijnlijk makkelijk).
  • Is het antwoord betrouwbaar? (Klinkt het antwoord logisch?).
  • Hoeveel stappen zijn er nodig? (Is het een simpele som of een lang verhaal?).

Op basis daarvan deelt hij de vraag in in drie categorieën:

  • 🟢 Gemakkelijk: "Dit is een simpele salade."
  • 🟡 Middel: "Dit is een pasta met saus."
  • 🔴 Moeilijk: "Dit is een 3-gangen diner."

2. De Differentiële Aanpak (Het "Refinement")

Nu past de chef de strategie aan op basis van de categorie:

  • Voor de Gemakkelijke vragen (Groen):
    De robot zegt: "Oké, dit is makkelijk." Hij pakt het beste antwoord uit de eerste ronde en stopt direct. Geen extra denken, geen twijfel. Dit bespaart enorm veel tijd en energie.

    • Vergelijking: Als je een boterham wilt, hoef je niet de hele keuken te openen. Je pakt het brood en doet er boter op. Klaar.
  • Voor de Moeilijke vragen (Rood):
    De robot zegt: "Dit is lastig, we moeten hier echt voor gaan." Hij start een iteratieve cyclus (een lus).

    1. Hij probeert een oplossing.
    2. Hij kijkt per stap of het klopt (met een speciale "stap-controleur").
    3. Als hij een fout ziet (bijvoorbeeld in stap 3), maakt hij alleen stap 3 en alles daarna opnieuw.
    4. Belangrijk: Hij verandert stap 1 en 2 niet. Die blijven behouden omdat die al bewezen goed waren.
    5. Hij herhaalt dit tot het antwoord perfect is.
    • Vergelijking: Stel je voor dat je een lange brief schrijft en een fout maakt in de derde alinea. Een domme robot zou de hele brief opnieuw schrijven. CoFiCot doet slim: hij houdt de eerste twee alinea's vast, schrijft de derde alinea opnieuw, en past de rest daarop aan. Zo blijft de logica van de hele brief behouden.

3. De "Stateful" (Geheugen) Methode

Dit is het slimste deel. Bij oude methoden werd bij elke poging de hele tekst weggegooid en opnieuw geschreven. CoFiCot onthoudt wat er al goed was.

  • Zonder geheugen: Je bouwt een huis, merkt dat de muur scheef staat, en sloopt het hele huis om het opnieuw te bouwen.
  • Met geheugen (CoFiCot): Je merkt dat de muur scheef staat. Je sloopt alleen die muur, bouwt hem recht, en zet de rest van het huis er weer bovenop. Het huis blijft stabiel.

Waarom is dit geweldig?

Het paper toont aan dat dit systeem veel beter werkt dan de oude methoden:

  • Sneller: Bij simpele vragen wordt er niet onnodig veel tijd verspild.
  • Beter: Bij moeilijke vragen wordt er genoeg tijd genomen om fouten op te lossen.
  • Efficiënter: Het gebruikt minder "rekenkracht" (tokens) om een beter resultaat te krijgen.

Samenvatting in één zin

CoFiCot is een slimme AI-strategie die eerst kijkt hoe moeilijk een vraag is, en dan beslist of hij snel moet antwoorden of diep moet graven, waarbij hij bij moeilijke vragen alleen de fouten repareert in plaats van alles opnieuw te bedenken.

Het is alsof je een slimme navigatie hebt die voor een ritje naar de supermarkt geen omweg berekent, maar voor een lange vakantieroute wel de beste, foutloze route pland.