← Nieuwste papers
⚛️ quantum physics

Planted-solution SAT and Ising benchmarks from integer factorization

Dit artikel introduceert een nieuwe familie van verifieerbare benchmarkproblemen voor SAT-oplossers en Ising-optimatie, die zijn afgeleid van priemgetallenfactorisatie en een exponentiële toename in rekentijd tonen naarmate de grootte van de factoren groeit.

Oorspronkelijke auteurs: Itay Hen

Gepubliceerd 2026-04-14
📖 4 min leestijd🧠 Diepgaand

Oorspronkelijke auteurs: Itay Hen

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

De "Gouden Sleutel" voor het testen van slimme computers

Stel je voor dat je een enorme, onbreekbare kluis hebt. Om hem te openen, moet je de juiste sleutel vinden. In de wereld van computers is deze "sleutel" een getal dat is gemaakt door twee grote priemgetallen met elkaar te vermenigvuldigen. Het is een bekend raadsel: het is makkelijk om twee getallen te vermenigvuldigen, maar ongelooflijk moeilijk om het resultaat weer terug te breken in die twee oorspronkelijke getallen.

Dit artikel introduceert een nieuwe manier om te testen hoe goed computers (en hun slimme algoritmen) zijn in het oplossen van dit soort raadsels. De auteur, Itay Hen, heeft een reeks van "opzettelijke puzzels" gemaakt.

Hier is hoe het werkt, vertaald naar alledaagse taal:

1. De Puzzel: Een Rekenmachine als Raadsel

Normaal gesproken zijn puzzels voor computers ofwel willekeurig (zoals een doolhof zonder plan) ofwel te makkelijk. De auteur doet iets anders: hij pakt twee geheime getallen (laten we ze P en Q noemen) en vermenigvuldigt ze tot een groot getal N.

Vervolgens vertaalt hij de rekenregels die nodig zijn om N te maken, naar een taal die computers begrijpen (een soort logische code).

  • Het idee: De computer moet de code oplossen om terug te vinden welke P en Q er zijn gebruikt.
  • De truc: De auteur weet al wat P en Q zijn. Dit is de "geplante oplossing". Het is alsof de maker van een kruiswoordraadsel het antwoord al in zijn zak heeft. Zo kan hij precies zien of de computer het goed heeft gedaan.

2. De "Carry" (Het Overdragen van Getallen)

Wanneer je twee grote getallen handmatig vermenigvuldigt, gebruik je de "overdracht" (in het Engels: carry). Als je 7 x 8 doet, krijg je 56. Je schrijft de 6 op en de 5 "draag je over" naar de volgende kolom.

In deze puzzel gebeurt dit op een heel speciaal manier:

  • Elke keer dat er een getal wordt "overgedragen", creëert het een nieuw logisch probleem voor de volgende kolom.
  • Dit zorgt voor een kettingreactie. Een kleine verandering in het eerste getal kan een golf van veranderingen veroorzaken die helemaal naar het einde van de berekening doorgaat.
  • De analogie: Stel je een lange rij mensen voor die een emmer water doorgeven. Als de eerste persoon een beetje water mors, moet de tweede persoon dat opvangen, wat weer invloed heeft op hoeveel water de derde persoon krijgt, enzovoort. Bij deze puzzel wordt de "mors" (de overdracht) steeds groter naarmate de rij langer wordt.

3. Waarom is dit zo moeilijk? (De Explosie van Complexiteit)

De auteur ontdekte iets fascinerends over de grootte van deze puzzels:

  • Als je de getallen d cijfers lang maakt, groeit de moeilijkheid niet lineair, maar als een vierkante piramide (in feite tot de macht 4).
  • Vergelijking: Als je de puzzel 2 keer zo groot maakt, wordt hij niet 2 keer, maar 16 keer zo zwaar.
  • Dit komt door die kettingreactie van de "overdrachten". De computer moet niet alleen naar het begin kijken, maar naar alles wat er in het midden gebeurt, omdat alles met elkaar verbonden is.

4. De Testresultaten

De auteur heeft deze puzzels voorgelegd aan de slimste computers ter wereld (de zogenaamde SAT-solvers).

  • Het resultaat: De computers deden het goed, maar naarmate de getallen langer werden, duurde het oplossen exponentieel langer.
  • De conclusie: Elke extra cijfer in het getal verdubbelde ongeveer de tijd die de computer nodig had. Dit bevestigt dat deze puzzels echt moeilijk zijn en perfect zijn om de grenzen van huidige technologie te testen.

5. Twee Gezichten, Eén Probleem

Het mooie aan deze methode is dat ze twee vormen heeft:

  1. De Logische Vorm (SAT): Voor traditionele computers die logisch redeneren.
  2. De Energievorm (Ising): Voor geavanceerde quantumcomputers en speciale machines die zoeken naar de "laagste energietoestand" (alsof een bal die van een heuvel rolt om op het laagste punt te stoppen).

Omdat de auteur precies weet wat het antwoord is, kan hij beide soorten computers op dezelfde puzzel testen en zien welke het snelst is.

Samenvattend

Dit artikel presenteert een nieuwe, zeer gestructureerde manier om computers te testen. Het is als het bouwen van een reeks van steeds zwaardere bergbeklimmingen, waarbij de maker precies weet hoe hoog de top is. Door te kijken hoe snel de klimmers (de computers) de top bereiken, kunnen wetenschappers beter begrijpen waar de grenzen liggen van wat computers vandaag de dag kunnen, en wat ze in de toekomst misschien kunnen.

Het is een brug tussen de wiskunde van getallen, de logica van computers en de fysica van quantummechanica, allemaal verpakt in een test die je kunt controleren met een simpele rekenmachine.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →