Agentic Diagrammatica: Towards Autonomous Symbolic Computation in High Energy Physics

Dit paper introduceert Diagrammatica, een extensie van het HEPTAPOD-agentframework die LLM-agenten in staat stelt om betrouwbare symbolische berekeningen in de deeltjesfysica uit te voeren door hun acties te beperken tot tooloproepen met conventie-vastleggende semantiek, wat wordt gevalideerd via benchmarks voor vervalbreedtes en muon-decay-sensitiviteit.

Oorspronkelijke auteurs: Tony Menzo, Alexander Roman, George T. Fleming, Sergei Gleyzer, Konstantin T. Matchev, Stephen Mrenna

Gepubliceerd 2026-03-31
📖 5 min leestijd🧠 Diepgaand

Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

🚀 De Kern: Een Slimme Robot die Wiskunde Doet

Stel je voor dat je een zeer slimme robot (een AI) hebt die alles over deeltjesfysica weet. Je wilt dat deze robot een complexe berekening maakt: "Hoe vaak vervalt een bepaald deeltje in andere deeltjes?"

In het verleden was dit lastig. Als je de robot vroeg om de wiskunde zelf te schrijven, maakte hij vaak onzichtbare fouten. Het was alsof je een chef-kok vraagt om een recept te bedenken, maar hij vergeet de zout, gebruikt de verkeerde oven of verwart suiker met zout. De maaltijd ziet er misschien goed uit, maar hij smaakt niet goed. In de fysica betekent zo'n fout dat je hele berekening onjuist is, zonder dat je het direct doorhebt.

Diagrammatica is de oplossing voor dit probleem. Het is geen robot die zelf de wiskunde "schrijft", maar een robot die de juiste knoppen indrukt op een super-geavanceerde rekenmachine.


🛠️ De Analogie: De Architect en de Bouwvakker

Laten we het proces vergelijken met het bouwen van een huis:

  1. De oude manier (Vrij schrijven):
    Je vraagt de AI: "Bouw een huis." De AI begint dan zelf muren te metselen, ramen te plaatsen en het dak te timmeren. Omdat de AI niet echt een bouwkundige is, kan het gebeuren dat de muren scheef staan of dat de ramen in de verkeerde muur zitten. De AI denkt dat het klopt, maar het huis is onveilig.

  2. De nieuwe manier (Diagrammatica):
    De AI is nu de architect. Hij tekent een heel simpel, duidelijk plan op een kaartje (een "diagram"). Hij zegt alleen: "Hier is een muur, hier is een raam, en gebruik deze specifieke bouten."
    De AI geeft dit kaartje door aan een super-geavanceerde bouwrobot (de "backend"). Deze bouwrobot is een onfeilbare machine die precies weet hoe je die bouten moet vastdraaien. De AI hoeft niet te weten hoe je een bout vastdraait; hij hoeft alleen te weten waar de bout moet komen.

Het grote voordeel: De AI kan geen fouten maken in het vastdraaien van de bouten, want hij doet het niet. Hij maakt alleen fouten in het tekenen van het plan. Maar omdat het plan heel simpel is (alleen knoppen indrukken in een menu), is het voor een mens heel makkelijk om te controleren of het plan klopt.


🧩 Hoe werkt het precies?

Het paper beschrijft twee manieren waarop deze robot werkt, afhankelijk van hoe nauwkeurig je wilt zijn:

1. De "Schatting" (NDA - Naive Dimensional Analysis)

Stel je voor dat je wilt weten hoeveel tijd het kost om een stad te bouwen. Je hoeft niet elke baksteen te tellen. Je zegt: "Het is een grote stad, dus het duurt ongeveer 10 jaar."

  • Wat doet de AI? Hij kijkt naar het deeltje en zegt: "Dit lijkt op een zwaar deeltje dat in twee lichte deeltjes breekt. De kans is ongeveer zo groot."
  • Waarom is dit handig? Het is supersnel. Je kunt duizenden scenario's in een seconde checken om te zien welke interessant zijn.

2. De "Exacte Berekening" (EDA - Exact Diagrammatic Analysis)

Nu wil je het exacte aantal bakstenen weten, tot op de millimeter.

  • Wat doet de AI? Hij tekent het plan (het diagram) en stuurt het naar de bouwrobot. De robot gebruikt een krachtig wiskundig programma (FeynCalc) om de berekening tot op de komma nauwkeurig uit te voeren.
  • Het resultaat: De AI krijgt een perfect antwoord, zonder dat hij zelf de moeilijke wiskunde hoeft te doen.

🧠 Waarom is dit zo belangrijk?

De auteurs ontdekten dat AI's goed zijn in het plannen (welke knoppen moet ik indrukken?), maar slecht in het uitvoeren van de details (de wiskundige regels).

  • Het probleem: Wiskunde heeft veel "stille regels". Bijvoorbeeld: "Gebruik dit teken voor plus, maar dat teken voor min." Als de AI één teken verkeerd zet, is het antwoord verkeerd, maar ziet het er nog steeds logisch uit.
  • De oplossing: Door de AI te dwingen om alleen gestructureerde opties te kiezen (zoals een meerkeuzetoets in plaats van een open vraag), verdwijnen die stille fouten. De AI kan niet kiezen voor "plus" als de machine alleen "min" toelaat.

🏆 Wat hebben ze bewezen?

De auteurs hebben hun systeem getest met twee grote uitdagingen:

  1. De Grote Catalogus: De AI moest alle mogelijke manieren berekenen waarop één deeltje in twee andere deeltjes kan vervallen. Het systeem deed dit volledig automatisch, controleerde de resultaten met bekende data uit de natuurkunde, en maakte zelfs mooie grafieken. Het was alsof de AI in één nacht een hele nieuwe encyclopedie schreef die 100% correct was.
  2. Het Muon Experiment: Ze keken naar een heel complex proces waarbij een muon (een deeltje) in heel veel elektronen en positronen kan vervallen. Er zijn honderdduizenden manieren waarop dit kan gebeuren. De AI kon automatisch tellen hoeveel manieren er waren, schatten hoe vaak het gebeurt, en zeggen: "Op dit moment kunnen we dit zien in experimenten, maar bij nog meer deeltjes wordt het te zeldzaam."

💡 Conclusie

Diagrammatica is een nieuwe manier om AI te gebruiken in de wetenschap. In plaats van de AI te laten "dromen" over wiskundige formules, geven we de AI een veilig speeltoestel (de gereedschapskist) waar hij alleen de juiste knoppen mag indrukken.

  • De AI is de strategist (hij weet wat er gedaan moet worden).
  • De computer is de uitvoerder (hij doet de zware wiskunde foutloos).

Dit maakt het mogelijk dat wetenschappers in de toekomst veel sneller nieuwe theorieën kunnen testen en ontdekken, zonder bang te hoeven zijn voor die vervelende, onzichtbare rekenfouten. Het is alsof je een onfeilbare rekenmachine hebt die luistert naar de slimste denker van de wereld.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →