AgentRivet: an automated system for producing Rivet routines from journal publications

Dit artikel presenteert AgentRivet, een geautomatiseerde workflow die gebruikmaakt van Large Language Models om details van natuurkundige analyses uit wetenschappelijke publicaties te extraheren en Rivet-routines te genereren, waarmee het aanzienlijke gat in de dekking voor modelonafhankelijke metingen in de deeltjeskunde wordt aangepakt.

Oorspronkelijke auteurs: Antonio J. Costa, Caterina Doglioni, Christian Gütschow, Andrew D. Pilkington, Sukanya Sinha

Gepubliceerd 2026-06-12
📖 4 min leestijd🧠 Diepgaand

Oorspronkelijke auteurs: Antonio J. Costa, Caterina Doglioni, Christian Gütschow, Andrew D. Pilkington, Sukanya Sinha

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Stel je de wereld van de deeltjesfysica voor als een enorme, prestigieuze kookwedstrijd. Wetenschappers bij gigantische machines (zoals de Large Hadron Collider) bereiden complexe "gerechten" (botsingen van deeltjes) en schrijven gedetailleerde recepten in wetenschappelijke papers. Ze leveren ook een lijst met ingrediënten (data) zodat andere chefs de gerechten kunnen proberen na te maken.

Er is echter een probleem: om deze gerechten echt te kunnen proeven en te vergelijken, hebben andere wetenschappers een specifieke, gestandaardiseerde keukentool nodig genaamd Rivet. Denk aan Rivet als een speciale, hoogtechnologische maatbeker die ervoor zorgt dat iedereen de soep op exact dezelfde manier afmeet. Zonder Rivet kun je de soep van iemand anders niet eerlijk vergelijken.

Het probleem is dat slechts ongeveer 40% van de gepubliceerde recepten met deze speciale maatbeker komt. De rest bestaat uit louter tekstuele beschrijvingen, die moeilijk om te zetten zijn in de precieze code die nodig is voor het instrument.

Ontmoet AgentRivet: De AI-Sous-Chef

De auteurs van dit paper hebben een nieuw systeem gebouwd genaamd AgentRivet. Denk aan AgentRivet als een team van AI-robots die ontwor twee van die rommelige, tekstuele recepten te lezen en de ontbrekende Rivet-maatbekers (computercode) automatisch voor je te bouwen.

Zo werkt dit "keukenteam" met behulp van een eenvoudige workflow:

  1. De Analist (De Lezer): Deze AI-robot leest het wetenschappelijke paper en fungeert als een zeer zorgvuldige sous-chef. Het leest niet alleen; het extraheert de exacte instructies: "Gebruik 2 citroenen," "Snipper de uien op deze manier," "Kook gedurende 10 minuten." Het zet de rommelige tekst om in een nette, gestructureerde boodschappenlijst.
  2. De Programmeur (De Bouwer): Deze robot neemt de boodschappenlijst en probeert het eigenlijke Rivet-instrument te bouwen (dat geschreven is in een specifieke programmeertaal genaamd C++). Het is als een robotarm die probeert een complexe machine te assembleren op basis van de instructies.
  3. De Reviewers (De Inspecteurs): Voordat het instrument klaar is, controleren twee inspecteurs het werk.
    • De Code Reviewer controleert op technische fouten, zoals het gebruik van het verkeerde type schroef of een defect onderdeel (syntaxfouten).
    • De Physics Reviewer controleert of de instructies daadwerkelijk overeenkomen met het recept. Heeft de robot de uien wel correct afgemeten? Is de kooktijd gevolgd?

De "Proeverij" (De Resultaten)

Het team testte dit AI-team op twee recente en complexe recepten van de ATLAS- en CMS-experimenten (twee grote deeltjesfysica-laboratoria). Ze vroegen de AI om de Rivet-tools vanaf nul op te bouwen.

  • Het Goede Nieuws: Het AI-team was verrassend goed in de taak. Ze bouwden werkende instrumenten met zeer weinig technische problemen. Wanneer ze de instrumenten gebruikten om gesimuleerde deeltjesbotsingen te meten, zagen de resultaten er zeer vergelijkbaar uit met wat de menselijke wetenschappers verwachtten.
  • Het Slechte Nieuws (De "Hallucinaties"): Soms raakte de AI in de war door vage delen van het recept.
    • Als het paper zei: "Doe iets speciaals met de saus," maar niet precies uitlegde hoe, dan ging de AI gokken. Soms gokte de AI goed; soms gokte de AI fout.
    • Eén AI-model (Gemini) vergat soms specifieke instructies over "neutrino's" (een type onzichtbaar deeltje) op te volgen, terwijl een ander model (Claude) soms in een loop vastliep of zijn eigen "gedachten" opschreef in plaats van alleen de code.
    • De AI had de meeste moeite met de meest complexe, abstracte delen van de recepten, zoals het meten van de "vorm" van een gebeurtenis of het gebruik van complexe wiskundige formules die niet duidelijk gedefinieerd waren.

Het Eindoordeel

Het paper concludeert dat AgentRivet een veelbelovend nieuw hulpmiddel is. Het kan succesvol ongeveer 40% van de "ontbrekende" recepten omzetten in werkende code, wat een enorme hulp is voor de natuurkundige gemeenschap.

Het is echter nog niet perfect. Er is nog steeds een mens nodig om over de schouder mee te kijken, vooral wanneer het originele recept vaag is. De auteurs stellen voor om de AI in de toekomst beter te leren door deze te trainen op meer voorbeelden en automatische controles toe te voegen om fouten te vangen voordat een mens ze zelfs maar ziet.

Kortom: AgentRivet is een geautomatiseerd team dat wetenschappelijke papers leest en de ontbrekende softwaretools bouwt die wetenschappers nodig hebben om hun data te vergelijken. Het werkt goed, maar het maakt nog steeds fouten wanneer de instructies onduidelijk zijn, waardoor menselijke experts nog steeds nodig zijn om het werk te controleren.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →