Feynman: Knowledge-Infused Diagramming Agent for Scalable Visual Designs

Dit paper introduceert Feynman, een agent die schaalbaar kennisrijke diagrammen genereert met behulp van de Penrose-rendering-engine, waardoor een dataset van meer dan 100.000 uitgelijnde diagram-ondertitelingsparen en een nieuw benchmark voor visueel redeneren, genaamd Diagramma, zijn gecreëerd.

Zixin Wen, Yifu Cai, Kyle Lee, Sam Estep, Josh Sunshine, Aarti Singh, Yuejie Chi, Wode Ni

Gepubliceerd 2026-03-16
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een meester-architect bent die een stad wil bouwen. Maar in plaats van dat je zelf elke baksteen moet leggen, heb je een zeer slimme, maar soms wat verwarde assistent (een AI) die je helpt.

Dit artikel introduceert FEYNMAN, een slimme digitale assistent die is ontworpen om diagrammen te maken. Denk aan die duidelijke plaatjes in een schoolboek: een molecuul, een stroomdiagram of een wiskundig bewijs.

Hier is hoe het werkt, vertaald naar alledaags taal:

1. Het Probleem: De "Alles-in-één" Valstrik

Tot nu toe probeerden AI's (zoals GPT-4V) om een diagram te maken door alles in één keer te doen: ze moesten eerst het idee bedenken (wat is een watermolecuul?), en toen direct het plaatje tekenen.

  • Het resultaat? Het was vaak rommelig. Soms was het idee goed, maar zag het eruit als een kinderkrabbel. Soms zag het plaatje er mooi uit, maar waren de feiten fout. Het is alsof je iemand vraagt om een restaurant te bouwen terwijl ze tegelijkertijd de menukaart moeten schrijven en de kok moeten zijn. Ze raken in de war.

2. De Oplossing: FEYNMAN (De Slimme Chef)

FEYNMAN lost dit op door het werk op te splitsen in twee duidelijke stappen, net zoals een professionele bouwplaat.

Stap 1: Het Ontwerp (De "Ideeën"-fase)
FEYNMAN begint niet met tekenen. Hij denkt eerst na. Hij vraagt zich af: "Wat zijn de belangrijkste onderdelen van dit onderwerp?"

  • Voorbeeld: Als we een watermolecuul maken, denkt FEYNMAN: "Oké, we hebben twee waterstofatomen en één zuurstofatoom nodig, en ze moeten verbonden zijn."
  • Hij schrijft dit op als een lijstje met feiten, zonder na te denken over kleuren of posities. Dit is het ontwerpplan.

Stap 2: De Vertaling (De "Code"-fase)
Nu komt de magie. FEYNMAN neemt dat lijstje met feiten en vertaalt het naar een speciale taal die computers begrijpen, genaamd PENROSE.

  • Denk aan PENROSE als een slimme tekenrobot. Jij geeft de robot een opdracht: "Teken een blauwe bol hier en een rode bol daar, en verbind ze."
  • De robot (PENROSE) is heel goed in het zorgen dat de bolletjes niet overlappen, dat de lijnen recht zijn en dat het eruitziet als een professioneel diagram.

3. De "Kritische Jury" (Iteratief Verbeteren)

Soms maakt FEYNMAN een fout in zijn code. Het plaatje komt eruit, maar het ziet er raar uit.

  • In plaats van te stoppen, sturen we het plaatje naar een panel van digitale critici (andere AI's).
  • Deze critici kijken naar het plaatje en zeggen: "Hé, die tekst is onleesbaar" of "Die lijn hoort hier niet te zijn."
  • FEYNMAN luistert, past de code aan, en probeert het opnieuw. Dit doet hij totdat het plaatje perfect is.

4. Waarom is dit zo speciaal? (De "Magische" Variatie)

Dit is het coolste deel. Omdat FEYNMAN eerst het idee (de feiten) scheidt van het plaatje (de vorm), kan hij met één en hetzelfde idee honderden verschillende plaatjes maken.

  • Stel je voor dat je een recept hebt voor een cake (het idee).
  • Normaal gesproken zou je elke keer dezelfde cake bakken.
  • Maar met FEYNMAN kun je zeggen: "Maak vandaag een cake in de vorm van een bloem, morgen als een auto, en overmorgen als een kasteel." Het recept (de feiten) blijft hetzelfde, maar het uiterlijk (de lay-out) verandert.
  • Dit zorgt voor een enorme verscheidenheid aan plaatjes die allemaal correct zijn.

5. Het Resultaat: Een Gouden Mijlpaal

Met deze methode heeft het team een grote schat gecreëerd:

  • Ze hebben 100.000 perfecte plaatjes met uitleg gemaakt.
  • Ze hebben een nieuwe test (een benchmark genaamd DIAGRAMMA) gemaakt om te kijken hoe goed andere AI's zijn in het begrijpen van deze plaatjes.
  • Het resultaat? Het is goedkoop, snel, en de kwaliteit is als een schoolboek.

Kort samengevat:
FEYNMAN is als een architect die eerst een blauwdruk tekent en dan een robot de bouw laat uitvoeren, terwijl een team van inspecteurs de bouw controleert. Hierdoor krijgen we niet alleen mooie plaatjes, maar ook plaatjes die waar zijn, en dat in een hoeveelheid die voor mensen onmogelijk is om handmatig te maken.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →