Predictive Coding Graphs are a Superset of Feedforward Neural Networks

Dit artikel bewijst dat Predictive Coding Graphs (PCGs) een wiskundige superverzameling vormen van feedforward neurale netwerken, waardoor ze een breder kader bieden voor machine learning en de studie van netwerktopologieën.

Björn van Zwol

Gepubliceerd Mon, 09 Ma
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Voorspellende Codes: De Superkrachtige Oude Broer van Neuronale Netwerken

Stel je voor dat je een enorme, ingewikkelde stad bouwt. In de wereld van kunstmatige intelligentie (AI) hebben we tot nu toe vooral gewerkt met Feedforward Neural Networks (FNNs). Dit zijn als strakke, rechte snelwegen: informatie stroomt alleen van punt A naar punt B, van de ingang (de ogen) naar de uitgang (de beslissing). Het werkt goed, maar het is een beetje stijf. Je kunt er geen afritten maken die teruglopen, en je kunt geen kruispunten hebben waar weg A en weg B elkaar kruisen.

Deze paper introduceert iets nieuws: Predictive Coding Graphs (PCGs). Om dit te begrijpen, gebruiken we een paar simpele vergelijkingen.

1. De "Rechte Weg" vs. De "Dynamische Stad"

De oude manier (FNN):
Stel je een fabriek voor waar producten op een lopende band gaan. Ze komen binnen, worden bewerkt door machine 1, dan machine 2, dan machine 3, en gaan eruit. Als er een fout in het product zit, moet je de hele fabriek stilleggen en terug naar de start om te kijken waar het misging (dit heet Backpropagation). Het is efficiënt, maar het is een eenrichtingsverkeer.

De nieuwe manier (PCG):
Nu stel je je een levendige stad voor met straten, steegjes, bruggen en zelfs wegen die teruglopen. In deze stad is iedereen een "voorspeller".

  • De bewoners (de neuronen) zeggen voortdurend: "Ik denk dat hier een auto komt."
  • Als er daadwerkelijk een auto komt, is alles goed.
  • Maar als er geen auto komt, of een vrachtwagen, dan is er een fout (een voorspellingsfout).
  • In plaats van de hele fabriek stil te leggen, roepen de bewoners luid: "Hé, ik had een auto verwacht, maar er kwam een vrachtwagen! Pas je verwachtingen aan!"

Deze "stad" (het PCG) kan elke vorm aannemen. Je kunt wegen maken die teruglopen, zijwegen die elkaar kruisen, of zelfs rondjes rijden. Het is een superset. Dat klinkt als wiskundetaal, maar het betekent simpelweg: Alles wat de oude rechte snelweg (FNN) kan, kan deze stad ook. Maar de stad kan ook veel meer dingen die de snelweg niet kan.

2. Het Grote Geheim: Ze zijn eigenlijk hetzelfde (als je kijkt naar het eindresultaat)

De schrijver, Björn van Zwol, heeft een belangrijk bewijs geleverd. Hij zegt:
"Wanneer je deze 'stad' gebruikt om een vraag te beantwoorden (bijvoorbeeld: 'Is dit een hond of een kat?'), dan doet hij precies hetzelfde als de oude 'rechte snelweg'."

Dit is als het bewijzen dat een sportauto en een vrachtwagen op de snelweg precies dezelfde snelheid kunnen halen als ze allebei vol gas geven. Ze zien er anders uit en hebben verschillende motoren, maar op het moment dat je aankomt, is het resultaat identiek.

Dit is belangrijk omdat het betekent dat de nieuwe "stad" net zo slim is als de oude "snelweg". Als de oude snelweg alles kan leren (wat wiskundig bewezen is), dan kan de nieuwe stad dat ook.

3. Waarom is dit zo cool? (De "Skip Connections")

In de moderne AI gebruiken we vaak "skip connections" (zoals in ResNets). Dat zijn als tunnels die een stuk van de weg overslaan, zodat informatie sneller door kan.

  • In de oude "rechte snelweg" (FNN) moet je deze tunnels handmatig inbouwen.
  • In de nieuwe "stad" (PCG) zijn deze tunnels natuurlijk onderdeel van het systeem.

De paper laat zien dat je in deze "stad" ook wegen kunt aanleggen die teruglopen (vanuit de uitgang naar de ingang) of zijwaarts lopen. De oude snelweg kan dit niet. De stad kan dit wel.

Stel je voor dat je een puzzel oplost.

  • De FNN kijkt alleen naar de stukjes voor zich.
  • De PCG kan ook kijken naar stukjes die hij al heeft gelegd, of zelfs naar stukjes die hij nog moet leggen, en zegt: "Hé, dit stukje past hier beter, laat me dat even aanpassen."

4. De Kosten: Meer tijd voor meer vrijheid

Er is een klein nadeel. Omdat de "stad" zo complex is en bewoners voortdurend met elkaar overleggen (voorspellingen aanpassen), duurt het iets langer om tot een antwoord te komen dan bij de simpele "rechte snelweg".

  • De snelweg is als een snelle trein: recht vooruit, geen omwegen.
  • De stad is als een fietsnetwerk: je kunt overal komen, maar je moet soms een omweg nemen en op een rood licht wachten.

De schrijver zegt echter: "Dat is niet erg!" Misschien is het langzamere denken tijdens het "oplossen" (inference) de moeite waard, omdat het systeem veel flexibeler is en misschien betere oplossingen vindt voor moeilijke problemen.

Samenvatting in één zin

Deze paper bewijst dat Predictive Coding Graphs de "super-versie" zijn van de standaard kunstmatige intelligentie: ze kunnen alles wat de oude modellen kunnen, maar ze zijn ook vrij genoeg om complexe, kringloop-achtige structuren aan te nemen die de oude modellen nooit zouden durven. Het is alsof we van een rechte snelweg zijn gegaan naar een volledig uitgerust, intelligent verkeersnetwerk.