Gauge Freedom and Metric Dependence in Neural Representation Spaces

Deze paper toont aan dat neurale representaties een meetkundige vrijheidsgraad hebben onder lineaire transformaties, waardoor veelgebruikte vergelijkingsmaten zoals cosinus-achtigheid afhankelijk worden van de gekozen coördinaten en niet-invariant zijn voor de daadwerkelijke modelfunctie.

Jericho Cain

Gepubliceerd 2026-03-10
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

De Verborgen Taal van AI: Waarom "Afstand" in Neuronale Netwerken Misleidend Kan Zijn

Stel je voor dat een kunstmatige intelligentie (zoals een chatbot of een beeldherkenningsprogramma) werkt als een enorme fabriek. In deze fabriek stroomt informatie door verschillende afdelingen (de lagen van het netwerk). Op elke afdeling wordt de informatie omgezet in een soort "geheime code": een lijst met getallen die we neuronale representaties noemen.

Wetenschappers kijken vaak naar deze getallenlijsten om te begrijpen hoe de AI denkt. Ze zeggen bijvoorbeeld: "Deze twee woorden lijken op elkaar omdat hun getallenlijsten dicht bij elkaar liggen in een denkbeeldige ruimte." Ze gebruiken daarvoor een maatstaf die cosinushoek (cosine similarity) heet.

Maar dit artikel, geschreven door Jericho Cain, onthult een verrassend geheim: deze getallenlijsten hebben geen vaste betekenis. Ze zijn net als een kaart die je kunt draaien, rekken of uitrekken zonder dat de bestemming verandert.

Hier is de uitleg in simpele taal, met een paar creatieve vergelijkingen.

1. De "Rijbewijs"-Analogie: Verschillende Kaarten, Dezelfde Bestemming

Stel je voor dat je een rijbewijs hebt. Je kunt het in het Nederlands, het Frans of het Duits hebben. De tekst is anders, de taal is anders, maar het feit dat je mag rijden, blijft precies hetzelfde.

In een neurale netwerk gebeurt iets vergelijkbaars:

  • De AI leert een taak (bijvoorbeeld: "Is dit een hond of een kat?").
  • De "geheime code" (de representatie) die de AI gebruikt om die beslissing te nemen, kan op oneindig veel manieren worden geschreven.
  • Als je de getallen in die code verandert (bijvoorbeeld door ze te vermenigvuldigen met een getal of ze te draaien), moet de AI alleen maar de volgende stap (de "leeslaag") een beetje aanpassen om de uitkomst hetzelfde te houden.

De auteur noemt dit Gauge-vrijheid (of gauge freedom). Het betekent dat de "coördinaten" van de AI's gedachten niet uniek zijn. Ze zijn net als een vertaling: je kunt de zin anders zeggen, maar de betekenis blijft gelijk.

2. Het Probleem: De "Rijstafel" vs. De "Werkelijke Afstand"

Nu komt het lastige deel. Wetenschappers kijken vaak naar deze getallenlijsten en zeggen: "Hoe dichter twee lijsten bij elkaar staan, hoe meer ze op elkaar lijken." Ze gebruiken daarvoor de cosinushoek.

Stel je voor dat je een wereldbol hebt.

  • De Normale Wereld: Je meet de afstand tussen Parijs en Londen op de bol. Dat is een vaste afstand.
  • De AI-Wereld: De AI kan de wereldbol echter uitrekken alsof het deeg is. Je kunt Parijs en Londen dichter bij elkaar duwen, of verder uit elkaar trekken, zolang je maar tegelijkertijd de "routebeschrijving" (de rest van het netwerk) aanpast.

Het artikel toont aan dat als je de AI's "deeg" uitrekt (een wiskundige transformatie toepast):

  1. De AI precies hetzelfde antwoord geeft (de hond is nog steeds een hond).
  2. Maar de afstand tussen de getallenlijsten verandert drastisch!

Twee woorden die voor de AI "dichtbij" leken, kunnen plotseling "ver weg" lijken, alleen omdat we de meetlat hebben veranderd. De cosinushoek is dus niet een eigenschap van de AI zelf, maar van de manier waarop we er naar kijken.

3. De Experimenten: Het Bewijs

De auteur heeft dit getest met twee simpele modellen:

  • Een model dat cijfers herkent (zoals op een postzegel).
  • Een model dat foto's van dieren herkent (CIFAR-10).

Hij deed het volgende:

  1. Hij liet het model een foto zien.
  2. Hij "vervormde" de geheime code van het model wiskundig (een gauge transformatie).
  3. Hij paste de laatste stap van het model aan zodat het antwoord niet veranderde.

Het resultaat was verbazingwekkend:

  • De voorspellingen bleven 100% hetzelfde.
  • Maar de "afstand" tussen de getallenlijsten (cosinushoek) veranderde enorm.
  • Soms veranderde het model van mening over welke foto het "meest lijkt" op een andere (de dichtstbijzijnde buurman veranderde).

Dit betekent dat als je zegt: "Deze twee woorden zijn semantisch verwant omdat hun cosinushoek 0,9 is," je misschien gewoon toeval kijkt. Het hangt af van welke "vertaling" (coördinatenstelsel) de AI op dat moment gebruikt.

4. De Oplossing: Een Standaard Maatstaf Kiezen

Als de afstand niet vaststaat, hoe kunnen we dan nog iets zeggen? De auteur stelt twee oplossingen voor:

Optie A: Zoek naar dingen die niet veranderen.
In plaats van naar de afstand te kijken, kijken we naar dingen die onafhankelijk zijn van de "uitrekking". Denk aan de vorm van een object, niet aan hoe groot het is. In de AI-wereld zijn er methoden (zoals CKA of SVCCA) die proberen deze stabiele vormen te meten.

Optie B: Kies één vaste "standaard" (Canonische Coördinaten).
Stel je voor dat je altijd in "meters" meet, nooit in "voet" of "el". De auteur suggereert een techniek genaamd Whitening (witwassen).

  • Dit is alsof je de "deeg" van de AI weer terugrekt tot een perfecte bol.
  • Hierdoor verdwijnt alle willekeurige rek en krijg je een eerlijke, neutrale maatstaf.
  • Als iedereen zijn AI's eerst "witwasst" voordat ze ze vergelijken, dan zijn de resultaten eerlijk en vergelijkbaar.

Conclusie: Waarom Dit Belangrijk Is

Dit artikel waarschuwt onderzoekers en ontwikkelaars: Wees voorzichtig met wat je ziet.

Wanneer we zeggen dat een AI "begrijpt" dat een hond en een kat op elkaar lijken, baseren we dat vaak op de afstand tussen hun getallenlijsten. Maar deze afstand is niet vast; het is een keuze die we maken door hoe we de data bekijken.

  • De les: De "geometrie" van een AI is niet zoals de geometrie van een tafel (die blijft staan). Het is meer zoals een dans: de dansers kunnen hun armen willekeurig bewegen (gauge vrijheid), zolang ze maar in het ritme blijven (de voorspelling).
  • De boodschap: Om echt te begrijpen hoe AI werkt, moeten we kijken naar wat er echt gebeurt (de voorspelling en de onderliggende structuur), en niet alleen naar de willekeurige afstanden tussen de getallenlijsten. Of we moeten ervoor kiezen om altijd in dezelfde "taal" (zoals na whitening) te praten.

Kortom: De kaart is niet het gebied. En bij AI kan je de kaart steeds opnieuw tekenen zonder dat het landschap verandert.