Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

Deze paper breidt het harmonische verlies uit door een breed scala aan niet-Euclidische afstandsmaten te onderzoeken en toont aan dat met name cosinus-afstand de prestaties, interpretatie en duurzaamheid van zowel visuele als taalkundige modellen verbetert ten opzichte van de standaard kruis-entropieverliesfunctie.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo

Gepubliceerd 2026-03-12
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een zeer slimme robot wilt trainen om dingen te herkennen, zoals foto's van katten en honden, of om teksten te schrijven. Om dit te leren, moet de robot een "leraar" hebben die hem vertelt of hij het goed of fout heeft. In de wereld van kunstmatige intelligentie noemen we deze leraar een verliesfunctie (loss function).

Voor heel lang was de standaardleraar Cross-Entropy. Maar deze leraar heeft een paar mankementen:

  1. Hij is een beetje een "zwarte doos": we snappen niet goed waarom de robot bepaalde beslissingen neemt.
  2. Hij kan de robot dwingen om extreem grote getallen te gebruiken om zekerheid te simuleren, wat het leren inefficiënt maakt.
  3. Soms leert de robot heel lang alleen maar uit het hoofd (overfitting) en pas heel laat begrijpt hij het echte patroon. Dit fenomeen noemen onderzoekers "grokking" (een plotselinge doorbraak na langdurig, nutteloos oefenen).

De Oplossing: De "Harmonische Leraar"

Onlangs hebben wetenschappers een nieuwe leraar bedacht: de Harmonische Loss. In plaats van te kijken naar abstracte scores, kijkt deze leraar naar afstanden.

  • De Analogie: Stel je voor dat elke categorie (bijv. "kat") een thuisbasis is in een grote ruimte. De robot moet elke foto van een kat zo dicht mogelijk bij die thuisbasis brengen.
  • Het Voordeel: Omdat de robot nu werkt met afstanden in plaats van abstracte scores, wordt het proces transparanter. We kunnen zien waar de robot de "thuisbasis" van een kat heeft neergezet. Het voorkomt ook dat de robot onnodig hard werkt om zijn zelfvertrouwen op te blazen.

Het Nieuwe Onderzoek: Niet Alle Afstanden Zijn Gelijk

De originele "Harmonische Leraar" gebruikte echter maar één manier om afstand te meten: de Euclidische afstand. Dat is de rechte lijn tussen twee punten (alsof je een vliegtuig van punt A naar punt B vliegt).

De auteurs van dit paper vragen zich af: "Is de rechte lijn altijd de beste manier om afstand te meten?"

Ze hebben een heel assortiment aan andere manieren om afstand te meten getest, zoals:

  • Cosine (Cosinus): Kijkt niet naar hoe ver iets is, maar naar de hoek of richting. Alsof je kijkt of twee pijlen in dezelfde richting wijzen, ongeacht hoe lang ze zijn.
  • Manhattan: Kijkt alsof je door een stad loopt met straten die haaks op elkaar staan. Je kunt niet rechtstreeks lopen; je moet om de gebouwen heen.
  • Bray-Curtis & Mahalanobis: Meer complexe manieren die rekening houden met hoe variabelen met elkaar samenhangen (bijvoorbeeld: als je groter bent, weeg je waarschijnlijk ook meer).

Wat Vonden Ze? (De Resultaten in Gewone Taal)

De onderzoekers hebben deze verschillende "afstands-leraren" getest op twee gebieden: het herkennen van beelden (zoals gezichten of auto's) en het begrijpen van taal (zoals Chatbots).

1. Voor Beelden (Visie): De "Cosine" is de Winnaar
Bij het herkennen van beelden bleek dat de Cosine-afstand (de hoek-meting) vaak de beste was.

  • Waarom? Het werkt als een kompas. Het zorgt ervoor dat de robot beter leert onderscheid maken tussen verschillende dingen, zonder dat hij zich laat afleiden door de "grootte" van de data.
  • Het Resultaat: De robots werden niet alleen slimmer (hoger percentage juiste antwoorden), maar ze stoten ook minder CO2 uit tijdens het leren. Ze zijn dus sneller en groener.
  • Speciale gevallen: Soms zijn andere metingen (zoals Bray-Curtis) nog beter voor het begrijpen van wat de robot leert (interoperabiliteit), maar dat kost soms iets meer rekenkracht.

2. Voor Taal (LLMs): Rust en Stabiliteit
Bij grote taalmodellen (zoals die gebruikt worden voor chatbots) hielpen deze nieuwe afstanden de robot om rustiger te leren.

  • De "trillingen" in het leerproces werden kleiner. De robot maakte minder wilde sprongen in zijn gedachten.
  • Dit leidde tot een stabielere en betere taalbeheersing, en ook hier weer met minder energieverbruik dan de oude standaardmethode.

3. Het "Grokking"-Probleem
Een van de coolste ontdekkingen was dat deze nieuwe methoden het "grokking"-probleem bijna volledig oplossen.

  • De Metafoor: De oude leraar liet de robot eerst urenlang uit het hoofd leren (zoals een kind dat een tekst letterlijk opzegt zonder te begrijpen wat het betekent). Pas na heel lang kreeg de robot de "aha-moment".
  • De Nieuwe Leraar: Met de nieuwe afstands-methoden begrijpt de robot het patroon direct. Geen lange wachttijd, geen uit het hoofd leren. Het is alsof de robot de logica van de taal of het beeld direct doorziet.

Waarom is dit belangrijk voor de wereld?

Dit onderzoek is niet alleen over "slimmere robots", maar ook over duurzame AI.

  • Groene AI: Omdat deze nieuwe methoden efficiënter zijn, hebben ze minder rekenkracht nodig. Minder rekenkracht betekent minder stroomverbruik en minder CO2-uitstoot.
  • Transparantie: Omdat we nu beter kunnen zien waarom een robot een beslissing neemt (door de afstanden en thuisbases te zien), kunnen we meer vertrouwen hebben in AI, bijvoorbeeld in de zorg of financiën.

Samenvatting in één zin

De auteurs hebben bewezen dat je de "leraar" van een AI kunt verbeteren door niet alleen te kijken naar hoe ver iets is, maar ook naar de hoek en de vorm van die afstand; dit maakt de AI slimmer, sneller, makkelijker te begrijpen en veel groener voor het milieu.