The Value of Graph-based Encoding in NBA Salary Prediction

Dit artikel toont aan dat het integreren van vectoriële representaties van een kennisgrafiek, gebaseerd op zowel prestaties op het veld als daarbuiten, de nauwkeurigheid van machine learning-modellen voor het voorspellen van NBA-salarissen aanzienlijk verbetert, met name voor veteranen en spelers met hoge salarissen.

Junhao Su, David Grimsman, Christopher Archibald

Gepubliceerd 2026-03-09
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

De Gouden Kooi: Waarom je niet alleen naar statistieken moet kijken bij NBA-salarissen

Stel je voor dat je een NBA-teammanager bent. Je moet beslissen hoeveel je een speler betaalt. De traditionele manier (de "oude school") is als een rekenmachine: je kijkt naar de cijfers van vorig jaar (hoeveel punten, rebounds, assists) en de leeftijd van de speler. Als de cijfers goed zijn, krijg je een groot salaris.

De auteurs van dit paper zeggen echter: "Wacht even, dat is te simpel."

In de echte wereld wordt een speler niet alleen betaald voor wat hij doet op het veld, maar ook voor wie hij kent en hoe lang hij al in het spel zit. Dit noemen ze "sociaal kapitaal". Een oude, gewonde speler kan nog steeds een enorm salaris krijgen omdat hij al 15 jaar in de liga zit en een goede agent heeft. Een rekenmachine ziet alleen de blessure en denkt: "Te duur!"

Het Probleem: De Rekenmachine vs. Het Netwerk

De onderzoekers van Brigham Young University wilden weten: Kunnen we een slim computermodel maken dat niet alleen naar cijfers kijkt, maar ook naar het "netwerk" van de speler?

Ze bouwden een kennisnetwerk (een soort gigantische connectie-kaart). Op deze kaart zijn spelers verbonden met:

  • Hun teams.
  • Hun agents.
  • De prijzen die ze hebben gewonnen.
  • Hun blessuregeschiedenis.

Het idee is als een groot sociaal netwerk: als je weet met wie iemand bevriend is, weet je vaak meer over die persoon dan alleen door naar zijn gezicht te kijken.

De Grote Ontdekking: Het hangt af van je "Leeftijd" in het spel

Het meest interessante deel van dit onderzoek is dat het antwoord "ja" is, maar met een grote maar. Het werkt heel anders voor twee groepen spelers:

1. De Rookies (De Nieuwelingen) = Het "Lege Vak"

Stel je een jonge speler voor die net uit de draft komt. Hij heeft nog geen team, geen agent die langdurig met hem werkt, en geen netwerk van vrienden in de NBA. Hij zit in een sociale leegte.

  • Wat het model deed: Het probeerde zijn netwerk te analyseren, maar omdat er geen connecties waren, kreeg het alleen maar ruis (onzin). Het model raakte in de war en maakte grote fouten.
  • De les: Voor jonge spelers is de simpele "rekenmachine" (kijken naar draft-positie en leeftijd) nog steeds de beste. Netwerken bestaan voor hen nog niet.

2. De Veteranen (De Oude Garde) = De "Gouden Kooi"

Stel je een speler voor die al 10 jaar speelt. Hij heeft een sterke agent, speelt voor een bekend team en heeft een reputatie. Zelfs als hij dit jaar wat minder presteert of geblesseerd is, blijft zijn salaris hoog.

  • Wat het model deed: De rekenmachine zag alleen de slechte cijfers en dacht: "Betaal hem minder!" Maar het netwerkmodel zag de connecties: "Ah, deze speler zit in een krachtig netwerk van top-agents en loyale teams. Hij is nog steeds waardevol!"
  • Het resultaat: Het netwerkmodel kon de rekenmachine "redden" door fouten te corrigeren. Het zag de onzichtbare waarde die de cijfers niet toonden.

De "Drie Toestanden" van het Model

De onderzoekers keken niet alleen naar het gemiddelde, maar keken specifiek naar de uitzonderingen (de spelers waar de rekenmachine het totaal bij verkeerd zat). Ze deelden de resultaten in drie categorieën:

  1. De Redding (Rescue): Het netwerkmodel zag dat een speler (zoals Fred VanVleet) meer waard was dan zijn cijfers suggereerden, omdat hij een goede agent en reputatie had. Het model "redde" de voorspelling en gaf een realistischer salaris.
  2. De Neutrale: Het model deed niets anders dan de rekenmachine.
  3. De Misleiding (Misguidance): Soms ging het net zo mis. Bij een speler als Chris Paul (die oud is en minder presteert) zag het netwerkmodel alleen de "oude roem" en dacht: "Hij is nog steeds een ster!" Terwijl de markt eigenlijk dacht: "Hij is te oud." Het model was dan te vastgeplakt aan het verleden.

De Grootste Leerlessen (in simpele taal)

  1. Kwaliteit boven Kwantiteit: Je hoeft niet alle data in het model te stoppen. Een simpel netwerk met de juiste connecties (wie is je agent, welk team) werkt beter dan een overladen netwerk met duizenden kleine details.
  2. De "Structuur-Maturiteit" Hypothese:
    • Rookies worden bepaald door regels (leeftijd, draft-nummer). Gebruik daar een simpele rekenmachine voor.
    • Veteranen worden bepaald door relaties (reputatie, agent, teamloyaliteit). Gebruik daar een slim netwerkmodel voor.
  3. Het Gevaar van "Over-smoothing": Soms is een speler zo'n superster (zoals Giannis Antetokounmpo) dat hij uniek is. Als het netwerkmodel te veel kijkt naar zijn teamgenoten (die minder verdienen), "verwaterd" het model zijn unieke waarde. Het maakt alles gemiddeld, terwijl supersters juist niet gemiddeld zijn.

Conclusie

Dit onderzoek leert ons dat er geen "one-size-fits-all" oplossing is voor het voorspellen van salarissen.

  • Voor nieuwe spelers is de simpele statistiek de koning.
  • Voor ervaren spelers is het netwerk (wie je kent) de sleutel tot de juiste prijs.

De beste manier om NBA-salarissen te voorspellen is dus een hybride systeem: gebruik de rekenmachine voor de nieuwelingen, maar schakel het slimme netwerkmodel in zodra een speler "rijp" is genoeg om een eigen sociaal kapitaal te hebben.