Traffic-MLLM: Curiosity-Regularized Supervised Learning for Traffic Scenario Case-Based Reasoning

Traffic-MLLM is een nieuw raamwerk voor verkeersredenering dat in plaats van expliciete casusretrieval een gestructureerde casusruimte leert door middel van curieuze, op RND gebaseerde regularisatie, wat leidt tot verbeterde prestaties in dynamische en zeldzame verkeerssituaties.

Waikit Xiu, Qiang Lu, Bingchen Liu, Chen Sun, Xiying Li

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een beginnend bestuurder bent die net zijn rijbewijs heeft gehaald. Je hebt een heel boek met rijregels geleerd (dat is de theorie), maar je hebt nog nooit een echte auto gestuurd in de regen of bij een onverwachte file. Wat doe je dan als je voor het eerst een situatie tegenkomt die je niet kent?

Normaal gesproken zouden we kijken naar onze ervaringen: "Oh, dit lijkt op die keer dat ik bijna een aanrijding had met een fiets, toen remde ik." Dit noemen we Case-Based Reasoning (Redeneren op basis van gevallen).

Het probleem met de huidige slimme auto's (AI) is dat ze vaak alleen "leren" door miljoenen voorbeelden te zien en patronen te zoeken. Ze zijn goed in situaties die vaak voorkomen (zoals een groen licht), maar ze raken in paniek of maken fouten bij zeldzame situaties (zoals een koe die plotseling de weg op rent, of een sneeuwstorm). Ze hebben geen echt "geheugen" van specifieke ervaringen om uit te putten.

Hier komt Traffic-MLLM om de hoek kijken. Het is een nieuwe manier om auto's slimmer te maken, en het werkt als volgt:

1. Het Grote Geheugenboek (De Case Base)

Stel je voor dat we een enorme bibliotheek bouwen met duizenden verhalen over verkeerssituaties.

  • Sommige verhalen zijn video's: "Kijk hoe die vrachtwagen remde en de fietser uitweek."
  • Andere verhalen zijn foto's met vragen: "Wat betekent dit bordje in de sneeuw?"

In plaats van dat de auto tijdens het rijden naar deze bibliotheek moet zoeken (wat te langzaam is), leert de auto tijdens zijn training om deze verhalen in zijn eigen hoofd te structureren. Hij bouwt een intern "landkaartje" van alle mogelijke verkeerssituaties.

2. De "Nieuwsgierige" Leraar (Curiosity-Regularization)

Dit is het magische deel. Normaal gesproken leren computers vooral van de dingen die ze vaak zien. Als ze 100 keer een groen licht zien en 1 keer een koe op de weg, leren ze vooral van het groene licht. De koe wordt genegeerd.

Traffic-MLLM heeft een speciale truc: een nauwkeurige, nieuwsgierige leraar (gebaseerd op iets dat Random Network Distillation heet, maar laten we het "De Nieuwsgierige Sensor" noemen).

  • Hoe het werkt: Als de auto een situatie ziet die hij nog niet goed begrijpt (bijvoorbeeld die koe, of een rare weersomstandigheid), zegt de sensor: "Wacht even, dit is raar! Ik heb dit nog niet vaak gezien. Laten we hier extra veel tijd en energie aan besteden!"
  • Het resultaat: De auto wordt niet alleen getraind op de saaie, veelvoorkomende situaties, maar wordt specifiek gestimuleerd om de moeilijke, zeldzame situaties te leren begrijpen. Hij wordt "nieuwsgierig" naar wat hij nog niet kent.

3. Waarom is dit beter dan gewoon zoeken?

Vroeger dachten mensen: "Om slim te zijn, moet je tijdens het rijden snel in een database zoeken naar een vergelijkbare situatie."

  • Nadeel: Dat kost te veel tijd en rekenkracht.
  • Traffic-MLLM oplossing: De auto heeft het antwoord al in zijn hoofd, omdat hij tijdens het leren een diep begrip heeft opgebouwd van hoe situaties met elkaar verbonden zijn. Hij hoeft niet te zoeken; hij voelt gewoon wat de juiste reactie is, zelfs als hij de situatie nog nooit exact zo heeft gezien.

Samenvattend in één zin:

Traffic-MLLM is als een super-rij-instructeur die niet alleen de meest voorkomende verkeerssituaties oefent, maar de auto speciaal traint om nieuwsgierig te zijn naar de rare en gevaarlijke situaties, zodat hij in de echte wereld nooit meer verrast wordt.

De resultaten?
De tests tonen aan dat deze auto veel beter presteert dan andere modellen, vooral bij:

  • Het voorspellen van wat er gaat gebeuren (dynamisch redeneren).
  • Het begrijpen van verkeersborden in vreemde omstandigheden (zoals regen of sneeuw).
  • Het overbrengen van kennis van gesimuleerde omgevingen naar de echte wereld.

Kortom: Het maakt zelfrijdende auto's niet alleen slimmer, maar ook veiliger in de onvoorspelbare chaos van het echte verkeer.