Dual-Interaction-Aware Cooperative Control Strategy for Alleviating Mixed Traffic Congestion

Dit artikel introduceert de DIACC-strategie, een op Multi-Agent Reinforcement Learning gebaseerde aanpak die door middel van gedecentraliseerde besluitvorming, een gecentraliseerde criticus en een veiligheidsgerichte actieherfinement de samenwerking tussen geautomatiseerde voertuigen verbetert om verkeersopstoppingen in gemengd verkeer effectief te verminderen.

Zhengxuan Liu, Yuxin Cai, Yijing Wang, Xiangkun He, Chen Lv, Zhiqiang Zuo

Gepubliceerd 2026-03-06
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Hoe Slimme Auto's Samenwerken om File te Voorkomen: Een Verhaal over "Dubbele Ogen" en "Slimme Remmen"

Stel je voor dat je op een drukke snelweg rijdt, net voor een punt waar twee rijbanen samenkomen tot één. Dit is een "flesnek" (bottleneck). In het verleden was dit een chaos: iedereen probeerde zijn eigen weg te vinden, niemand gaf de voorrang, en er ontstond een enorme file.

Nu komen er steeds meer slimme, zelfrijdende auto's (CAV's) bij. De hoop is dat deze auto's met elkaar kunnen praten en samenwerken om de file op te lossen. Maar er is een groot probleem: de weg is nog steeds vol met gewone auto's die door mensen worden bestuurd (HDV's). Mensen zijn onvoorspelbaar; sommigen zijn agressief, sommigen zijn voorzichtig, en sommigen doen gewoon wat ze willen.

De onderzoekers van dit papier hebben een nieuwe strategie bedacht, genaamd DIACC. Je kunt dit zien als een superkrachtige "coördinatie-app" voor de slimme auto's. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Twee Soorten "Ogen" (De Dubbele Interactie)

Stel je voor dat een slimme auto twee soorten brillen heeft om naar de wereld te kijken.

  • Bril voor de "Teamgenoten" (CAV-CAV): Als de slimme auto een andere slimme auto ziet, kijkt hij door een bril die zegt: "Hé, jij bent ook slim! Laten we een plan maken." Ze kunnen elkaar vertellen wat ze gaan doen (bijvoorbeeld: "Ik ga naar links, jij gaat rechtdoor"). Dit is samenwerking.
  • Bril voor de "Mensen" (CAV-HDV): Als de slimme auto een gewone menselijke auto ziet, kijkt hij door een andere bril die zegt: "Die meneer in die rode auto is onvoorspelbaar. Ik moet zijn bewegingen gissen en op zijn gedrag reageren." Dit is observatie.

De oude methoden zagen alle auto's als hetzelfde. De nieuwe methode (DIACC) maakt een duidelijk onderscheid: met teamgenoten werken we samen, met mensen leren we van hun gedrag.

2. De "Hoofdtrainer" die de Grote Droom Ziet (De Critic)

In het trainingsproces van deze auto's is er een Actor (de bestuurder) en een Critic (de trainer).

  • De Actor zit in de auto en kijkt alleen naar wat er direct om hem heen gebeurt. Hij ziet niet de hele file.
  • De Critic is de "Hoofdtrainer" die vanuit een helikopter naar de hele situatie kijkt.

Het probleem was dat de trainer niet goed begreep waarom de auto's soms vastliepen. De nieuwe C-IEC module geeft de trainer een "X-ray zicht". Hij ziet niet alleen waar de auto's zijn, maar ook hoe ze op elkaar reageren. Hij kan zeggen: "Jullie doen het lokaal goed, maar jullie samenwerking zorgt ervoor dat de file verderop erger wordt. Probeer het anders." Dit helpt de auto's om niet alleen voor zichzelf, maar voor het geheel te rijden.

3. De "Moeilijke Oefeningen" (De Beloning)

Stel je voor dat je een sporter traint. Als je alleen oefent op de makkelijke dingen (zoals hardlopen op een leeg veld), word je niet beter in moeilijke situaties.

De onderzoekers hebben een slimme beloningssysteem bedacht. In het begin laten ze de auto's alles proberen (breed zoeken). Maar naarmate ze trainen, gaan ze zich specifiek richten op de moeilijkste momenten: de drukke momenten waar de auto's bijna botsen of waar de file erg is.

  • Als een auto het goed doet op een rustig moment, krijgt hij een kleine beloning.
  • Als een auto het goed doet op een drukkend, gevaarlijk moment, krijgt hij een grote beloning.

Dit zorgt ervoor dat de auto's zich focussen op het oplossen van de echte files, in plaats van alleen maar makkelijk te rijden.

4. De "Veiligheids-Rem" (PSAR)

Soms is de slimme computer zo enthousiast om een nieuwe route te proberen, dat hij een gevaarlijke beweging maakt. Om dit te voorkomen, hebben ze een PSAR-module toegevoegd.

Dit is als een ervaren passagier die naast de bestuurder zit. De computer zegt: "Ik ga nu snel van baan wisselen!" De passagier kijkt naar de afstand en de snelheid en zegt: "Wacht even, die auto komt te snel aan. Rem een beetje of wacht."
De computer doet dit niet voor de hele rit, maar alleen op het allerlaatste moment als er echt gevaar dreigt. Dit maakt het trainen veiliger en sneller.

Wat is het resultaat?

Door deze drie dingen samen te doen (twee soorten brillen, een trainer met X-ray zicht, en een focus op moeilijke oefeningen), laten de slimme auto's zien dat ze:

  1. Minder files veroorzaken.
  2. Veiliger rijden (minder bijna-ongevallen).
  3. Zelfs werken als er weinig slimme auto's zijn (ze passen zich aan aan de mensen).

Kortom: De onderzoekers hebben een manier gevonden om slimme auto's te leren om niet alleen "slim" te zijn, maar ook "sociaal" en "voorzichtig" te zijn in een wereld vol met onvoorspelbare mensen. Ze kijken naar hun teamgenoten anders dan naar de rest, en ze leren het meest van de moeilijkste situaties.