Dual-Interaction-Aware Cooperative Control Strategy for Alleviating Mixed Traffic Congestion

本文提出了一种面向混合交通瓶颈场景的双交互感知协同控制策略(DIACC),通过结合多智能体强化学习框架下的去中心化交互自适应决策、集中式交互增强评估器及软最小值奖励设计,有效提升了网联自动驾驶车辆在复杂人机混行环境下的交通效率与适应性。

Zhengxuan Liu, Yuxin Cai, Yijing Wang, Xiangkun He, Chen Lv, Zhiqiang Zuo

发布于 2026-03-06
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一种名为 DIACC 的新策略,旨在解决一个非常现实的问题:当“自动驾驶汽车”(CAV)和“人类驾驶汽车”(HDV)混在一起开车时,如何避免堵车和事故?

想象一下,你正开车在一个繁忙的路口,前面车道突然变窄了(就像高速公路施工导致车道减少)。这时候,如果全是人类司机,大家都会争抢车道,谁也不让谁,结果就是堵成一团,甚至发生剐蹭。但如果引入自动驾驶汽车,它们本可以像“超级交警”一样互相配合,疏通交通。

问题在于: 人类司机开车风格千奇百怪(有的急躁、有的慢吞吞、有的喜欢突然变道),而且自动驾驶汽车很难预测人类下一秒会做什么。现有的自动驾驶算法要么太死板,要么在复杂的人类车流中“学不会”怎么合作。

这篇论文提出的 DIACC 策略,就像给自动驾驶汽车装上了一套**“双重视觉 + 超级大脑 + 智能教练”**的组合拳,让它们能更聪明地应对这种混乱局面。

以下是用通俗语言对论文核心内容的解读:

1. 核心痛点:人类太“随性”,机器太“困惑”

在混合交通中,自动驾驶汽车面临两个难题:

  • 分不清对象: 它不知道旁边那辆车是“队友”(也是自动驾驶的,可以商量)还是“路人”(人类司机,只能观察猜测)。
  • 顾此失彼: 现有的算法往往只盯着自己眼前的车(局部视角),忽略了整个路口的拥堵情况(全局视角),导致虽然自己开得顺了,但整体交通还是堵。

2. DIACC 的三大“超能力”

第一招:双重视觉(D-IADM 模块)——“分清队友和路人”

  • 比喻: 想象你在打篮球。面对队友,你可以直接喊话配合(“我传给你,你快跑!”);面对对手,你只能观察他的动作来预判(“他好像要突破,我得防守”)。
  • 做法: 以前的算法把所有人都当成一样的对手。DIACC 给自动驾驶汽车装了两套“眼睛”:
    • 一套专门看队友(其他自动驾驶车):不仅看它们在哪,还知道它们上一秒打算做什么,从而进行默契配合。
    • 另一套专门看路人(人类车):只根据它们的历史轨迹来猜测意图,保持安全距离。
  • 效果: 这样自动驾驶汽车就能更精准地判断:该跟谁“商量”变道,该给谁“让路”。

第二招:超级大脑(C-IEC 模块)——“上帝视角”

  • 比喻: 想象下棋。普通的棋手只看自己这一步怎么走(局部);而“超级大脑”能看到整个棋盘的局势(全局),知道这一步走完后,对手会怎么反应,整个局面会怎么演变。
  • 做法: 在训练过程中,有一个“裁判”(Critic)不仅看每个车怎么开,还通过全局交互图,分析所有车之间的互动如何影响整个路口的通畅度。
  • 效果: 这个“裁判”会告诉每辆车:“虽然你变道现在很爽,但会导致后面三辆车堵死,所以别变!”它指导车辆为了整体效率做出更优的决策,特别是在车流量极大的时候,效果最明显。

第三招:智能教练(奖励机制 + 安全修正)——“专挑难题练,安全不妥协”

  • 比喻: 就像学生做题。如果老师只给简单的题练,学生遇到难题就懵了。DIACC 的“智能教练”会专门挑那些最难的互动场景(比如大家挤在一起抢道)进行重点训练。
    • 温度退火(Temperature Annealing): 刚开始训练时,像“广撒网”一样尝试各种方法;随着训练深入,逐渐把注意力集中在那些最容易出错、最混乱的场景上,让学生(算法)在困难中快速成长。
    • 安全修正(PSAR): 这是一个“安全网”。如果算法想出的动作太激进(比如离前车太近),这个模块会像老司机的本能一样,瞬间把动作修正回来(比如强制刹车或取消变道),防止撞车。
  • 效果: 训练速度更快,而且学会的策略非常稳健,即使在没见过的复杂路况下也能安全通过。

3. 实验结果:真的有用吗?

研究人员在电脑模拟的“瓶颈路段”(车道突然减少的地方)进行了测试,对比了纯人类驾驶、普通自动驾驶和 DIACC 策略。

  • 通行效率更高: 在车道减少 50% 的极端情况下,DIACC 让车流速度提升了约 55%,而普通方法提升很少。
  • 更安全: 在测试中,DIACC 几乎消除了所有可能导致碰撞的“安全关键事件”(Safety-Critical Events),而普通方法在车多时事故率会飙升。
  • 适应性强: 即使把训练好的模型放到没见过的地图、不同数量的车辆、不同性格的人类司机(有的急躁、有的保守)中,它依然表现优异。

总结

这篇论文就像是为自动驾驶汽车设计了一套**“高情商”的社交法则**:

  1. 认得清谁是队友,谁是路人;
  2. 看得远,不仅顾自己,还顾大局;
  3. 练得精,专门攻克最难的堵车场景,同时时刻系好“安全带”。

这项技术让自动驾驶汽车在人类司机依然占大多数的未来交通中,不仅能“独善其身”,更能“兼济天下”,真正缓解拥堵,让出行更安全、更顺畅。