Deconfounded Lifelong Learning for Autonomous Driving via Dynamic Knowledge Spaces

本文提出了名为 DeLL 的去混淆终身学习框架,通过结合狄利克雷过程混合模型与因果推断中的前门调整机制,构建动态知识空间以解决自动驾驶端到端系统中的灾难性遗忘、跨场景知识迁移困难及虚假相关问题,从而显著提升模型在持续学习中的适应性与驾驶性能。

Jiayuan Du, Yuebing Song, Yiming Zhao, Xianghui Pan, Jiawei Lian, Yuchu Lu, Liuyi Wang, Chengju Liu, Qijun Chen

发布于 2026-03-17
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 DeLL 的新方法,旨在让自动驾驶汽车像人类一样拥有“终身学习”的能力。

为了让你轻松理解,我们可以把自动驾驶汽车想象成一个正在考驾照并不断积累经验的“新手司机”

1. 以前的痛点:为什么现在的自动驾驶“记性”不好?

想象一下,你教这个新手司机开车:

  • 场景一(遗忘症): 他刚学会了在雨天减速(任务 A),结果第二天你教他在高速上变道(任务 B),他转头就把“雨天减速”忘得一干二净,甚至开始乱开。这就是**“灾难性遗忘”**。
  • 场景二(瞎猜): 他看到前面有个红灯,就立刻刹车。但他其实是因为“红灯”和“刹车”同时出现才这么做的,而不是真的理解了红灯的含义。如果以后红灯旁边有个大广告牌,他可能看到广告牌就误以为要刹车。这就是**“虚假关联”**(把巧合当成了因果)。
  • 场景三(死板): 以前的系统像是一个固定大小的工具箱,里面只有 5 个格子。每学一个新技能,就得把旧技能挤出去,或者把新技能硬塞进去,导致要么塞不下,要么把旧东西弄坏。

2. DeLL 的解决方案:给司机配了一个“超级大脑”

DeLL 框架通过三个核心创新,解决了上述问题:

A. 动态知识空间:从“固定工具箱”变成“无限生长的图书馆”

  • 以前的做法: 工具箱格子是固定的。
  • DeLL 的做法: 它建立了一个**“无限生长的图书馆”**(基于狄利克雷过程混合模型 DPMM)。
    • 显性书架(轨迹知识空间): 专门存放具体的驾驶动作,比如“怎么变道”、“怎么急刹车”。每遇到一种新情况,图书馆就自动增加一个新的书架,把新动作存进去,绝不覆盖旧动作
    • 隐性书架(特征知识空间): 专门存放对环境的“直觉”和“模式识别”,比如“这种路况很危险”、“那种天气视线不好”。
    • 比喻: 就像你的大脑,学新东西时,大脑会自动长出新的神经元连接,而不是把旧的记忆删掉。

B. 因果去混淆:从“瞎猜”变成“懂逻辑”

  • 以前的做法: 司机看到“广告牌”就刹车,因为他发现以前广告牌出现时刚好有人刹车。
  • DeLL 的做法: 引入了**“前门调整”**(Front-door adjustment)机制。
    • 比喻: 想象司机在开车时,脑子里有一个**“过滤器”**。当他看到“广告牌”时,过滤器会问:“这个广告牌真的导致我要刹车吗?还是因为前面有障碍物?”
    • 它利用图书馆里存好的“正确驾驶经验”作为中间人,过滤掉那些因为传感器噪音或环境巧合产生的错误联想。它只学习真正的因果关系(红灯=停),而不是虚假的巧合(广告牌=停)。

C. 进化式解码器:从“一步步想”变成“一眼看全”

  • 以前的做法: 规划路线时,像走一步看一步,先想第一步,再想第二步,效率低且容易卡住。
  • DeLL 的做法: 使用**“进化式轨迹解码器”**。
    • 比喻: 就像下棋高手,看一眼棋盘,脑子里瞬间生成好几条可能的路线(变道、加速、减速),然后直接选出最好的一条。它不再是一个接一个地生成,而是并行生成,反应更快,更灵活。

3. 实验结果:它真的变聪明了吗?

研究人员在 CARLA(一个非常逼真的自动驾驶模拟游戏)里进行了测试:

  • 测试场景: 让司机按顺序学习 5 种高难度技能(如紧急刹车、识别路牌、并线、超车、礼让)。
  • 结果:
    • 不遗忘: 学会了第 5 种技能后,它依然能完美完成第 1 种技能(旧技能没忘)。
    • 会迁移: 学会了“并线”后,再学“超车”会更快(新技能利用了旧经验)。
    • 更聪明: 在面对从未见过的复杂路况时,它能做出更合理的判断,而不是像以前那样乱撞或急刹。

总结

这篇论文的核心思想就是:
不要让自动驾驶汽车死记硬背,而要给它一个能自动扩容的“记忆库”,教它分清“巧合”和“真理”,并让它能像人类专家一样,一眼看穿路况,瞬间做出最佳决策。

这就好比把一辆只会背题的“做题机器”,升级成了一辆拥有丰富经验、懂得举一反三、且不会忘本的“老司机”。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →