PPT: Pretraining with Pseudo-Labeled Trajectories for Motion Forecasting

本文提出了 PPT 框架,利用由现成检测器和跟踪器自动生成的伪标签轨迹进行预训练,以低成本、可扩展的方式学习鲁棒的运动表示,从而在标注数据稀缺及跨域场景下显著提升自动驾驶运动预测的泛化性能。

Yihong Xu, Yuan Yin, Éloi Zablocki, Tuan-Hung Vu, Alexandre Boulch, Matthieu Cord

发布于 2026-02-27
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 PPT(Pseudo-labeled Trajectories Pretraining,伪标签轨迹预训练)的新方法,旨在让自动驾驶汽车更聪明地预测周围车辆和行人的未来动向。

为了让你轻松理解,我们可以把自动驾驶预测比作教一个新手司机(AI 模型)。

1. 传统方法的痛点:昂贵的“私教课”

在以前,教这个新手司机预测路况,必须依赖人类专家(标注员)手写的“标准答案”。

  • 怎么做:人类看着监控录像,一笔一划地画出每一辆车过去 2 秒和未来 6 秒的轨迹。
  • 缺点
    • 太贵太慢:人工标注非常耗时耗力,就像请私教一样,成本极高。
    • 太死板:人类标注通常只给“唯一标准答案”(比如这辆车肯定走直线),忽略了现实中车辆可能走直线也可能变道的多种可能性。
    • 水土不服:在 A 城市(数据集)练好的司机,到了 B 城市(新环境)往往就不灵了,因为人类标注的风格和习惯不同。

2. PPT 的核心创意:让“机器老师”带“野路子”

PPT 提出了一种全新的思路:别等人类写答案了,直接用现成的、粗糙的机器数据来“预训练”

想象一下,我们不再让新手司机只读教科书(人类标注数据),而是先让他看860 万段由不同摄像头和雷达自动生成的“行车录像”。

  • 数据来源:这些轨迹不是人类画的,而是由现成的 3D 检测器(像眼睛)和追踪器(像大脑)自动生成的。
  • 特点:这些数据不完美(有噪点,像机器偶尔会看错位置),而且非常多样(有的检测器看车偏左,有的偏右,有的快,有的慢)。

3. 为什么“不完美”的数据反而更好?(核心隐喻)

这就好比学游泳

  • 传统方法:教练(人类标注)只教你一种完美的泳姿,动作标准但单一。一旦到了有风浪的陌生水域,你容易慌。
  • PPT 方法:先让你在各种不同水质(不同检测器)的泳池里游。
    • 有的水浑浊(有噪点),有的水有暗流(轨迹多样)。
    • 虽然教练没教你标准动作,但你在这些“乱糟糟”的环境里游久了,身体本能(AI 的底层能力)学会了如何适应各种水流,如何保持平衡。
    • 结果:当你最后真正下水(在少量人类标注数据上微调)时,你只需要稍微调整一下姿势,就能游得比那些只练过标准动作的人快得多、稳得多。

4. PPT 的三大绝招

  1. 以少胜多(低数据量下的王者):
    如果你只有 1% 的人类标注数据(就像只有 1 节私教课),用 PPT 预训练过的模型,表现比那些从头开始、用了 100% 数据训练的模型还要好。因为它已经通过“野路子”练好了基本功。

  2. 举一反三(跨域泛化):
    在 A 城市练出来的司机,直接去 B 城市开,依然很稳。因为 PPT 让模型见识了各种各样的“路况”和“噪音”,它学会了通用的驾驶逻辑,而不是死记硬背某个城市的地图。

  3. 去繁就简(不需要完美后处理):
    以前的自动标注需要复杂的“后期修图”(把机器画的线修得跟人类一样直)。PPT 发现:完全不需要!直接把机器生成的原始、粗糙的轨迹拿来用,效果反而更好。因为那些“不完美”恰恰代表了真实世界的复杂性,让模型更健壮。

5. 总结:它改变了什么?

这篇论文告诉我们,在教 AI 预测未来时,“量”和“多样性”比“完美的质量”更重要

  • 以前:追求完美的、人类手写的标准答案,成本高,通用性差。
  • 现在(PPT):拥抱海量的、自动生成的、甚至有点“脏”的数据。先让 AI 在海量粗糙数据中“野蛮生长”,学会通用的运动规律,最后再用少量人类数据“精修”一下。

一句话总结
PPT 就像是一个高效的“特训营”,它利用海量现成的、不完美的机器数据,让自动驾驶 AI 在正式上岗前就练就了一身“抗造”的本领,从而在真实世界中开得更安全、更聪明。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →