CORAL: Scalable Multi-Task Robot Learning via LoRA Experts

本文提出了 CORAL 框架,通过冻结预训练 VLA 骨干网络并为每个任务分配独立的轻量级 LoRA 专家,在运行时动态切换专家以彻底消除多任务学习中的梯度冲突与灾难性遗忘,从而在真实机器人和多个仿真基准上实现了高效、可扩展的终身多任务学习。

Yuankai Luo, Woping Chen, Tong Liang, Zhenguo Li

发布于 Wed, 11 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 CORAL 的新系统,它旨在解决机器人学习中的一个大难题:如何让一个机器人同时学会做很多不同的事情,而且互不干扰,还不占太多内存?

为了让你轻松理解,我们可以把机器人想象成一位**“超级大厨”,把 CORAL 系统想象成这位大厨的“智能厨房管理系统”**。

1. 核心难题:大厨的困境

想象一下,你雇佣了一位非常有天赋的“通用大厨”(这就是论文里的预训练大模型,比如 OpenVLA 或 SimVLA)。他什么菜都会做,基础很好。

但是,如果你让他同时学做“川菜”、“法餐”和“甜点”,传统的做法有两种,都有大问题:

  • 做法 A(混合训练): 让他把所有菜谱混在一起学。结果就是,他学做甜点时,可能会把做川菜的手艺搞混(比如做蛋糕时手抖撒了辣椒),导致每样都做得不够好。这叫**“任务干扰”**。
  • 做法 B(单独训练): 为每道菜请一个专门的大厨,或者给这位大厨准备 100 套完全不同的制服和工具。但这太贵了!你的厨房(机器人的内存)根本放不下 100 套完整的装备。这叫**“存储爆炸”**。

2. CORAL 的解决方案:万能底座 + 可插拔的“技能插件”

CORAL 提出了一种聪明的新办法,就像给这位万能大厨设计了一套**“乐高式”的厨房系统**:

  • 冻结的万能底座(Frozen Backbone):
    这位大厨的核心大脑和基础技能(比如怎么拿刀、怎么切菜、怎么认食材)是固定的,不再改变。这就像机器人的“通用身体”和“基础视觉语言理解能力”。这部分是冻结的,不会乱动。

  • 轻量级技能插件(LoRA Experts):
    对于每一个具体的任务(比如“把书合上”或“按电梯按钮”),CORAL 只给大厨加一个极小的“技能插件”(论文里叫 LoRA 专家)。

    • 这个插件非常小,就像一张便签纸或一个小挂件,只记录这个特定任务需要的微调技巧。
    • 它只有几兆(MB)大,而完整的大厨模型是几个吉(GB)大。所以,你可以轻松地在口袋里装下几百个这样的插件。
  • 智能调度员(CORAL Manager):
    这是系统最酷的地方。当主人(用户)发出指令,比如“请把书合上”,CORAL 的调度员会立刻识别出这是“合书”任务,然后瞬间把“合书”的小插件挂到大厨身上,把之前的插件摘下来。

    • 关键点: 这个切换过程不需要重新计算,速度极快(100 毫秒内),就像换一副眼镜一样自然,机器人反应不会变慢。

3. 为什么这很厉害?(三大优势)

🚀 优势一:互不干扰,样样精通

因为每个任务都有自己独立的“小插件”,它们之间完全隔离。

  • 比喻: 就像你学骑自行车时,不需要担心会忘记怎么游泳。在 CORAL 里,学“按电梯”的插件不会覆盖“合书”的插件。
  • 结果: 机器人做每个任务都特别精准,不会因为学了新东西就把旧东西搞忘了(解决了灾难性遗忘问题)。

💾 优势二:省空间,能装下几百个任务

  • 比喻: 以前你想让机器人学会 100 种技能,需要存 100 个巨大的“大脑备份”(每个几十 GB)。现在,你只需要存 1 个“大脑” + 100 个“小插件”(每个只有几 MB)。
  • 结果: 存储需求减少了100 倍!这意味着你可以把整个技能库塞进机器人的小芯片里,甚至塞进手机里。

⚡ 优势三:像搭积木一样,随时学新技能

  • 比喻: 如果明天来了一个新任务(比如“给植物浇水”),你不需要重新训练整个机器人。你只需要花很少的时间,训练一个新的“浇水插件”,然后把它挂上去就行了。
  • 结果: 机器人可以伴随你的一生,不断学习新技能,而不会变笨或变慢。

4. 实验结果:真的好用吗?

作者在真实的机器人(Galaxea R1 双机械臂)和多个模拟测试中验证了这套系统:

  • 更聪明: 在复杂的任务测试中,CORAL 的表现比传统方法好得多,特别是在处理那些容易混淆的指令时。
  • 更稳定: 即使面对从未见过的环境(比如换了个房间),只要加载对应的插件,机器人也能完成得很漂亮。
  • 不遗忘: 即使连续学习 8 个全新的复杂任务(如开不同的门、按不同的电梯按钮),它也不会忘记之前学的,而传统的“混合训练”方法在这些新任务面前直接“崩溃”,成功率跌到 20% 多。

总结

CORAL 就像给机器人配备了一个**“万能底座 + 无限扩展的技能卡槽”
它不再试图让一个大脑记住所有细节,而是让大脑保持通用,把具体的技能做成一个个
轻便、独立、即插即用的小插件**。这让机器人变得更聪明、更省内存、更能适应未来,是迈向真正“终身学习”机器人的重要一步。