Uni-Skill: Building Self-Evolving Skill Repository for Generalizable Robotic Manipulation

本文提出了 Uni-Skill 框架,通过构建基于大规模非结构化机器人视频的层级化技能库(SkillFolder)并实现技能库的自动演化,解决了传统方法依赖固定技能库的局限性,从而显著提升了机器人在新任务中的零样本泛化能力与自适应规划水平。

Senwei Xie, Yuntian Zhang, Ruiping Wang, Xilin Chen

发布于 2026-03-04
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 Uni-Skill 的机器人系统。简单来说,它解决了一个让机器人“变笨”的痛点:以前的机器人只能做人类教过它的动作,一旦遇到没教过的任务,就彻底“卡壳”了。

Uni-Skill 就像给机器人装了一个**“会自我进化的超级大脑”**,让它不仅能听懂新指令,还能自己“查字典”、“找教程”,甚至自己“发明”新技能来完成任务。

为了让你更容易理解,我们可以用**“一个刚入职的超级实习生”**来打比方:

1. 以前的机器人:死板的“执行机器”

想象一下,你以前雇佣的机器人实习生,手里只有一本固定的《操作手册》(这就是传统的“技能库”)。

  • 如果你说:“把杯子拿起来。”它手册里有“拿杯子”这一页,它就能做。
  • 但如果你说:“把桌子擦干净。”它翻遍手册,发现没有“擦桌子”这一页,它就彻底懵了,或者只能胡乱尝试,因为它不知道该怎么把“拿杯子”和“移动”组合成“擦桌子”。
  • 痛点:每遇到一个新任务,人类就得手把手教它,或者重新写代码,效率极低。

2. Uni-Skill 的突破:会“自我进化”的实习生

Uni-Skill 把这个实习生升级了,它现在有两个超能力:

超能力一:技能感知与规划(“我知道我缺什么”)

当你对它说:“把桌子擦干净”时,它不会死板地查手册。

  • 它会先思考:“我现有的技能(比如‘拿’、‘放’)够吗?”
  • 它发现不够,于是它会自动意识到:“哦,我缺一个‘擦’的技能!”
  • 它不会停下来等人类教,而是自己生成一个“擦桌子”的任务描述(比如:“用布或海绵在桌面上来回移动”)。
  • 比喻:就像你让实习生去修一个没见过的电器,他发现自己不会修,但他不会直接放弃,而是先写出:“我需要学会‘拆卸螺丝’和‘更换电路板’这两个步骤”,然后开始行动。

超能力二:自动技能进化(“我去网上找教程”)

既然它知道自己缺“擦桌子”这个技能,它去哪学呢?

  • 以前的方法需要人类去拍视频、打标签,告诉机器人怎么擦。
  • Uni-Skill 有一个叫 SkillFolder(技能文件夹) 的超级数据库。这个文件夹里存了成千上万段从互联网上抓取的机器人操作视频(就像 YouTube 上的各种教程视频)。
  • 这个文件夹不是乱放的,而是像图书馆的分类系统一样,把动作分门别类(比如:所有“擦”的动作都归在一起,再细分为“擦桌子”、“擦窗户”等)。
  • 当机器人需要“擦桌子”时,它立刻去 SkillFolder 里检索,找到一段别人擦桌子的视频。
  • 比喻:这就像实习生遇到不会的题,不再等老师教,而是直接打开维基百科,搜索“如何擦桌子”,然后看别人是怎么做的,模仿着做。

3. 它是如何工作的?(三步走)

  1. 发现缺口:机器人听到指令,发现现有技能不够用。
  2. 生成描述:它自己用语言描述出缺少的技能(比如:“用布擦拭表面”)。
  3. 检索与模仿
    • 它去 SkillFolder 里找类似的视频片段。
    • 它不是死板地复制视频,而是提取出核心逻辑(比如:手要接触哪里?移动轨迹是圆形的还是直线的?)。
    • 它把这些逻辑应用到当前的新场景中,生成新的动作代码。

4. 效果怎么样?

论文在电脑模拟和真实世界中都做了测试:

  • 模拟环境:在遇到从未见过的任务(比如“关上冰箱”、“拔掉充电器”)时,Uni-Skill 的成功率比目前最先进的其他方法(MOKA)高出了 31%
  • 真实世界:在真实的机械臂上,它也能很好地完成像“叠衣服”、“搅拌东西”这种需要复杂轨迹的任务,成功率提升了 20% - 34%

总结

Uni-Skill 的核心思想就是:
不要试图把世界上所有动作都提前教给机器人(那是做不到的)。
而是给机器人一个**“会查资料、会总结规律、会自我学习”的能力。它把海量的、杂乱无章的机器人视频,整理成一本结构化的“技能百科全书”。当遇到新任务时,它就能像人类一样,“举一反三”**,自己学会新技能。

这就好比,以前的机器人是只会背课文的学生,而 Uni-Skill 是懂得查字典、会做笔记、能举一反三的学霸

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →