A robust and compliant robotic assembly control strategy for batch precision assembly task with uncertain fit types and fit amounts

本文针对具有不确定配合类型和配合量的批量化精密装配任务,提出了一种基于力 - 视觉融合控制器驱动的多任务强化学习与多教师策略蒸馏相结合的方法,成功构建并验证了能够适应不同配合状态、兼具高训练效率与优异力顺应性的鲁棒机器人装配控制策略。

Bin Wang, Jiwen Zhang, Song Wang, Dan Wu

发布于 2026-03-11
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章讲述了一个关于机器人如何像“老手”一样,灵活地组装精密零件的研究。

想象一下,你正在玩一个非常精密的乐高积木游戏,或者是在组装手机镜头。这些零件(我们叫它“销”和“孔”)非常小,公差极小(误差只有头发丝的几十分之一)。

1. 遇到的难题:未知的“手感”

在工厂里,机器人要组装成千上万个这样的零件。理论上,它们应该严丝合缝。但实际上,因为机器加工总有误差,每个零件的“手感”都不一样:

  • 有的太松(像穿大一号的袜子,晃晃悠悠);
  • 有的太紧(像穿小一号的鞋,硬挤进去);
  • 有的刚刚好(过渡配合)。

更麻烦的是,机器人在拿起零件之前,根本不知道手里拿的这个是“松”的还是“紧”的。如果机器人太“死板”,遇到太紧的零件就会硬怼,把零件弄坏;遇到太松的零件又可能插歪。

以前的机器人要么太笨(只会按固定程序走),要么太灵活但学得太慢(每次遇到新情况都要重新学)。

2. 解决方案:分而治之 + 集体智慧

为了解决这个问题,清华大学的团队想出了一个聪明的“三步走”策略,我们可以把它想象成培养一个全能冠军的过程:

第一步:拆解任务(分班教学)

既然不知道每个零件的具体松紧度,那就把可能的情况分成几类。

  • 想象把零件按“松紧程度”分成四个班:
    • A 班:特别紧(过盈配合);
    • B 班:稍微有点紧;
    • C 班:稍微有点松;
    • D 班:特别松(间隙配合)。
  • 机器人先分别在这四个班里特训,学会每种情况下的“独门绝技”。

第二步:多任务强化学习(集体特训)

传统的做法是机器人一个班一个班地练,效率很低。

  • 这篇论文的方法是让机器人同时在四个班里训练。
  • 这就好比一个学生同时上四门课,他发现虽然课不一样,但“如何保持平衡”、“如何感知阻力”这些底层逻辑是相通的
  • 通过这种“集体特训”,机器人学得非常快(效率提高了 50% 以上),并且掌握了不同松紧度背后的共同规律。

第三步:策略蒸馏(融会贯通)

这时候,机器人手里有四套不同的“独门绝技”(四个老师)。如果直接让它用,它还得先判断“我现在是在 A 班还是 B 班”,这太慢了。

  • 于是,研究人员设计了一个**“超级学生”**(学生网络)。
  • 让这四个“老师”把它们的经验、动作和直觉,全部传授给这个“超级学生”。
  • 这个“超级学生”不需要知道具体的松紧度,它只需要看眼前的(摸起来紧不紧)和眼睛(看准不准),就能自动做出最合适的反应。它把四个老师的优点都融合了,变成了一个**“万能高手”**。

3. 核心黑科技:力与眼的融合

在这个训练过程中,机器人不仅仅靠“手”(力传感器),还靠“眼”(摄像头)。

  • 力传感器:告诉机器人“这里有点卡住了”或者“这里太松了”。
  • 摄像头:告诉机器人“零件歪了,得往左偏一点”。
  • 以前的机器人可能只靠其中一种,或者参数是固定的。而这个系统让机器人自己调整“手”和“眼”的配合力度。就像老司机开车,遇到坑洼会自动调整方向盘和油门,而不是死板地按说明书操作。

4. 结果:真正的“老司机”

在真实的工厂实验里,这个“超级学生”表现惊人:

  • 成功率极高:不管零件是松是紧,甚至是有轻微变形,它都能成功组装,成功率高达 98.5%
  • 温柔且高效:它组装时用的力非常小,不会把精密零件弄坏,而且动作很快。
  • 通用性强:即使遇到训练时没见过的“特别紧”或“特别松”的零件,它也能凭直觉搞定。

总结

这就好比教一个机器人组装手机镜头。

  • 旧方法:给机器人一本说明书,告诉它“如果是 A 型号就用力 5 牛,如果是 B 型号就用力 3 牛”。一旦遇到没写过的型号,机器人就懵了。
  • 新方法:让机器人先分别练习“紧”、“松”、“适中”几种手感,然后把所有经验融合成一个**“直觉”。现在,无论给它什么零件,它都能像经验丰富的老工匠一样,凭手感(力觉)和凭眼力**(视觉)自动调整,温柔又精准地完成组装。

这项技术对于未来 3C 产品(手机、电脑等)的自动化生产非常重要,因为它能让机器人真正适应工业生产中那些不可避免的“小误差”。