Human-in-the-Loop Uncertainty Analysis in Self-Adaptive Robots Using LLMs

原作者： Hassan Sartaj, Jalil Boudjadar, Mirgita Frasheri, Shaukat Ali, Peter Gorm Larsen

📖 1 分钟阅读☕ 轻松阅读

原作者： Hassan Sartaj, Jalil Boudjadar, Mirgita Frasheri, Shaukat Ali, Peter Gorm Larsen

原始论文采用 CC BY 4.0 许可（http://creativecommons.org/licenses/by/4.0/）。 ✨ 这是对下方论文的AI生成解释。它不是由作者撰写的。如需技术准确性，请参阅原始论文。阅读完整免责声明

想象一下，你正在建造一个机器人，它需要穿梭于繁忙的城市、修理笔记本电脑，或驾驶船只。这个世界混乱、不可预测，且充满意外。如果你的机器人没有为这些意外（论文中称为“不确定性”）做好准备，它可能会撞毁、损坏物品或陷入困境。

问题在于，找出所有可能出错的状况极其困难。这就像在建造房屋之前，试图列出房屋可能着火的每一种方式。通常，工程师必须依靠经验进行猜测，而这往往会遗漏隐藏的危险。

本文介绍了一种名为RoboULM的新工具，旨在帮助解决这一问题。可以将 RoboULM 想象成一位超级聪明、不知疲倦的助手，它在机器人建造之前，协助工程师头脑风暴出所有可能的“如果……会怎样”的情景。

以下是其工作原理，使用简单的类比说明：

首先，研究人员创建了一个庞大且有条理的“总清单”，称为UncerTax。

该工具使用大语言模型（LLM），这就像一个知识渊博但有时话痨的人工智能。

类比：想象你试图在干草堆里找一根针。你请一位朋友（AI）帮忙。如果你只说“找到那根针”，他们可能会错过。但如果你给他们一个具体的策略，他们就会做得更好。
作用：RoboULM 不只是让 AI“猜测”。它基于“总清单”，给 AI 提供一套具体的指令（提示）。它告诉 AI：“查看机器人的需求，并使用这 12 个具体类别，准确告诉我风险在哪里。”

这是最重要的一环。AI 不会被留在那里独自工作；人类始终掌握方向盘。

类比：将 AI 想象成一位热情但偶尔会犯错的初级实习生。你（资深工程师）审查他们的工作。
- 评分：你给实习生打分。“你‘安全’部分答对了（10/10），但你的‘硬件’猜测很弱（3/10）。再试一次。”
- 示例：你说：“记得那次机器人滑倒在湿地板上吗？在猜测风险时想想那个情况。”
- 清单：你指着“总清单”说：“你漏掉了‘环境’类别。回去把它补上。”
作用：该工具让人类工程师能够不断打磨 AI 的回答，直到完美。这是一个来回对话的过程，而非一次性的命令。

研究人员用 16 位真实专家测试了该工具，这些专家涉及四种不同类型的机器人：

结果：

简而言之，RoboULM是一个数字工作坊，人类工程师与智能 AI 在此协同工作。人类提供经验和最终判断，而 AI 则充当强大的引擎，扫描庞大的“总清单”以发现潜在危险。通过在一个包含提问、检查和优化的循环中协同工作，他们可以构建出更安全、更可靠的机器人，以应对不可预测的现实世界。

类似论文