User-driven development and evaluation of an agentic framework for analysis of large pathway diagrams

本文介绍了一个名为 Llemy 的基于大语言模型的代理框架,通过从黑客松开始的持续用户驱动开发流程,有效辅助研究人员探索和分析复杂的大型分子相互作用图谱,并验证了其在路径总结及功能优先排序方面的实用价值。

原作者: Corradi, M., Djidrovski, I., Ladeira, L., Staumont, B., Verhoeven, A., Sanz Serrano, J., Rougny, A., Vaez, A., Hemedan, A., Mazein, A., Niarakis, A., de Carvalho e Silva, A., Auffray, C., Wilighagen
发布于 2026-03-12
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个名为 Llemy 的聪明小助手是如何诞生的,以及它如何帮助科学家们在巨大的“生物知识迷宫”中轻松导航。

我们可以把这篇论文的故事想象成:一群科学家试图教一个超级 AI 如何当一名“生物地图导游”。

以下是用通俗语言和生动比喻对这篇论文的解读:

1. 背景:面对一座巨大的“生物图书馆”

想象一下,科学家手里有一本本极其复杂的“生物地图”(比如肝脏代谢图、神经退行性疾病图)。这些地图不是普通的纸片,而是由成千上万个分子、化学反应和路径组成的超级迷宫

  • 问题:这些迷宫太大了,而且格式各异。新手科学家(甚至老手)进去很容易迷路,找不到想要的信息,就像在巨大的图书馆里找一本没写书名、没写作者的书。
  • 机会:现在有了大语言模型(LLM),就像是一个读过全世界所有书的超级大脑。大家想:“能不能让这个超级大脑帮我们读这些地图,告诉我们答案?”

2. 主角登场:Llemy(一个由用户“养大”的导游)

作者们没有闭门造车,而是采用了一种**“用户驱动”**的方法。

  • 黑客马拉松(Hackathon):就像是一场**“创意烹饪大赛”**。一群专家(医生、生物学家、程序员)聚在一起,在两天内快速做出了 Llemy 的雏形。大家直接告诉开发者:“我们需要它能回答这类问题,不能犯那种错。”
  • Llemy 的工作原理
    1. 你问它一个问题(比如:“这个病是怎么影响肝脏的?”)。
    2. Llemy 不会瞎编,它会立刻去查**官方数据库(MINERVA 平台)**里的“地图”。
    3. 它把查到的事实和自己的“大脑”结合起来,给你一个总结,并且像导游指路一样,在回答里直接给你贴上“地图坐标”的链接,让你能点进去看原图验证。

3. 测试环节:25 位“试飞员”的反馈

为了看看 Llemy 好不好用,作者们找了 25 位专家来试用,就像试飞员测试新飞机

  • 测试内容:他们让 Llemy 做三件事:
    1. 总结(Summarise):把整张复杂的地图概括成一段话。
    2. 查找(Find):在地图里找特定的零件(比如“找出所有的酶”)。
    3. 分析(Analyse):推演如果某个零件坏了,会发生什么连锁反应。
  • 用户打分:用户给回答的准确性、简洁性可靠性打分(1-5 分)。

4. 测试结果:它很聪明,但还有点“小脾气”

  • 优点
    • 总结能力很强:在“总结”任务上,大家给它打了高分。它能把复杂的迷宫讲得头头是道。
    • 透明度高:它不像有些 AI 那样“一本正经地胡说八道”,它会告诉你答案是从哪张图的哪个角落找到的,你可以随时去核对。
    • 省时:75% 的用户觉得用它省了时间。
  • 缺点(也是改进方向)
    • 反应慢,分数就低:如果它思考太久,用户就会觉得体验不好(就像等外卖等太久会饿死一样)。
    • 名字认不全:如果科学家用“学名”提问,它可能认识;但如果用“俗名”或“别名”,它有时会懵圈,找不到对应的零件。
    • 回答不稳定:同样的问题问两次,它可能会给出两个稍微不一样的答案,或者链接有时候会失效。这就像是一个导游,今天指的路很准,明天可能就把你带偏了。

5. 未来计划:让它变得更完美

作者们根据大家的反馈,列出了一份**“升级清单”**:

  1. 跑得更快:优化系统,减少等待时间。
  2. 更懂行话:训练它识别各种生物名词的别名,不再“认生”。
  3. 更稳定:确保每次回答都靠谱,链接都能点得开。
  4. 开源化:未来计划使用更开放、更透明的 AI 模型,而不是依赖昂贵的商业模型,这样科学家们可以免费、安全地使用它。

总结

这篇论文的核心思想是:科技工具不能只由程序员在办公室里决定,必须让真正使用它的科学家(用户)参与设计和测试。

Llemy 就像是一个正在实习的生物导游。虽然它现在偶尔会迷路或反应慢,但通过不断的“用户反馈”和“实战演练”,它正在迅速成长为一名能帮科学家在复杂生物迷宫中轻松指路的得力助手。这不仅是一个软件的开发故事,更是一次关于**“如何让人工智能真正服务于科学研究”**的生动实验。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →