← 最新论文
⚛️ phenomenology

CoLLM: AI engineering toolbox for end-to-end deep learning in collider analyses

CoLLM 是一个 AI 工程工具箱,它利用预训练的大型语言模型和图形用户界面来自动化生成符合物理一致性的事件选择代码和深度学习分析,从而降低端到端对撞机分析的编程和技术门槛。

原作者: W. Esmail, A. Hammad, M. Nojiri

发布于 2026-02-09
📖 1 分钟阅读🧠 深度阅读

原作者: W. Esmail, A. Hammad, M. Nojiri

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下你是一位大师级厨师(粒子物理学家),你有一个关于新菜品(大型强子对撞机中的科学实验)的绝妙创意。你完全清楚自己想要什么样的口味,以及这些食材应该如何相互作用。然而,为了真正烹饪出这道菜,你必须花费数小时用一种只有计算机才能理解的语言(Python 代码)编写一份复杂的、逐行的食谱。如果你犯了一个哪怕微小的错误——比如把盐误当成了糖——整道菜就会毁掉,而且你可能直到品尝到最终成品时才会察觉。

CoLLM 就像是一位超级聪明、专业的副厨,它能流利地切换“厨师”(物理学)和“计算机”(代码)两种语言。它能将你的想法转化为纯英文,并瞬间为你写出一份完美且无误的食谱,随后甚至能直接把菜肴烹饪出来呈献给你。

以下是 CoLLM 的工作原理,分为简单的步骤进行拆解:

1. “氛围工程”厨师助手

通常,当人们使用 AI 来编写代码时,他们只是索要一个食谱并听天由命。这被称为“氛围编程”(vibe coding)。但在科学领域,一个错误的配料会毁掉多年的研究工作。CoLLM 使用了一种更严格的方法,称为**“氛围工程”(vibe engineering)**。

  • 提示词(规则手册): 在 AI 编写任何一行代码之前,它都会获得一本极其详尽、宏大的“规则手册”(系统提示词)。这本规则手册包含了所有的物理定律、粒子数据的特定存储方式,以及在对撞机实验室中烹饪的金科玉律。它告诉 AI:“永远不要混淆这些数字,”以及“始终以这种方式测量这个配料。”
  • 翻译: 你用纯英文输入你的实验想法:“我想找到看起来像这样的粒子,忽略那些,并测量剩余部分的能量。” AI 在规则手册的引导下,将其转化为一段完美的 Python 脚本。

2. 自我修正的试味过程

即使是最优秀的厨师也会犯错。如果 AI 写出的某行代码导致了计算机崩溃(比如试图去剁一块石头而不是洋葱),CoLLM 不会就此放弃。

  • 循环: 它会运行代码。如果出错,AI 会读取错误信息,意识到:“噢,我忘了加一个逗号,”然后仅修复那个特定的部分。它会再次尝试。它会不断重复这个过程,直到代码完美运行。这就像一个机器人,在不需要你动一下勺子的情况下,通过不断品尝汤的味道并加入一撮盐,直到味道恰到好处为止。

3. 自动评审团(深度学习)

一旦食谱编写完成且食材准备就绪,接下来的步骤通常是训练一台计算机来识别信号(有趣的粒子)与背景噪声(乏味的内容)之间的“风味”差异。

  • 魔法盒: CoLLM 的工作并不止于编写食谱。它会自动提取准备好的数据,并将其喂给三种不同类型的“试味机器”(深度学习模型):
    • MLP: 一个简单、快速的品鉴者,用于处理标准数据。
    • GNN: 一个聪明的品鉴者,能够理解粒子之间是如何相互连接的,就像食材之间的社交网络一样。
    • Transformer: 一个超级品鉴者,它能同时观察全局,理解粒子之间的长程关系。
  • 结果: 它会训练这些模型,检查它们的效果,并为你提供一份包含图表的成绩单,展示模型在寻找“大海捞针”方面的表现究竟有多好。

4. 用户界面:两种订餐方式

CoLLM 旨在对每个人都保持友好,无论你是技术大牛还是只想高效完成任务。

  • 终端 (TUI): 面向那些喜欢在后台输入命令并运行脚本的专业人士。
  • 图形界面 (GUI): 一个色彩鲜艳、可点击的网站,你可以在其中输入你的想法,点击按钮,然后实时观看 AI 的工作过程,并看着图表被绘制出来。

为什么这很重要?

在过去,一名物理学家必须同时是精通编程、数据科学和粒子物理的专家。如果你擅长物理但不擅长编程,你就会陷入困境。

CoLLM 充当了一个通用翻译官。它降低了准入门槛,让科学家能够专注于物理学(“是什么”和“为什么”),而不是编程(“如何做”)。它确保了代码不仅是被写出来的,而且是符合物理规律的可复现的(你每次都会得到相同的结果),并且是自动验证过的

简而言之: CoLLM 是一个工具,它让你能够用纯英文描述一个复杂的粒子物理实验,然后它会自动编写代码、修正错误,并训练出一个智能 AI 来寻找答案,而这一切都不需要你是编程专家。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →