LLM-Meta-SR: In-Context Learning for Evolving Selection Operators in Symbolic Regression

本文提出了一种名为 LLM-Meta-SR 的元学习框架,通过引入语义感知选择算子、膨胀控制及领域知识提示,使大语言模型能够自动设计出超越专家水平并显著提升符号回归性能的进化选择算子。

Hengzhe Zhang, Qi Chen, Bing Xue, Wolfgang Banzhaf, Mengjie Zhang

发布于 2026-04-01
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个非常有趣的故事:人工智能(大语言模型)如何学会“教”另一个人工智能如何更好地学习。

为了让你轻松理解,我们可以把这项研究想象成**“聘请一位超级教练来设计比赛规则”**。

1. 背景:什么是符号回归?

想象你有一堆数据点(比如气温和冰淇淋销量的关系),你的任务是找出一个数学公式(比如 y=2x+5y = 2x + 5)来完美描述这些点。

  • **符号回归(Symbolic Regression)**就是让计算机自动去“猜”这个公式长什么样。
  • 在这个过程中,计算机通常会像生物进化一样,产生成千上万个“候选公式”,然后进行“优胜劣汰”。

2. 核心问题:谁来决定谁被淘汰?

在进化过程中,最关键的一步是**“选择”**:哪几个公式应该留下来继续“生孩子”(变异和交叉),哪几个应该被淘汰?

  • 这就好比一场选秀比赛,“选择算子”(Selection Operator)就是评委
  • 过去:评委都是人类专家设计的。他们凭经验制定规则,比如“谁分高谁留”。但这很费力,而且可能不够完美,就像让一个老教练凭直觉定规则,可能漏掉天才选手。
  • 现在的挑战:现有的大语言模型(LLM)虽然能写代码,但在这个“选秀评委”的角色上,它们要么写得不好,要么写出来的代码太啰嗦(像写了一万字的废话),要么看不懂不同题目之间的细微差别。

3. 解决方案:LLM-Meta-SR(让 AI 设计评委)

这篇论文提出了一种新方法,叫 LLM-Meta-SR。简单来说,就是让大语言模型(LLM)去进化出一个更聪明的“评委”

他们给大语言模型设计了一个“特训营”,并解决了三个大难题:

难题一:评委太“笨”,只看平均分

  • 比喻:以前的评委只看选手的“总平均分”。如果一个选手在“数学题”上满分,但在“语文题”上零分,总分可能和另一个全科 60 分的选手一样。评委就分不清谁更有特长了。
  • 创新:作者教大语言模型看**“细粒度成绩单”**。不仅看总分,还要看每个具体题目上的表现。
  • 效果:大语言模型学会了**“互补”**。它会想:“这个选手数学好,那个选手语文好,把他们俩‘生’在一起,可能生出一个全科天才。”这让进化出的公式更强大。

难题二:代码“注水”(Bloat)

  • 比喻:大语言模型有时候喜欢“炫技”,写出来的评委规则像写了一部小说,明明一句话能说清,它非要写十页。这导致计算机跑得慢,而且很难看懂(不可解释)。
  • 创新:作者在给大语言模型的“指令(Prompt)”里加了**“字数限制”**,并且在进化过程中,如果代码太长,就直接淘汰。
  • 效果:进化出来的评委规则变得简洁、干练,像一句精辟的格言,而不是冗长的废话。

难题三:缺乏“常识”

  • 比喻:大语言模型虽然博学,但不懂“体育比赛的潜规则”。比如,比赛刚开始要鼓励大家多尝试(探索),比赛快结束时要追求精准(利用)。
  • 创新:作者把人类专家的经验(比如“多样性”、“可解释性”、“动态调整压力”)写进了给大语言模型的**“考试大纲”**里。
  • 效果:大语言模型不再是瞎猜,而是像一个懂行的老教练,知道什么时候该激进,什么时候该保守。

4. 最终成果:Omni 选手

经过这一套“特训”,大语言模型设计出了一个名为 Omni 的超级评委。

  • 战绩:在 116 个不同的数学回归测试题上,这个由 AI 设计的评委,打败了所有人类专家设计的传统评委,甚至打败了目前世界上最先进的 28 种算法。
  • 特点:它找出的公式不仅(预测误差小),而且(公式简单,容易理解),就像是一个既聪明又谦虚的天才。

总结

这篇论文的核心思想是:不要只让 AI 去解题,要让 AI 去设计“解题的规则”。

通过给大语言模型加上“看细节”、“防注水”和“懂常识”这三个法宝,研究人员成功让 AI 自动设计出了比人类专家更优秀的“选秀评委”。这不仅让符号回归(找公式)变得更强,也证明了 AI 在自动设计算法方面,已经具备了超越人类专家的能力。

一句话概括
人类专家还在手动设计“比赛规则”时,这篇论文让大语言模型自己学会了设计规则,结果它设计的规则让比赛(找公式)变得又快又准,还特别简洁。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →