Experimental evidence of progressive ChatGPT models self-convergence

该研究通过文本相似度指标发现,随着训练数据中合成内容比例的增加,不同版本的 ChatGPT 模型输出多样性呈现显著下降趋势,表现出一种被称为“模型自收敛”的现象。

Konstantinos F. Xylogiannopoulos, Petros Xanthopoulos, Panagiotis Karampelas, Georgios A. Bakamitsos

发布于 2026-03-16
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个关于人工智能(AI)正在陷入“自我重复”怪圈的有趣发现。为了让你轻松理解,我们可以把大语言模型(比如 ChatGPT)想象成一个正在学习写作的超级学生

1. 核心故事:AI 的“回声室”效应

想象一下,这个超级学生(ChatGPT)原本是通过阅读人类写的所有书、文章和网页来学习的。他的知识很广博,写出来的东西丰富多彩,像是一个充满创意的作家。

但是,最近发生了一个变化:互联网上出现了大量的AI 生成的文章。这些文章也是由像他一样的 AI 写的。现在,互联网上“人类写的书”变少了,而"AI 写的书”变多了。

当这个超级学生再次去互联网上“找书”学习时,他发现自己读到的很多内容,其实都是以前的 AI 写的。这就像是一个人在一个全是镜子的房间里,他看到的不是外面的世界,而是镜子里反射的无数个自己的倒影。

2. 实验:我们在测试什么?

研究人员做了一项实验,就像是在考这个学生:

  • 题目:给出一篇经典的人类文章(比如《荒凉山庄》的章节摘要)。
  • 任务:让不同版本的 ChatGPT(从旧版到最新的 5.2 版)用不同的“性格”来改写这篇文章。
    • 性格 A(温度=0):像是一个严谨的翻译官,尽量按部就班,只有一种写法。
    • 性格 B(温度=1):像是一个充满想象力的诗人,允许天马行空,应该写出很多种不同的版本。

研究人员的担忧是:如果 AI 读的都是 AI 写的东西,那么即使让它发挥想象力(性格 B),它可能也写不出什么新意,因为它的“大脑”里已经被 AI 生成的套路填满了。

3. 发现:AI 正在“自我收敛”

实验结果非常惊人,可以用一个比喻来解释:

  • 以前的 AI(旧版本):当你让它用“诗人”性格改写文章时,它就像一个真正的艺术家。虽然大家写的都是同一个故事,但每个人(每个版本)的笔触、用词、风格都截然不同,就像不同画家画的同一棵树,有的像油画,有的像素描,有的像水墨画
  • 现在的 AI(新版本,特别是 5.1 和 5.2):当你让它用“诗人”性格改写时,它却变得像是一个只会复印的机器。不管怎么让它发挥,它写出来的东西,和旧版本写的、甚至和自己之前写的,都越来越像

这就是论文提出的新概念:“模型自我收敛”(Model Self-Convergence)。

  • 比喻:想象一群人在玩“传话游戏”。
    • 以前:每个人听到话后,都会用自己的语言重新讲述,故事会变得越来越生动有趣,或者至少每个人讲得都不一样。
    • 现在:因为大家听到的话本身就是别人“转述”过的(AI 生成的数据),每个人再转述时,就只会重复那些转述过的词。结果就是,所有人的话都变得一模一样,失去了原本的多样性和创造力。

4. 为什么这很可怕?

论文指出,这种现象比大家熟知的“模型崩溃”(Model Collapse,指 AI 越学越傻,最后开始胡言乱语)更隐蔽,也更危险。

  • 模型崩溃:就像学生读坏了书,最后开始说胡话,大家一眼就能看出来“这 AI 坏了”。
  • 模型自我收敛:就像学生变得极其平庸和重复。他说的话语法正确,逻辑通顺,但毫无新意。他不再能产生真正的人类创意,只是不断地在已有的 AI 数据里打转。

后果
如果这种情况继续下去,互联网上的内容将变成AI 生成的“回声”。人类独特的声音会被淹没,AI 将失去创新的能力,因为它再也接触不到新鲜、真实的人类思想了。

5. 总结

这篇论文告诉我们一个警示:
AI 正在被自己“喂养”的食物撑坏了。

因为互联网上充满了 AI 生成的内容,新一代的 AI 在学习时,实际上是在学习“上一代 AI 的总结”。这导致它们越来越像,越来越缺乏多样性。就像一个厨师如果只吃别人做的菜,最后做出来的菜只会越来越像别人的菜,而失去了自己的灵魂。

如果不加干预,未来的 AI 可能会变得非常“安全”和“标准”,但也会变得非常无聊和重复,再也无法像人类一样进行真正的创新。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →