EDIS: Diagnosing LLM Reasoning via Entropy Dynamics

该论文提出通过大语言模型生成过程中熵值的动态演化轨迹(而非静态聚合统计)来诊断推理错误,并据此构建了熵动态不稳定性评分(EDIS),有效提升了推理时的选择准确率及训练数据的筛选效果。

Chenghua Zhu, Siyan Wu, Xiangkang Zeng, Zishan Xu, Zhaolu Kang, Yifu Guo, Yuquan Lu, Junduan Huang, Guojing Zhou

发布于 2026-03-09
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文提出了一种名为 EDIS 的新方法,用来“听诊”大语言模型(LLM)在思考问题时的状态。简单来说,它不再只看模型“最后的答案对不对”,而是通过观察模型在生成答案过程中“心跳”(置信度)的变化规律,来判断它是不是在胡编乱造。

我们可以用**“侦探破案”“开车导航”**的比喻来理解这项研究:

1. 以前的做法:只看“终点站”

过去,当我们想判断一个 AI 回答得好不好时,通常看它最后给出的答案。

  • 比喻:就像你叫了一辆出租车,司机把你送到了目的地。以前我们只问:“到了吗?”如果到了,就觉得司机开得好;如果没到,就觉得他不行。
  • 问题:有时候司机其实走错了路,绕了一大圈,最后凭运气蒙对了地方;或者他虽然到了,但一路上一直在疯狂掉头、急刹车。只看结果,我们根本不知道过程有多混乱。

2. 核心发现:错误的思考会有“心跳失常”

研究人员发现,AI 在思考(生成文字)的过程中,它的“自信心”(在数学上叫,Entropy)是随着时间变化的。

  • 正确的思考:像一条平稳的河流。AI 很有信心,每一步都走得很稳,自信心曲线平滑,没有大起大落。
  • 错误的思考:像坐过山车或者心电图乱跳。AI 在犯错时,自信心会表现出两种奇怪的“故障模式”:
    1. 爆发式混乱(Burst Spikes):就像司机越开越慌,越开越不确定,自信心一路直线下降,最后彻底迷失。
    2. 假自信后的崩塌(Peak-Valley Spikes):就像司机突然自信满满地猛打方向盘(以为找到了路),结果马上发现走错了,又急刹车猛回头。这种“自信 -> 恐慌 -> 再自信 -> 再恐慌”的剧烈波动,是错误推理的典型特征。

3. EDIS 是什么?:给 AI 的“思考过程”打分

为了解决这个问题,作者发明了 EDIS(熵动力学不稳定性评分)。

  • 比喻:EDIS 就像是一个高级的“驾驶记录仪”。它不只看车到了没,而是全程记录司机的操作:有没有急刹车?有没有频繁变道?有没有突然加速又突然减速?
  • 工作原理
    • 如果 AI 在生成答案时,自信心曲线像过山车一样剧烈波动,EDIS 就会给出一个高分(表示“不稳定,可能是错的”)。
    • 如果曲线平滑如镜,EDIS 就是低分(表示“稳定,很可能是对的”)。

4. 这项技术有什么用?

A. 考试时的“筛选器”(推理阶段)

想象你要让 AI 做一道数学题,你让它先试着写 16 种不同的解法。

  • 以前:你可能随机挑一个,或者让 AI 自己投票选一个。
  • 现在(用 EDIS):你让 EDIS 去检查这 16 种解法的“思考过程”。它会直接挑出那个“思考过程最平稳、最自信”的答案,把那些“思路混乱、反复横跳”的错误答案直接扔掉。
  • 效果:论文显示,这种方法能让 AI 做数学题的准确率提升 82%!这就像是在一堆乱糟糟的草稿纸里,直接挑出了最清晰的那一张。

B. 训练时的“教练”(学习阶段)

在训练 AI 时,我们通常希望它多学点东西。

  • 以前:不管 AI 是“蒙对”的,还是“想通了”的,只要答案对,就给它奖励。
  • 现在(用 EDIS)
    • 如果 AI 是稳稳当当地做对了,给它大奖励(这是真本事)。
    • 如果 AI 是跌跌撞撞、过程混乱地做对了(可能是运气),或者过程混乱地做错了,我们就减少奖励甚至重点分析(因为这种混乱的过程很有教学价值,能告诉它哪里容易出错)。
  • 效果:这样训练出来的 AI,不仅更聪明,而且思考过程更专注,废话更少。

总结

这篇论文的核心思想是:“过程比结果更重要”

以前的方法像只看考试成绩,而 EDIS 像是看解题思路的草稿。它发现,那些真正做对题的人,思路是连贯流畅的;而那些做错题的人,思路往往是混乱、反复、自我怀疑的。通过捕捉这种“混乱的波动”,EDIS 能更精准地识别出 AI 是在“真思考”还是在“瞎蒙”,从而极大地提升了 AI 的推理能力。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →