Leverage Knowledge Graph and Large Language Model for Law Article Recommendation: A Case Study of Chinese Criminal Law

本文提出了一种结合案例增强法律条文知识图谱(CLAKG)与大语言模型(LLM)的闭环法律条文推荐框架,通过图嵌入检索与基于知识图谱的推理,在中国刑法判决数据上将推荐准确率从 0.549 显著提升至 0.694,有效缓解了基层法院的案件积压与决策依赖问题。

Yongming Chen, Miner Chen, Ye Zhu, Juan Pei, Siyu Chen, Yu Zhou, Yi Wang, Yifan Zhou, Hao Li, Songan Zhang

发布于 2026-03-04
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一种**“给法官配个超级智能助手”**的新方法,目的是帮助法官更快、更准地找到处理案件时该引用的法律条文。

想象一下,法官每天面对堆积如山的案件,就像是在一个巨大的、没有索引的图书馆里找书。以前,他们要么靠自己的记忆(容易累、容易错),要么靠传统的搜索工具(只能搜关键词,不懂深层含义)。

这篇论文提出的方案,可以概括为三个核心步骤,我们用生活中的比喻来解释:

1. 核心发明:CLAKG(法律界的“超级关系网”)

比喻:把法律条文和过往案例变成一张巨大的“地铁线路图”。

  • 传统做法:以前的法律数据库像一本厚厚的字典,你查“盗窃”,只能看到关于盗窃的定义,但不知道哪个案例里法官是怎么判的,或者这个定义和“抢劫”有什么细微差别。
  • 新方法(CLAKG):作者构建了一个**“案例增强型法律条文知识图谱”**。
    • 这就好比把法律条文(站点)和过去的真实案例(列车)全部连在了一起。
    • 不仅知道“盗窃”这个站,还知道它和“入室”、“夜间”、“金额大小”等关键信息(换乘站)是怎么连接的。
    • 关键点:这个“地图”不是人工一点点画的,而是用**大语言模型(LLM)**自动去读判决书,把里面的关键信息提取出来画上去的,效率极高。

2. 工作流程:如何给法官推荐条文?

比喻:就像是一个“懂行的老律师”带着“智能导航”在帮你找路。

当一个新的案件(比如“张三偷了东西”)进来时,系统是这样工作的:

  1. 提取关键词(找路标)

    • 系统先让大语言模型(LLM)读一下案情,提取出几个核心词,比如“盗窃”、“金额”、“自首”。
    • 这就像是你告诉导航:“我要去一个有盗窃、金额不大、且主动自首的地方”。
  2. 在“地图”上检索(查路线)

    • 系统拿着这些关键词,去刚才建好的“超级关系网”(CLAKG)里找。
    • 它不是简单的文字匹配,而是看结构。比如,它发现“盗窃”这个节点,通过“关键信息”这条线,直接连着“刑法第 385 条”这个站点。
    • 同时,它还能顺藤摸瓜,找到以前处理过类似情况的“老案例”(历史列车),看看当时是怎么判的。
  3. 大模型做最终决定(老律师把关)

    • 系统把找到的“候选法律条文”和“类似老案例”打包,喂给大语言模型。
    • 最重要的一步:大模型被严格限制了,它只能从系统找到的这几个选项里选,不能瞎编(防止“幻觉”,即胡编乱造法律条文)。
    • 最后,大模型像一位经验丰富的老律师,结合案情和找到的证据,给出最终建议:“这个案子应该用第 385 条,因为……"

3. 闭环升级:越用越聪明

比喻:就像“错题本”和“地图更新”。

  • 如果法官觉得系统推荐得对,系统就把这个新案例记下来,更新到“地图”里。
  • 如果法官觉得不对,手动改对了,系统不仅会修正结果,还会把这次“纠错”的经验也记下来,更新“地图”。
  • 这样,这个系统就像一个会学习的助手,随着使用的人越多、修正的越多,它画的“地图”就越精准,以后推荐得就越准。

4. 效果怎么样?

比喻:从“蒙对”到“算得准”。

  • 以前的方法:就像是用传统的搜索引擎(BERT、DPCNN 等),准确率只有 0.549(大概一半对一半,甚至更低,因为容易受数据不平衡影响,比如某个条文案例多,它就总猜那个)。
  • 大模型自己用:虽然大模型很聪明,但容易“一本正经地胡说八道”(幻觉),准确率大概 0.549
  • 我们的新方法:结合了“超级关系网”和“受限的大模型”,准确率直接提升到了 0.694
  • 结论:这个方法比目前市面上最先进的方法都要好,而且大大减少了大模型“瞎编”法律条文的风险。

总结

这篇论文的核心思想就是:不要只让 AI 靠“死记硬背”或“瞎猜”来判案,而是给它一张精心绘制的、包含所有法律条文和真实案例的“关系地图”,并给它戴上“紧箍咒”(只能查地图,不能乱编)。

这样,AI 就能像一个经验丰富的法律专家一样,既快又准地帮法官找到最合适的法律依据,让司法效率更高,判决更公正。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →