Domain Knowledge-Enhanced LLMs for Fraud and Concept Drift Detection

本文提出了一种领域知识增强的 LLM 框架,该框架将结构化洞察与两阶段检测流程相结合,以有效识别欺骗性对话并将概念漂移分类为良性或欺诈性,在实现 98% 准确率的同时,相较于零样本基线展现出更优越的鲁棒性。

原作者: Ali Şenol, Garima Agrawal, Huan Liu

发布于 2026-05-27✓ Author reviewed
📖 1 分钟阅读☕ 轻松阅读

原作者: Ali Şenol, Garima Agrawal, Huan Liu

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

以下是用简单语言和创意类比对这篇论文的解读。

核心难题:擅长“变形”的骗子

想象你是一家繁忙俱乐部(互联网)的保安。你的任务是识破试图混入的假客人(骗子)。

过去,骗子很容易辨认,因为他们戴着显而易见的伪装。但现在,骗子就像变形者。他们起初会像平常一样谈论天气或食物(良性对话),然后突然转换话题,试图窃取你的信用卡或欺骗你(欺诈)。

这种话题或语气的突然转变被称为**“概念漂移”**。

  • 问题所在:有时,普通人也会转换话题(例如,先聊天气,然后请求搭车)。普通的保安可能会感到困惑,误以为正常的话题转换是诈骗,或者更糟糕的是,因为诈骗始于正常对话而漏掉了真正的骗局。
  • 旧工具:传统的计算机程序就像只死记硬背“坏词”列表的保安。如果骗子使用新词汇或转换话题,保安就会漏掉他们。
  • 新工具(大语言模型):大语言模型(LLMs)就像能够阅读和理解复杂故事的保安。然而,它们有时会感到困惑,会胡编乱造(幻觉),或者不了解你俱乐部的具体规则。

解决方案:“专家指南”系统

这篇论文的作者建立了一个三人保安团队来抓捕这些变形骗子。他们不仅仅是给 AI 一个通用的大脑,而是给了它一本专门的说明书(领域知识),帮助它理解骗子使用的具体诡计。

以下是他们系统的逐步工作原理:

1. 第一道防线:“虚假评论”检测器

在应对复杂对话之前,他们首先在虚假评论(如虚假的 Yelp 或亚马逊评论)上测试了该系统。

  • 类比:想象一名保安在检查宾客名单。如果没有帮助,保安可能会认为一条非常热情的评论只是一个开心的顾客。
  • 升级:团队给保安提供了一份“可疑迹象”清单(例如:“赞美是否过于夸张?”“听起来是否像机器人?”“是否有奇怪的 buzzwords?”)。
  • 结果:当保安拥有这份清单时,他们识别虚假评论的能力大幅提升。例如,其中一个 AI 模型(Claude)仅通过使用清单,准确率就从 87% 提升到了95%

2. 第二道防线:“漂移”警报(OCDD)

一旦系统开始监控实时对话,它就需要知道话题是否正在发生变化。

  • 类比:想象对话是一条河流。通常,水流平稳。突然,河流撞上一块岩石并改变了方向。
  • 工具:他们使用了一种名为**OCDD(单类概念漂移检测器)*的统计工具。该工具尚不试图理解词语的含义*;它更像是一个运动传感器。如果对话的“流动”发生过于剧烈的变化,警报就会拉响。

3. 第三道防线:“专家解读员”

当警报拉响时,第二道更聪明的防线(第二个大语言模型)就会介入。

  • 职责:这位保安审视突然的变化并问道:“这是无害的话题转换(比如谈论天气),还是一个陷阱(比如网络钓鱼尝试)?”
  • 秘密武器:就像第一道防线一样,这位保安也拥有专门的说明书。它知道,如果有人在谈论工作后突然索要你的信用卡,那是一种特定的欺诈模式。
  • 结果:该系统成功区分了无害的话题转换和恶意的诈骗。

结果:谁赢得了比赛?

团队使用真实对话数据集(SEConvo)测试了该系统,并将其与旧方法进行了比较。

  • 冠军LLaMA 模型(一个开源 AI)是明星选手。当获得“专门说明书”(领域知识)后,它达到了98% 的准确率。它远胜于旧的“保安团队”(传统机器学习模型),后者仅能达到约 82% 的正确率。
  • 教训:赋予 AI 关于骗子如何行事的具体知识,使其比单纯让其自行猜测更加聪明、可靠且值得信赖。

总结

可以将这篇论文视为一份如何训练保安的指南。

  1. 不要只依赖记忆:旧保安(传统机器学习)会忘记新诡计。
  2. 不要只依赖原始智能:聪明的保安(大语言模型)可能会困惑或胡编乱造。
  3. 给他们一张作弊条:通过向 AI 灌输关于欺诈的具体规则和模式(领域知识),它就能成为一名超级保安,能够发现其他保安会漏掉的、隐蔽的、会变形的骗子。

这篇论文证明,当你将智能 AI 与人类对欺诈战术的理解相结合时,你就能得到一个准确率极高且能解释为何抓到了骗子的系统。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →