PRAGMA: Revolut Foundation Model

本文介绍了 PRAGMA,这是一系列基于 Transformer 架构的预训练基础模型,旨在通过自监督掩码建模处理大规模异构银行事件序列,从而在无需复杂微调的情况下,为信用评分、欺诈检测等下游金融任务提供卓越的特征表示。

原作者: Maxim Ostroukhov, Ruslan Mikhailov, Vladimir Iashin, Artem Sokolov, Andrei Akshonov, Vitaly Protasov, Dmitrii Beloborodov, Vince Mullin, Roman Yokunda Enzmann, Georgios Kolovos, Jason Renders, Pavel N
发布于 2026-04-13
📖 1 分钟阅读☕ 轻松阅读

这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 PRAGMA 的“超级大脑”,它是专门为银行和金融机构设计的。你可以把它想象成一位拥有读心术的资深银行家,它不需要你告诉它具体的规则,而是通过阅读数百万人的“生活日记”(交易记录),学会了如何预测风险、发现欺诈和推荐产品。

下面我用几个生动的比喻来拆解这篇论文的核心内容:

1. 核心问题:以前的银行家太“死板”了

想象一下,以前的银行系统就像是一个只会填表格的办事员

  • 如果你要评估一个人的信用,办事员会问:“你有房吗?有工作吗?”(静态数据)。
  • 如果你要抓小偷,办事员会看:“这笔钱是不是转给了黑名单?”(规则匹配)。
  • 痛点:现代人的银行生活太复杂了。你不仅转账,还在 App 里点来点去、看股票、发邮件、甚至只是浏览了一下页面。这些零碎的信息像是一堆乱糟糟的乐高积木,以前的办事员(传统模型)要么看不懂,要么为了拼凑出一个答案,需要人工把积木一块块分类、打磨(特征工程),效率极低且容易出错。

2. PRAGMA 是什么?一位“全知全能的阅读者”

PRAGMA 是一个基础模型(Foundation Model),就像是一个读过所有银行历史记录的“超级读者”。

  • 它读什么? 它不读文字书,它读的是**“事件流”**。比如:
    • 事件 A:2023 年 11 月 2 日,用户往账户里存了 100 英镑。
    • 事件 B:2023 年 11 月 2 日,用户看了一眼“金属计划”页面。
    • 事件 C:2024 年 4 月 7 日,用户发了一封关于股票的邮件。
  • 它怎么读? 它不像人类那样把数字拆成"1"、"0"、"0"来读(那样会丢失大小概念),而是把每一笔交易看作一个完整的“故事片段”。它同时记住了:
    1. 你是谁(静态档案:年龄、会员等级、所在地区)。
    2. 你做了什么(动态历史:转账、购物、浏览)。
    3. 时间节奏(多久没操作了?是周末还是工作日?)。

3. 它是如何学习的?(玩“填空游戏”)

PRAGMA 在训练时,玩了一个巨大的**“蒙眼猜词”游戏**(Masked Modelling)。

  • 给它看一个人的完整交易记录,然后随机遮住其中几笔(比如遮住“转账金额”或“交易类型”)。
  • 让它根据前后的上下文(比如“他在浏览股票页面后,紧接着做了一笔操作”)去猜被遮住的内容是什么。
  • 结果:经过数万亿次这样的练习,它不再需要死记硬背规则,而是真正理解了金融行为背后的逻辑。比如,它学会了:“如果一个人在深夜频繁查看大额转账页面,然后突然尝试修改密码,这很可能是在准备欺诈。”

4. 它有多强?(“万能钥匙”)

以前,银行需要为每个任务专门训练一个“小专家”:

  • 一个专家专门抓小偷(反欺诈)。
  • 一个专家专门算信用分(信贷评分)。
  • 一个专家专门猜你会买什么(产品推荐)。
  • PRAGMA 的做法:它只有一把**“万能钥匙”**(预训练好的核心模型)。
    • 当需要抓小偷时,它稍微“微调”一下(LoRA 技术,就像给钥匙磨个尖),就能完美胜任。
    • 当需要算信用分时,它换个“磨法”,又能完美胜任。
  • 效果:论文显示,这把“万能钥匙”在几乎所有任务上都比那些专门训练的“小专家”更强,而且不需要重新造钥匙,省时省力。

5. 它的三个“超能力”版本

PRAGMA 有三种体型,适应不同需求:

  • PRAGMA-S (小个子):只有 1000 万参数,像个实习生。反应快,适合简单的任务(比如预测用户会不会买某个产品)。
  • PRAGMA-M (中个子):1 亿参数,像个资深经理。平衡了速度和智力。
  • PRAGMA-L (大个子):10 亿参数,像个行业泰斗。虽然训练慢、吃算力,但在最难的任务(如信贷评分,判断一个人会不会赖账)上,它能发现人类专家都看不到的深层规律,表现惊人地好。

6. 它的局限性:它不是“读心术”

虽然 PRAGMA 很厉害,但它也有盲区。

  • 比喻:PRAGMA 只能看到**“一个人的日记”**。
  • 局限:如果洗钱团伙是**“一群人互相配合”(比如 A 转给 B,B 转给 C,C 再转给 A),PRAGMA 因为只能看单个人的记录,看不到他们之间的“团伙网络”,所以在这种反洗钱(AML)**任务上,它反而不如专门针对网络关系设计的旧系统。这是它目前唯一的短板。

总结

PRAGMA 就像是给银行装上了一个**“通用金融大脑”**。
它不再需要人工去定义成千上万条复杂的规则,而是通过阅读海量的真实交易故事,自己学会了如何理解人类的经济行为。

  • 以前:银行家说“如果转账超过 1 万且是深夜,就报警”。
  • 现在:PRAGMA 说“根据这个人过去 3 年的 5000 条记录,结合他现在的浏览习惯和账户状态,这笔交易有 99% 的概率是欺诈,建议拦截”。

这不仅让银行更安全、更智能,也让金融服务能更精准地服务于每个人。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →