Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

本文提出了检索增强高斯头像(RAF),通过在训练期间引入从大规模无标签表情库中检索到的近邻表情来增强数据,从而在不依赖配对跨身份数据或架构修改的情况下,显著提升了无模板可驱动头像在未见表情驱动下的泛化能力与鲁棒性。

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski

发布于 Tue, 10 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 RAF (Retrieval-Augmented Faces,检索增强面部) 的新方法,旨在让电脑生成的"3D 数字人头像”变得更生动、更听话,尤其是当它们需要模仿别人的表情时。

为了让你轻松理解,我们可以把这项技术想象成**“教一个只会自己家方言的演员去演各种角色的过程”**。

1. 以前的难题:演员的“戏路太窄”

想象一下,你有一个非常逼真的 3D 数字人(比如一个虚拟演员)。

  • 传统方法(模板派): 以前的做法是给这个演员套上一个“标准模具”(比如 3DMM 模型)。这个模具里只有几十种预设的表情(比如笑、哭、皱眉)。演员只能做模具里有的动作。如果导演让他做一个“既惊讶又带点狡黠”的复杂表情,模具做不出来,演员就卡住了,或者表情很僵硬。
  • 新方法(无模板派): 最近的技术不再用模具,而是让演员直接**“看视频学动作”**。只要给他看他自己做表情的视频,他就能学会非常细腻、真实的动作,甚至能做出模具里没有的复杂表情。
    • 但是,新问题来了: 这个演员只看过自己的视频。如果导演让他模仿别人(比如一个完全不同的演员)做鬼脸,他就不懂了。因为他没见过那种鬼脸,他的“大脑”(神经网络)里就没有这种表情的记忆。一旦让他模仿没见过的动作,他就会乱套,或者表情变得很奇怪。

2. 核心创意:给演员找个“表情图书馆”

这篇论文提出的 RAF 方法,就是为了解决这个“戏路窄”的问题。

它的做法是这样的:
想象这个演员在排练时,旁边站着一位**“表情图书管理员”**。

  1. 建立图书馆: 管理员手里有一个巨大的“表情图书馆”,里面存了成千上万种来自不同人的表情数据(比如 400 多个人,8 万多个表情片段)。
  2. 排练时的“偷师”: 当演员在练习自己的表情时,管理员会偷偷地**“偷换”**一部分指令。
    • 比如,演员本来想做一个“大笑”,管理员会立刻从图书馆里找一个**“最像大笑”但来自另一个人**的表情指令,塞给演员。
    • 关键点: 演员虽然收到了别人的表情指令,但他必须在屏幕上还原出自己原本的样子(即:用别人的表情逻辑,画出自己的脸)。
  3. 效果: 通过这种“偷换”训练,演员的大脑被迫去理解:“哦,原来这种肌肉运动模式(表情)是可以独立于‘我是谁’(身份)存在的。”

3. 为什么要这么做?(比喻:学外语 vs. 学方言)

  • 没有 RAF 时: 就像一个人只学过“家乡话”。让他模仿别人的方言,他完全听不懂,只能瞎猜,结果听起来很怪。
  • 有了 RAF 后: 就像这个人在学家乡话的同时,还去图书馆借了各种方言的录音带听。虽然他还是说家乡话,但他听懂了各种方言的发音规律。
    • 当别人让他模仿一个他没见过的“方言表情”时,他能迅速从图书馆里找到最接近的“参考样本”,然后灵活地应用到自己的脸上。
    • 结果就是:他不仅能演好自己,还能完美模仿别人,而且表情非常自然、有情感。

4. 这个方法厉害在哪里?

  • 不需要额外数据: 不需要专门去拍“两个人互相做表情”的昂贵视频,只需要一个巨大的、现成的表情数据库(图书馆)就行。
  • 不需要改架构: 不需要重新设计演员的“大脑”结构,只是改变了训练时的“喂饭”方式(训练策略)。
  • 效果显著: 论文里的实验证明,用了这个方法后,数字人在模仿别人(跨身份驱动)时,表情相似度大幅提升,甚至在自己做没见过的表情时(自驱动),表现也更自然了。

5. 总结

简单来说,RAF 就是给那些只会“自己演自己”的 3D 数字人,配了一个巨大的“表情参考书”

在训练过程中,它让数字人不断练习“用别人的表情逻辑,演自己的脸”。这样,当它真正需要去模仿别人时,它就不再是瞎猜,而是能举一反三,做出既符合对方情感,又保留自己长相的高质量表情。

这就好比一个演员,虽然只演过自己的戏,但因为读遍了天下所有的剧本,所以无论让他演谁,他都能演得惟妙惟肖。