Is it Me? Toward Self-Extension to AI Avatars in Virtual Reality

本文介绍了名为 ProxyMe 的 VR 原型设计,旨在通过结合化身具身、语音克隆与 AI 语音增强技术,探索用户将 AI 生成的沟通内容体验为自身表达行为的“自我延伸”现象,并研究不同委托与可控程度对感知代理权、作者身份及自我认同的影响。

Jieying Zhang, Steeven Villa, Abdallah El Ali

发布于 Mon, 09 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 ProxyMe 的虚拟现实(VR)实验项目,它的核心思想非常有趣:当你的虚拟替身(Avatar)说话时,如果 AI 悄悄帮你的话“润色”甚至“重写”了,那这还是“你”在说话吗?

为了让你轻松理解,我们可以把这篇论文想象成是在探讨**“数字时代的分身术”**。

1. 核心概念:你的“数字替身”有了自己的嘴巴

想象一下,你戴上了 VR 眼镜,变成了一个虚拟角色。在传统的 VR 游戏里,你动一下,角色就动一下;你张嘴说话,角色就发出你原本的声音。

但在 ProxyMe 的世界里,情况变了:

  • :在 VR 里自然说话,比如你说:“我……我会尽力……"(有点结巴,或者不够自信)。
  • AI 助手:就在你说话的瞬间,它像是一个**“隐形的翻译官”“超级编剧”**,立刻把你的话接过去。
  • 结果:你的虚拟替身嘴里说出来的,变成了:“我会全力以赴,做到最好!”(声音可能还是你的,但语气更坚定,内容更完美)。

这就引出了论文的核心问题: 当你的替身用经过 AI 修饰的声音和话语去交流时,这到底算不算“我”? 这种体验是让你感觉能力增强了(自我延伸),还是让你觉得“这好像不是我”(自我异化)?

2. 论文里的三个“魔法场景”

作者们设想了这个系统能用在哪些地方,我们可以用三个生动的比喻来说明:

  • 场景一:社恐患者的“自信扩音器”

    • 比喻:就像给一个害羞的人戴上了一个**“自动修音麦克风”**。
    • 作用:你在台上演讲,心里很慌,说话结巴。AI 实时把你的结巴话变得流畅、自信。你依然拥有演讲的“所有权”,但 AI 帮你把“表现力”拉满了。这能帮人克服公开演讲的恐惧。
  • 场景二:性格探索的“变装试衣间”

    • 比喻:就像你在试穿不同性格的“衣服”。
    • 作用:你想试试自己如果更强势一点会怎样?或者更温柔一点?AI 会把你原本平淡的话,改写成符合那种性格的语气。你不需要真的变成另一个人,而是通过 AI 的“滤镜”,体验不同版本的自己。
  • 场景三:心理治疗的“冷静旁观镜”

    • 比喻:就像把心里的情绪**“外包”**给一个冷静的镜子。
    • 作用:当你非常生气或悲伤时,直接说出来的话可能太冲。AI 把你的情绪话语“翻译”成更客观、更温和的版本,让你通过虚拟替身听到这些话。这能帮你从情绪中抽离出来,像看别人说话一样审视自己的内心,从而获得心理上的平静。

3. 技术是如何实现的?(简单的“流水线”)

这个系统就像一个**“极速加工厂”**:

  1. :你说话,系统立刻把你说的话变成文字(像听写)。
  2. :AI 大脑(大语言模型)根据预设的规则,把文字改得更好、更合适。
  3. :系统用克隆你的声音(或者机器人的声音),把改好的话读出来,让你的虚拟替身“说”给其他人听。

4. 最大的挑战:那个“我是谁”的哲学问题

论文最深刻的地方在于它提出的担忧:

  • 责任归属:如果你的替身说了一句伤人的话,那是 AI 改的,还是你原本的意图?如果大家都习惯了 AI 帮自己说话,我们会不会慢慢忘记**“原本的自己”**长什么样?
  • 记忆模糊:就像论文里提到的“记忆缺口”,如果你经常让 AI 帮你说话,过段时间你可能都分不清,哪句话是你自己想的,哪句话是 AI 帮你润色的。
  • 失控感:如果 AI 改得太离谱,你看着替身说话,心里却想“这完全不是我想说的”,那种**“这不是我”**的疏离感会非常强烈。

5. 总结:这是进化还是迷失?

这篇论文并不是要立刻把这个产品卖给你,而是在**“预演”未来**。

它就像在问我们:

如果科技能让我们变得更聪明、更自信、更善于表达,但代价是我们必须把一部分“说话的权利”交给 AI,我们愿意吗?

  • 好的方面:它可能帮口吃的人流利交流,帮内向的人勇敢表达,帮我们在虚拟世界里探索更好的自己。
  • 坏的方面:它可能让我们变得依赖,甚至分不清“真实的自己”和“被修饰的自己”。

一句话总结:
ProxyMe 就像是一个**“智能面具”**,它既能帮你戴上更完美的面具去社交,也可能让你忘记面具下原本的脸。这篇论文就是邀请大家一起来思考:在这个 AI 越来越像我们的时代,我们该如何定义“我”?