From Perception to Cognition: How Latency Affects Interaction Fluency and Social Presence in VR Conferencing

该论文通过对比虚拟现实(VR)与传统视频会议,利用主观实验分析了端到端延迟如何从感知层面的交互流畅性和认知层面的社会临场感两个维度影响用户体验,并揭示了两者在不同延迟条件下的内在关联机制,从而为优化沉浸式虚拟环境系统提供了指导。

Jiarun Song, Ninghao Wan, FuZheng Yang, Weisi Lin

发布于 Wed, 11 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在研究**“在虚拟世界里开会,网络卡顿(延迟)到底会让我们的体验变得多糟糕”**。

想象一下,你戴着一副超级逼真的 VR 眼镜,和一个朋友在虚拟的会议室里聊天。你们能看到对方的虚拟化身(Avatar),能挥手、点头,甚至能感觉到彼此就在身边。这听起来很酷,对吧?但就像所有网络通话一样,如果网络不好,声音和画面就会“卡”一下。

这篇论文就是想知道:这种“卡顿”,到底是怎么影响我们聊天的流畅度,以及我们是否真的觉得“对方就在我身边”?

为了让你更容易理解,我们可以把这篇研究比作**“在两个不同的餐厅里吃饭”**:

1. 两个不同的“餐厅”(实验场景)

研究者找了两个地方做实验:

  • 传统视频通话(VC)餐厅:就像我们在微信或 Zoom 上开会。你只能看到朋友的脸和肩膀(像在一个小窗户里看人),大家坐在电脑前。
  • VR 会议餐厅:就像在《头号玩家》里。你戴着 VR 眼镜,朋友是一个 3D 的虚拟人(Avatar),你们在一个巨大的虚拟房间里,可以转头看四周,甚至看到对方的全身。

2. 两个核心问题(研究重点)

研究者问了两个大问题,我们可以用**“身体反应”“大脑感受”**来比喻:

  • 问题一:聊天顺不顺?(交互流畅度 - 感知层面)

    • 比喻:这就像两个人打乒乓球。如果球打过来,对方要等很久才回击,这球还能打吗?
    • 发现
      • 如果网络很快(延迟低),两个餐厅的聊天都很顺畅。
      • 如果网络变卡(延迟高),传统视频通话(VC)的人会觉得非常难受,就像乒乓球拍突然变重了,完全接不住球。
      • 有趣的是,在 VR 餐厅里,大家对卡顿的容忍度更高!哪怕有点卡,大家还是觉得“还行,能聊”。
      • 为什么? 研究者认为,因为在 VR 里,大家是在和一个“虚拟人”互动,大脑需要多花点力气去想象“这是真人在动”,这种额外的脑力消耗反而让我们对“卡顿”变得不那么敏感了。就像你戴着厚重的面具跳舞,稍微慢半拍,你也不太在意。
  • 问题二:感觉对方在吗?(社会临场感 - 认知层面)

    • 比喻:这就像你和一个朋友在咖啡馆聊天。如果对方反应迟钝,你会不会觉得:“他是不是心不在焉?”“他是不是没听懂我的笑话?”“我还能感觉到他的情绪吗?”
    • 发现
      • 低延迟时:VR 餐厅完胜!大家觉得对方就在身边,能准确理解对方的情绪和意图,感觉非常真实。
      • 高延迟时:VR 餐厅的“临场感”崩塌得比传统视频通话更快、更惨
      • 为什么? 因为 VR 本来承诺给你“身临其境”的感觉,一旦卡顿,这种“身临其境”的幻觉就破灭了。就像你本来以为自己在飞,突然被拽了一下,你会觉得“这飞得一点都不真实”。而在传统视频通话里,大家本来就没指望能完全身临其境,所以卡顿带来的心理落差反而小一点。

3. 不同的聊天任务(实验细节)

研究者还设计了三种聊天游戏来测试:

  • 数数游戏(像抢答):反应要极快。这时候卡顿最要命,大家会觉得“这系统太烂了”。
  • 算术题(稍微想一下):卡顿影响中等。
  • 自由聊天(聊天气、聊八卦):大家本来就要思考怎么回答,所以即使有点卡,大家也更容易原谅,觉得“哦,他在想怎么回答”,而不是“系统卡了”。

4. 总结:这篇论文告诉我们什么?

  • VR 是个“双刃剑”

    • 好处:在网速好的时候,VR 聊天比视频通话更自然、更流畅,大家觉得更舒服。
    • 坏处:一旦网速变差,VR 聊天带来的“真实感”会迅速消失,大家会觉得“这虚拟世界太假了”,甚至不如老老实实开个视频电话。
  • 给开发者的建议

    • 如果你想做 VR 会议软件,网速必须非常快(最好低于 1 秒的延迟)。因为一旦卡顿,VR 那种“身临其境”的优势就会瞬间变成劣势。
    • 对于那种需要快速反应的任务(比如抢答、游戏),VR 对延迟更敏感;但对于闲聊,大家比较宽容。

一句话总结
这篇论文告诉我们,VR 会议在网速快时是“神仙体验”,但在网速慢时可能变成“尴尬现场”。它比传统视频通话更“娇气”,需要更完美的网络环境才能发挥它的魅力。