Each language version is independently generated for its own context, not a direct translation.
🎭 物語の舞台:2 つの会議室
まず、この研究が比較している 2 つの会議室を想像してください。
- 普通の会議室(ビデオ会議・VC):
- 画面に相手の「顔と肩」しか映っていない、2 次元のテレビ電話のような空間です。
- 相手は「実在する人間」そのものです。
- 魔法の会議室(VR 会議):
- 3 次元の空間に、自分のアバター(分身)と相手のアバターがいます。
- 頭を動かすと周りが見え、全身(または上半身)が見えます。没入感(臨場感)が高い空間です。
この 2 つの会議室で、**「通信が少し遅れる(相手の声が 1 秒後に聞こえる、動きがカクつく)」**というトラブルが起きたとき、私たちの脳はどう反応するかを調べる実験を行いました。
🔍 実験で調べた 2 つのポイント
研究者は、遅れが起きる時に私たちが感じる 2 つの異なる感覚を測りました。
1. 「会話の滑らかさ」(Interaction Fluency)
- どんな感覚? 「会話のリズムが崩れたな」「返事が遅れて、会話がつまらなくなったな」と感じる直感的な感覚です。
- 例え話: お茶を飲む時、ストローが細すぎて吸いにくいと感じるようなものです。「あ、これ遅れてるな」と体が感じます。
- 実験結果:
- 遅れが 100 ミリ秒(0.1 秒)以内なら: どちらの会議室でも、誰も遅れに気づきません。スムーズです。
- 遅れが 200 ミリ秒を超えると: 遅れに気づき始めます。
- 意外な発見: **VR 会議の方が、遅れに対して「我慢強い(鈍感)」**でした!
- 理由: 普通の会議では「相手の顔」を見ているので、遅れを「相手の反応が遅い」とか「システムが悪い」とすぐに感じます。でも、VR では「アバター(キャラクター)」と話しているため、脳が「これはゲームやアニメのようだ」と無意識に考え、「遅れても仕方ないかな」と許容してしまうのです。
2. 「相手の気持ちの通じ合い」(Social Presence)
- どんな感覚? 「相手は私の話を理解してくれているかな?」「相手の感情が伝わっているかな?」という頭で考える(認知する)感覚です。
- 例え話: 相手の表情を見て「あ、今怒ってるな」と察知したり、「この人は私の話を真剣に聞いてくれている」と感じたりする部分です。
- 実験結果:
- 遅れが少ない時(1 秒未満): VR 会議の方が圧倒的に「相手と繋がっている感覚」が強いです。アバターがリアルに動くので、一緒にいる感じがします。
- 遅れが多くなると: VR 会議の「繋がっている感覚」は急激に崩壊します。
- 理由: VR は「一緒にいる感覚」に頼りすぎているため、少しの遅れでも「あれ?アバターが動かない?」「今、相手は何を考えているの?」と脳が混乱しやすくなるのです。一方、普通のビデオ会議は最初から「画面越し」なので、遅れても「あ、通信が悪いんだな」と冷静に受け止められ、崩壊のスピードが遅いのです。
🎢 3 つの会話ゲームの結果
実験では、3 つの異なる会話パターンのテストを行いました。
- カウントゲーム(1, 2, 3...と数える)
- 考える必要がないので、遅れがすぐに「会話の乱れ」として感じられます。
- 結果: 遅れがあると、会話の滑らかさがガクッと落ちます。
- 計算ゲーム(足し算をする)
- 少し考える必要があるので、遅れへの耐性が少し上がります。
- 自由会話(天気や趣味の話)
- 考える時間(沈黙)が自然に生まれるので、遅れが気になりにくいです。
- 結果: 遅れても、会話の滑らかさはあまり落ちませんでした。
💡 この研究からわかること(結論)
この研究は、VR 会議の設計者に重要なヒントを与えています。
- VR は「遅れに強い」が「遅れに脆い」:
- 会話のリズム(滑らかさ)に関しては、VR はアバターのおかげで遅れを許容してくれます。
- しかし、「相手の気持ち」や「一緒にいる感覚」に関しては、遅れが 1 秒を超えると一気に壊れてしまいます。
- 最適な遅れの限界:
- VR 会議で「相手と心を通わせている」と感じ続けるためには、遅れを 1 秒(1000 ミリ秒)以下に抑える必要があります。それ以上遅れると、VR の魅力(臨場感)が失われてしまいます。
🌟 まとめ
VR 会議は、**「遅れても会話自体は続けられる(滑らかさ)」という強みを持っていますが、「遅れると相手の心が読めなくなる(共感性)」**という弱点を持っています。
普通のビデオ会議は「遅れても冷静に対処できる」けれど、VR 会議は「遅れると没入感が崩壊する」という、相反する性質を持っていることがわかりました。
今後の VR 会議をより良くするためには、**「1 秒以内の超高速通信」**を実現することが、最も重要な鍵だと言えそうです。
Each language version is independently generated for its own context, not a direct translation.
論文要約:VR 会議における遅延が相互作用の流暢性と社会的プレゼンスに与える影響
1. 研究の背景と課題
バーチャルリアリティ(VR)会議は、地理的に分散したユーザーに没入型の環境を提供し、アバターを通じた豊かな社会的相互作用を可能にする可能性を秘めています。しかし、遠隔通信には避けられない「エンドツーエンド(E2E)遅延」が存在し、これがユーザー体験に重大な影響を及ぼします。
既存の研究では、従来のビデオ会議(VC)における遅延の影響は一定程度解明されていますが、VR 会議特有の要素(広視野角、アバター表現、没入感、6 自由度移動など)を考慮した研究は不足しています。特に、遅延が**「知覚レベル」の相互作用の流暢性と「認知レベル」の社会的プレゼンス**にそれぞれどのように影響し、また両者の間にどのような関係があるのかは十分に解明されていません。
本研究の主な課題は以下の通りです:
- 遅延が VR 会議における相互作用の流暢性(知覚)と社会的プレゼンス(認知)に与える影響の解明。
- VR 会議と従来の VC における遅延影響の違いの比較と、その要因の特定。
- 知覚と認知のメカニズムの関連性の分析。
2. 研究方法
本研究では、VR 会議と従来の VC を比較するための主観的実験を 2 段階で実施しました。
実験プラットフォーム
- VR 環境: Meta Quest 2 を使用し、Unity Engine で Horizon Workrooms に似た 3D 空間を構築。アバターは Meta Avatars SDK を用い、上半身のみを表示(座席での会議を想定)。
- VC 環境: Windows PC 向けのカスタム WebRTC アプリケーション(Zoom や Tencent Meeting を模倣)。
- 遅延制御: WebRTC 技術を用い、送信時のキャプチャ時刻と受信時のレンダリング時刻の差を制御することで、E2E 遅延を 100ms〜3000ms の範囲で精密に調整しました(ベースライン遅延は約 80ms)。
参加者
- 22 名の大学生(23-25 歳)。VR 機器と PC 会議の両方の使用経験があり、互いに知り合いであるペア(11 組)で構成され、自然な対話を促しました。
実験手順
2 つの実験が実施されました:
- 実験 1(相互作用の流暢性の評価):
- タスク: 3 種類の対話タスク(「数え上げ(高頻度・低認知負荷)」、「計算(中頻度・中認知負荷)」、「自由会話(低頻度・高認知負荷)」。
- 評価: 絶対評価法(ACR)を用い、5 段階評価で流暢性を測定。
- 実験 2(社会的プレゼンスの評価):
- タスク: 自由会話のみ(社会的プレゼンスの認知プロセスを重視するため)。
- 評価: Networked Minds Social Presence Inventory (NMSPI) 質問紙(6 つのサブスケール:共在、注意配分、メッセージ理解、感情理解、感情的相互依存、行動的相互依存)を使用。7 段階リッカート尺度で評価。
3. 主要な結果
A. 遅延が相互作用の流暢性に与える影響
- 一般傾向: 遅延が増加するにつれて、VR と VC 双方で流暢性のスコア(MOS)は低下しました。
- タスク依存性:
- 数え上げタスク: 遅延の影響が最も大きく、100ms を超えると急激に低下。
- 計算タスク: 中程度の影響。
- 自由会話: 影響が最も小さく、遅延が 3000ms に達しても比較的安定していました。
- 理由: 認知負荷の低いタスク(数え上げ)では、ユーザーは遅延を「システムの性能問題」として帰属させやすく、流暢性の低下を敏感に感じます。一方、自由会話では遅延を「相手の反応の遅さ」として帰属させやすく、許容度が高い傾向が見られました。
- VR と VC の比較:
- 遅延が 100ms 以下では、両者の流暢性に有意差はありませんでした。
- 遅延が 200ms を超えると、VR 会議の方が VC よりも高い流暢性を維持しました。
- 要因: アバターとの対話にはより多くの認知的リソースが割かれるため、遅延に対する知覚的な感度が低下し、遅延による流暢性の低下に対する許容度が高まると考えられます。
B. 遅延が社会的プレゼンスに与える影響
- VR の優位性と限界: 遅延が低い場合(100ms 未満)、VR は VC よりも高い社会的プレゼンス(特にメッセージ理解や感情理解)を示す傾向がありました。
- 遅延増加時の逆転: 遅延が増加すると、VR における社会的プレゼンスの低下が VC よりも顕著になりました。
- 注意配分 (AA) とメッセージ理解 (MU): 遅延 2500ms を超えると、VR のスコアが VC を下回りました。VR は遅延に対してより敏感に反応します。
- 感情的・行動的相互依存 (EI, BI): 全体的に VC の方が VR よりも高いスコアを示しました。これは、現在のアバター技術が人間の表情や行動を完全に再現できていないため、遅延がこれらの要素の伝達を阻害しやすいためと考えられます。
- 閾値: VR 会議で良好な社会的プレゼンス(サブスケールスコア 5 以上かつ VC 以上)を維持するためには、遅延を1 秒(1000ms)以下に抑える必要があります。
C. 相互作用の流暢性と社会的プレゼンスの関係
- VR 会議: 相互作用の流暢性の低下は、社会的プレゼンスのすべてのサブスケール(特に共在、注意配分、メッセージ理解、行動的相互依存)と強い正の相関(SRCC > 0.9)を示しました。つまり、知覚的な流暢性の低下が、認知レベルの社会的プレゼンスの低下に直結します。
- VC 会議: 流暢性の低下は共在や行動的相互依存に影響しましたが、注意配分(AA)にはほとんど影響しませんでした。VC では、遅延があってもユーザーは会話タスクに集中し続ける傾向があります。
4. 主な貢献
- 知覚と認知の分離分析: VR 会議における遅延の影響を、「相互作用の流暢性(知覚)」と「社会的プレゼンス(認知)」の 2 つの異なる次元から体系的に分析しました。
- VR と VC の比較: 遅延に対する VR の「高い流暢性許容度(知覚面)」と「高い社会的プレゼンス感度(認知面)」という二面性を明らかにしました。
- タスク依存性の解明: 対話タスクの種類(認知負荷)によって、遅延の帰属と影響度が異なることを実証しました。
- システム最適化への示唆: VR 会議システムを設計する際、単に遅延を減らすだけでなく、アバターの表現力向上や、タスクに応じた遅延許容度の考慮が重要であることを示しました。
5. 意義と結論
本研究は、メタバースや VR 会議システムの設計において、遅延管理が単なる技術的課題ではなく、ユーザーの社会的認知に深く関わる重要な要素であることを示しました。
- 知覚面: VR はアバター表現により、遅延に対する流暢性の低下への耐性が高いという利点があります。
- 認知面: しかし、遅延が増大すると、アバターの表現限界により社会的プレゼンス(特に感情や行動の相互理解)が VC よりも急速に劣化するリスクがあります。
したがって、高品質な VR 会議を実現するには、遅延を 1 秒以下に抑えることが不可欠であり、将来的にはより表現豊かなアバター(顔面表情の高精度な追跡など)の開発が、遅延による社会的プレゼンスの低下を補う鍵となると結論付けられています。