Enhancing Consistency of Werewolf AI through Dialogue Summarization and Persona Information

Each language version is independently generated for its own context, not a direct translation.

この論文は、「人狼ゲーム」で戦う AI（人工知能）を、より賢く、一貫性のある「キャラクター」として作ろうとした研究について書かれています。

まるで、**「記憶力が抜群だが、ついつい言いたいことを忘れがちで、誰にでも同じ口調で話してしまう天才的な新人俳優」を、「名監督」が手助けして、「一貫した役柄」**を演じさせるような話です。

以下に、3 つのポイントに分けてわかりやすく解説します。

1. 問題点：「記憶過多」と「キャラ崩壊」のジレンマ

人狼ゲームは、会話の履歴や過去の行動をすべて覚えていないと勝てないゲームです。
しかし、最新の AI（LLM）には 2 つの大きな弱点がありました。

弱点①：長すぎる会話履歴でパンクする
- 例え話： 1 日中ずっと喋り続けた会議の録音を、すべて読み上げてから「次はどうしよう？」と考えるのは、人間でも AI でも大変です。メモ帳がパンクして、重要な情報（誰が嘘をついたか）が見えなくなってしまうのです。
弱点②：キャラが定まらない
- 例え話： 最初は「威厳ある王様」のつもりで話していたのに、相手の「元気な少年」の口調に流されて、自分も「よっしゃ！行こうぜ！」と喋り出してしまう。これでは役者として失格です。

2. 解決策：2 つの「魔法の道具」

この研究では、AI が人狼ゲームで活躍するために、2 つの工夫（魔法の道具）を使いました。

①「会話の要約メモ」で記憶を整理する

AI は、その日の会話が終わるたびに、「誰が何を言ったか、誰が怪しいか」を AI 自身が要約してメモを作ります。

例え話： 長い会議録音（会話履歴）をすべて聞く代わりに、「今日の会議の要点はこれだけ！」という 1 枚の要約シートだけを見て判断します。
効果： 無駄な雑談を省けるので、AI は「誰が嘘をついたか」という重要な情報に集中でき、計算コストも節約できます。

②「役者用のプロフィールカード」でキャラを固定する

AI に、**「あなたは誰ですか？」「どんな性格ですか？」「どんな口調で話す？」という詳細なプロフィールと、「こんな風に話す例」**を渡しました。

例え話： 俳優に「あなたは『17 歳のサッカー少年』です。元気よく、敬語を使わずに話してください。例：『よっしゃ！』」と指示を出し、そのカードを常に手元に置かせています。
効果： 相手がどんなに騒いでも、AI は「自分はサッカー少年だ」というカードを信じて、一貫したキャラクターで話し続けることができます。

3. 結果：「一貫した名演技」の達成

この方法を使って、5 人の AI が人狼ゲームをプレイしたところ、素晴らしい結果が出ました。

記憶の維持： 前の日の会話で「誰が嘘をついたか」を要約メモで覚えており、次の日でも「昨日はあなたが嘘をついていましたよ」と正しく指摘できました。
キャラの維持： 王様役の AI は終始威厳を保ち、サッカー少年役の AI は終始元気よく話しました。途中でキャラが崩れることはありませんでした。
行動の一貫性： 「投票する」と言った通りに、実際にその人を投票で追い出すなど、発言と行動が一致していました。

まとめ

この論文は、**「AI に『要約メモ』を与えて記憶を整理させ、『プロフィールカード』を与えて性格を固定させる」ことで、人狼ゲームという複雑な状況でも、「賢く、かつ一貫したキャラクター」**として活躍できることを証明しました。

これは、単にゲームを勝つためだけでなく、**「AI が人間のように、自分の性格や記憶を持ちながら、長い会話でもブレずに話せる」**ようになるための重要な一歩と言えます。

Enhancing Consistency of Werewolf AI through Dialogue Summarization and Persona Information

1. 問題点：「記憶過多」と「キャラ崩壊」のジレンマ

2. 解決策：2 つの「魔法の道具」

①「会話の要約メモ」で記憶を整理する

②「役者用のプロフィールカード」でキャラを固定する

3. 結果：「一貫した名演技」の達成

まとめ

1. 研究の背景と課題 (Problem)

2. 提案手法 (Methodology)

2.1 対話要約による効率的な文脈管理

2.2 ペルソナと発言例によるキャラクターの統一

2.3 行動決定における Chain-of-Thought (CoT)

3. 主要な貢献 (Key Contributions)

4. 結果と評価 (Results)

5. 意義と結論 (Significance)

Enhancing Consistency of Werewolf AI through Dialogue Summarization and Persona Information

1. 問題点：「記憶過多」と「キャラ崩壊」のジレンマ

2. 解決策：2 つの「魔法の道具」

①「会話の要約メモ」で記憶を整理する

②「役者用のプロフィールカード」でキャラを固定する

3. 結果：「一貫した名演技」の達成

まとめ

1. 研究の背景と課題 (Problem)

2. 提案手法 (Methodology)

2.1 対話要約による効率的な文脈管理

2.2 ペルソナと発言例によるキャラクターの統一

2.3 行動決定における Chain-of-Thought (CoT)

3. 主要な貢献 (Key Contributions)

4. 結果と評価 (Results)

5. 意義と結論 (Significance)

関連論文

One Language, Two Scripts: Probing Script-Invariance in LLM Concept Representations

MultiGraSCCo: A Multilingual Anonymization Benchmark with Annotations of Personal Identifiers

ConFu: Contemplate the Future for Better Speculative Sampling

SciTaRC: Benchmarking QA on Scientific Tabular Data that Requires Language Reasoning and Complex Computation

Automated Thematic Analysis for Clinical Qualitative Data: Iterative Codebook Refinement with Full Provenance