Re2: A Consistency-ensured Dataset for Full-stage Peer Review and Multi-turn Rebuttal Discussions

Each language version is independently generated for its own context, not a direct translation.

🍳 料理コンテストの例え話

想像してください。世界中の料理人が、新しいレシピ（学術論文）を審査員に提出する巨大な料理コンテストがあるとします。

🔴 今までの問題点：混乱するキッチン

最近、料理人（研究者）が増えすぎて、審査員が追いつきません。

レシピのバージョン違い: 審査員が「まずい！」と指摘したレシピを、料理人が直した**「最終版」をデータとして持ってきているのに、審査員が評価したのは「最初の失敗作」**だった、というズレがありました。これでは、AI が「どう直せばいいか」を学ぶことができません。
会話の欠如: 審査員と料理人のやり取り（「ここを直して」「わかりました、直しました！」というリベート）が、単なるメモとしてバラバラで、AI が「会話の流れ」を学ぶデータがありませんでした。
データの偏り: 使われているデータが、特定の有名なコンテスト（ICLR など）だけだったり、量が少なかったりしました。

🟢 この論文の解決策：完璧な「練習用シミュレーター」の完成

そこで、この研究チームは**「Re2（リ・ツー）」という、「一貫性が保証された」**巨大なデータセットを作りました。

📚 本物の「初稿」だけを集めた図書館:
審査員が実際に目を通した**「最初のレシピ（原稿）」と、それに対する「審査員のコメント」、そして「料理人の反論（リベート）」と「その後の会話」**を、すべてセットで集めました。
- 例：「このソースは塩辛いです（審査員）」→「申し訳ありません、塩を減らしました（料理人）」→「なるほど、試してみます（審査員）」という一連の会話を、AI が学べるように整理しました。
🗣️ 会話形式のトレーニング:
従来のデータは「質問と答え」だけでしたが、Re2 は**「多ターン会話（チャット）」**としてデータ化しています。
- これにより、AI は「静的な審査」だけでなく、**「審査員と議論しながら、どうやって論文を良くするか」**という、生きたスキルを学べるようになります。
🌍 世界中のコンテストを網羅:
24 の主要な学会と 21 のワークショップから、約 2 万件の原稿、7 万件以上の審査コメント、5 万件以上の反論・会話を集めました。これは**「あらゆる料理コンテストの記録」**を集めたような規模です。

🚀 なぜこれがすごいのか？

このデータセットを使って AI（大規模言語モデル）を訓練すると、以下のようなことが可能になります。

🤖 AI 審査員の誕生:
AI が、人間のような鋭い目で論文を読み、「ここが弱い」「ここを直せばもっと良くなる」という建設的なアドバイスを出せるようになります。
📝 著者への「事前チェック」:
論文を提出する前に、著者が AI に「私の論文、大丈夫かな？」と相談できます。AI が「ここを直せば、審査員に受かりやすくなりますよ」と教えてくれるため、「直して再提出」という無駄な手間が減ります。
⚖️ 審査員の負担軽減:
AI が最初の審査やコメント作成を補助することで、人間が疲弊するのを防ぎ、より質の高い審査に集中できるようにします。

💡 まとめ

この論文は、**「AI が学術界の『良きパートナー』になるために、最も本物に近い『練習用データ』を作りました」**という話です。

これまでのデータは「ズレ」や「不足」がありましたが、Re2 は**「初稿から会話まで、すべて一貫した本物の記録」を提供します。これにより、AI は単なる「採点機」ではなく、「著者と審査員の橋渡しをする、賢いアシスタント」**へと進化できるのです。

まるで、**「失敗した料理の記録と、それをどう直して優勝したかの会話」**をすべて記録した教科書が完成し、これから料理を学ぶ AI が、最短でプロの味をマスターできるようになったようなものです。

Re2: A Consistency-ensured Dataset for Full-stage Peer Review and Multi-turn Rebuttal Discussions

🍳 料理コンテストの例え話

🔴 今までの問題点：混乱するキッチン

🟢 この論文の解決策：完璧な「練習用シミュレーター」の完成

🚀 なぜこれがすごいのか？

💡 まとめ

Re2: 一貫性が保証された完全な査読プロセスと多ターン反論議論のためのデータセット

1. 背景と問題定義

2. 手法とデータセット構築 (Re2)

データ収集と前処理

Re2-Review データセット

Re2-Rebuttal データセット

3. 主要な貢献

4. 実験結果

5. 意義と将来展望

Re2: A Consistency-ensured Dataset for Full-stage Peer Review and Multi-turn Rebuttal Discussions

🍳 料理コンテストの例え話

🔴 今までの問題点：混乱するキッチン

🟢 この論文の解決策：完璧な「練習用シミュレーター」の完成

🚀 なぜこれがすごいのか？

💡 まとめ

Re2: 一貫性が保証された完全な査読プロセスと多ターン反論議論のためのデータセット

1. 背景と問題定義

2. 手法とデータセット構築 (Re2)

データ収集と前処理

Re2-Review データセット

Re2-Rebuttal データセット

3. 主要な貢献

4. 実験結果

5. 意義と将来展望

関連論文

Self-Calibrating Language Models via Test-Time Discriminative Distillation

Toward Generalized Cross-Lingual Hateful Language Detection with Web-Scale Data and Ensemble LLM Annotations

HumorGen: Cognitive Synergy for Humor Generation in Large Language Models via Persona-Based Distillation

Generating High Quality Synthetic Data for Dutch Medical Conversations

GIANTS: Generative Insight Anticipation from Scientific Literature