Re2: A Consistency-ensured Dataset for Full-stage Peer Review and Multi-turn Rebuttal Discussions

O artigo apresenta o Re², o maior conjunto de dados de revisão por pares e réplicas com consistência garantida, que inclui submissões iniciais, comentários de revisores e réplicas de múltiplas conferências para superar as limitações de diversidade e qualidade dos dados existentes e apoiar tanto tarefas estáticas quanto assistentes interativos de IA.

Daoze Zhang, Zhijian Bao, Sihang Du, Zhiyi Zhao, Kuangling Zhang, Dezheng Bao, Yang Yang

Publicado 2026-03-16
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que o mundo da ciência é como uma gigantesca festa de aniversário onde todos os pesquisadores trazem seus melhores trabalhos (os "bolos") para serem provados e julgados por convidados especiais (os "revisores").

O problema é que, ultimamente, a festa ficou tão cheia que os convidados não dão conta de provar todos os bolos. Eles estão cansados, estressados e, às vezes, a qualidade da avaliação cai porque há muitos bolos ruins sendo trazidos repetidamente. Os autores muitas vezes não sabem o que está errado no seu bolo antes de levá-lo à festa, então eles trazem, são rejeitados, tentam consertar e trazem de novo, sobrecarregando ainda mais os convidados.

Aqui entra a Re2, a nova "ferramenta mágica" apresentada neste artigo. Vamos explicar como ela funciona usando analogias simples:

1. O Problema: A Cozinha Bagunçada

Antes da Re2, existiam outros livros de receitas (conjuntos de dados) que ajudavam a treinar robôs (Inteligência Artificial) a julgar esses bolos. Mas esses livros tinham três defeitos graves:

  • Eram pequenos: Tinham pouca variedade de receitas.
  • Estavam desatualizados: Muitas vezes, mostravam a receita do bolo depois que ele já tinha sido consertado, e não como ele era quando foi entregue pela primeira vez. Isso confundia o robô: "Será que o robô deve julgar o bolo original ou o bolo consertado?"
  • Eram estáticos: Eles só mostravam o momento em que o bolo foi entregue e o comentário inicial. Não mostravam a conversa que acontecia depois, quando o autor tentava explicar ou defender seu bolo.

2. A Solução: O "Grande Livro de Histórias" (Re2)

Os pesquisadores criaram o Re2, que é como um arquivo gigante e perfeitamente organizado de toda a história de uma festa de aniversário que durou anos.

  • Tudo Começa do Zero (Consistência): O Re2 garante que, para cada história, eles pegaram a receita exatamente como ela foi entregue pela primeira vez, antes de qualquer conserto. Isso é crucial para que a IA aprenda a julgar o trabalho real, e não a versão polida depois do fato.
  • O Diálogo Completo (Multi-turn): A grande inovação é que o Re2 não para no primeiro comentário. Ele inclui a conversa completa. Imagine que o revisor diz: "Este bolo está muito salgado". O autor responde: "Ah, foi um erro, vou diminuir o sal". O revisor diz: "Ok, mas e a textura?". O Re2 guarda todo esse bate-papo como se fosse um chat de WhatsApp entre o autor e o revisor.
  • Tamanho Gigante: É o maior livro do mundo sobre esse assunto, com quase 20.000 histórias de bolos, mais de 70.000 comentários e quase 54.000 respostas, vindos de muitas festas diferentes (conferências) ao redor do mundo.

3. Para que serve essa "Ferramenta Mágica"?

Com esse livro gigante e organizado, os cientistas podem treinar Assistentes de IA que fazem duas coisas incríveis:

  1. O "Chef de Cozinha" (Para os Autores): Antes de você levar seu bolo para a festa, você pode pedir para a IA: "Ei, leia minha receita e me diga o que está errado". A IA, treinada no Re2, age como um crítico experiente que te ajuda a consertar o bolo antes de você enviá-lo. Isso evita que você perca tempo levando um bolo ruim e alivia a pressão dos revisores.
  2. O "Juiz Virtual" (Para os Revisores): A IA pode ajudar os revisores humanos a escreverem comentários mais claros e úteis, ou até simular conversas para treinar novos revisores.

Resumo em uma Frase

O Re2 é como ter um espelho mágico que mostra exatamente como os trabalhos científicos eram quando foram entregues e como as conversas de defesa aconteceram depois. Isso permite criar robôs inteligentes que ajudam os autores a escreverem melhores trabalhos antes de enviá-los, tornando a "festa da ciência" menos caótica e mais justa para todos.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →