Test-Time Strategies for More Efficient and Accurate Agentic RAG

Este artigo propõe e avalia estratégias de tempo de teste para o pipeline Search-R1, integrando módulos de contextualização e deduplicação que, combinados, aumentam a precisão das respostas e reduzem o número de turnos de recuperação em sistemas de RAG agêntico.

Brian Zhang, Deepti Guntur, Zhiyang Zuo, Abhinav Sharma, Shreyas Chaudhari, Wenlong Zhao, Franck Dernoncourt, Puneet Mathur, Ryan Rossi, Nedim Lipka

Publicado 2026-03-16
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um detetive superinteligente (o modelo de IA) tentando resolver um mistério complexo, como "Quem matou o Sr. Boddy na biblioteca com o castiçal?".

Para resolver o caso, esse detetive não sabe tudo de cabeça. Ele precisa consultar livros (documentos) em uma grande biblioteca. O sistema original, chamado Search-R1, funciona assim: o detetive faz uma pergunta, pega alguns livros, lê, tenta deduzir a resposta, e se não tiver certeza, faz outra pergunta, pega mais livros e repete o processo.

O problema é que, às vezes, esse detetive fica confuso e repetitivo:

  1. Ele esquece o que já leu e pega o mesmo livro três vezes, gastando tempo e dinheiro (tokens).
  2. Mesmo lendo o livro, ele não consegue pegar a informação importante, ficando perdido em meio a páginas cheias de texto inútil.

Os autores deste artigo propuseram três "truques de última hora" (estratégias de teste) para ajudar esse detetive a ser mais rápido e inteligente, sem precisar reescolá-lo do zero.

Aqui estão os três truques explicados com analogias do dia a dia:

1. O Módulo de Contextualização (O "Resumo do Advogado")

Imagine que, em vez de entregar ao detetive o livro inteiro (que tem 300 páginas), você contrata um advogado especialista que lê o livro rapidamente e entrega apenas um resumo de uma página com as partes que realmente importam para o caso.

  • Como funciona: Antes de o detetive pensar na próxima pergunta, um segundo IA (o advogado) lê o que foi encontrado, extrai apenas o essencial e guarda isso em uma "memória permanente".
  • O resultado: O detetive nunca esquece o que já descobriu e não precisa ler o livro inteiro de novo. Ele foca apenas no que importa.
  • Na prática: Isso aumentou a precisão das respostas em 5,6% e fez o detetive precisar de menos tentativas para resolver o caso.

2. O Módulo de Desduplicação (O "Filtro de Notícias Falsas")

Às vezes, o detetive fica tão nervoso que começa a pedir o mesmo jornal para três pessoas diferentes, achando que ninguém ouviu direito.

  • Como funciona: Este módulo é como um bibliotecário rigoroso. Se o detetive tentar pegar um livro que ele já leu antes, o bibliotecário diz: "Ei, você já viu isso! Aqui, pegue o próximo livro na lista que você ainda não viu".
  • O resultado: Isso força o detetive a explorar novas informações em vez de ficar rodando em círculos.
  • O problema: Curiosamente, apenas fazer isso não foi suficiente. O detetive, sem o resumo do advogado, continuou perdido e fez mais perguntas inúteis tentando encontrar algo que já estava lá, mas que ele não conseguiu entender.

3. A Abordagem Híbrida (O "Equipe Completa")

É a combinação dos dois: o detetive tem o bibliotecário (que garante que ele veja coisas novas) e o advogado (que resume o que é importante).

  • O resultado: Funciona bem, mas a equipe do "Advogado" (Contextualização) sozinha foi a campeã absoluta.

O Veredito Final

A grande descoberta do artigo é que ler melhor é mais importante do que ler mais.

O sistema original (Search-R1) era como alguém que lê 10 livros mas não retém nada. Com o novo método de Contextualização (o resumo inteligente), o sistema:

  • Acertou mais: A resposta ficou mais precisa.
  • Gastou menos: Precisa de menos "voltas" (turnos) para chegar à resposta.
  • Ficou mais rápido: Menos tempo processando informações inúteis.

Em resumo: Em vez de fazer a IA "correr mais" (fazer mais perguntas), os autores ensinaram a IA a "parar e pensar melhor" sobre o que ela já encontrou, organizando as informações de forma que ela não se perca no meio do caminho. É como trocar um mapa cheio de ruas erradas por um GPS que só mostra o caminho certo.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →