CARROT: A Learned Cost-Constrained Retrieval Optimization System for RAG

O artigo apresenta o CARROT, um sistema de otimização de recuperação para RAG que utiliza busca em árvore Monte Carlo e um agente de configuração para selecionar e ordenar blocos de conhecimento de forma adaptativa, maximizando a utilidade dentro de restrições de custo e superando desafios como redundância e utilidade não monotônica.

Ziting Wang, Haitao Yuan, Wei Dong, Gao Cong, Feifei Li

Publicado Fri, 13 Ma
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um gênio muito inteligente (a Inteligência Artificial) que sabe responder a quase tudo, mas tem um problema: ele não sabe o que aconteceu ontem, nem tem acesso a livros novos. Para resolver isso, nós damos a ele uma biblioteca gigante (a internet ou documentos da empresa) para consultar antes de responder.

Esse processo é chamado de RAG (Geração Aumentada por Recuperação). Mas aqui está o problema: a biblioteca é enorme e o gênio tem uma "memória de curto prazo" limitada. Se você jogar 100 páginas de texto para ele ler, ele fica confuso, cansado e começa a inventar coisas (alucinar).

A maioria dos sistemas atuais funciona assim: eles pegam os 5 ou 10 pedaços de texto que parecem mais parecidos com a sua pergunta e jogam tudo junto. É como tentar montar um quebra-cabeça jogando todas as peças de uma vez no chão e esperando que a imagem apareça. Muitas vezes, as peças se sobrepõem, se contradizem ou estão na ordem errada, e o resultado é ruim.

O artigo que você enviou apresenta o CARROT (um sistema inteligente para organizar essa "biblioteca"). Vamos entender como ele funciona usando analogias simples:

1. O Problema: A Bagunça na Biblioteca

O CARROT identifica três problemas principais nos sistemas atuais:

  • A Desordem: Eles pegam pedaços de texto (chamados de "chunks") de forma isolada, sem pensar em como eles se conectam. É como pegar um capítulo de um livro, depois um parágrafo aleatório de outro, e depois a capa do livro. A ordem importa muito!
  • O Efeito "Mais é Pior": Às vezes, adicionar mais texto piora a resposta. Se você tem a resposta exata em um parágrafo, adicionar mais 10 páginas de informações irrelevantes só confunde o gênio. A utilidade não é sempre crescente; às vezes, menos é mais.
  • O "Tamanho Único" não funciona: Perguntas sobre medicina precisam de uma estratégia diferente de perguntas sobre culinária. Os sistemas atuais usam a mesma "receita" para tudo.

2. A Solução: O Detetive com um Mapa (MCTS)

O CARROT não joga as peças no chão. Ele usa uma estratégia chamada Busca em Árvore de Monte Carlo (MCTS).

A Analogia do Labirinto:
Imagine que você precisa encontrar a saída de um labirinto (a melhor resposta).

  • Sistemas antigos (Gananciosos): Eles olham para a porta mais próxima e vão para ela. Se for um beco sem saída, eles ficam presos.
  • O CARROT: Ele é como um detetive que desenha um mapa mental. Ele testa vários caminhos possíveis, simula o que aconteceria se ele fosse por ali ou por acolá, e escolhe o caminho que parece levar à melhor saída, considerando que ele tem um limite de tempo (custo).

No caso do CARROT, ele não escolhe apenas quais pedaços de texto usar, mas também a ordem exata em que eles devem aparecer para o gênio ler. Ele descobre que colocar o pedaço A antes do B é muito melhor do que B antes de A, mesmo que ambos sejam relevantes.

3. O Gerente Inteligente (Agente de Configuração)

O CARROT tem um "gerente" que olha para a sua pergunta antes de começar a busca.

  • Se você pergunta algo complexo sobre leis, o gerente diz: "Precisamos de mais tempo de busca e um especialista em textos jurídicos".
  • Se você pergunta algo simples sobre o clima, ele diz: "Vamos rápido, usemos uma busca simples".

Isso evita desperdício. O sistema se adapta automaticamente, sem precisar ser reprogramado para cada novo tipo de pergunta.

4. O Orçamento (Custo)

Tudo isso custa "dinheiro" (tokens, que são unidades de processamento). O CARROT é muito econômico. Ele sabe exatamente quando parar. Se ele já encontrou a resposta perfeita com 3 pedaços de texto, ele não continua procurando mais 10 só porque pode. Ele economiza recursos para não estourar o orçamento.

Resumo dos Resultados

Os testes mostraram que o CARROT é um vencedor:

  • Melhor Qualidade: As respostas são até 30% melhores do que os sistemas atuais.
  • Mais Rápido e Barato: Ele usa menos "memória" (tokens) para chegar a uma resposta melhor.
  • Escalável: Funciona bem mesmo quando a biblioteca de textos é gigantesca.

Conclusão

Em vez de jogar uma pilha de papéis bagunçados na mesa de um gênio e esperar que ele adivinhe a ordem, o CARROT organiza os papéis, escolhe os melhores, coloca-os na sequência perfeita e entrega apenas o necessário. É como ter um bibliotecário de elite que sabe exatamente qual livro, qual página e em qual ordem entregar para que você tenha a melhor resposta possível, gastando o mínimo de tempo e energia.