KohakuRAG: A simple RAG framework with hierarchical document indexing

O artigo apresenta o KohakuRAG, um framework RAG hierárquico que preserva a estrutura documental através de uma representação em árvore de quatro níveis, utiliza um planejador de consultas baseado em LLM e inferência em conjunto para melhorar a precisão e a estabilidade, alcançando o primeiro lugar no Desafio WattBot 2025 com pontuação de 0,861.

Shih-Ying Yeh, Yueh-Feng Ku, Ko-Wei Huang, Buu-Khang Tu

Publicado 2026-03-10
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem uma biblioteca gigante com 32 livros técnicos muito densos sobre o consumo de energia de Inteligência Artificial. Alguém chega e faz uma pergunta super específica: "Quanto de água foi usada para treinar o modelo X?".

O problema é que os livros estão bagunçados, a linguagem é difícil e, às vezes, a resposta está escondida em um gráfico ou em uma frase pequena no meio de um parágrafo gigante. Se você pedir para um robô (uma Inteligência Artificial) ler tudo e responder, ele pode inventar coisas (alucinar), esquecer de dizer de onde tirou a informação ou ficar confuso.

Os autores do KohakuRAG criaram uma solução inteligente para esse problema. Vamos explicar como funciona usando analogias do dia a dia:

1. A Biblioteca Organizada (Indexação Hierárquica)

O Problema: A maioria dos sistemas tenta ler os livros cortando-os em pedaços aleatórios de tamanho fixo, como se você pegasse uma tesoura e cortasse um livro de capa dura ao meio, misturando o índice com o capítulo 3. Isso perde a estrutura.

A Solução KohakuRAG: Eles tratam os documentos como uma árvore genealógica ou um mapa de endereços.

  • O Livro inteiro é a raiz.
  • Os Capítulos são os galhos grandes.
  • Os Parágrafos são os galhos menores.
  • As Frases são as folhas.

Ao invés de cortar aleatoriamente, o sistema entende que uma frase pertence a um parágrafo, que pertence a um capítulo. Quando o robô precisa de uma informação, ele não busca apenas uma "fatia" solta; ele busca a folha exata, mas também traz o galho e o ramo para cima, para que o robô entenda o contexto completo. É como pedir para um bibliotecário: "Traga-me a página 42", mas ele traz também o capítulo inteiro para garantir que você não perca o sentido da história.

2. O Detetive com Múltiplas Lentes (Recuperação Multi-Consulta)

O Problema: Às vezes, você pergunta "Qual o PUE?" (um termo técnico), mas o livro usa a frase "Eficiência no Uso de Energia". O robô, sendo literal, não acha nada. É como procurar "batata" na prateleira de "papas".

A Solução KohakuRAG: Eles usam um Detetive Inteligente (um modelo de IA) antes de procurar.

  • O Detetive recebe sua pergunta e pensa: "Espera, essa pessoa pode estar procurando por 'PUE', 'Eficiência Energética' ou 'Razão de Consumo'".
  • Ele cria várias versões da mesma pergunta (como se tivesse várias lentes diferentes) e as envia para a biblioteca.
  • Depois, ele junta todas as respostas. Se vários "detetives" encontraram o mesmo documento, esse documento ganha mais pontos e vai para o topo da lista. É como se várias pessoas buscassem algo no mesmo lugar; se todos apontam para o mesmo baú, provavelmente o tesouro está lá.

3. O Painel de Especialistas (Inferência em Conjunto)

O Problema: Se você pedir a um único robô para responder, ele pode ter um "dia ruim", ficar confuso ou inventar uma resposta porque não encontrou o que queria.

A Solução KohakuRAG: Eles não confiam em um único robô. Eles organizam uma reunião de especialistas.

  • O sistema pede a resposta para o mesmo robô várias vezes (digamos, 9 vezes), cada vez com uma pequena variação.
  • Se o robô diz "Não sei" (abstenção) em uma das vezes, mas os outros 8 dizem "É 500 litros", o sistema ignora o "Não sei" e segue a maioria.
  • Se todos dizem "Não sei", o sistema admite honestamente que não sabe, em vez de inventar uma mentira. Isso evita que o robô alucine.

4. O Mecanismo de "Tente de Novo"

Às vezes, o robô diz "Não sei" porque a informação estava um pouco escondida. O sistema tem um botão de retry (tente de novo). Se o robô desistir, o sistema aumenta a busca, traz mais contexto e pergunta de novo. É como se você estivesse procurando algo no fundo de uma gaveta bagunçada; se não acha na primeira olhada, você tira mais coisas de cima e tenta de novo.

O Resultado?

Na competição WattBot 2025, onde o desafio era responder perguntas técnicas com precisão de 0,1% e citar exatamente de onde veio a informação, o KohakuRAG venceu.

Eles foram a única equipe que manteve o 1º lugar tanto na fase pública quanto na fase privada (que é como um "segredo" que só é revelado no final). Isso prova que o sistema deles não apenas "decorou" as perguntas, mas aprendeu a buscar e entender a informação de verdade, sendo robusto e confiável.

Resumo da Ópera:
O KohakuRAG é como ter um bibliotecário superorganizado, um detetive que sabe falar várias línguas técnicas e um conselho de especialistas que vota juntos para garantir que a resposta seja correta, honesta e bem fundamentada.