Each language version is independently generated for its own context, not a direct translation.
Imagine que você tem uma biblioteca gigante com 32 livros técnicos muito densos sobre o consumo de energia de Inteligência Artificial. Alguém chega e faz uma pergunta super específica: "Quanto de água foi usada para treinar o modelo X?".
O problema é que os livros estão bagunçados, a linguagem é difícil e, às vezes, a resposta está escondida em um gráfico ou em uma frase pequena no meio de um parágrafo gigante. Se você pedir para um robô (uma Inteligência Artificial) ler tudo e responder, ele pode inventar coisas (alucinar), esquecer de dizer de onde tirou a informação ou ficar confuso.
Os autores do KohakuRAG criaram uma solução inteligente para esse problema. Vamos explicar como funciona usando analogias do dia a dia:
1. A Biblioteca Organizada (Indexação Hierárquica)
O Problema: A maioria dos sistemas tenta ler os livros cortando-os em pedaços aleatórios de tamanho fixo, como se você pegasse uma tesoura e cortasse um livro de capa dura ao meio, misturando o índice com o capítulo 3. Isso perde a estrutura.
A Solução KohakuRAG: Eles tratam os documentos como uma árvore genealógica ou um mapa de endereços.
- O Livro inteiro é a raiz.
- Os Capítulos são os galhos grandes.
- Os Parágrafos são os galhos menores.
- As Frases são as folhas.
Ao invés de cortar aleatoriamente, o sistema entende que uma frase pertence a um parágrafo, que pertence a um capítulo. Quando o robô precisa de uma informação, ele não busca apenas uma "fatia" solta; ele busca a folha exata, mas também traz o galho e o ramo para cima, para que o robô entenda o contexto completo. É como pedir para um bibliotecário: "Traga-me a página 42", mas ele traz também o capítulo inteiro para garantir que você não perca o sentido da história.
2. O Detetive com Múltiplas Lentes (Recuperação Multi-Consulta)
O Problema: Às vezes, você pergunta "Qual o PUE?" (um termo técnico), mas o livro usa a frase "Eficiência no Uso de Energia". O robô, sendo literal, não acha nada. É como procurar "batata" na prateleira de "papas".
A Solução KohakuRAG: Eles usam um Detetive Inteligente (um modelo de IA) antes de procurar.
- O Detetive recebe sua pergunta e pensa: "Espera, essa pessoa pode estar procurando por 'PUE', 'Eficiência Energética' ou 'Razão de Consumo'".
- Ele cria várias versões da mesma pergunta (como se tivesse várias lentes diferentes) e as envia para a biblioteca.
- Depois, ele junta todas as respostas. Se vários "detetives" encontraram o mesmo documento, esse documento ganha mais pontos e vai para o topo da lista. É como se várias pessoas buscassem algo no mesmo lugar; se todos apontam para o mesmo baú, provavelmente o tesouro está lá.
3. O Painel de Especialistas (Inferência em Conjunto)
O Problema: Se você pedir a um único robô para responder, ele pode ter um "dia ruim", ficar confuso ou inventar uma resposta porque não encontrou o que queria.
A Solução KohakuRAG: Eles não confiam em um único robô. Eles organizam uma reunião de especialistas.
- O sistema pede a resposta para o mesmo robô várias vezes (digamos, 9 vezes), cada vez com uma pequena variação.
- Se o robô diz "Não sei" (abstenção) em uma das vezes, mas os outros 8 dizem "É 500 litros", o sistema ignora o "Não sei" e segue a maioria.
- Se todos dizem "Não sei", o sistema admite honestamente que não sabe, em vez de inventar uma mentira. Isso evita que o robô alucine.
4. O Mecanismo de "Tente de Novo"
Às vezes, o robô diz "Não sei" porque a informação estava um pouco escondida. O sistema tem um botão de retry (tente de novo). Se o robô desistir, o sistema aumenta a busca, traz mais contexto e pergunta de novo. É como se você estivesse procurando algo no fundo de uma gaveta bagunçada; se não acha na primeira olhada, você tira mais coisas de cima e tenta de novo.
O Resultado?
Na competição WattBot 2025, onde o desafio era responder perguntas técnicas com precisão de 0,1% e citar exatamente de onde veio a informação, o KohakuRAG venceu.
Eles foram a única equipe que manteve o 1º lugar tanto na fase pública quanto na fase privada (que é como um "segredo" que só é revelado no final). Isso prova que o sistema deles não apenas "decorou" as perguntas, mas aprendeu a buscar e entender a informação de verdade, sendo robusto e confiável.
Resumo da Ópera:
O KohakuRAG é como ter um bibliotecário superorganizado, um detetive que sabe falar várias línguas técnicas e um conselho de especialistas que vota juntos para garantir que a resposta seja correta, honesta e bem fundamentada.