MDKeyChunker: Single-Call LLM Enrichment with Rolling Keys and Key-Based Restructuring for High-Accuracy RAG

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem uma biblioteca gigante de documentos (como manuais, artigos e guias) e quer criar um "assistente inteligente" que possa responder perguntas sobre eles. Esse é o objetivo do RAG (Geração Aumentada por Recuperação).

O problema é que, tradicionalmente, esses assistentes cortam os documentos em pedaços iguais e pequenos (como fatias de pão), sem se importar se a fatia corta uma tabela ao meio, separa um código de sua explicação ou divide uma lista. Além disso, para entender cada fatia, o assistente precisa fazer várias perguntas separadas a uma Inteligência Artificial (IA), o que é caro e lento.

O MDKeyChunker é uma nova solução proposta pelo pesquisador Bhavik Mangla que resolve isso de forma mais inteligente. Vamos explicar como funciona usando analogias do dia a dia:

1. O Problema: Cortar o Pão de Forma Errada

Imagine que você está lendo um livro de receitas.

O jeito antigo (Chunking Fixo): Alguém corta o livro em pedaços de 500 caracteres. O resultado? Você pode pegar um pedaço que tem a metade da lista de ingredientes e a outra metade da explicação de como misturar. Ou pior, a receita inteira de um bolo é cortada ao meio. O assistente fica confuso porque o contexto foi destruído.
O jeito MDKeyChunker (Estrutura Inteligente): Em vez de cortar por tamanho, o sistema olha para a "arquitetura" do documento (títulos, tabelas, listas, blocos de código). Ele trata cada receita inteira, cada tabela completa e cada lista como uma unidade atômica (um bloco que não pode ser quebrado). É como se ele cortasse o livro respeitando os capítulos e as páginas inteiras, nunca rasgando uma imagem ou uma tabela.

2. O Superpoder: A "Bolsa de Anotações" (Chaves Rolantes)

Aqui está a parte mais genial. Normalmente, para cada pedaço de texto, a IA teria que ler e responder a 7 perguntas diferentes: "Qual é o título?", "Qual o resumo?", "Quais são as palavras-chave?", "Quem são as pessoas citadas?", etc. Isso seria como pedir para um funcionário fazer 7 viagens diferentes para entregar 7 cartas.

O MDKeyChunker faz tudo em uma única viagem (uma única chamada à IA).

A Analogia da "Bolsa de Anotações": Imagine que você está organizando arquivos em uma pasta. Ao analisar o primeiro documento, você escreve uma "chave" (ex: "Processo de Admissão") em um caderno. Quando analisa o segundo documento, você olha no caderno. Se o segundo documento também fala sobre "Processo de Admissão", você usa a mesma chave do caderno, em vez de inventar um novo nome como "Prazos de Inscrição".
Isso evita que o sistema crie sinônimos confusos. Ele mantém um "dicionário de chaves" que viaja com você, garantindo que tudo que fala sobre o mesmo assunto seja agrupado, mesmo que esteja em páginas diferentes do livro.

3. O Reorganizador: O Jogo de Tetris (Reestruturação)

Depois de analisar tudo, o sistema pega os pedaços que têm a mesma chave e os junta.

A Analogia do Tetris: Imagine que você tem peças de Tetris espalhadas pela mesa. Algumas peças são sobre "Modelos de IA", outras sobre "Aplicações de IA", mas elas estão separadas por outras peças. O MDKeyChunker usa um algoritmo de "empacotamento" (bin-packing) para juntar todas as peças que têm a mesma chave em um único bloco maior, desde que não fiquem gigantes demais.
Resultado: Em vez de o assistente ter que procurar em 3 lugares diferentes para entender um tópico, ele encontra tudo em um único bloco coeso.

Por que isso é incrível? (Os Resultados)

O artigo mostra testes com 30 perguntas sobre 18 documentos:

Precisão: Quando o sistema usa uma busca simples (BM25) sobre esses blocos bem organizados, ele acerta 100% das respostas nas 5 primeiras tentativas.
Eficiência: Ele economiza dinheiro e tempo porque faz tudo em uma única chamada de IA, em vez de várias.
Integridade: Nenhum bloco de código ou tabela foi cortado ao meio. Tudo ficou intacto.

Resumo em uma frase

O MDKeyChunker é como um bibliotecário superorganizado que, em vez de rasgar livros aleatoriamente, lê cada capítulo inteiro, cria um índice inteligente que conecta ideias relacionadas em todo o livro, e reorganiza as prateleiras para que você encontre a resposta completa em um único lugar, tudo isso gastando metade do esforço e dinheiro.

É uma forma de tornar a Inteligência Artificial mais "humana" na forma como lê e entende documentos, respeitando a estrutura natural do texto e mantendo o contexto vivo.