SRAG: RAG with Structured Data Improves Vector Retrieval

O artigo propõe o SRAG, um método que aprimora a recuperação em sistemas RAG ao incorporar informações estruturadas (como tópicos, sentimentos, triplas de grafos de conhecimento e tags semânticas) tanto nas consultas quanto nos trechos, resultando em um aumento significativo de 30% na qualidade das respostas geradas, especialmente para perguntas comparativas, analíticas e preditivas.

Shalin Shah, Srikanth Ryali, Ramasubbu Venkatesh

Publicado 2026-03-31
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um bibliotecário superinteligente (a Inteligência Artificial) que sabe responder a quase qualquer pergunta. O problema é que, para responder, ele precisa procurar em uma biblioteca gigante cheia de milhões de livros e documentos.

No método tradicional (chamado de RAG), quando você faz uma pergunta, o bibliotecário olha apenas para as palavras que você usou. Ele procura os livros que têm as palavras mais parecidas com a sua pergunta.

  • O problema: Às vezes, a resposta certa está em um livro que usa palavras diferentes, mas que trata do mesmo assunto de forma profunda. O bibliotecário tradicional perde essa resposta porque ele é muito "literal". É como procurar um livro sobre "como consertar um carro" e só achar livros que têm a palavra exata "carro", ignorando um manual excelente chamado "Guia de Mecânica Automotiva".

Os autores deste paper, a Anvai AI, criaram uma solução chamada SRAG (RAG com Dados Estruturados). Vamos usar uma analogia para entender como funciona:

A Analogia da "Etiqueta Mágica"

Imagine que, em vez de apenas colocar os livros na prateleira, você colar uma etiqueta colorida e detalhada em cada um deles antes de guardá-los.

Essa etiqueta não diz apenas o título do livro. Ela diz:

  • O Tema: "Finanças", "Tecnologia", "Saúde".
  • O Sentimento: "Positivo", "Negativo", "Neutro".
  • O Tipo de Pergunta: "Comparativo" (A vs B), "Analítico" (Por que isso acontece?), "Preditivo" (O que vai acontecer no futuro?).
  • Conexões Secretas: "Este livro se conecta com o livro X e Y" (como se fossem trilhas de conhecimento).

Quando você faz uma pergunta, o SRAG também etiqueta a sua pergunta com essas mesmas informações.

Como a mágica acontece:

  1. Sem SRAG (RAG Comum): Você pergunta: "Como a Apple se compara à Microsoft?". O sistema procura livros que têm "Apple" e "Microsoft". Se o livro certo estiver escrito de forma muito técnica ou usar sinônimos, ele pode ser ignorado.
  2. Com SRAG: O sistema vê que sua pergunta é do tipo "Comparativo" e tem o tema "Tecnologia". Ele vai direto para a prateleira onde estão todos os livros com a etiqueta "Comparativo" + "Tecnologia", ignorando os que só têm as palavras soltas. Ele encontra a resposta perfeita, mesmo que o livro não tenha a palavra exata "Apple" no título inicial.

O Que Eles Descobriram?

Os autores testaram isso em perguntas complexas, como:

  • "Como a estratégia de IA da Apple se compara à da Google?"
  • "Qual o impacto da sazonalidade nas receitas da Apple?"

Os resultados foram impressionantes:

  • Melhora de 30%: A qualidade das respostas aumentou drasticamente.
  • Especialista em Raciocínio: O sistema ficou muito melhor em perguntas que exigem comparação, análise e previsão (aquelas que exigem pensar, não apenas copiar um fato).
  • Menos Erros Graves: O sistema raramente dá respostas ruins; na maioria das vezes, ele dá respostas muito melhores do que antes.

Por que isso é importante?

Pense no SRAG como dar ao bibliotecário um mapa do tesouro em vez de apenas uma lista de palavras-chave.

  • O método antigo (RAG) é como procurar uma agulha no palheiro apenas olhando para a cor da agulha.
  • O novo método (SRAG) é como saber que a agulha está perto de um pedaço de palha azul e de um fio de linha vermelha. Você acha a agulha muito mais rápido e com mais certeza.

Resumo em uma frase:
O SRAG ensina a Inteligência Artificial a entender o contexto e a intenção por trás da pergunta, organizando a informação de forma que ela consiga "lembrar" de experiências passadas relevantes, mesmo que as palavras não sejam exatamente as mesmas, tornando as respostas muito mais inteligentes e precisas.