Evaluation of LLMs in retrieving food and nutritional context for RAG systems

Este artigo avalia a eficácia de quatro Grandes Modelos de Linguagem (LLMs) em traduzir consultas em linguagem natural para filtros de metadados estruturados em um sistema RAG para dados nutricionais, concluindo que, embora sejam altamente precisos para consultas expressíveis, enfrentam desafios significativos ao lidar com restrições não representáveis no formato de metadados.

Maks Požarnik Vavken, Matevž Ogrinc, Tome Eftimov, Barbara Koroušic Seljak

Publicado Wed, 11 Ma
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem uma biblioteca gigante de alimentos, onde cada livro contém informações detalhadas sobre milhares de comidas: desde o quanto de proteína tem um queijo até a quantidade de sódio em um biscoito. O problema é que essa biblioteca é tão grande e complexa que, para encontrar algo específico, você precisaria ser um especialista em computadores e saber a "linguagem secreta" (códigos e filtros técnicos) para pedir o livro certo.

Este artigo é sobre uma equipe de cientistas da Eslovênia que criou um robô assistente (baseado em Inteligência Artificial) para resolver esse problema. O objetivo era permitir que nutricionistas e pessoas comuns pudessem simplesmente conversar com a biblioteca, como se estivessem falando com um amigo, e receber a resposta exata.

Aqui está a explicação do funcionamento e dos resultados, usando analogias do dia a dia:

1. O Problema: A Biblioteca Confusa

Antes, se um nutricionista quisesse saber "Quais queijos têm mais de 12g de proteína?", ele teria que saber exatamente como escrever essa pergunta no sistema do computador. Se ele errasse um código, o sistema não encontrava nada. Era como tentar entrar em um clube VIP sem saber a senha correta.

2. A Solução: O Tradutor Mágico (RAG + LLM)

Os pesquisadores criaram um sistema com dois passos principais:

  • O Tradutor (LLM): Imagine um tradutor superinteligente. Quando você diz "Quero queijos com muita proteína", o robô traduz essa frase simples para a "linguagem secreta" que a biblioteca entende (filtros técnicos).
  • O Guardião (Banco de Dados): Uma vez que o robô traduziu a ordem, ele vai até a biblioteca, ignora todos os livros que não são de "queijos" e foca apenas naqueles que têm "muita proteína".

3. O Teste: A Prova de Fogo

Eles testaram quatro robôs famosos (chamados de Grandes Modelos de Linguagem: Gemini, GPT, Claude e Mistral) com 150 perguntas de diferentes níveis de dificuldade:

  • Nível Fácil (A Caminhada no Parque): Perguntas simples como "O que tem mais de 12g de gordura?".
    • Resultado: Perfeito! Todos os robôs acertaram quase 100% das vezes. Eles traduziram a pergunta e encontraram a comida exata sem errar.
  • Nível Médio (O Labirinto): Perguntas com várias regras, como "O que tem mais de 0,5g de potássio, menos de 5g de gordura e é da categoria 'Frutas'?"
    • Resultado: Excelente. Os robôs conseguiram lidar com várias regras ao mesmo tempo, funcionando muito bem.
  • Nível Difícil (O Quebra-Cabeça Impossível): Perguntas que exigem raciocínio complexo, como "Quais carnes têm mais proteína do que colesterol?" ou "Some a proteína e a gordura e veja se passa de 80g".
    • Resultado: Aqui é que eles tropeçaram. Os robôs tiveram dificuldade em criar a "senha" correta para essas perguntas. A biblioteca não tinha um botão pronto para "soma de nutrientes", e o robô não conseguiu inventar uma maneira de pedir isso. A precisão caiu para cerca de 40-45%.

4. O Plano B (A Rede de Segurança)

Quando o robô não conseguia criar a "senha" perfeita para as perguntas difíceis, o sistema tinha um plano de emergência:

  1. Filtro Relaxado: Em vez de tentar ser exato, o robô tentava apenas filtrar pela categoria geral (ex: "Tudo que é carne").
  2. Busca por Semelhança: Se nada disso funcionasse, o robô olhava para a pergunta e dizia: "Bem, isso parece com estes livros aqui", mostrando resultados aproximados.
    Isso garantiu que o usuário nunca ficasse de mãos vazias, mesmo que a resposta não fosse 100% exata.

5. O Veredito Final

  • Para o dia a dia: A tecnologia é fantástica! Se você quer filtrar alimentos por nutrientes básicos ou categorias, esse sistema funciona perfeitamente e poupa muito tempo de especialistas. É como ter um assistente pessoal que conhece cada detalhe da sua despensa.
  • O limite: A tecnologia ainda não é perfeita para perguntas que exigem "matemática complexa" ou comparações estranhas dentro dos dados. Quando a pergunta sai do padrão, o robô pode se confundir.

Em resumo: Os cientistas provaram que podemos conversar com bancos de dados complexos de comida usando linguagem natural. É um grande salto para ajudar nutricionistas, mas ainda precisamos ensinar os robôs a serem melhores em resolver quebra-cabeças matemáticos complexos antes que eles sejam totalmente autônomos para todas as situações.