PromCopilot: Simplifying Prometheus Metric Querying in Cloud Native Online Service Systems via Large Language Models

O artigo apresenta o PromCopilot, um framework baseado em Modelos de Linguagem Grande (LLMs) e grafos de conhecimento que simplifica a geração de consultas PromQL a partir de linguagem natural para monitoramento de sistemas online em nuvem, alcançando 69,1% de precisão em um novo conjunto de dados de benchmark.

Chenxi Zhang, Bicheng Zhang, Dingyu Yang, Xin Peng, Miao Chen, Senyu Xie, Gang Chen, Wei Bi, Wei Li

Publicado Thu, 12 Ma
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é o capitão de um navio gigante e moderno, cheio de máquinas complexas, turbinas e sistemas elétricos que nunca param de funcionar. Para manter esse navio seguro, você precisa de painéis de controle cheios de luzes, medidores e gráficos que mostram a velocidade do vento, a temperatura dos motores e o nível de combustível.

No mundo digital, esses "navios" são os sistemas online (como sites de compras, bancos ou redes sociais) e os "painéis de controle" são ferramentas de monitoramento chamadas Prometheus.

Aqui está a história do PromCopilot, explicada de forma simples:

1. O Problema: O "Dicionário" que Ninguém Entende

Para ver os dados do seu navio (ou do seu site), os engenheiros precisam escrever perguntas em uma linguagem muito específica e difícil, chamada PromQL. É como se, para saber a temperatura do motor, você precisasse escrever uma frase em latim com regras gramaticais estritas, em vez de apenas dizer: "Qual a temperatura do motor?".

  • A dificuldade: Escrever essas frases em PromQL exige saber exatamente o nome de cada peça, onde ela está instalada e como se chama. Se o engenheiro errar uma vírgula ou o nome de um sensor, a pergunta não funciona. É como tentar pedir uma pizza em um restaurante onde você precisa saber o código de barras de cada ingrediente para fazer o pedido.

2. A Solução: O PromCopilot (Seu "Tradutor Mágico")

Os autores criaram o PromCopilot, que funciona como um assistente inteligente que traduz a linguagem humana para essa linguagem de computador difícil.

Imagine que o PromCopilot tem dois cérebros trabalhando juntos:

  1. O "Mapa do Tesouro" (Grafo de Conhecimento): Antes de tudo, o sistema cria um mapa gigante e detalhado de todo o navio. Ele sabe que o "Serviço de Pedidos" está instalado no "Pod 1", que o "Pod 1" está no "Nó 3", e que o "Nó 3" tem um sensor de memória. É como ter um manual de instruções 3D que mostra como tudo está conectado.
  2. O "Tradutor Inteligente" (IA de Linguagem): Quando um engenheiro pergunta em português: "Qual nó tem mais memória livre onde o serviço de pedidos está rodando?", o PromCopilot não chuta. Ele olha no "Mapa do Tesouro", encontra o caminho correto (Serviço -> Pod -> Nó) e descobre os nomes técnicos reais. Depois, ele usa sua inteligência para montar a frase correta em PromQL.

3. Como Funciona na Prática?

Vamos usar uma analogia de pedir uma comida em um restaurante:

  • Sem PromCopilot: Você chega no balcão e precisa dizer: "Quero o prato com o código #992, feito com o ingrediente #445, cozido na panela #12, servido pelo garçom #03". Se você não souber os códigos, não come nada.
  • Com PromCopilot: Você chega e diz: "Quero o prato do dia, mas sem cebola".
    • O PromCopilot (o garçom inteligente) olha no cardápio (o Mapa de Conhecimento) para ver o que é "prato do dia".
    • Ele verifica quem é o chef responsável e quais ingredientes estão disponíveis.
    • Ele traduz seu pedido simples para a ordem técnica que a cozinha precisa: "Preparar prato #992, retirar ingrediente #445".

4. O Que Eles Descobriram?

Os pesquisadores testaram essa ideia criando um "simulador" com 280 perguntas reais que engenheiros fariam.

  • O Resultado: O PromCopilot conseguiu traduzir corretamente cerca de 69% das perguntas complexas.
  • Comparação: Se você apenas pedisse para uma Inteligência Artificial comum (sem o "Mapa do Tesouro"), ela acertaria muito pouco (cerca de 2,6%), porque ela não conhece os nomes específicos das peças do seu sistema. Com o mapa e a IA trabalhando juntos, a precisão saltou muito.
  • Velocidade: Engenheiros que usaram a ferramenta terminaram suas tarefas em 100 segundos, enquanto os que usaram métodos antigos levavam quase 6 minutos.

5. Por Que Isso é Importante?

Hoje, os sistemas são tão complexos que nenhum humano consegue decorar onde cada peça está ou como se chama cada sensor. O PromCopilot tira o peso das costas dos engenheiros, permitindo que eles foquem em resolver problemas e não em decorar códigos.

Resumo da Ópera:
O PromCopilot é como ter um tradutor universal que conecta a linguagem simples do dia a dia com a linguagem técnica e complicada dos computadores, usando um "mapa mental" do sistema para garantir que a tradução seja sempre precisa. Isso torna a vida dos engenheiros muito mais fácil e os sistemas mais seguros.