Proof Strategy Extraction from LLMs for Enhancing Symbolic Provers

O artigo apresenta o Strat2Rocq, uma abordagem que extrai estratégias de prova de modelos de linguagem para formalizá-las como lemas no Rocq, aumentando assim a taxa de sucesso dos provadores simbólicos e dos agentes de prova baseados em LLM.

Jian Fang, Yican Sun, Yingfei Xiong

Publicado 2026-03-05
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um gênio matemático (o Modelo de Linguagem ou LLM) que é incrivelmente rápido, criativo e consegue resolver problemas complexos de lógica quase instantaneamente. No entanto, esse gênio tem dois grandes problemas:

  1. Ele é caro de manter (precisa de supercomputadores).
  2. Ele é inseguro para empresas que não podem revelar seus segredos industriais (códigos confidenciais) para uma nuvem externa.

Por outro lado, você tem um robô lógico (o Provedor Simbólico, como o CoqHammer). Ele é barato, roda no seu computador pessoal, é super seguro e não comete erros de "alucinação". Mas ele é lento e, às vezes, trava porque não consegue ver o "pulo do gato" para resolver um problema.

A pergunta que os autores deste trabalho fizeram foi: "E se pudéssemos pegar as 'dicas de estratégia' do gênio e ensinar o robô a usá-las, sem precisar que o gênio esteja lá na hora?"

A resposta é o Strat2Rocq.

A Metáfora: O Mestre e o Estagiário

Pense no Gênio (LLM) como um Mestre de Xadrez experiente e no Robô (Provedor Simbólico) como um estagiário muito inteligente, mas inexperiente.

  1. O Problema: O estagiário tenta resolver um tabuleiro complexo, mas fica preso em movimentos óbvios e demorados. O Mestre, se estivesse lá, daria um conselho rápido: "Não pense em cada passo, lembre-se que neste cenário, a peça X sempre se move para o canto Y". Mas você não pode ter o Mestre no escritório o tempo todo (é caro e arriscado).

  2. A Solução (Strat2Rocq):

    • Fase 1 (Aprendizado Offline): Você pede ao Mestre para resolver uma pilha de problemas antigos. Enquanto ele resolve, você observa como ele pensa. Você percebe que ele usa atalhos inteligentes. Em vez de copiar o Mestre para o escritório, você escreve um manual de regras (chamado de "Lemas") baseado nas estratégias que ele usou.
    • Fase 2 (O Trabalho Real): Agora, quando o estagiário (o Robô) recebe um novo problema, você entrega a ele esse manual de regras que você criou. O estagiário não precisa do Mestre ao lado. Ele apenas consulta o manual, vê o atalho que o Mestre usaria e resolve o problema sozinho, rápido e seguro.

Como funciona na prática?

O sistema faz isso em duas etapas principais:

  • Mineração de Estratégias (Offline): O sistema usa o LLM para provar milhares de teoremas. Ele olha para a "pista" que o LLM deixou (a prova em linguagem natural) e transforma os "pulos de fé" inteligentes do LLM em regras formais e verificáveis. É como transformar a intuição do gênio em uma lei escrita.
  • Prova Online: Quando chega um novo teorema para ser provado, o sistema pega essas regras novas e as entrega ao provedor simbólico (CoqHammer). O provedor, agora com esse "superpoder" extra, consegue resolver coisas que antes eram impossíveis para ele.

Os Resultados (O que aconteceu?)

Os autores testaram isso em projetos reais de software (como compiladores e sistemas operacionais verificados). O resultado foi impressionante:

  • O Robô ficou 13,41% mais eficiente: Com as dicas do manual, o provedor simbólico conseguiu provar muito mais teoremas do que conseguia sozinho.
  • Segurança e Custo: Como o LLM só é usado uma vez para criar o manual (offline), o processo final é barato e seguro. Você não precisa enviar dados confidenciais para a nuvem toda vez que quiser provar algo.
  • Efeito Colateral Surpreendente: O manual também ajudou o próprio LLM a trabalhar melhor quando usado como um agente autônomo, provando que as regras extraídas são realmente úteis.

Resumo em uma frase

O Strat2Rocq é como um tradutor que pega a "intuição mágica" de uma inteligência artificial cara e a transforma em um "manual de instruções" barato e seguro, permitindo que computadores comuns resolvam problemas de lógica complexa com a mesma eficiência de um gênio, sem precisar que o gênio esteja presente.