Verbalizing LLM's Higher-order Uncertainty via Imprecise Probabilities

Este artigo propõe novas técnicas de elicitação de incerteza baseadas em probabilidades imprecisas para capturar a incerteza de primeira e segunda ordem em Grandes Modelos de Linguagem (LLMs), superando as limitações dos métodos probabilísticos clássicos e melhorando a confiabilidade das respostas em cenários ambíguos e complexos.

Anita Yang, Krikamol Muandet, Michele Caprio, Siu Lun Chau, Masaki Adachi

Publicado 2026-03-12
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está conversando com um assistente de IA super inteligente. Você faz uma pergunta, e ele responde com total confiança: "Com 90% de certeza, a resposta é X".

O problema é que, às vezes, a pergunta é confusa, ou a IA está chutando, mas ela continua dizendo "90%". É como se um médico dissesse "tenho 90% de certeza que é gripe" quando você tem sintomas de três doenças diferentes e ele não sabe qual delas é.

Este artigo propõe uma nova maneira de perguntar à IA: "Não me dê apenas um número exato. Me diga o quanto você realmente sabe e o quanto você está apenas 'adivinhando'."

Aqui está a explicação simplificada, usando analogias do dia a dia:

1. O Problema: A "Confiança Cega"

Atualmente, as IAs usam uma "confiança clássica" (chamada de Vanilla). Elas tentam encaixar tudo em uma única porcentagem.

  • O erro: Se a pergunta é ambígua (tem mais de uma resposta correta dependendo da interpretação), a IA ainda tenta dar um número único. Isso é como tentar medir a temperatura de um dia chuvoso com um termômetro que só mostra "quente" ou "frio", sem mostrar a variação.

2. A Solução: A "Faixa de Incerteza" (Probabilidades Imprecisas)

Os autores sugerem que, em vez de pedir um número único (ex: 80%), devemos pedir à IA uma faixa ou um intervalo (ex: "Estou entre 40% e 80% de certeza").

Pense nisso como um orçamento de viagem:

  • Método Antigo (Preciso): "Vou gastar exatamente R$ 500,00." (Se o preço do combustível subir, você quebra).
  • Método Novo (Impreciso): "Vou gastar entre R400,00eR 400,00 e R 600,00." (Isso mostra que você tem uma ideia do custo, mas reconhece que o mundo é incerto).

3. Os Dois Tipos de Incerteza (O Segredo do Método)

O grande trunfo deste trabalho é separar a incerteza em dois níveis, como se fossem duas camadas de uma cebola:

Camada 1: A Incerteza do Mundo (Primeira Ordem)

  • O que é: Coisas que são realmente confusas ou aleatórias, mesmo para um gênio.
  • Analogia: Imagine que você pergunta: "Qual time ganhou o campeonato?" Mas a pergunta não diz qual esporte. Pode ser futebol, basquete ou tênis. A resposta é ambígua por natureza.
  • O que a IA faz: Ela deve dizer: "Não consigo reduzir essa dúvida. O mundo é assim mesmo."

Camada 2: A Incerteza do Próprio Cérebro (Segunda Ordem)

  • O que é: A dúvida sobre o quanto a IA sabe. É a "incerteza sobre a incerteza".
  • Analogia: Imagine que você está tentando adivinhar a senha de um cofre.
    • Se você tem 10 dicas, sua dúvida é baixa (você sabe quase tudo).
    • Se você tem 0 dicas, sua dúvida é alta (você está no escuro).
    • À medida que você recebe mais dicas (exemplos no texto), a "dúvida sobre a dúvida" diminui, mesmo que a senha ainda seja difícil.
  • O que a IA faz: O novo método permite que a IA diga: "Estou confuso porque não tenho informações suficientes, mas se você me der mais exemplos, minha confiança vai subir."

4. Como Funciona na Prática?

Os pesquisadores criaram "prompts" (instruções) especiais para a IA. Em vez de perguntar "Qual a chance de ser X?", eles perguntam:

  • "Qual é o mínimo de chance que você considera plausível?"
  • "Qual é o máximo de chance que você considera defensável?"

Isso cria uma faixa de segurança. Se a faixa for larga (ex: 10% a 90%), significa que a IA está muito insegura sobre o que sabe. Se a faixa for estreita (ex: 85% a 90%), ela está muito confiante.

5. Por que isso é importante?

  • Para Ambiguidade: Se você pergunta algo confuso, a IA não vai mentir dizendo que tem certeza. Ela vai mostrar uma faixa larga, avisando: "Ei, essa pergunta tem vários significados, cuidado!"
  • Para Aprendizado: Se você der mais exemplos à IA (como em um teste), ela consegue "afinar" sua faixa de certeza, mostrando que está aprendendo.
  • Para Decisões: Se você é um médico ou um juiz usando IA, é melhor saber que a IA está "entre 40% e 60% de certeza" do que ela dizer "80% de certeza" e estar errada. Isso evita acidentes.

Resumo em uma frase

Este trabalho ensina as IAs a serem mais honestas: em vez de fingir que sabem tudo com um número exato, elas agora podem dizer "Estou entre 'talvez' e 'provável', e aqui está o motivo da minha dúvida", o que as torna muito mais confiáveis para tomar decisões importantes.