ConCISE: A Reference-Free Conciseness Evaluation Metric for LLM-Generated Answers

O artigo apresenta o ConCISE, uma nova métrica sem referência para avaliar a concisão de respostas geradas por modelos de linguagem, que quantifica conteúdo não essencial através da média de três métodos de compressão sem depender de anotações humanas ou referências padrão.

Seyed Mohssen Ghafari, Ronny Kol, Juan C. Quiroz, Nella Luan, Monika Patial, Chanaka Rupasinghe, Herman Wandabwa, Luiz Pizzato

Publicado 2026-03-13
📖 3 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você pediu a um assistente de IA para explicar como fazer um bolo. Um bom assistente daria a receita direta: "Misture farinha, ovos e açúcar, e asse por 30 minutos". Mas, infelizmente, muitos assistentes de IA modernos tendem a ser "tagarelas". Eles começam a contar a história da farinha, explicar a química dos ovos, dar dicas de como escolher o açúcar e terminar com um poema sobre o cheiro do bolo. O resultado? Você recebe a resposta certa, mas tem que ler 10 páginas para achar os 3 passos importantes. Isso cansa, confunde e ainda custa mais caro (já que muitas IAs cobram por cada palavra que geram).

Foi para resolver esse problema que os autores deste artigo criaram o ConCISE.

O que é o ConCISE?

Pense no ConCISE como um "Detector de Encheção de Linguagem" automático. É uma ferramenta que analisa a resposta de uma IA e diz: "Ei, essa resposta está muito gorda! Tem muita gordura (informação inútil) e pouca carne (informação útil)".

O grande diferencial é que ele não precisa de um "gabarito" ou de um professor humano para corrigir. Ele é autossuficiente.

Como ele funciona? (A Analogia da Cozinha)

Para medir se uma resposta é concisa, o ConCISE usa três truques de "cozinha" mental, todos feitos por outra IA:

  1. O Resumo de Chef (Resumo Abstrativo): A IA tenta reescrever a resposta original com suas próprias palavras, como se fosse um chef resumindo a receita para um amigo. Se a resposta original era um livro de 50 páginas e o resumo do chef é de 2 páginas, a diferença mostra o quanto de "encheção" existia.
  2. O Cortador de Gordura (Resumo Extrativo): A IA pega a resposta original e apenas "corta" as partes que não são essenciais, mantendo apenas as frases mais importantes, como se alguém estivesse tirando o excesso de gordura de um bife.
  3. O Podador de Jardim (Remoção de Palavras): A IA tenta remover o máximo possível de palavras da resposta original sem mudar o significado. É como podar um arbusto: você corta os galhos secos e folhas mortas para que a planta (a resposta) fique bonita e funcional.

O ConCISE pega a média desses três testes. Quanto mais palavras a IA consegue remover ou resumir sem perder o sentido, maior a pontuação de "concisão" e menor a pontuação de "gordura".

Por que isso é importante?

  • Economia: Em muitas empresas, usar IA custa dinheiro por palavra gerada. Respostas curtas e diretas economizam dinheiro.
  • Clareza: Ninguém gosta de ler um texto longo para achar uma informação simples.
  • Satisfação: Um assistente que vai direto ao ponto é mais útil e agradável de usar.

O Resultado

Os autores testaram essa ferramenta com milhares de perguntas e respostas. Eles compararam a pontuação do ConCISE com a opinião de pessoas reais (humanos).

  • O ConCISE acertou em cheio: Ele conseguiu identificar quais respostas eram curtas e diretas quase tão bem quanto um humano.
  • Os métodos antigos falharam: Outras ferramentas que tentavam apenas dar uma nota de 0 a 10 para a IA muitas vezes se confundiam, achando que respostas longas eram melhores (o que é um viés comum em IAs).

Conclusão

O ConCISE é como um "filtro de ruído" inteligente. Ele ajuda a garantir que, quando você pedir algo a uma IA, a resposta seja como um bom e-mail: curto, direto ao ponto e sem enrolação, economizando seu tempo e dinheiro, sem precisar de um humano para revisar tudo manualmente. É um passo importante para tornar as conversas com máquinas mais naturais e eficientes.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →