COMI: Coarse-to-fine Context Compression via Marginal Information Gain

O artigo propõe o COMI, um framework de compressão de contexto adaptativo de coarse-to-fine que utiliza a Métrica de Ganho de Informação Marginal (MIG) para otimizar a relevância semântica e a diversidade, superando significativamente os métodos existentes em tarefas de longo contexto ao reduzir drasticamente a redundância sem perda de informação crítica.

Jiwei Tang, Shilei Liu, Zhicheng Zhang, Yujin Yuan, Libin Zheng, Wenbo Su, Bo Zheng

Publicado 2026-03-09
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um livro gigante, cheio de milhares de páginas, e precisa responder a uma pergunta específica sobre ele. Se você tentar ler o livro inteiro de uma vez só, seu cérebro (ou o computador que está lendo) vai ficar sobrecarregado, lento e, pior, pode se perder nos detalhes e esquecer o que realmente importa.

Isso é o que acontece com os Modelos de Linguagem Grandes (LLMs), como o ChatGPT ou o Qwen, quando tentam processar textos muito longos. Eles gastam muita energia e, muitas vezes, ficam confusos com informações repetidas.

O artigo que você enviou apresenta uma solução inteligente chamada COMI. Vamos explicar como ele funciona usando uma analogia simples: A Preparação de um Banquete para um Visitante Específico.

O Problema: O Banquete Desnecessário

Imagine que um convidado (a pergunta ou query) chega à sua casa querendo saber apenas a receita do bolo de chocolate.

  • O jeito antigo (sem compressão): Você serve a mesa inteira do supermercado: temperos, frutas, carnes, peixes e, claro, os ingredientes do bolo. O convidado tem que vasculhar tudo para achar o que precisa. É lento e cansativo.
  • O jeito "inteligente" mas imperfeito (métodos anteriores): Você olha para a pergunta e seleciona apenas os ingredientes que parecem ter a ver com "bolo". O problema? Você pode pegar cinco tipos diferentes de farinha, três tipos de cacau e quatro receitas de bolo. Tudo é relevante, mas é redundante (repetitivo). O convidado ainda fica sobrecarregado com tanta coisa parecida.

A Solução: O COMI (O Chef Inteligente)

O COMI é como um Chef de Cozinha superinteligente que usa uma nova regra chamada Ganho de Informação Marginal (MIG).

A regra do Chef é: "O que é útil para o convidado E o que é único (não repetitivo)?"

O COMI faz isso em duas etapas, como se fosse uma peneira de dois tamanhos:

1. A Peneira Grossa (Realocação de Grupos)

Primeiro, o Chef divide o livro gigante em vários capítulos (grupos).

  • Ele olha para cada capítulo e pergunta: "Quanto isso ajuda a responder a pergunta do convidado?" e "Quanto isso se repete do que já li nos outros capítulos?"
  • A mágica: Se um capítulo tem muita informação nova e útil, o Chef dá a ele mais espaço na mesa (menos compressão). Se um capítulo é chato ou só repete o que já foi dito, ele joga fora a maior parte dele (alta compressão).
  • Analogia: É como decidir que o capítulo sobre "Farinha" merece 10 páginas de resumo, mas o capítulo sobre "História do Trigo" (que não ajuda no bolo) merece apenas 1 linha.

2. A Peneira Fina (Fusão de Palavras)

Agora, dentro de cada capítulo que o Chef decidiu manter, ele precisa resumir ainda mais.

  • Ele olha para cada palavra ou frase. Se duas palavras dizem a mesma coisa (ex: "delicioso" e "saboroso"), ele não guarda as duas. Ele as funde em uma única representação que captura o melhor dos dois, mas sem a repetição.
  • Analogia: Em vez de escrever "O bolo é delicioso, o bolo é saboroso, o bolo é gostoso", ele escreve apenas "O bolo é incrível". Ele mantém o significado, mas elimina o ruído.

Por que isso é tão bom?

O grande segredo do COMI é que ele não olha apenas para o que é relevante (tem a ver com a pergunta), mas também para o que é diverso (não é repetitivo).

  • Outros métodos diziam: "Guarde tudo que tem a ver com bolo". Resultado: Você guarda 50 receitas de bolo iguais.
  • O COMI diz: "Guarde a receita do bolo, mas se já tenho uma, não guarde a segunda que é igual. Guarde a que tem um ingrediente especial diferente."

Os Resultados na Vida Real

Os autores testaram isso em perguntas difíceis e em textos enormes (como romances inteiros).

  • Eles conseguiram reduzir o texto em 32 vezes (de um livro de 320 páginas para 10 páginas) e o computador ainda respondeu melhor do que se tivesse lido o livro inteiro ou usado outros métodos de resumo.
  • Em testes de perguntas e respostas, o COMI melhorou a precisão em cerca de 25 pontos comparado aos melhores concorrentes.

Resumo Final

O COMI é como um assistente pessoal que, antes de te entregar um relatório gigante, lê tudo, identifica o que é verdadeiramente importante para o seu problema, descarta o que é repetitivo e entrega apenas o "suco" da informação.

Isso faz com que os computadores:

  1. Pensem mais rápido (gastam menos energia).
  2. Cometam menos erros (não se confundem com informações repetidas).
  3. Respondam melhor (focam no que realmente importa).

É como transformar uma pilha de jornais bagunçados em um único bilhete claro e direto que responde exatamente à sua dúvida.