Handling Supervision Scarcity in Chest X-ray Classification: Long-Tailed and Zero-Shot Learning

Este artigo apresenta soluções específicas para o desafio CXR-LT 2026, abordando a escassez de supervisão em radiografias de tórax através de uma estratégia de aprendizado multi-rótulo equilibrada para classes raras e uma abordagem de reconhecimento zero-shot para doenças não vistas, alcançando o primeiro lugar no ranking público.

Ha-Hieu Pham, Hai-Dang Nguyen, Thanh-Huy Nguyen, Min Xu, Ulas Bagci, Trung-Nghia Le, Huy-Hieu Pham

Publicado 2026-02-24
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um médico especialista em raios-X de tórax. Seu trabalho é olhar para as imagens e dizer o que está errado: pneumonia, fraturas, tumores, etc. O problema é que, na vida real, algumas doenças são muito comuns (como um resfriado) e outras são extremamente raras (como uma doença genética específica). Além disso, às vezes você encontra algo que nunca viu antes e não tem um manual para isso.

Este artigo descreve como uma equipe de pesquisadores criou um "assistente de IA" inteligente para ajudar nessa tarefa, participando de uma competição chamada CXR-LT 2026. Eles ganharam o primeiro lugar em duas categorias difíceis.

Aqui está a explicação simples, usando analogias do dia a dia:

1. O Grande Desafio: A "Festa" Desequilibrada

Pense no conjunto de dados de raios-X como uma grande festa.

  • O Problema da "Cauda Longa" (Task 1): Na festa, 90% das pessoas estão dançando a mesma música popular (doenças comuns). Apenas 10% estão em um canto escuro tocando músicas de nicho (doenças raras). Se você treinar um DJ (a IA) apenas ouvindo a música popular, ele vai ignorar completamente as músicas raras.
  • O Problema do "Zero-Shot" (Task 2): Imagine que, de repente, alguém chega na festa com uma roupa que você nunca viu e pede para dançar uma música que você nunca ouviu. Como você sabe se é uma dança válida? Você não tem exemplos dessa dança para treinar.

2. A Solução para Doenças Comuns e Raras (Task 1)

Para resolver o problema da festa desequilibrada, a equipe criou uma estratégia de "Treinamento Inteligente":

  • Dar mais atenção aos "invisíveis": Eles ensinaram a IA a não ignorar as pessoas no canto escuro. Usaram uma técnica chamada Loss Distribution-Balanced. Imagine que, em vez de dar 1 ponto por cada pessoa que dança a música popular, você dá 100 pontos para cada pessoa que dança a música rara. Isso força a IA a prestar atenção nelas.
  • Ampliar a amostragem: Eles usaram um "sistema de repetição". Se uma imagem tem uma doença rara, a IA vê essa imagem várias vezes durante o treino, como se estivesse revisando o mesmo capítulo difícil de um livro várias vezes.
  • O "Chefe" da IA (Ensemble): No final, eles não usaram apenas uma IA, mas duas trabalhando juntas. É como ter dois médicos experientes olhando a mesma imagem e discutindo o diagnóstico antes de dar a resposta final.
  • O Filtro de "Normalidade": Eles adicionaram uma regra simples: "Se a IA tem 99% de certeza de que o paciente está saudável, ela deve reduzir drasticamente a chance de dizer que há algo errado". Isso evita que a IA invente doenças onde não existem (falsos positivos).

Resultado: A IA ficou excelente em identificar tanto as doenças comuns quanto as raras, ficando em 1º lugar na competição.

3. A Solução para Doenças Nunca Vistas (Task 2)

Para as doenças que a IA nunca viu (as 6 categorias "fora de distribuição"), eles não puderam usar exemplos de imagens. Então, eles usaram a Linguagem como Ponte.

  • O Tradutor Visual: Eles usaram uma IA especial chamada WhyXrayCLIP. Pense nela como um tradutor que aprendeu a conectar imagens de raios-X com palavras descritivas.
  • Como funciona: Em vez de mostrar à IA uma foto de uma doença chamada "Bulla" (uma bolha no pulmão) para ela aprender, eles apenas deram a ela o texto "Bulla" e a explicaram o que é.
  • O Teste de Similaridade: Quando chega uma nova imagem, a IA não procura por "fotos de Bulla". Ela pergunta: "Esta imagem se parece mais com a descrição 'Bulla' ou com a descrição 'Pneumonia'?" Ela compara a imagem com o texto e dá uma nota de similaridade.
  • O "Kit de Perguntas": Para ser mais preciso, eles criaram várias formas de descrever a mesma doença (como "bolha no pulmão", "espaço vazio", etc.) e pediram para a IA responder a todas essas perguntas ao mesmo tempo, tirando uma média.

Resultado: Mesmo sem nunca ter visto uma foto dessas doenças específicas, a IA conseguiu identificá-las apenas lendo as descrições, ficando novamente em 1º lugar.

Resumo Final

A equipe criou um sistema que:

  1. Não ignora o raro: Aprende a dar valor às doenças que aparecem pouco.
  2. Lê e entende: Usa o texto para reconhecer doenças que nunca viu antes, como se estivesse lendo um manual médico em tempo real.

Eles provaram que, com as técnicas certas, a inteligência artificial pode ser um parceiro muito mais justo e completo para os médicos, ajudando a diagnosticar desde o comum até o inédito.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →