Gradient based Severity Labeling for Biomarker Classification in OCT

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um médico oftalmologista tentando diagnosticar uma doença nos olhos chamada Retinopatia Diabética. Para isso, você usa fotos muito detalhadas do fundo do olho, chamadas de OCT (Tomografia de Coerência Óptica).

O problema é que essas fotos são complexas. Para ensinar um computador a identificar os sinais da doença (chamados de "biomarcadores"), você precisaria de milhares de fotos já marcadas por especialistas. Mas especialistas são caros e o tempo deles é limitado. Então, a maioria das fotos fica sem rótulo (sem saber se tem doença ou não).

Aqui entra a ideia genial deste artigo: como ensinar o computador a aprender sozinho, sem precisar de um professor para cada foto?

O Problema da "Fotografia Roubada"

Normalmente, para ensinar computadores com poucas fotos marcadas, usamos uma técnica chamada "Aprendizado Contrastivo". A ideia é mostrar duas fotos do mesmo objeto e dizer: "Olha, são iguais!".

No mundo comum (como fotos de gatos), você pode cortar a foto, mudar a cor ou borrá-la um pouco, e o computador ainda entende que é o mesmo gato. Mas no mundo médico, borrar a foto pode apagar o sintoma da doença! Se você borrar uma pequena mancha que indica a doença, o computador perde a pista importante. É como tentar encontrar uma agulha num palheiro e, em vez disso, você joga o palheiro inteiro no liquidificador.

A Solução: O "Termômetro de Gravidade"

Os autores do artigo tiveram uma ideia diferente. Em vez de tentar adivinhar se duas fotos são iguais por cortes e cores, eles perguntaram: "Quão doente é esta foto?"

Eles criaram um sistema que funciona como um termômetro de gravidade:

Aprendizado do "Saudável": Primeiro, eles ensinaram o computador a reconhecer como é um olho perfeitamente saudável, usando milhares de fotos de pessoas sem doença.
O Teste de Estresse (Gradientes): Depois, eles pegaram as fotos desconhecidas (sem rótulo) e as mostraram para o computador. O computador tentou "entender" a foto.
- Se a foto fosse de um olho saudável, o computador pensaria: "Ah, isso é fácil, já vi isso antes!" e não precisaria se esforçar muito.
- Se a foto tivesse uma doença, o computador ficaria confuso: "Ué, isso é estranho! Não se parece com o que aprendi." Ele precisaria se "estressar" (fazer grandes ajustes matemáticos) para entender o que está vendo.

Esse "estresse" do computador é chamado de gradiente. Quanto mais o computador precisa se esforçar para entender a foto, mais "anômala" (doente) ela é.

A Etiqueta de "Nível de Gravidade"

Com base nesse esforço, eles deram uma nota para cada foto, do "mais saudável" ao "mais doente".

Fotos com notas baixas = Olhos saudáveis.
Fotos com notas altas = Olhos doentes.

Em vez de dizer "tem doença" ou "não tem doença", eles criaram graus de gravidade. É como classificar a dor de um dente: "não dói", "dói um pouco", "dói muito".

O Treinamento Final

Agora, o computador usa essas notas de gravidade para estudar. Ele agrupa fotos que têm o mesmo "nível de dor" (mesma gravidade) e as separa das que têm níveis diferentes.

Ao fazer isso, ele aprende a reconhecer os padrões sutis da doença muito melhor do que se tentasse apenas adivinhar. Depois de estudar com essas "fotos de gravidade", eles mostram para ele algumas poucas fotos reais marcadas por médicos para refinar o diagnóstico.

O Resultado?

Foi como se o computador tivesse lido um livro de casos clínicos antes de ir para a faculdade.

Sem o método: O computador acerta cerca de 75% dos casos.
Com o método: O computador acerta até 81-84% dos casos, dependendo do tipo de lesão.

Resumo da Ópera

Imagine que você está aprendendo a identificar frutas estragadas.

Método antigo: Você pega uma maçã boa, corta um pedaço, muda a cor e diz "é a mesma maçã". O computador confunde a maçã com a fruta podre.
Método novo: Você pega uma maçã boa e uma maçã podre. Você pergunta ao computador: "Qual dessas exige mais esforço para você entender?". A podre exige mais esforço. Você usa esse "esforço" para criar uma escala de "quão podre" a fruta está. Assim, o computador aprende a reconhecer a podridão muito mais rápido, mesmo sem você ter que explicar cada detalhe de cada fruta.

Conclusão: Os autores criaram uma maneira inteligente de usar fotos sem rótulo, transformando a "dificuldade de entender a imagem" em uma ferramenta de aprendizado, melhorando drasticamente a detecção de doenças oculares.

Each language version is independently generated for its own context, not a direct translation.

Título: Rotulagem de Severidade Baseada em Gradientes para Classificação de Biomarcadores em OCT

1. Problema e Motivação

A Retinopatia Diabética (RD) é uma causa líder de cegueira irreversível. O diagnóstico e tratamento dependem da detecção precisa de biomarcadores em imagens de Tomografia de Coerência Óptica (OCT). Embora métodos de aprendizado profundo tenham avançado, eles enfrentam um gargalo crítico: a dependência de grandes conjuntos de dados rotulados, que são caros e difíceis de obter na área médica devido à necessidade de especialistas para anotação.

Para contornar isso, técnicas de Aprendizado Contrastivo (Self-Supervised Learning) têm sido usadas para aproveitar dados não rotulados. No entanto, a abordagem tradicional de aprendizado contrastivo (como SimCLR) gera "pares positivos" através de aumentações de imagem (ex: rotação, desfoque gaussiano). No contexto médico, essas aumentações arbitrárias podem distorcer ou ocultar regiões localizadas pequenas e críticas onde os biomarcadores residem, prejudicando a aprendizagem de representações significativas.

O artigo propõe que, em vez de aumentações artificiais, pares positivos devem ser selecionados com base na severidade da doença, pois amostras com níveis de severidade semelhantes compartilham características estruturais comuns da progressão da doença.

2. Metodologia

O trabalho propõe um framework de duas etapas que utiliza dados não rotulados para criar pseudo-rótulos de severidade, os quais são então usados para treinar um modelo supervisionado.

A. Geração de Pseudo-Rótulos de Severidade (Severity Labeling)

Modelo de Anomalia: Utiliza-se um conjunto de imagens OCT saudáveis (não afetadas) para treinar um Autoencoder através da metodologia GradCON. O objetivo é aprender a distribuição de imagens saudáveis.
Cálculo da Pontuação de Severidade (Severity Score - SS): Para cada imagem não rotulada, calcula-se uma pontuação baseada na resposta do gradiente do modelo. A fórmula utilizada é:
$SS = -L_{recon} + \alpha L_{grad}$
Onde:
- $L_{recon}$ é o erro quadrático médio entre a entrada e a reconstrução.
- $L_{grad}$ é a similaridade cosseno média entre os gradientes da imagem alvo e os gradientes de referência aprendidos das imagens saudáveis.
- $\alpha$ é um hiperparâmetro (0.03).
- Lógica: Amostras anômalas (doentes) exigem atualizações de gradiente mais drásticas para serem representadas em relação à distribuição saudável, resultando em pontuações de severidade mais altas.
Discretização (Binning): As pontuações de severidade são ordenadas e divididas em $N$ "bins" (intervalos). Imagens dentro do mesmo bin recebem o mesmo Rótulo de Severidade (SL). Isso transforma dados não rotulados em um conjunto de dados pseudo-rotulado com $N$ classes de severidade.

B. Aprendizado Contrastivo Supervisionado

Treinamento do Encoder: Um encoder (ResNet-18) é treinado usando uma Função de Perda Contrastiva Supervisionada (Supervised Contrastive Loss - SupCon).
- Imagens com o mesmo rótulo de severidade (SL) são tratadas como pares positivos (atraídas no espaço de embedding).
- Imagens com rótulos diferentes são tratadas como pares negativos (repelidas).
Ajuste Fino (Fine-tuning): Após o treinamento do encoder, uma camada linear é anexada e o modelo é ajustado (fine-tuned) usando o pequeno conjunto de dados com rótulos reais de biomarcadores para a tarefa final de classificação binária (presença ou ausência do biomarcador).

3. Contribuições Principais

Estratégia de Seleção de Pares Médica: Propõe abandonar aumentações arbitrárias em favor da seleção de pares baseada na severidade da doença, alinhando-se melhor com a progressão estrutural da patologia.
Método de Rotulagem via Gradiente: Introduz o uso de respostas de gradiente de um modelo de detecção de anomalias (GradCON) para gerar pseudo-rótulos de severidade sem necessidade de anotação humana.
Framework Híbrido: Demonstra como dados saudáveis abundantes e dados não rotulados podem ser usados para melhorar a representação de características, resultando em ganhos significativos na classificação de biomarcadores específicos.

4. Resultados Experimentais

O método foi testado em dois conjuntos de dados: imagens saudáveis (Kermany) e imagens com biomarcadores de Edema Macular Diabético (Prime + TREX DME). Foram avaliados 5 biomarcadores: IRF, DME, IRHRF, FAVF e PAVF.

Desempenho Geral: A abordagem proposta superou as bases de estado da arte de aprendizado auto-supervisionado (SimCLR, PCL, MoCo v2).
Métrica Multi-Rótulo (AUC Médio): O método alcançou um AUC médio de 0.774 (com 5000 bins), superando o SimCLR (0.754) e o MoCo v2 (0.769).
Desempenho por Biomarcador:
- Houve melhorias de até 6% em relação às bases de auto-supervisão para indicadores-chave.
- O número de bins ( $N$ $N$ ) influenciou o desempenho:
  - Biomarcadores mais distintos (como DME e IRF) beneficiaram-se de um número maior de bins (15.000 - 20.000), permitindo pares positivos mais homogêneos.
  - Biomarcadores mais difíceis de identificar (como PAVF) tiveram melhor desempenho com um número moderado de bins (10.000), sugerindo que uma certa diversidade nos pares positivos ajuda a distinguir a estrutura do biomarcador do fundo.
Ablação de Detectores de Anomalia: O método baseado em gradientes (SL) superou outras técnicas de detecção de anomalia (como MSP, ODIN e Mahalanobis) na geração de rótulos de severidade.

5. Significado e Conclusão

Este trabalho demonstra que a integração de dados não rotulados em tarefas médicas pode ser drasticamente melhorada ao alinhar a estratégia de aprendizado contrastivo com a lógica clínica (severidade da doença) em vez de transformações geométricas puras.

Ao definir a "severidade" como o grau de anomalia relativa à distribuição saudável, capturada através de gradientes de atualização do modelo, os autores conseguiram criar clusters semanticamente interpretáveis. Isso permite que o modelo aprenda um espaço de representação mais robusto, superando métodos auto-supervisionados tradicionais e reduzindo a dependência de anotações caras de especialistas, um avanço crucial para a aplicação prática de IA em oftalmologia.