SphOR: A Representation Learning Perspective on Open-set Recognition for Identifying Unknown Classes in Deep Learning Models

O artigo propõe o SpHOR, uma abordagem de aprendizado de representação supervisionada que, ao empregar embeddings de rótulos ortogonais, restrições esféricas e técnicas de regularização como Mixup e Label Smoothing, melhora significativamente a separabilidade angular e de norma para alcançar resultados de ponta na Reconhecimento de Conjunto Aberto (OSR).

Nadarasar Bahavan, Sachith Seneviratne, Saman Halgamuge

Publicado 2026-02-24
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está treinando um guarda de segurança (uma Inteligência Artificial) para reconhecer apenas cinco tipos específicos de frutas: maçãs, bananas, laranjas, uvas e peras. Você mostra milhares de fotos dessas frutas para o guarda durante o treinamento.

O problema surge quando alguém traz uma laranja-do-mar (uma fruta que o guarda nunca viu) ou um tomate (que parece uma laranja, mas é outra coisa).

  • O problema atual: A maioria dos sistemas de IA atuais é como um guarda teimoso. Se ele não consegue identificar a fruta como uma das cinco que ele conhece, ele adivinha qual é a mais parecida. Então, ele pode gritar: "É uma laranja!" para um tomate, cometendo um erro grave. Isso é perigoso em áreas como medicina (diagnosticar um tumor desconhecido como um conhecido) ou carros autônomos.
  • A solução do papel (SpHOR): Os autores criaram um novo método chamado SpHOR. Em vez de apenas treinar o guarda para "adivinhar", eles treinaram o guarda para entender o espaço onde as frutas vivem.

Aqui está a explicação do método usando analogias simples:

1. O Cenário: A Sala Redonda (O Espaço Esférico)

Normalmente, as IAs pensam em um espaço "infinito" e plano (como um papel de parede infinito). Nesses espaços, é difícil dizer se algo é "estranho" ou apenas "longe".

O SpHOR muda as regras: ele transforma essa sala em uma esfera gigante (como um globo terrestre).

  • A analogia: Imagine que todas as frutas conhecidas (maçã, banana, etc.) são cidades em um mapa-múndi. O SpHOR força essas cidades a ficarem bem distribuídas ao redor do globo, longe umas das outras.
  • O resultado: Se uma fruta nova (desconhecida) aparecer, ela não vai cair "em cima" de uma cidade conhecida. Ela vai cair no "oceano" (o espaço vazio entre as cidades). O guarda sabe imediatamente: "Isso não é uma cidade conhecida, é algo novo!"

2. Os Três Segredos do SpHOR

Para fazer essa "esfera" funcionar perfeitamente, o SpHOR usa três truques inteligentes:

A. O Truque da "Distância Obrigatória" (Embeddings Ortogonais)

Imagine que você tem que desenhar setas para cada fruta. O SpHOR diz: "As setas da maçã e da banana devem apontar para direções totalmente opostas ou completamente diferentes, nunca na mesma direção".

  • Por que isso ajuda? Isso impede que o sistema confunda frutas parecidas. Se a seta da "maçã vermelha" e a da "maçã verde" ficarem muito próximas, o sistema pode se confundir com um tomate. O SpHOR força uma separação clara, criando "bairros" distintos para cada tipo de fruta.

B. O Truque do "Globo Perfeito" (Distribuição von Mises-Fisher)

O sistema não deixa as frutas espalhadas aleatoriamente. Ele as organiza como se estivessem em um globo terrestre perfeito.

  • A analogia: Pense em como os países estão distribuídos na Terra. O SpHOR garante que os "países" das frutas conhecidas ocupem bem o globo, deixando grandes áreas de "oceano" (espaço vazio) para coisas desconhecidas. Se algo cai no oceano, o sistema sabe que é um "desconhecido".

C. O Truque da "Fusão de Frutas" (Mixup e Suavização)

Durante o treinamento, o SpHOR faz algo curioso: ele pega uma foto de uma maçã e uma de uma banana e as mistura digitalmente, criando uma "fruta meio maçã, meio banana".

  • Por que isso ajuda? Isso ensina o guarda a ser mais flexível. Ele aprende que, no meio do caminho entre duas frutas conhecidas, não existe uma fruta "oficial". Isso ajuda o sistema a entender que, se algo estiver no meio do caminho ou em um lugar estranho, provavelmente é algo novo e não deve ser forçado a ser uma das frutas conhecidas. Isso evita a "armadilha da familiaridade", onde o sistema insiste em classificar o novo como algo velho.

3. Como eles medem o sucesso?

Os autores criaram duas novas "réguas" para medir se o guarda está funcionando bem:

  1. Medida de Ângulo (Angular Separability): Quão longe estão as frutas conhecidas das desconhecidas em termos de direção? (Quanto mais longe, melhor).
  2. Medida de Tamanho (Norm Separability): As frutas desconhecidas têm um "tamanho" (intensidade) diferente das conhecidas? Se sim, é fácil separá-las.

O Resultado Final

Quando testaram esse novo guarda (SpHOR) em bancos de dados reais (como imagens de pássaros, carros e aviões), ele foi muito melhor do que os métodos antigos.

  • Ele conseguiu identificar frutas novas (classes desconhecidas) com muito mais precisão.
  • Ele não cometeu o erro de dizer "é uma maçã" para um tomate.
  • Funcionou bem mesmo quando o sistema não tinha sido treinado com milhões de fotos antes (o que economiza tempo e dinheiro).

Em resumo: O SpHOR é como um treinador de guarda que não apenas ensina as frutas, mas desenha um mapa mental perfeito onde cada fruta tem seu próprio "bairro" exclusivo, deixando grandes áreas vazias para que, quando algo novo aparecer, o sistema saiba imediatamente: "Isso não é do meu mapa. É um desconhecido!"

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →