Neurosymbolic Learning for Advanced Persistent Threat Detection under Extreme Class Imbalance

Este artigo propõe uma arquitetura neurosimbólica que integra um modelo BERT otimizado com redes de tensores lógicos para detectar ameaças persistentes avançadas em redes IoT, superando os desafios de desequilíbrio extremo de classes e falta de explicabilidade, alcançando alta precisão e interpretabilidade no conjunto de dados SCVIC-APT2021.

Quhura Fathima, Neda Moghim, Mostafa Taghizade Firouzjaee, Christo K. Thomas, Ross Gore, Walid Saad

Publicado 2026-03-03
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é o segurança de um prédio gigante e moderno, cheio de dispositivos inteligentes (como lâmpadas, câmeras e sensores) que formam uma "Cidade Inteligente". O problema é que os ladrões (os hackers) não batem na porta; eles se disfarçam de moradores, entram devagarinho, exploram cantos escuros e roubam coisas sem fazer barulho. Esses são os APTs (Ameaças Persistentes Avançadas).

Aqui está a explicação do que os autores desse artigo fizeram, usando analogias do dia a dia:

1. O Grande Desafio: A Agulha no Palheiro

O maior problema para o segurança (o sistema de detecção) é que 98% das pessoas que passam pelo portão são inocentes. Apenas 2% são ladrões.

  • O problema antigo: Se você treina um guarda apenas para acertar "quem é quem", ele vai ficar preguiçoso e dizer "todo mundo é inocente". Assim, ele acerta 98% das vezes (porque a maioria é inocente), mas perde 100% dos ladrões.
  • A solução: O sistema precisa ser super esperto para encontrar essas 2% de ladrões sem gritar "ALERTA!" toda vez que um morador inocente passa.

2. A Solução Mágica: O "Detetive Híbrido" (Neurosymbolic)

Os autores criaram um sistema chamado Neurosymbolic. Pense nele como uma dupla de detetives trabalhando juntos:

  • O Detetive Intuitivo (BERT - A Parte Neural):
    Imagine um detetive que leu milhões de livros e tem uma intuição incrível. Ele olha para a multidão e, sem pensar muito, sente que "algo está estranho" naquele grupo. Ele é ótimo em ver padrões complexos e sutis, mas às vezes não consegue explicar por que achou suspeito. Ele é como um gênio que sabe a resposta, mas não sabe explicar a matemática.
  • O Detetive Lógico (LTN - A Parte Simbólica):
    Imagine um segundo detetive que é um advogado rigoroso. Ele não confia em "intuição". Ele exige regras claras: "Se a pessoa carregar uma mala muito pesada E estiver olhando para as janelas traseiras, então é suspeito". Ele é lento, mas consegue explicar exatamente o motivo da suspeita.

A Mágica: Eles treinam os dois juntos. O Intuitivo aponta o suspeito, e o Lógico verifica se as regras batem. Juntos, eles são rápidos como o Intuitivo e explicáveis como o Lógico.

3. Como eles lidam com a falta de ladrões (Imbalança de Classe)

Como há tão poucos ladrões nos dados, o sistema usa uma estratégia de dois andares:

  • Andar 1 (O Portão Principal): Um sistema leve e rápido que só responde: "É inocente ou é um ladrão?". Ele ignora os detalhes. Se disser "Inocente", o caso é arquivado. Se disser "Ladrão", vai para o próximo andar. Isso evita que o sistema se confunda com a enorme quantidade de gente boa.
  • Andar 2 (A Sala de Interrogatório): Só entra aqui quem o Portão Principal já marcou como suspeito. Aqui, um sistema mais complexo tenta descobrir qual tipo de ladrão é: "É o que está apenas espiando?", "É o que está roubando dados?", "É o que está se escondendo?".

Isso é como ter um guarda que só deixa entrar na sala de interrogatório quem já foi flagrado, economizando tempo e energia.

4. O Resultado: Precisão e Transparência

O sistema foi testado em dados reais e os resultados foram impressionantes:

  • Precisão: Ele conseguiu identificar 95% dos ataques reais.
  • Falsos Alarmes: Ele quase nunca gritou "ladrão" quando era um morador inocente (apenas 0,14% de erro). Isso é crucial para não cansar os segurança reais.
  • Explicabilidade: Diferente de outros sistemas que são "caixas pretas" (você vê o resultado, mas não sabe o porquê), este sistema consegue dizer: "Suspeitei porque o dispositivo enviou muitos dados para um lugar estranho à noite".

Resumo em uma frase

Os autores criaram um "sistema de segurança inteligente" que combina a intuição de uma IA moderna com a lógica de regras claras, conseguindo achar os hackers raros e perigosos em meio a milhões de usuários normais, sem dar falsos alarmes e explicando exatamente por que suspeitou de cada um.

Isso é essencial para que, no futuro, possamos ter cidades e indústrias inteiras protegidas por robôs que não apenas detectam crimes, mas que os humanos conseguem entender e confiar.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →