What Are Adversaries Doing? Automating Tactics, Techniques, and Procedures Extraction: A Systematic Review

Este artigo apresenta uma revisão sistemática de 80 estudos que analisam o estado da arte na extração automatizada de táticas, técnicas e procedimentos (TTPs) de textos não estruturados, identificando a predominância de arquiteturas baseadas em transformadores, mas destacando limitações críticas como a falta de generalização entre domínios e a escassez de recursos reprodutíveis.

Mahzabin Tamanna, Shaswata Mitra, Md Erfan, Ahmed Ryan, Sudip Mittal, Laurie Williams, Md Rayhanur Rahman

Publicado 2026-04-07
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que o mundo da segurança cibernética é como uma grande biblioteca de detetives. Todos os dias, milhares de novos livros são escritos (os relatórios de ameaças), descrevendo como os "vilões" (hackers) estão tentando roubar segredos, invadir casas digitais ou espionar empresas.

O problema é que esses livros são escritos em uma linguagem complexa, bagunçada e mudam o tempo todo. Os detetives (especialistas em segurança) precisam ler tudo isso para entender o que os vilões estão fazendo, como estão fazendo e por que estão fazendo. Mas ler manualmente milhões de páginas é impossível, cansativo e propenso a erros.

É aqui que entra este artigo de pesquisa. Os autores fizeram uma "grande revisão" para ver como a ciência está tentando criar robôs inteligentes que leem esses livros e extraem automaticamente as informações importantes.

Aqui está a explicação simples, usando analogias:

1. O Que São TTPs? (A Receita do Crime)

Para entender o que os robôs estão procurando, precisamos entender o que é um TTP:

  • Tática (Tactics): É o "Porquê". É o objetivo do vilão. Exemplo: "Quero roubar dados" ou "Quero ficar escondido no sistema".
  • Técnica (Techniques): É o "Como". É o método usado. Exemplo: "Vou usar uma senha fraca" ou "Vou esconder meu rastro apagando os logs".
  • Procedimento (Procedures): São os passos exatos. É a receita detalhada. Exemplo: "Primeiro, instalei o programa X, depois rodei o comando Y".

Os pesquisadores usam um "livro de regras" famoso chamado MITRE ATT&CK (pense nele como um dicionário gigante de crimes) para classificar essas ações.

2. O Que a Pesquisa Descobriu? (O Mapa do Tesouro)

Os autores leram 80 estudos diferentes e organizaram o que os cientistas estão fazendo. Eles descobriram algumas tendências interessantes:

  • O Foco Principal: A maioria dos robôs está focada em identificar apenas as Técnicas (o "como"). É como se eles soubessem que o ladrão usou um pé-de-cabra, mas não soubessem se ele queria roubar joias ou apenas assustar o dono da casa.
  • A Evolução dos Robôs:
    • Antigamente: Eles usavam regras simples (como procurar palavras-chave específicas). Era como procurar por "dinheiro" em um texto. Funcionava, mas era limitado.
    • Hoje: Eles usam Inteligência Artificial Avançada (chamada de Transformers, como o BERT). Esses modelos são como estudantes que leram milhões de livros e entendem o contexto. Eles sabem que "o banco foi invadido" é diferente de "o banco de dados foi invadido".
    • O Futuro: Começaram a usar LLMs (Modelos de Linguagem Grandes, como o ChatGPT). Esses são os "gênios" que podem ler um relatório inteiro, entender a história e resumir o que o vilão fez, quase como um humano.

3. Os Problemas Atuais (Onde a Coisa Travou)

Apesar dos avanços, o artigo aponta que a tecnologia ainda não é perfeita. Aqui estão os principais gargalos, explicados de forma simples:

  • O Problema do "Livro Secreto": Muitos estudos usam dados que são secretos ou pagos (como relatórios de empresas privadas). É como se um professor de culinária ensinasse uma receita, mas dissesse: "Não posso mostrar os ingredientes, você tem que acreditar na minha palavra". Isso impede que outros cientistas verifiquem se o robô realmente funciona.
  • A Ilusão de Precisão: Muitos robôs são testados apenas em um tipo de texto (ex: apenas relatórios da empresa X). Quando você muda o texto para um blog ou um fórum da internet, o robô "trava". É como treinar um cachorro para buscar apenas uma bola vermelha; quando você joga uma azul, ele não sabe o que fazer.
  • Falta de Detalhes: A maioria dos estudos diz "nossa máquina acertou 90%". Mas não diz quais 10% ela errou ou por que errou. É como um aluno que tira 9 na prova, mas o professor não diz quais questões ele errou.

4. O Que Precisamos Fazer Agora? (O Caminho a Seguir)

Os autores sugerem algumas direções para melhorar essa "biblioteca de detetives":

  1. Compartilhar os Livros: Precisamos de mais dados públicos e abertos para que todos possam treinar e testar seus robôs.
  2. Pensar em Conjunto: Os robôs precisam entender que um relatório pode ter várias táticas e técnicas misturadas, não apenas uma.
  3. Entender o Contexto: Em vez de analisar frase por frase, os robôs precisam ler o relatório inteiro para entender a história completa do crime.
  4. Testar no Mundo Real: Em vez de testar em laboratórios perfeitos, precisamos ver como esses robôs funcionam com o "barulho" e a confusão dos relatórios reais do dia a dia.

Resumo Final

Este artigo é um mapa para os cientistas. Ele diz: "Olhem, já construímos robôs inteligentes que leem relatórios de hackers e identificam como eles agem. Estamos usando tecnologias modernas, mas ainda estamos presos em testes pequenos e dados secretos. Para proteger o mundo de verdade, precisamos de robôs mais inteligentes, testes mais realistas e mais transparência para que todos possam ajudar a construir a defesa."

É um chamado para transformar a "caça ao vilão" de uma arte manual e difícil em uma ciência automatizada, precisa e acessível a todos.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →