What Are Adversaries Doing? Automating Tactics, Techniques, and Procedures Extraction: A Systematic Review

本論文は、構造化されていないテキストから攻撃の戦術・技術・手順(TTP)を自動的に抽出する研究分野の現状を、80 件の論文を体系的に分析することで概観し、技術分類が主流である一方で評価の限界や再現性の課題など、今後の発展に向けた重要な課題を浮き彫りにしています。

Mahzabin Tamanna, Shaswata Mitra, Md Erfan, Ahmed Ryan, Sudip Mittal, Laurie Williams, Md Rayhanur Rahman

公開日 2026-04-07
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「サイバー犯罪者が今、何をしているのか?その手口を AI に自動で読み解かせるにはどうすればいいか?」**というテーマを、80 件の研究を徹底的に分析してまとめた「研究の総まとめ」です。

まるで、「泥棒の行動パターン(TTPs:手口・技・手順)」を辞書に載せるための、AI 開発者のための大図鑑を作ろうとしたようなものです。

以下に、難しい専門用語を避け、身近な例え話を使って解説します。


🕵️‍♂️ 1. 背景:なぜこんな研究が必要なの?

サイバー攻撃は増え続けています。セキュリティの専門家たちは、毎日膨大な量の「脅威レポート(犯罪者の手記のようなもの)」を読まなければなりません。
しかし、人間が全部読んで「あ、これは『鍵をこじ開ける技』を使っているな」と分類するのは、**「図書館の司書が、毎日何万冊も来る本を、手作業で全て分類しようとしている」**ようなもので、とても大変でミスも起こりやすいです。

そこで、**「AI に読ませて、自動的に『鍵こじ開け技』とか『パスワード盗み技』を見つけさせよう!」**という研究が盛んに行われています。

🔍 2. この論文がやったこと

著者たちは、過去 10 年間の「AI で手口を自動抽出する」研究 80 件をすべて集めて、**「どんな方法が使われていて、何がうまくいって、何がダメだったのか」**を整理しました。

まるで、**「料理のレシピ本 80 冊を集めて、どの料理が人気で、どの材料が不足しているかを分析する」**ような作業です。

📊 3. 発見された 3 つの大きなトレンド(料理の例えで)

① 「技(Technique)」を見つけるのがメイン

研究の多くは、**「具体的な技(例:『パスワードを総当たりで試す』)」**を見つけることに集中しています。

  • 例え: 「泥棒が『窓から入った』か『鍵をこじ開けた』か」を特定することに熱心ですが、「泥棒が『なぜ入ったのか(金庫を狙った)』」や「『どうやって部屋を抜け出したか』」まで詳しく分析する研究は少ないです。

② AI の進化:「辞書」から「天才」へ

  • 昔: 単純な「キーワード検索」や「ルールブック」を使っていました。(例:「『パスワード』という文字があれば、それは技だ!」)
  • 最近: Transformer(BERT など) という、文脈を理解できる AI が使われるようになりました。(例:「『パスワード』という言葉がなくても、文脈から『総当たり攻撃』だと推測できる」)
  • 最新: LLM(大規模言語モデル) を使った研究も出てきました。これは、**「AI に『泥棒の手記を読んで、手口をまとめて』と指示する」**ような高度なものです。

③ データの「偏り」と「秘密」

  • 偏り: 多くの研究が、**「特定の企業のレポート」「人工的に作ったデータ」**だけでテストしています。まるで、「練習用のおもちゃの泥棒」だけで訓練した AI が、本物の泥棒に強いかどうかはわからない状態です。
  • 秘密: 多くの研究で、**「使ったデータやコードを公開していない」という問題があります。これは、「料理のレシピ本に『味付けは秘密』と書いてある」**ようなもので、他の人がその味を再現したり、改良したりできません。

⚠️ 4. 今の課題(「ここがダメ!」という点)

  1. 現実離れしたテスト: 多くの AI は、きれいに整理されたデータでしかテストされていません。現実のレポートは messy(ごちゃごちゃ)で、AI が混乱しやすいのです。
  2. 再現性の欠如: 「この AI はすごい!」と言っていますが、**「どうやって作ったか(コードやデータ)」**が公開されていないため、他の人が「本当にすごいのか?」と確認できません。
  3. 文脈の無視: 文書全体の流れ(「まず A をして、次に B をして…」)を理解せず、バラバラの文で判断しようとしているため、複雑な攻撃を見逃すことがあります。

🚀 5. 未来への提案(「こうすれば良くなる!」)

著者たちは、今後の研究に以下のことを提案しています。

  • もっとリアルなデータ: 実際のセキュリティ担当者が使っている、ごちゃごちゃしたレポートを AI に学習させる。
  • 公開と共有: 作ったデータやコードをみんなで見られるようにして、みんなで改良する(レシピを公開する)。
  • 文脈を理解する: 文書全体を読んで、「泥棒のストーリー」を理解できる AI を作る。
  • 複雑な手口に対応: 一つのレポートに複数の手口が混ざっている場合でも、すべて見つけられるようにする。

💡 まとめ

この論文は、「AI にサイバー犯罪の手口を教える研究」は、すでに「辞書で検索するレベル」から「文脈を理解する天才レベル」に進化したが、まだ「練習用のおもちゃ」でしかテストしていないと指摘しています。

今後は、**「もっとリアルな現場のデータ」を使い、「結果をみんなで共有」**しながら、実際に役立つセキュリティの味方を育てていこう、というメッセージです。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →