RedSage: A Cybersecurity Generalist LLM

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「RedSage（レッドセージ）」**という名前の新しい人工知能（AI）について紹介しています。

簡単に言うと、**「サイバーセキュリティの専門家として、誰の助けも借りずに自分のパソコンで動かせる、賢い助手」**を作ったという話です。

以下に、難しい専門用語を避けて、身近な例え話を使って説明します。

1. なぜこの AI が必要なの？（問題点）

今のサイバーセキュリティの世界は、ハッカーの攻撃がすごく巧妙になっていて、守るのが大変です。でも、専門家（セキュリティアナリスト）が足りていません。

そこで、AI に頼ろうとする動きがありますが、これまでの AI には 2 つの大きな問題がありました。

問題 A（プライバシーのリスク）： 大手の AI 会社（クラウド型）を使うと、会社の秘密や機密データを外部に送ることになり、漏れる恐れがある。
問題 B（知識不足）： 無料で使える AI は、一般的なことは知っているけど、「ハッキングの手法」や「セキュリティツールの使い方」といった専門的なことには弱くて、役に立たないことが多い。

2. RedSage の解決策（3 つのステップ）

研究者たちは、この 2 つの問題を解決するために、AI を「育てる」ために 3 つの特別なステップを踏みました。

ステップ 1：専門書の山を読み込ませる（継続的学習）

まず、AI に**「サイバーセキュリティ専門の図書館」**を作りました。

何をした？ インターネットから 118 億語（11.8B トークン）ものセキュリティ関連の文章を集め、AI に読ませました。
例え話： 普通の AI が「小学生の教科書」しか読まなかったのに対し、RedSage は「大学レベルの専門書」や「ハッカーの日記」を大量に読み込ませたので、専門用語や攻撃手法を深く理解できるようになりました。
工夫： 専門知識を入れすぎると、普通の会話ができなくなる（忘れる）ので、一般教養の文章も混ぜてバランスを保ちました。

ステップ 2：AI 同士の「模擬訓練」で練習させる（エージェント増強）

ただ本を読むだけでは、実際に会話したり指示に従ったりする力がつきません。そこで、**「AI 同士でロールプレイ（役柄ごっこ）」**をさせました。

何をした？ 専門家が書いた資料（シードデータ）を元に、別の AI が「攻撃者役」と「防御者役」になって、何千回も対話を作り出しました。
例え話： 料理のレシピ（資料）をただ読むだけでなく、「料理人（AI）」と「見習い（AI）」が厨房で何度も練習し、失敗談やコツを会話形式で記録したノートを作ったようなものです。これにより、26 万もの「実践的な会話データ」が生まれました。

ステップ 3：試験を作って実力を測る（RedSage-Bench）

本当に強くなったか確認するために、独自の試験問題（ベンチマーク）を作りました。

内容： 単に知識を問うだけでなく、「ツール（Kali Linux など）の使い方を説明できるか」「実際の攻撃シナリオを分析できるか」といった、**「知識」「スキル」「ツールの操作」**の 3 つを総合的にテストします。
結果： 3 万問の選択問題と、240 問の自由回答問題で、RedSage は他の AI よりもはるかに高い点数を取りました。

3. RedSage のすごいところ

プライバシーが守れる： 大きなクラウドサーバーを使わず、個人のパソコン（一般的なグラフィックボード）でも動かせるサイズ（80 億パラメータ）に作られています。だから、会社の機密データを外部に送らずに、社内で安全に使えます。
賢い： 専門的なセキュリティの質問だけでなく、一般的な質問や指示に従う力も、他の AI よりも優れています。
オープンソース： 作ったデータ、コード、モデルをすべて公開しています。誰でも自由に使って、さらに改良できます。

4. まとめ

この研究は、**「セキュリティの専門家がいなくても、自分の PC で動かせる、信頼できる AI 助手」**を作ったという画期的な成果です。

従来の AI： 外部の先生に聞けばいいけど、秘密は漏れるし、専門知識は浅い。
RedSage： 自分たちの部屋（ローカル環境）で、専門書を読み込み、模擬訓練を積んだ「最強の助手」が常駐している。

これにより、セキュリティの専門家不足を補いながら、機密情報を守ったまま、高度な防御活動が可能になることが期待されています。

RedSage: A Cybersecurity Generalist LLM

1. なぜこの AI が必要なの？（問題点）

2. RedSage の解決策（3 つのステップ）

ステップ 1：専門書の山を読み込ませる（継続的学習）

ステップ 2：AI 同士の「模擬訓練」で練習させる（エージェント増強）

ステップ 3：試験を作って実力を測る（RedSage-Bench）

3. RedSage のすごいところ

4. まとめ

RedSage: サイバーセキュリティ専門の汎用 LLM に関する技術的サマリー

1. 背景と問題定義

2. 提案手法：RedSage の構築パイプライン

2.1 継続的事前学習（Continual Pretraining）

2.2 自律的データ拡張（Agentic Data Augmentation）

2.3 評価ベンチマーク：RedSage-Bench

2.4 学習プロセス

3. 主要な結果

4. 意義と貢献

結論

RedSage: A Cybersecurity Generalist LLM

1. なぜこの AI が必要なの？（問題点）

2. RedSage の解決策（3 つのステップ）

ステップ 1：専門書の山を読み込ませる（継続的学習）

ステップ 2：AI 同士の「模擬訓練」で練習させる（エージェント増強）

ステップ 3：試験を作って実力を測る（RedSage-Bench）

3. RedSage のすごいところ

4. まとめ

RedSage: サイバーセキュリティ専門の汎用 LLM に関する技術的サマリー

1. 背景と問題定義

2. 提案手法：RedSage の構築パイプライン

2.1 継続的事前学習（Continual Pretraining）

2.2 自律的データ拡張（Agentic Data Augmentation）

2.3 評価ベンチマーク：RedSage-Bench

2.4 学習プロセス

3. 主要な結果

4. 意義と貢献

結論

関連論文

One Language, Two Scripts: Probing Script-Invariance in LLM Concept Representations

MultiGraSCCo: A Multilingual Anonymization Benchmark with Annotations of Personal Identifiers

ConFu: Contemplate the Future for Better Speculative Sampling

SciTaRC: Benchmarking QA on Scientific Tabular Data that Requires Language Reasoning and Complex Computation

Automated Thematic Analysis for Clinical Qualitative Data: Iterative Codebook Refinement with Full Provenance