NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

NOTAI.AI は、曲率やスタイル特徴などの 17 の解釈可能な特徴量を XGBoost で統合し、SHAP と LLM を用いて自然言語による説明を生成する、機械生成テキストの検出およびその根拠提示を可能にする説明可能なフレームワークです。

Oleksandr Marchenko Breneur, Adelaide Danilov, Aria Nourbakhsh, Salima Lamsiyah

公開日 2026-03-09
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ NOTAI.AI:AI が書いた文章を見抜く「魔法の探偵」

この論文は、**「NOTAI.AI」**という新しいシステムについて紹介しています。これは、人間が書いた文章と、AI(人工知能)が書いた文章を見分けるための「探偵」のようなツールです。

でも、ただ「AI だ!」と告げるだけでなく、「なぜそう判断したのか?」を、誰でもわかる言葉で説明してくれるのが最大の特徴です。

以下に、難しい専門用語を使わず、日常の例え話で解説します。


1. 従来の「探偵」と何が違うの?

これまでの AI 検知ツールは、まるで**「黒い服を着た犯人を捕まえる警察官」**のようでした。
「これは AI です!」と結果だけ教えてくれますが、「なぜそう思ったのか?」は「計算の結果だから」としか言いません。一般の人には「えっ、なんで?」と納得できません。

NOTAI.AIは、**「証拠を並べて説明する名探偵」**です。
「この文章は、AI が書くような『滑らかすぎる』言葉遣いをしていて、人間ならもっと『少し不規則』な表現をするはずだから、AI だと判断しました」と、理由を詳しく教えてくれます。

2. 名探偵の「3 つの武器」

このシステムは、単一の視点ではなく、3 つの異なる角度から文章を分析します。まるで探偵が「指紋」「足跡」「服装」の 3 つの証拠を照らし合わせるように、これらを組み合わせて判断します。

① 曲線の魔法(Curvature)

  • どんなもの? 文章の「滑らかさ」を数値で測る技術です。
  • 例え話:
    • AI の文章は、まるで**「整然と並んだ新幹線」**のよう。予測通りに、滑らかで、どこか人工的な美しさがあります。
    • 人間の文章は、**「川の流れ」**のよう。ところどころに石(意外な言葉)があったり、流れが乱れたりして、少し不規則です。
    • このシステムは、その「流れの曲がり具合」を測って、「人工的すぎる滑らかさ」を見つけ出します。

② 言葉の辞書(Stylometric Features)

  • どんなもの? 文章の「書き方」や「語彙の豊富さ」をチェックします。
  • 例え話:
    • AIは、同じような言葉を繰り返したり、文法が完璧すぎたりすることがあります(まるで**「完璧なコピー機」**)。
    • 人間は、同じ言葉を使わずに言い換えたり、文脈に合わせて文の長さを変えたりします(まるで**「生きた作家」**)。
    • このシステムは、「言葉の多様性」や「文の長さ」を測って、人間らしさをチェックします。

③ 脳の読み取り(Neural Signals)

  • どんなもの? 最新の AI 技術を使って、文章の「意味のつながり」を深く読み解きます。
  • 例え話:
    • これは**「プロの編集者」**のような役割です。表面的な言葉だけでなく、「この文脈でこの言葉は自然か?」を深く分析します。

3. 「なぜ AI だと判断したの?」を説明する仕組み

このシステムが最もすごいのは、**「SHAP(シャップ)」という技術と、「AI による説明」**を組み合わせている点です。

  1. 証拠の集計(SHAP):
    まず、上記の 3 つの武器(曲線、言葉、脳)が、どれくらい「AI だ」という判断に貢献したかを計算します。

    • 「曲線の滑らかさ」が 30% 貢献
    • 「言葉の繰り返し」が 20% 貢献
    • といった具合です。
  2. 人間らしい翻訳(LLM):
    しかし、数値だけ見ても一般人にはわかりません。そこで、**「もう一人の AI(説明役)」**に頼みます。

    • 「曲線の滑らかさが 30% 貢献」→ 「この文章は、AI が書くような『完璧すぎる』リズムで書かれています」
    • 「言葉の繰り返し」→ 「特定のフレーズが人間なら使わないほど繰り返されています」
    • このように、「専門的な数値」を「誰でもわかる日本語の理由」に変換して表示します。

4. 実際の使い方は?

このシステムは、**「対話型のウェブサイト」**として公開されています。

  • 入力: 気になる文章を貼り付けるだけ。
  • 結果: 「AI である可能性 96%」といった結果が表示されます。
  • 証拠: その下に、「なぜ AI だと判断したか」の理由が、3 つのポイントで書かれています。
  • 実験: 「もしこの部分(例えば文の長さ)を無視したらどうなる?」という実験もでき、ユーザーが自分で「もしも」を試すことができます。

🌟 まとめ:なぜこれが重要なの?

AI が書く文章は、人間と区別がつかないほど上手くなってきました。
NOTAI.AI は、単に「AI だ」と告げるだけでなく、「どこが怪しいのか」「どんな証拠があるのか」を透明に示すことで、教育者やジャーナリスト、一般の人々が、AI 生成コンテンツを正しく理解し、判断するのを助けます。

「ブラックボックス(中身が見えない箱)」だった AI 検知を、「ガラス張りの透明な箱」に変えたのが、この研究の大きな功績です。