A Two-Stage Architecture for NDA Analysis: LLM-based Segmentation and Transformer-based Clause Classification

この論文は、LLM(LLaMA-3.1-8B-Instruct)を用いた契約書セグメンテーションと、微調整された Legal-Roberta-Large を用いた条項分類という 2 段階のアーキテクチャを提案し、NDA 文書の自動分析において高い精度を達成したことを示しています。

Ana Begnini, Matheus Vicente, Leonardo Souza

公開日 2026-03-12
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「複雑で読みにくい秘密保持契約書(NDA)を、AI が自動的に読み解き、整理してくれる仕組み」**について説明しています。

法律の専門家でも、契約書の形や書き方が会社によってバラバラだと、一つ一つ手作業で読むのは大変で、ミスも起きやすいものです。この研究では、それを**「2 つの工程」**に分けて、AI に任せる方法を提案しています。

まるで**「優秀な翻訳者(セグメンター)」「熟練の分類係(クラシファイヤー)」**のチームが働いているようなイメージです。


🏗️ 仕組みの全体像:2 段階のチームワーク

このシステムは、大きく分けて 2 つの役割を持つ AI が連携して動きます。

  1. 第 1 段階:文章を「塊(かたまり)」に切り分ける(セグメンター)

    • 役割: 何百ページもある長い契約書全体を受け取り、「ここからここまでは『秘密情報の定義』の話だ」「ここからは『違反した時の罰則』だ」というように、意味のまとまりごとにパキパキと切り分ける仕事です。
    • 使われている AI: 「LLaMA-3.1-8B」という、非常に頭が良く、長い文章も理解できる AI です。
    • アナロジー: これは、**「長くて複雑な料理のレシピ本」を、AI が「前菜」「メイン」「デザート」**という料理ごとに、きれいにページを切り離してくれるようなものです。元の形がバラバラでも、AI が「あ、これは料理 A の手順だ」と見分けてくれます。
  2. 第 2 段階:切り分けた塊に「ラベル」を貼る(クラシファイヤー)

    • 役割: 1 段階で切り分けられたそれぞれの塊(条項)を見て、「これは『秘密情報の定義』だ」「これは『契約期間』だ」と分類し、ラベルを貼る仕事です。
    • 使われている AI: 「Legal-Roberta」という、法律の専門用語に特化して訓練された AI です。
    • アナロジー: 切り分けられた料理の塊を、**「冷蔵庫の整理係」**が受け取ります。「これは野菜だ(ラベル:野菜)」「これは肉だ(ラベル:肉)」と、それぞれの棚に正しいラベルを貼り付けて、整理整頓するイメージです。

🧠 なぜこれがすごいのか?

1. 形がバラバラでも大丈夫!

契約書は、会社によって「1 列で書かれているもの」もあれば「2 列で書かれているもの」もあり、書き方も千差万別です。従来のルールベース(「〇〇という文字が見つかったらここから」という単純なルール)のシステムでは、形が変わるとすぐに失敗してしまいました。
しかし、このシステムは**「文脈(全体の意味)」**を理解する AI を使っているため、形が変わっても「あ、これは『秘密情報の定義』のセクションだな」と、人間のように意味を理解して切り分けられます。

2. 結果は驚くほど正確

  • 切り分け精度: 95% 以上の精度で、元の文章の内容を損なわずに切り分けられました。まるで**「コピー機でコピーしたかのように」**忠実に、かつきれいに分割されています。
  • 分類精度: 切り分けられた内容を分類する精度も、全体として 85% 程度と非常に高いレベルを達成しました。

3. 難しい点:「少数派」の分類

14 種類ある分類のうち、いくつかのタイプ(例えば「競業避止義務」など)は、契約書の中にあまり登場しません(データが少ない)。
これは、「教室で 1 人しかいない生徒(少数派)」と「100 人いる生徒(多数派)」を同時に教えるようなもので、AI が少数派のルールを覚えるのが少し苦手でした。それでも、全体の性能は非常に高く、実用レベルに達しています。


🚀 未来への展望

この研究は、単に「契約書を読む」だけでなく、**「契約書のチェックや修正まで」**を自動化するシステムの第一歩です。

  • 今の状態: AI が契約書を「切り分け」て、「何の条項か」を特定する。
  • 未来の目標: さらに進めて、AI が**「ここが法律違反のリスクがあるよ」「この表現は曖昧だから直したほうがいいよ」**と、弁護士のような視点でアドバイスまでできるようになることを目指しています。

📝 まとめ

この論文は、**「AI に『翻訳者』と『整理係』の役割をさせれば、複雑で面倒な秘密保持契約書のチェックが、人間の手作業よりも速く、正確に、そして疲れずにできるようになる」**と証明した素晴らしい研究です。

これにより、企業の法務担当者は、単純な読み込み作業から解放され、より重要な判断や交渉に集中できるようになるでしょう。