SWE-Adept: An LLM-Based Agentic Framework for Deep Codebase Analysis and Structured Issue Resolution

本論文は、コード依存関係の選択的探索による問題箇所の特定と、進捗追跡および Git ベースのバージョン管理を備えた適応的計画による修正実装を行う 2 代理エージェントフレームワーク「SWE-Adept」を提案し、SWE-Bench ベンチマークにおいて既存手法を上回る問題解決率を達成したことを報告しています。

Kang He, Kaushik Roy

公開日 2026-03-03
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「SWE-Adept(ソフトウェア・エーデプト)」**という、人工知能(AI)がソフトウェアのバグ(不具合)を見つけて直すための新しい仕組みについて紹介しています。

従来の AI は、短いコードを書くのは得意ですが、何千ものファイルからなる巨大なプロジェクト(例:Twitter や Amazon のような大規模なシステム)の「どこに問題があるか」を見つけたり、複雑な修正を加えたりするのは苦手でした。

SWE-Adept は、この問題を解決するために、**「2 人の専門家のチーム」**として働くように設計されています。


🕵️‍♂️ 1. 問題の場所を探す「探偵(ローカライゼーション・エージェント)」

まず、巨大な図書館(コードベース)の中で、どこに「壊れた本」があるかを探す必要があります。

  • 従来の AI の問題点:
    従来の AI は、図書館のすべての本を一度に読み始めようとして、パンクしてしまったり、関係のない本まで読みすぎて「どこに問題があるか」を見失ったりしていました。
  • SWE-Adept のアプローチ(エージェント主導の深さ優先探索):
    SWE-Adept の「探偵」は、「必要な本だけ、必要な順番で」探すという戦略を使います。
    • アナロジー: 図書館の図書を検索する際、いきなりすべての本を棚から出すのではなく、「この本には『A』という章があり、その章には『B』という関連本がリンクされている」という**「本の目次とリンク」**を頼りに、問題に関連しそうな本だけを選んで深く掘り下げていきます。
    • 2 段階のフィルタリング:
      1. まず目次だけ見る: 本の中身(全テキスト)を読む前に、表紙と目次(コードの構造)だけを見て、「これっぽい」という候補を絞り込みます。
      2. 中身を詳しく読む: 絞り込んだ候補だけの中身を詳しく読み、本当にそこが原因かを確認します。
    • 効果: これにより、AI の記憶容量(コンテキスト)を無駄に使わず、正確に「バグの場所」を特定します。

🔧 2. 問題を直す「職人(リゾルーション・エージェント)」

場所が特定できたら、次は実際に修理をする番です。

  • 従来の AI の問題点:
    従来の AI は、ひたすら「考えて、直して、テストして、失敗したらまた直して…」を繰り返すのですが、**「どこまで直したか」「失敗した修正をどう元に戻すか」**の管理が雑でした。そのため、修正を重ねるほどにコードがぐちゃぐちゃになり、元の状態に戻れなくなることがありました。
  • SWE-Adept のアプローチ(構造化された解決とチェックポイント):
    SWE-Adept の「職人」は、**「作業メモ」と「バージョン管理」**を徹底します。
    • アナロジー(修理屋さんの作業):
      • 仮説を立てる: 「A という部品が壊れているから、B に交換しよう」という**仮説(Hypothesis)**を立てます。
      • 作業リスト(To-Do): 「部品を外す」「新しい部品を付ける」「テストする」といった作業リストを作成します。
      • チェックポイント(Git): 作業を一つ終わるたびに、**「今の状態を写真に撮って保存(チェックポイント)」**します。
      • 分岐と戻り: もし「B に交換したら、別の部品が壊れてしまった!」という失敗をしたら、**「前の写真(チェックポイント)に戻って、別の修理方法(別の仮説)を試す」**ことができます。
    • 効果: 失敗しても「元に戻せる」ため、AI は恐れずに大胆に試行錯誤できます。また、複数の修理方法を並行して試して、最も良いものを選ぶことができます。

🏆 結果:なぜこれがすごいのか?

この「探偵」と「職人」のチームワークにより、SWE-Adept は以下の成果を上げました。

  • 正確な場所特定: 従来の方法より、バグの場所を特定する精度が大幅に向上しました(最大 5.4% の改善)。
  • 成功する修理: 最終的に問題を解決できる割合も上がり、最大 4.7% 向上しました。
  • 効率化: 無駄な情報を読み飛ばすため、AI が使う計算リソース(トークン数)も抑えられています。

📝 まとめ

この論文が言いたいことは、**「AI に『巨大なプロジェクトのバグを直す』という仕事を任せるなら、ただ『考えて直す』だけではダメだ。『場所を慎重に探す探偵』と『失敗しても元に戻せるように管理する職人』という、役割を分けたチームが必要だ」**ということです。

SWE-Adept は、この 2 つの役割を明確に分け、それぞれに最適なツール(検索方法やバージョン管理)を与えることで、AI が人間のように複雑なソフトウェア開発を支援できる可能性を大きく広げました。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →