ceLLMate: Sandboxing Browser AI Agents

本論文は、ブラウザ操作 AI エージェントが提示注入攻撃に脆弱であるという課題に対し、UI 操作とバックエンド通信の関連性に着目し、HTTP レベルでのサンドボックス化を実現する「ceLLMate」を提案し、WASP ベンチマークにおいて攻撃を効果的に防御しつつ遅延オーバーヘッドを最小限に抑えることを示しています。

Luoxi Meng, Henry Feng, Ilia Shumailov, Earlence Fernandes

公開日 2026-03-05
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「CELLMATE(セルメイト)」という新しい仕組みについて書かれています。これは、AI がウェブブラウザを使ってタスクをこなす際に起こりうる「危険なミス」を防ぐための「安全装置(サンドボックス)」**です。

まるで、AI という「優秀だが少し危ない助手」に、家の鍵や冷蔵庫の鍵を預けるようなものだと想像してください。CELLMATE は、その助手が「勝手に冷蔵庫を開けて中身を全部食べちゃおう」とか「家の鍵を泥棒に渡そう」という間違った命令(悪意のある指示)を聞いても、**「いや、それは許可されていないよ!」**と止めてくれる仕組みです。

以下に、難しい専門用語を使わずに、身近な例え話で解説します。


1. 問題:AI 助手は「悪魔の囁き」に弱い

最近、AI は人間のようにブラウザを操作して、ネットショッピングをしたり、メールを書いたりするようになりました(これを「ブラウザ・エージェント」と呼びます)。

しかし、ここに大きな問題があります。
AI は、ネット上のあらゆるテキストを読み取ります。もし、誰かが「この商品ページに『あなたのクレジットカード番号をここに送ってください』と隠れて書いておいた」としたら、AI はそれを「ユーザーの命令」と勘違いして、本当にその情報を出してしまったり、勝手に注文してしまったりする可能性があります。

これを**「プロンプト・インジェクション(命令注入攻撃)」**と呼びます。AI が「悪魔の囁き」に騙されて、ユーザーの大切なものを奪われてしまうのです。

2. 従来の対策がなぜダメだったか?

これまでの対策は、AI 自体を「もっと賢くして、嘘を見抜けるようにする」ことでした。しかし、これは**「悪魔がもっと上手に嘘をつくたびに、AI ももっと賢くならなければいけない」**という、終わりのない「いたちごっこ」になっています。

また、AI が「クリック」や「スクロール」といった**「指先の動き」**を制限しようとしても、それは非常に難しいです。

  • 例え話: 「このボタン(座標 246, 1023)は押していいけど、他のボタンはダメ」というルールを作ったとします。でも、画面のサイズが変わったり、ページが変わったりすると、その「246, 1023」は全く違う意味のボタン(例えば「削除」ボタン)になってしまうかもしれません。
  • 結論: 「指先の動き」でルールを作るのは、**「地図の『北』を指で指すだけで、目的地を決める」**ようなもので、あまりに頼りなく、危険です。

3. 解決策:CELLMATE の「魔法のフィルター」

CELLMATE は、AI の「指先の動き」ではなく、**「ネットの通信(HTTP リクエスト)」**というレベルで守ります。

  • 核心となるアイデア:
    AI が「クリック」や「入力」をしていても、裏では必ず「サーバーへの通信」が発生しています。

    • 「カートに入れる」=「サーバーに『購入』という注文を送る」
    • 「メールを送る」=「サーバーに『送信』というデータを送る」

    CELLMATE は、「指先の動き」ではなく「通信内容」を見て守るのです。
    「通信内容」には明確な意味(例:「50 ドル以下の購入」「特定のサイトへの送信」)があるため、ルール作りが非常に簡単で確実になります。

4. 仕組み:3 つの役割分担

CELLMATE は、3 つの役割が協力して動きます。

  1. ウェブサイトの開発者(地図を作る人)

    • 彼らは**「エージェント・サイトマップ(Agent Sitemap)」**という地図を作ります。
    • これは、そのサイトにある「どんな操作(通信)が可能か」をリスト化したものです。
    • 例え話: レストランのメニュー表のようなものです。「ステーキは注文できるけど、厨房には入れない」といったルールを明記します。
  2. ユーザー(注文をする人)

    • ユーザーは「Amazon で 50 ドル以下のコーヒーメーカーを買って」と言います。
    • CELLMATE は、この注文に合わせて、必要な「ルール(許可)」だけを自動的に選び出します。
  3. ブラウザの拡張機能(警備員)

    • これが CELLMAATE の本体です。AI が何か通信しようとした瞬間、**「その通信は、選んだルール(50 ドル以下など)に合っていますか?」**をチェックします。
    • 合っていれば通し、合っていなければ(例えば 100 ドルの購入や、知らないサイトへの送信など)即座にブロックします。

5. なぜこれがすごいのか?

  • 悪魔の囁きも無効化:
    AI が「悪意あるページ」を見て「秘密を漏らして!」と命令されても、CELLMATE は「その通信はルールにないから許可しない!」と止めます。AI がどんなに騙されても、最終的な「通信の gate(門)」で止まるのです。
  • 遅延はほとんどない:
    実験によると、この安全装置をつけても、動作が遅くなるのはわずか 7%〜15% 程度。人間が待たされるような重さではありません。
  • 誰でも使える:
    特別な設定は不要で、Chrome などのブラウザに拡張機能を入れるだけで使えます。

まとめ

CELLMATE は、**「AI 助手に『何をしていいか』というルールを、通信のレベルで厳格に守らせるシステム」**です。

これまでは「AI に『騙されないように』と教育する」ことに注力していましたが、CELLMATE は**「AI が何をしようとしても、許可されたことしかできないように、物理的な壁(ルール)を作る」**という、より確実で安全なアプローチを提供しています。

まるで、**「子供(AI)に冷蔵庫の鍵を渡す際、鍵自体に『中身は取れるけど、冷凍庫は開けられない』というロックをかけた」**ようなもの。子供がどんなに「開けて!」と泣き叫んでも、ルール(ロック)が守ってくれるのです。