原論文は CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) でライセンスされています。 これは以下の論文のAI生成解説です。著者が執筆したものではありません。技術的な正確性については原論文を参照してください。 免責事項の全文を読む
あなたが新しいレシピを作ろうとしている料理人と想像してください。あなたは超賢い、AI 搭載のシェフ助手に助けを求めます。助手は自信満々に「スーパースパイス9000を食料品店で買う必要があります!」と言います。あなたは店に行きますが、スーパースパイス9000は存在しません。
コンピュータプログラミングの世界において、この「食料品店」は PyPI(Python 用)または npm(JavaScript 用)と呼ばれるデジタル倉庫です。これらの倉庫には、プログラマーが単一のコマンドでダウンロードできる数百万もの既製のコード「材料」(パッケージ)が保管されています。
この論文は、昨年に語られた恐ろしい物語の続編です。当時、研究者たちは AI 料理人が材料の名前を付けるのが非常に下手であることを発見しました。彼らは「スーパースパイス9000」のような架空の名前を、約 5% から 22% の頻度で発明していました。ずるい泥棒は、その架空の名前で悪意のあるパッケージを登録し、プログラマーが AI にそれを求めるのを待ち、プログラマーをウイルスのインストールにだますことができます。これは「スロップスクワッティング」と呼ばれます。
この論文の著者である独立研究者は、こう問いかけました:「2 年後の今、AI はこの点で改善したでしょうか?」
以下に、彼らの発見を簡単に説明します。
1. 「架空の材料」の問題は小さくなったが、消えたわけではない
研究者たちは、2026 年初頭に利用可能な最も賢い 5 つの AI コーディングモデル(Anthropic、OpenAI、Google、DeepSeek などの企業から提供されているもの)をテストしました。
- 良い知らせ: 「最高」の AI と「最低」の AI の間の格差は劇的に縮まりました。2024 年、一部の AI はひどく(22% の架空名)、他の AI はまあまあ(5%)でした。2026 年、それらはすべてほぼ同じです:すべてが約 4.6% から 6.1% の頻度で架空の名前を作り出します。「悪さ」のばらつきは崩壊しました。
- 悪い知らせ: 脅威は依然として非常に現実的です。率が下がったとはいえ、4〜6% はまだ泥棒が利益を得るのに十分な高さです。AI が 20 回に 1 回架空の名前を作る場合、泥棒はその架空の名前を登録し、何千人ものプログラマーが誤ってそれをダウンロードするのを待つことができます。
2. 「普遍的な架空」の発見
これがこの論文最大の驚きです。研究者たちは、上位 5 つの AI モデルすべてが発明した 127 個の特定の架空の名前を発見しました。
- 比喩: 5 人の異なる専門家料理人に「このスープの秘密の材料は何ですか?」と尋ねたところ、彼らがすべて独立して「それはブルーフレーバー7です」と答えたと想像してください。その材料は存在しないのに。
- 危険性: 泥棒が一度「ブルーフレーバー7」を登録すれば、5 つの AI 企業のすべてのユーザーを同時に攻撃できます。これは、どの AI を使うかに依存しない「普遍的な罠」です。
3. いくつかの奇妙なひねり
この論文は、私たちが予想していたのとは逆のパターンをいくつか発見しました。
- Python 対 JavaScript: 2024 年、AI は JavaScript の材料の名前付けがより下手でした。2026 年、実際には Python の材料の名前付けがより下手です。AI は Python の厄介な命名規則に混乱しているようです。
- 「小」対「大」の兄弟: 通常、小さく安価な AI モデルは、大きく高価なモデルよりも多くの間違いを犯します。しかしここでは、「小」モデル(Claude Haiku)は、その「大の兄弟」(Claude Sonnet)よりも架空の名前を少なく作りました。小モデルは指示に対して特に慎重になるように訓練されたようです。
4. なぜ問題は縮んだのか?
著者は、AI が現在わずかに改善した理由として 3 つの要因を挙げています。
- 競争環境の公平化: 「オープンソース」モデル(無料で利用可能)が非常に良くなり、今では「商用」モデル(有料)と同等に賢くなったため、それらの間の格差が埋まりました。
- より良いトレーニング: AI にデータを供給する企業は、より多くの架空の材料名を除去するために「レシピ本」(トレーニングデータ)を整理したようです。
- 標準化されたトレーニング: すべての大手 AI 企業が現在、同様の教授方法を使用しているため、それらはすべて同様の(わずかに改善された)間違いを犯します。
結論
AI 料理人たちは少しだけ行動を正しましたが、依然として頻繁に架空の材料を発明しており、危険です。最も懸念すべき点は、彼らがすべて同じ架空の材料を発明していることです。
この論文が言っていないこと:
- これは解決された問題だとは言っていない。
- AI の使用を中止すべきだとは言っていない。
- すべての AI モデルが悪いと主張しているわけではない(彼らは上位 5 つの「フロンティア」モデルのみをテストした。より小さく古いモデルは依然としてはるかに悪い可能性がある)。
著者の主なメッセージは次の通りです:エラーの範囲は縮小したが、脅威は残っている。 プログラマーとセキュリティチームは、今日の最も賢い AI でさえも、あなたを架空で危険なダウンロードに導く可能性があることを認識する必要があります。
自分の分野の論文に埋もれていませんか?
研究キーワードに一致する最新の論文のダイジェストを毎日受け取りましょう——技術要約付き、あなたの言語で。