Why Pass@k Optimization Can Degrade Pass@1: Prompt Interference in LLM Post-training

本論文は、検証可能なタスクにおける Pass@k の最適化が、負の干渉を伴うプロンプトへの再重み付けにより勾配競合を引き起こし、結果として Pass@1 の性能を低下させるという理論的メカニズムを解明し、大規模言語モデルの実験で実証したことを示しています。

Anas Barakat, Souradip Chakraborty, Khushbu Pahwa, Amrit Singh Bedi

公開日 2026-02-27
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

🍳 結論:「何回も試す」練習が、なぜ「1 回で決める」力を奪うのか?

この論文の核心は、**「AI が苦手な問題(難しい料理)に集中しすぎた結果、得意な問題(簡単な料理)の味まで壊してしまった」**という現象です。

1. 背景:Pass@k とは何か?

AI に「料理のレシピ」を教えるとき、2 つのテスト方法があります。

  • Pass@1(1 回勝負): 1 回だけ作って、それが美味しければ合格。
  • Pass@k(k 回勝負): 10 回(k=10)作らせて、そのうち1 つでも美味しければ合格。

最近の AI 研究では、「k 回勝負」で合格する確率を最大化するように AI を訓練する(Pass@k 最適化)のが流行っています。「何回も試せば正解が出るから、その方が実用的だよね」という考えからです。

2. 問題:Pass@k を上げると、Pass@1 が下がる?

しかし、実験をすると奇妙なことが起きます。
**「k 回勝負の成績はグングン伸びるのに、1 回勝負の成績は逆に下がってしまう」**のです。
まるで、「10 回中 1 回でも成功すればいいように練習したら、1 回で成功する確率が下がってしまった」ような状態です。

なぜこんなことが起きるのか?この論文は**「Prompt Interference(プロンプト干渉)」**という新しい概念で説明しています。

3. 原因:「苦手な人」を優先しすぎた結果

AI の学習は、「間違えた問題(苦手な料理)」に重点を置いて修正するという性質があります。

  • Pass@1 の場合: 得意な問題も苦手な問題も、平等に「1 回で正解する確率」を上げようとします。
  • Pass@k の場合: 「10 回中 1 回でも成功すればいい」という目標のため、「もともと成功率が低い(非常に難しい)問題」に極端に大きな重み(ポイント)を付けます。

ここで**「干渉(Interference)」**という現象が起きます。
AI の脳(パラメータ)は一つしかありません。

  • 得意な問題を正解させるための「脳への修正」
  • 苦手な問題を正解させるための「脳への修正」

これらが**「真逆の方向」**を指していることがあります。
(例:得意な料理の味付けを「甘く」すると、苦手な料理の味付けは「辛く」しなければいけない、みたいな矛盾です。)

4. 悲劇のメカニズム:「苦手な人」の声が大きすぎる

Pass@k の学習では、「苦手な問題」の修正ポイントが、Pass@1 の修正ポイントと真逆であることが多いのに、Pass@k はその「苦手な問題」に**「100 倍、1000 倍」の重み**を付けてしまいます。

  • Pass@1 の先生: 「得意な問題も苦手な問題も、バランスよく直そう」
  • Pass@k の先生: 「苦手な問題が最重要!ここを直せ!」

Pass@k の先生が「苦手な問題」の修正を強く指示すると、AI の脳はそれに従って大きく動きます。しかし、その動きは「得意な問題」にとっては**「壊す方向」**だったのです。

その結果、**「苦手な問題は少し良くなった(k 回勝負の成績 UP)」けれど、「得意な問題は壊れてしまった(1 回勝負の成績 DOWN)」**という、最悪のトレードオフが生まれます。

5. 具体的な例え話:「料理コンテスト」

想像してください。

  • AIは料理人です。
  • 得意な料理は「卵焼き」(簡単)。
  • 苦手な料理は「フレンチの複雑なソース」(難易度高)。

Pass@1 訓練:
「卵焼きもソースも、1 回で完璧に作れるように練習しなさい」と言われます。
→ 卵焼きは完璧、ソースも少し上手になります。

Pass@k 訓練(10 回勝負):
「卵焼きは 10 回作れば 1 回は完璧に出せるからいい。でも、ソースは 10 回作っても 1 回も成功しない!だからソースに集中して練習しなさい!」と言われます。
さらに、「ソースを成功させるには、卵焼きの作り方を**完全に忘れる(逆の動きをする)**必要がある」という矛盾したルールがあります。

AI は「ソースを成功させる」ために必死に練習します。その結果、ソースは 10 回に 1 回くらい成功するようになりました(Pass@k 向上)。
しかし、その練習法が卵焼きの作り方を壊してしまったため、卵焼きはもう 1 回で完璧に作れなくなりました(Pass@1 低下)

💡 この論文のメッセージ

この研究は、**「Pass@k(何回も試す)を最適化しすぎると、AI が『1 回で決める力』を失う危険性がある」**と警告しています。

  • なぜ重要か? 現実世界では、AI が 10 回も答えを出す時間やコストがないことが多いです(チャットボットやリアルタイム処理など)。また、1 回で失敗すると致命的な場合もあります。
  • どうすればいい? Pass@k の学習をするときは、「苦手な問題」に集中しすぎないよう、**「得意な問題の力も落とさないバランス」**を考慮する必要があります。

つまり、「何回も試せばいい」という安易な考えで AI を訓練すると、AI が「1 回で正解する天才」から「何回も試さないと正解できない凡人」に変わってしまうかもしれない、という重要な発見なのです。

このような論文をメールで受け取る

あなたの興味に合わせた毎日または毎週のダイジェスト。Gistまたは技術要約を、あなたの言語で。

Digest を試す →