Beyond the Prompt: An Empirical Study of Cursor Rules

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「AI プログラミング助手（Cursor など）に、開発者がどんな『お守り』や『マニュアル』を書いているのか」**を調査した研究です。

一言で言うと、**「AI に『こうやって働いてね』と教えるための『開発者のメモ』を分析した」**という話です。

以下に、難しい専門用語を避け、日常の例え話を使って分かりやすく解説します。

🍳 料理の例え：AI は「天才シェフ」だが、レシピは必要

想像してください。あなたが**「どんな料理でも作れる天才シェフ（AI）」を雇ったとします。
でも、このシェフには「あなたの家の冷蔵庫の中身」も「あなたの家族の好み」も「いつもの味付け」**も分かりません。

失敗例： シェフに「パスタを作って」とだけ言うと、彼は「スパゲッティ・ボロネーゼ」を作りますが、あなたの家族は「トマトソースが苦手」で、冷蔵庫には「牛乳しかない」状態かもしれません。
成功例： 事前に「うちの冷蔵庫には牛乳しかないこと」「トマトは嫌い」「いつもはパスタよりリゾット風にする」「塩分控えめで」という**メモ（ルール）**を貼っておけば、シェフは完璧な料理を作れます。

この論文は、世界中の開発者が**「AI シェフに貼っているメモ（Cursor Rules）」を 401 件も集めて分析し、「どんなメモが書かれているのか」**を分類しました。

🔍 発見された 5 つの「メモの種類」

開発者が AI に残しているメモは、大きく分けて 5 つのタイプに分類されました。

1. 🏢 プロジェクト情報（「このお店はどんな店？」）

内容： 「このアプリは何を作るものか」「使う技術は何か（Python か JavaScript か）」など。
例え： 「この店はイタリアンレストランです。材料はオーガニック限定です」というお店の紹介文のようなもの。
目的： AI が「何を作ればいいか」の全体像を理解するため。

2. 📏 慣習・ルール（「ここはこう書く決まり」）

内容： 名前付けのルール、コードの書き方、ファイルの置き場所など。
例え： 「店内では靴を脱いでください」「メニューは左から右へ並べる」というお店のルールやマナー。
目的： 誰が作っても同じような見た目で、整理されたコードになるようにするため。

3. 📜 ガイドライン（「こうあるべきだ」という指針）

内容： テストの重要性、セキュリティ対策、パフォーマンス重視など、高レベルなアドバイス。
例え： 「料理は必ず味見をしてから出すこと」「火傷しないように注意すること」という職人の心得やベストプラクティス。
目的： 品質を高く保ち、失敗を防ぐため。

4. 🤖 AI 向け指示（「あなたへの特別な注文」）

内容： 「推測せずに確認して」「この役割（ペルソナ）になりきって」「出力はこういう形式で」といった、AI への直接的な命令。
例え： 「シェフさん、あなたは『健康志向の料理人』という役になりきってください。もし材料が足りなければ、勝手に変えずに私に聞いてください」というシェフへの具体的な注文。
特徴： 人間向けのマニュアルにはない、AI 特有の指示です。

5. 📝 具体例（「見本」）

内容： 「良いコードの例」「悪いコードの例」。
例え： 「こんな料理の盛り付けが理想です（写真付き）」という見本写真。
目的： 言葉で説明するより、見本を見せた方が伝わるため。

💡 面白い発見（調査結果）

この研究でわかった面白いことは以下の通りです。

言語によってメモの量が違う：
- Python や JavaScript（自由な言語）を使うプロジェクトは、AI が迷わないように**「詳しいメモ」**を多く書きます。
- Java や Go（厳格な言語）を使うプロジェクトは、言語自体が厳しすぎるため、AI が勝手に推測しやすいので、メモは少し少なめです。
- 例え： 自由な料理（和食など）は「味付けは適当で」と言えないのでレシピが必要ですが、厳格な料理（寿司など）は「米の温度は 30 度」と決まっているので、余計な説明が不要な感じです。
コピー＆ペーストが多い：
- 約 3 割のメモは、他の人のメモやテンプレートをそのままコピーしています。
- 例え： 「有名なシェフのレシピ本」をそのまま貼っているような状態です。
新しいプロジェクトほど「AI への注文」が多い：
- 最近作られたプロジェクトほど、「AI への特別な指示（ペルソナ設定など）」を多く含んでいます。
- 例え： 新しいお店は「新しいシェフへの注文」に熱心ですが、昔からあるお店は「いつものやり方」で済ませている感じです。

🚀 この研究が教えてくれること（今後の展望）

この研究は、**「AI と人間がより仲良く働くためにはどうすればいいか」**を教えます。

AI に「何を知っているか」を教える：
開発者は「AI はすでにコードを読んでいるから、同じことを書かなくていい」と思っているかもしれません。でも、AI は「文脈（コンテキスト）」を正しく理解していないことが多いです。開発者は、「AI がすでに知っている情報」と「新しく伝えるべき情報」の区別を学ぶ必要があります。
自動生成ツールの進化：
「どんな言語や分野なら、どんなメモが必要か」がわかったので、**「プロジェクトに合わせて自動で最適なメモ（ルール）を作ってくれるツール」**が作れるようになります。
教育の必要性：
初心者は「何を書けばいいか」が分からないことが多いです。この研究でわかった「5 つのメモの種類」を教育に使えば、誰でもすぐに AI と仲良く働けるようになります。

まとめ

この論文は、**「AI という新しいパートナーと働くために、人間がどんな『メモ』を書いているか」を分析し、「より良いメモの書き方」**を見つけ出そうとしたものです。

AI に「天才」になってもらうには、人間が「良い上司（または良い注文主）」になって、適切な指示を出すことが重要だというメッセージが込められています。

Beyond the Prompt: An Empirical Study of Cursor Rules

🍳 料理の例え：AI は「天才シェフ」だが、レシピは必要

🔍 発見された 5 つの「メモの種類」

1. 🏢 プロジェクト情報（「このお店はどんな店？」）

2. 📏 慣習・ルール（「ここはこう書く決まり」）

3. 📜 ガイドライン（「こうあるべきだ」という指針）

4. 🤖 AI 向け指示（「あなたへの特別な注文」）

5. 📝 具体例（「見本」）

💡 面白い発見（調査結果）

🚀 この研究が教えてくれること（今後の展望）

まとめ

論文「Beyond the Prompt: An Empirical Study of Cursor Rules」の技術的サマリー

1. 研究の背景と問題定義

2. 研究方法論

3. 主要な貢献：文脈の分類体系（Taxonomy）

4. 主要な結果と知見

RQ1: プログラミング言語による違い

RQ2: アプリケーションドメインによる違い

RQ3: ルールの再利用性

RQ4: 文脈の共起性

RQ5: 時間的変化（リポジトリの年齢）

5. 意義と将来への示唆

結論

Beyond the Prompt: An Empirical Study of Cursor Rules

🍳 料理の例え：AI は「天才シェフ」だが、レシピは必要

🔍 発見された 5 つの「メモの種類」

1. 🏢 プロジェクト情報（「このお店はどんな店？」）

2. 📏 慣習・ルール（「ここはこう書く決まり」）

3. 📜 ガイドライン（「こうあるべきだ」という指針）

4. 🤖 AI 向け指示（「あなたへの特別な注文」）

5. 📝 具体例（「見本」）

💡 面白い発見（調査結果）

🚀 この研究が教えてくれること（今後の展望）

まとめ

論文「Beyond the Prompt: An Empirical Study of Cursor Rules」の技術的サマリー

1. 研究の背景と問題定義

2. 研究方法論

3. 主要な貢献：文脈の分類体系（Taxonomy）

4. 主要な結果と知見

RQ1: プログラミング言語による違い

RQ2: アプリケーションドメインによる違い

RQ3: ルールの再利用性

RQ4: 文脈の共起性

RQ5: 時間的変化（リポジトリの年齢）

5. 意義と将来への示唆

結論

関連論文

Multi-objective optimization determines when, which and how to fuse deep networks: an application to predict COVID-19 outcomes

A Systematic Review of Intermediate Fusion in Multimodal Deep Learning for Biomedical Applications

MARIA: a Multimodal Transformer Model for Incomplete Healthcare Data

Detecting LLM-Generated Peer Reviews

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs