Beyond the Prompt: An Empirical Study of Cursor Rules

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在做一场**“给 AI 编程助手写‘使用说明书’的大调查”**。

想象一下，你刚雇了一位超级聪明但有点“没头没脑”的AI 编程助手（比如 Cursor）。它虽然懂很多代码，但它不知道你们公司的“家规”、不知道你们项目的“装修风格”，甚至不知道你们喜欢用什么“方言”写代码。

如果直接让它干活，它可能会写出风格杂乱、甚至完全不符合你项目要求的代码。于是，聪明的开发者们开始给这位 AI 助手写**“Cursor Rules"（光标规则）——这就好比是给 AI 准备的一份“入职指南”或“项目圣经”**。

这篇论文的研究者们（来自加州大学尔湾分校）就好奇：大家到底在这份“入职指南”里写了什么？大家是怎么写的？有没有什么规律？

他们收集了 401 个开源项目 里的这些规则文件，像侦探一样仔细分析，最后得出了以下有趣的发现：

1. 开发者们都在写什么？（五大类“家规”）

研究者把大家写的规则分成了五大类，我们可以用**“装修房子”**来打比方：

🏠 项目信息 (Project Info)：告诉 AI“这是谁的家”
- 内容：这个项目是干嘛的？用了什么技术栈（比如是 Vue 还是 React）？怎么启动？
- 比喻：就像告诉 AI：“这是张三的公寓，用的是北欧风，厨房在左边，别把客厅当卧室用。”
📏 约定俗成 (Convention)：告诉 AI“咱们怎么说话”
- 内容：代码命名要什么样？缩进用几个空格？文件放哪个文件夹？
- 比喻：就像规定：“咱们家说话要轻声细语（命名规范），鞋子必须摆在门口（文件结构），不能乱扔袜子（代码风格）。”
💡 指导原则 (Guideline)：告诉 AI“做事的哲学”
- 内容：要重视安全吗？要追求性能吗？怎么测试代码？
- 比喻：就像家训：“做人要诚实（代码安全），做事要高效（性能优化），出门要锁门（异常处理）。”
🤖 给 AI 的“特别指令” (LLM Directives)：告诉 AI“你怎么思考”
- 内容：这是最有趣的一类！直接教 AI 怎么思考。比如：“遇到不懂的先问清楚，别瞎猜”、“先列计划再动手”、“你要扮演一个资深 Python 专家”。
- 比喻：这是给 AI 的**“思维训练课”**。就像告诉它：“别急着干活，先想三步；如果不确定，就举手提问；记住，你现在是这里的‘技术总监’。”
📝 示例 (Example)：告诉 AI“照着这个做”
- 内容：直接给一段好的代码或坏的代码做对比。
- 比喻：就像给 AI 看一张“样板房”照片：“看看这个柜子是怎么打的，照着这个做。”

2. 大家是怎么写的？（几个有趣的发现）

🗣️ 语言不同，写法不同
- 用 JavaScript/PHP 这种“自由奔放”的语言，开发者写的规则特别多，因为怕 AI 乱来，得把规矩定死。
- 用 Go/Java 这种“严谨刻板”的语言，规则反而少一点，因为语言本身就很严格，AI 不容易跑偏。
- 比喻：就像教小孩，教“自由派”小孩（动态语言）得啰嗦点，多立规矩；教“纪律派”小孩（静态语言）只要给个大方向就行。
🏗️ 领域不同，重点不同
- 做网页的：喜欢给很多“示例”，因为网页样式变化太快，得让 AI 看样图。
- 做数据或系统的：喜欢给很多“指导原则”，因为逻辑复杂，怕 AI 算错。
- 比喻：做菜的，如果是做创意菜（前端），得给菜谱和成品图；如果是做精密仪器（后端/系统），得给操作手册和安全条例。
📄 很多人都在“抄作业”
- 研究发现，近 30% 的规则行是直接复制粘贴的！大家喜欢互相抄，或者抄网上的“万能模板”。
- 比喻：就像大家写“家规”时，发现隔壁老王写得挺好，直接拿过来改个名字就用。虽然省事，但有时候可能不完全适合自己家。
🕰️ 越老的项目，越“惜字如金”
- 新创建的项目，大家喜欢写很多关于"AI 该怎么思考”的指令（LLM Directives），因为大家还在摸索怎么跟 AI 相处。
- 老项目，大家更关注具体的项目细节，或者把规则精简了。
- 比喻：刚认识新朋友（新项目），你会拼命介绍自己怎么思考、怎么工作；老朋友（老项目）了，大家默契了，说话就简单直接，只提重点。

3. 这篇论文告诉我们什么？（给未来的启示）

AI 也需要“懂行”的搭档：现在的 AI 很聪明，但它不懂你的“潜规则”。开发者写的这些规则，其实就是把人类的经验“翻译”给 AI 听。
工具需要更聪明：现在的工具（比如 Cursor）还在让大家手动写这些规则，而且很多人都在“抄作业”。未来的工具应该能自动分析你的项目，然后自动生成一份最适合你的“入职指南”，不用大家手动去抄。
别把 AI 当傻子，也别把它当神：开发者们发现，有时候写太多废话（比如把 AI 能自己查到的文档也写进去）是浪费空间。我们需要更精准地告诉 AI：“哪些是你不知道的，必须告诉我；哪些是你自己就能查到的，别让我重复。”

总结

简单来说，这篇论文就是**“人类如何教 AI 适应人类工作习惯”的田野调查**。

它告诉我们，开发者们正在努力给 AI 写**“说明书”，从“怎么干活”到“怎么思考”都在教。虽然目前大家还在互相“抄作业”，还在摸索最佳实践，但这标志着人类和 AI 的协作方式正在发生巨大的变化**——我们不再只是给 AI 下命令，而是在培养一个懂规矩、懂业务、懂思考的数字同事。

Beyond the Prompt: An Empirical Study of Cursor Rules

1. 开发者们都在写什么？（五大类“家规”）

2. 大家是怎么写的？（几个有趣的发现）

3. 这篇论文告诉我们什么？（给未来的启示）

总结

1. 研究背景与问题 (Problem)

2. 方法论 (Methodology)

3. 关键贡献：上下文分类体系 (Key Contributions & Taxonomy)

4. 主要研究结果 (Results)

RQ1: 编程语言的影响

RQ2: 应用领域的影响

RQ3: 规则复用性

RQ4: 上下文共现

RQ5: 时间演变

5. 意义与启示 (Significance & Implications)

总结

Beyond the Prompt: An Empirical Study of Cursor Rules

1. 开发者们都在写什么？（五大类“家规”）

2. 大家是怎么写的？（几个有趣的发现）

3. 这篇论文告诉我们什么？（给未来的启示）

总结

1. 研究背景与问题 (Problem)

2. 方法论 (Methodology)

3. 关键贡献：上下文分类体系 (Key Contributions & Taxonomy)

4. 主要研究结果 (Results)

RQ1: 编程语言的影响

RQ2: 应用领域的影响

RQ3: 规则复用性

RQ4: 上下文共现

RQ5: 时间演变

5. 意义与启示 (Significance & Implications)

总结

类似论文

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

Talking like Piping and Instrumentation Diagrams (P&IDs)

SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models

IntrinsicWeather: Controllable Weather Editing in Intrinsic Space

Expert Evaluation of LLM World Models: A High-TcT_cTc​ Superconductivity Case Study

Expert Evaluation of LLM World Models: A High- $T_c$ Superconductivity Case Study