Does Scientific Writing Converge to U.S. English? Evidence from Generative AI-Assisted Publications

Each language version is independently generated for its own context, not a direct translation.

这篇文章探讨了一个非常有趣的现象：生成式人工智能（GenAI，比如 ChatGPT）是否正在让全球科学界的写作风格变得“千篇一律”，特别是越来越像“美式英语”？

为了让你更容易理解，我们可以把这篇论文的研究过程想象成一场**“全球科学写作的大迁徙”**。

1. 背景：英语是科学界的“通用货币”，但有人“汇率”吃亏

在科学界，英语是绝对的霸主。这就好比全球贸易都用美元结算。

母语是英语的研究者（主要是美国人）：就像持有美元的人，说话写文章天然就符合“市场标准”，容易通过审核，容易发表。
非英语母语的研究者（比如中国、德国、巴西的科学家）：就像持有其他货币的人。他们必须把文章“兑换”成完美的美元（英语）才能进入市场。过去，他们要么花大量时间自己死磕语法，要么花钱请专业的“语言翻译官”（润色服务）。这就像一种隐形的“关税”，阻碍了他们的才华被世界看到。

2. 转折点：2022 年底，ChatGPT 像“免费的外汇兑换机”出现了

2022 年底，ChatGPT 横空出世。它就像一个超级智能、免费且不知疲倦的“语言翻译官”。

以前的研究只关注：用了 AI 后，文章是不是变好读了？词汇是不是变高级了？
这篇论文问了一个更深层的问题：用了 AI 后，非英语国家的文章，是不是在风格上越来越像“美式英语”了？ 这种“趋同”是好事还是坏事？

3. 研究方法：给 565 万篇文章做"DNA 比对”

作者们收集了 2021 到 2024 年间发表的565 万篇科学论文。

工具：他们使用了一种叫 SciBERT 的 AI 模型。你可以把它想象成一个**“超级语言指纹扫描仪”**。它能读懂文章的标题和摘要，然后给每篇文章打一个“美式相似度”的分数（0 到 1 分，1 分就是完美的美式科学英语）。
对比：他们把非英语国家的文章，和美国的“纯美式”文章进行比对。
关键发现：他们发现，在 ChatGPT 发布（2022 年底）之后，那些使用了 AI 辅助写作的非英语国家文章，其“美式相似度”分数显著上升了。而且，这种上升是非 AI 辅助的文章所没有的。

4. 核心发现：谁受益最大？（“汇率差”越大，兑换越猛）

这就好比汇率波动，那些原本“汇率”最差的人，换汇的冲动最大。研究发现，AI 带来的“美式化”趋势在以下群体中最明显：

语言距离最远的国家：比如中文、阿拉伯语等与英语差异巨大的国家。他们的文章风格变化最大，因为 AI 帮他们抹平了最大的语言鸿沟。
只有本国作者的团队：如果是国际团队（比如中美合作），通常已经有英语母语者帮忙润色了，AI 的作用就没那么明显。但如果是“纯本土团队”，AI 就是他们唯一的“语言救星”。
发表在“普通”期刊上的文章：顶级期刊本来就有严格的编辑把关，风格已经很规范了。但在普通期刊上，语言门槛曾是最大的拦路虎，AI 在这里的作用最显著。

5. 这意味着什么？（硬币的两面）

正面：打破壁垒，更公平
想象一下，以前科学界的大门有一道很高的门槛（语言关），很多有才华但英语不好的人被挡在门外。现在，AI 就像给每个人发了一双“增高鞋”。

这让来自语言弱势国家的科学家能更自信地发声。
全球科学界的“思想库”可能会变得更丰富，因为更多样化的人能参与进来了。

反面：风格同质化，失去个性
但是，如果所有人都穿上同样的“增高鞋”，甚至为了迎合标准而把原本独特的表达风格都磨平了，科学写作会不会变得**“千文一面”**？

就像全球各地的餐厅如果都为了迎合游客口味，把本地特色菜都改成了“美式汉堡”，虽然大家都吃得懂了，但世界美食的多样性就消失了。
作者担心，科学界可能会过度依赖单一的“美式标准”，导致修辞和表达方式的多样性减少。

总结

这篇论文告诉我们：生成式 AI 正在让全球科学写作迅速向“美式英语”靠拢。

对于非英语国家的科学家：这是一把双刃剑。它极大地降低了发表门槛，让才华不再被语言埋没（好事）。
对于科学界整体：我们需要警惕，这种“趋同”是否会让科学写作变得单调乏味，失去原本丰富多彩的文化特色（潜在风险）。

未来的关键在于：我们如何利用 AI 这个强大的工具，既帮助大家跨越语言障碍，又能保留科学写作中那些独特的、多元的声音。

Each language version is independently generated for its own context, not a direct translation.

这是一份关于论文《科学写作是否向美式英语趋同？生成式人工智能辅助出版物的证据》（Does Scientific Writing Converge to U.S. English? Evidence from Generative AI-Assisted Publications）的详细技术总结。

1. 研究问题 (Problem)

尽管现有文献已广泛记录生成式人工智能（GenAI）正在改变科学写作（如词汇变化和可读性提升），但一个关键问题尚未得到解答：GenAI 的使用是否导致了系统性的“趋同”（Convergence）？

核心区别：现有研究多关注写作的“绝对变化”（如变得更容易读），而本研究关注的是写作风格是否向主导的科学英语形式（即美式英语） 靠拢。
研究意义：如果存在趋同，意味着语言相关的出版障碍正在降低，这可能改变全球科学界的参与度和竞争格局；但也可能引发对单一语言标准主导下多样性丧失的担忧。
研究缺口：此前缺乏针对已发表期刊文章的大规模、跨学科研究来验证非英语国家作者是否在使用 GenAI 后，其写作风格显著向美式英语基准收敛。

2. 数据与方法 (Methodology)

2.1 数据来源

样本：2021 年至 2024 年间在 Scopus 索引的 565 万篇 英文科学论文。
筛选标准：至少包含一位来自非英语国家（基于机构所属国）作者的论文。
分析单元：论文 $\times$ 国家 $\times$ 学科领域的组合，共约 1430 万条观测值。
学科分类：将 Scopus 细分领域聚合为四大类：生命科学、物理科学、工程与技术、社会科学。

2.2 识别 GenAI 辅助论文

研究并未直接获取用户日志，而是通过词汇模式转变来识别：

关键词列表：基于先验研究，选取了 65 个与 GenAI 内容相关的词汇（如 delve, groundbreak, intricate, meticulous, realm, revolution, showcase, underscore, unveil 等）。
识别规则：
1. 在标题或摘要中检测这些词（词干形式）。
2. 学科特异性频率过滤：仅当某词汇在特定学科内，2021-2024 年的相对使用频率增加至少 300%（即翻四倍）时，才被视为 GenAI 标记。
3. 分类：只要论文在任意分配的学科中检测到至少一个符合频率标准的标记，即被归类为"GenAI 辅助论文”。

2.3 语言相似性测量 (Linguistic Similarity)

模型：使用 SciBERT（在大规模科学语料上预训练的 Transformer 模型）生成文本嵌入（Text Embeddings）。
处理流程：将论文的标题和摘要拼接，输入 SciBERT 模型，提取 768 维的均值池化向量。
相似度计算：计算非美国论文向量与纯美国机构作者（仅美国 affiliation）同年份、同学科论文向量的余弦相似度（Cosine Similarity）。
基准：美国科学写作作为基准语料库（Benchmark Corpus）。

2.4 实证策略

采用事件研究双重差分法（Event-study Difference-in-Differences, DiD）：

处理组：GenAI 辅助论文。
对照组：非 GenAI 辅助论文。
时间断点：以 2022 年底 ChatGPT 发布为界。
模型设定：
$y_{ifcjt} = \delta_0 \cdot GenAI_{ifcjt} + \sum_{\tau} \beta_\tau \cdot 1\{t=\tau\} \times GenAI_{ifcjt} + \text{Controls} + \text{Fixed Effects} + \epsilon$
- 控制变量：作者数量、是否有英语国家合著者。
- 固定效应：国家、学科、期刊、年份、期刊 $\times$ 年份（控制期刊随时间的特定冲击）。
核心系数： $\beta_\tau$ 表示在年份 $\tau$ ，GenAI 辅助论文相对于 2022 年基准，与美式英语的相似度差距变化。

3. 主要发现 (Key Results)

3.1 总体趋同效应

显著收敛：2022 年之后，来自非英语国家的 GenAI 辅助论文，其语言风格显著且持续地向美式科学英语收敛。
幅度：相对于 2022 年基准，2023 年相似度增加约 0.15%，2024 年增加约 0.4%。
无预趋势：2021-2022 年期间，GenAI 辅助论文与非辅助论文之间无显著差异，证明趋同是由 ChatGPT 发布后的使用驱动的，而非其他趋势。

3.2 异质性分析 (Heterogeneity)

趋同效应在语言障碍最大的群体中最为显著：

作者团队构成：纯国内作者团队（无国际合著者）的趋同效应强于国际团队。国际团队通常自带语言支持，而国内团队更依赖 GenAI。
语言距离：来自语言距离英语较远国家（Low Common Language Index）的论文，其趋同幅度显著大于语言相近国家。
合著者背景：团队中没有英语母语合著者的论文，趋同效应更强。
期刊影响力：在低影响力期刊中，趋同效应更明显。高影响力期刊本身已有严格的语言润色，存在“天花板效应”；而低影响力期刊的作者往往缺乏专业编辑服务，GenAI 在此处替代作用最大。

3.3 稳健性检验

研究通过多种方式验证了结果的可靠性：

关键词阈值：改变频率阈值（200% 或 400%），结果依然显著。
识别严格度：要求至少出现两个 GenAI 关键词，结果依然成立（尽管效应幅度略小且滞后）。
基准语料库定义：
- 排除基准中的 GenAI 论文。
- 仅使用 2021 年（ChatGPT 发布前）的美国论文作为基准。
- 仅使用美国顶级期刊（前 10%）论文作为基准。
- 结论：无论基准如何定义，趋同趋势均稳健存在，且向顶级期刊风格收敛的幅度甚至更大。

4. 主要贡献 (Key Contributions)

概念创新：超越了以往仅关注“绝对改进”（如可读性提升）的研究，首次在大尺度上提供了**“语言趋同”**的证据，揭示了 GenAI 如何缩小非英语国家与主导语言标准之间的风格差距。
方法论贡献：结合了学科特异性词汇标记与基于嵌入的语义相似度测量，构建了一个可扩展的框架，用于追踪已发表科学文献中的风格演变。
跨学科与跨国证据：填补了现有文献多集中于预印本或单一学科的空白，提供了涵盖四大科学领域、跨越众多国家的实证证据。

5. 意义与启示 (Significance)

5.1 积极影响：降低准入门槛

语言平等化：GenAI 充当了“部分语言平等器”，显著降低了非英语母语研究者的出版障碍。
多样性潜力：通过减少语言壁垒，可能扩大国际期刊的参与度，引入更多样化的思想，有助于缓解科学创新停滞（Declining Scientific Novelty）的问题。
贸易理论视角：类似于贸易自由化，降低语言壁垒可能带来全球研究生态的“比较优势”释放，使更多高质量想法进入竞争。

5.2 潜在风险：同质化与依赖

风格同质化：趋同可能意味着科学写作正走向单一的美式英语规范，可能导致修辞多样性和文化视角的丧失。
依赖性：非英语国家研究者可能对单一语言标准产生更深层次的依赖。

5.3 政策建议

透明披露：期刊应要求作者透明披露 GenAI 的使用情况（用于何种任务、谁负责验证），而非简单禁止。
公平获取：资助机构应支持资源匮乏机构获取 GenAI 工具，以缩小数字鸿沟。
审稿指南：编辑和审稿人应区分“语言清晰度”与“科学贡献”，避免将语言辅助视为学术不端，同时警惕基于 LLM 的检测工具（这些工具往往对非母语写作有偏见）。

总结

该研究通过大规模数据分析证明，生成式人工智能正在系统性地改变全球科学写作的风格，使其显著向美式英语基准收敛。这种趋同效应在语言障碍最大、资源最匮乏的群体中最为强烈。虽然这有望促进全球科学的包容性和参与度，但也引发了关于科学表达多样性和文化同质化的深刻讨论。未来的关键在于如何在利用技术消除语言障碍的同时，保护科学表达的多元性。