Limiting to English language records: A comparison of five methods on Ovid MEDLINE and Embase versus removal during screening

⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文探讨了一个在医学和科学研究中非常实际的问题：当我们做“系统综述”（也就是把全世界关于某个话题的研究都找出来汇总分析）时，如果只找英文文章，会不会漏掉重要的东西？以及，我们在搜索阶段直接过滤掉非英文文章，和先把所有文章都找出来、在人工筛选阶段再剔除非英文文章，这两种方法有什么区别？

为了让你更容易理解，我们可以把这项研究想象成在一个巨大的跨国图书馆里寻找特定的食谱。

1. 背景：为什么要限制语言？

想象一下，你正在写一本关于“如何治愈感冒”的百科全书。图书馆里有几百万本书，但你的团队只会说英语，而且时间紧迫、预算有限。

做法 A（搜索时过滤）： 你在图书馆的检索机器上直接输入“只给我英文书”。机器会立刻把非英文的书全部挡在门外，你只看到英文书。
做法 B（筛选时过滤）： 你把所有书（不管什么语言）都搬出来，堆在桌子上。然后你的团队开始一本本看，看到非英文的书就扔回书架，只留下英文的。

核心问题： 这两种做法结果一样吗？会不会因为机器太笨，把一些其实是英文的书误当成非英文书给扔了？或者把一些其实是非英文的书误当成英文书留下来了？

2. 研究做了什么？

两位作者（Helen 和 Kirsty）就像图书馆的“侦探”。他们找了 7 个已经做过的真实研究项目，把这些项目里最终被采纳的“好文章”（Includes）和被因为“不是英文”而扔掉的“坏文章”（NEL Excludes）都找了出来。

然后，他们在这两个巨大的数据库（Ovid MEDLINE 和 Embase，相当于两个超级大的数字图书馆）里，测试了5 种不同的“只找英文”的搜索技巧，看看这些技巧能不能精准地找回那些“好文章”，同时能不能精准地扔掉那些“坏文章”。

3. 主要发现：机器其实挺准，但偶尔会“脸盲”

发现一：5 种搜索技巧，效果几乎一模一样

作者测试了 5 种不同的搜索指令（有的只搜“英文”，有的搜“英文 + 没标语言的”，有的用复杂的逻辑排除法）。

比喻： 就像你用了 5 种不同的金属探测器在沙滩上找金币。结果发现，这 5 个探测器找到的金币数量几乎完全一样。
数据： 在 MEDLINE 数据库里，99.8% 的“好文章”都被成功找到了；在 Embase 里是 99.7%。这意味着，在搜索阶段直接限制语言，绝大多数情况下是安全的，不会漏掉重要的英文研究。

发现二：机器也会“脸盲”（误杀）

虽然准确率很高，但还是有5 篇本该被留下的英文文章，被搜索指令错误地扔掉了。

比喻： 这就像保安在门口检查护照。有一本护照上写着“英语”，但保安看到旁边还贴着一张“西班牙语”的贴纸（因为这本杂志是双语的，或者元数据标错了），保安就以为它是西语书，把它拦在了门外。
原因： 这些文章通常发表在双语或多语种的期刊上。数据库里的标签（元数据）只标了“西班牙语”或“波兰语”，没标“英语”，导致搜索指令误判。
结论： 直接过滤虽然方便，但确实存在极小概率（约 0.2%-0.3%）把真正的英文好文章误杀的风险。

发现三：人工筛选也会“看走眼”（误放）

反过来，那些在人工筛选阶段被扔掉的“非英文文章”里，也有17 篇（MEDLINE 8 篇，Embase 9 篇）其实是英文文章，或者是有英文摘要的文章。

比喻： 这就像你的团队在桌子上翻书时，看到一本封面是法文的，就顺手把它扔了。结果后来发现，这本书里面全是英文写的，只是封面印了法文，或者它是一本双语书。
原因： 人工筛选时，工作人员可能只看了标题或摘要的语言，或者数据库的标签本身就有错（比如把一本英文期刊标成了波兰语）。

4. 这意味着什么？（给普通人的启示）

这篇论文给做研究的人（以及关心研究质量的大众）提了几个醒：

没有完美的过滤器： 无论是用机器在搜索时直接过滤，还是人工在后期筛选，都有出错的可能。机器会“脸盲”（因为标签错误），人也会“看走眼”（因为标签错误或疏忽）。
双语/多语期刊是“重灾区”： 最容易出错的，就是那些同时出版多种语言的文章。数据库的标签往往只标了一种，导致机器或人误判。
如何降低风险？
- 不要只依赖一种方法： 如果你只搜英文，可能会漏掉那 0.3% 的误杀文章。
- 使用“引文追踪”（Citation Searching）： 就像侦探查案一样，看看被采纳的文章引用了谁，或者谁引用了它。这样即使搜索漏掉了，也能通过“顺藤摸瓜”把漏网之鱼找回来。
- 如果资源允许，不要急着过滤： 如果时间充裕，最好先把所有语言的文章都找出来，在筛选阶段再仔细检查。如果必须过滤，要意识到那微小的风险，并做好准备去补救。

总结

这就好比在机场安检：

搜索时过滤就像在登机口直接设卡，只让说英语的人过。效率极高，但偶尔会误伤一个拿着英语护照但被系统标错的人。
筛选时过滤就像把所有乘客都拉进大厅，一个个检查。虽然更稳妥，但人力成本高，而且检查员也可能看错护照。

这篇论文告诉我们： 为了追求效率和准确性，我们通常可以在搜索时直接限制语言（因为 99.8% 是准的），但必须留个心眼，知道那 0.2% 的“误杀”是真实存在的，并且要用“引文追踪”等额外手段来确保万无一失。同时，数据库的标签系统（元数据）还需要更聪明、更准确才行。

Limiting to English language records: A comparison of five methods on Ovid MEDLINE and Embase versus removal during screening

1. 背景：为什么要限制语言？

2. 研究做了什么？

3. 主要发现：机器其实挺准，但偶尔会“脸盲”

发现一：5 种搜索技巧，效果几乎一模一样

发现二：机器也会“脸盲”（误杀）

发现三：人工筛选也会“看走眼”（误放）

4. 这意味着什么？（给普通人的启示）

总结

论文标题

1. 研究背景与问题 (Problem)

2. 方法论 (Methodology)

3. 关键贡献 (Key Contributions)

4. 主要结果 (Results)

5. 研究意义与结论 (Significance & Conclusion)

Limiting to English language records: A comparison of five methods on Ovid MEDLINE and Embase versus removal during screening

1. 背景：为什么要限制语言？

2. 研究做了什么？

3. 主要发现：机器其实挺准，但偶尔会“脸盲”

发现一：5 种搜索技巧，效果几乎一模一样

发现二：机器也会“脸盲”（误杀）

发现三：人工筛选也会“看走眼”（误放）

4. 这意味着什么？（给普通人的启示）

总结

论文标题

1. 研究背景与问题 (Problem)

2. 方法论 (Methodology)

3. 关键贡献 (Key Contributions)

4. 主要结果 (Results)

5. 研究意义与结论 (Significance & Conclusion)

类似论文

A case report on gendered biases in a Finnish healthcare AI assistant

An End-to-End Synthetic Oncology Clinical Trial Framework Integrating Radiographic Response, Circulating Tumor DNA, Safety, and Survival for Decision-Oriented Clinical Data Science

Who is leading medical AI? A systematic review and scientometric analysis of chest x-ray research

High-Throughput Observational Evidence Generation Using Linked Electronic Health Record and Claims Data

Perception of Safety in Behavioral Health Crisis Units among Patients and Care Partners versus Artificial Intelligence (AI): A Multimethod Study