Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

这篇综述系统梳理了大型多模态语言模型在文献检索、研究构思与实验、内容生成、多模态创作及科学评估等五大关键环节中的应用,深入探讨了相关数据集、方法、评估策略、局限性及伦理风险,旨在为“人工智能驱动科学”(AI4Science)领域的新进者提供指南并推动未来系统的整合与发展。

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller

发布于 2026-03-09
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是一份**“给科学界的 AI 使用说明书”,或者更形象地说,它是一份“超级助手如何帮助科学家从‘灵光一闪’到‘发表成果’的全流程指南”**。

想象一下,科学家的日常工作就像是在一个巨大的、迷宫般的图书馆里寻宝,还要自己种菜(做实验)、写日记(写论文),最后还要把成果展示给全世界看。过去,这一切都得靠科学家自己熬夜苦干。但现在,大型语言模型(LLM) 就像是一个无所不知、不知疲倦的**“超级实习生”**,正在彻底改变这个过程。

这篇论文详细梳理了这个“超级实习生”在科学研究的五个关键阶段是如何帮忙的:

1. 找资料:从“大海捞针”到“智能导航”

  • 以前的困难: 科学家要在成千上万篇论文里找灵感,就像在茫茫大海里捞一根特定的针。
  • AI 的魔法: AI 就像一个**“超级图书管理员”**。你不用只搜关键词,你可以直接问它:“我想研究某种治疗癌症的新药,最近有什么新发现?”它能瞬间把相关的论文读一遍,总结出重点,甚至画出它们之间的关系图。
  • 现状: 现在的工具(如 Elicit, Consensus)已经能帮你快速找到答案,但有时候它们也会“记错书”或者漏掉一些冷门的重要资料。

2. 想点子与做实验:从“苦思冥想”到“头脑风暴 + 自动化工厂”

  • 以前的困难: 提出一个新的科学假设(比如“这种植物能治感冒”)非常难,需要深厚的知识积累。设计实验更是繁琐,容易出错。
  • AI 的魔法:
    • 想点子: AI 像个**“创意合伙人”**。它能阅读海量文献,把两个看似不相关的概念拼在一起,提出人类可能想不到的新假设。
    • 做实验: 在计算机模拟的世界里,AI 像个**“自动化工厂”**。它可以自动写代码、运行模拟实验,甚至像下棋一样,通过不断试错来寻找最佳方案。
  • 现状: AI 提出的点子往往很有新意,但有时候不太“落地”(可行性差)。而且,如果让它直接控制真实的化学实验,它可能会因为“幻觉”(瞎编数据)而把实验室搞乱,所以人类专家还得在旁边盯着。

3. 写论文:从“咬笔头”到“智能润色”

  • 以前的困难: 写论文,特别是标题、摘要和“相关工作”部分,非常耗神。还要确保引用的文献是真的,不能瞎编。
  • AI 的魔法: AI 像个**“金牌编辑”**。
    • 它能帮你把枯燥的实验结果变成吸引人的标题。
    • 它能帮你润色语言,让非英语母语的科学家也能写出地道的英文论文。
    • 它能帮你整理参考文献。
  • 现状: AI 写摘要很快,但有时候会**“一本正经地胡说八道”**(比如编造不存在的参考文献)。所以,人类必须最后把关,确保引用的书是真的存在。

4. 画图与做 PPT:从“手绘草图”到“一键生成”

  • 以前的困难: 把复杂的实验数据变成漂亮的图表、幻灯片或海报,既费时又需要设计技巧。
  • AI 的魔法: AI 像个**“全能设计师”**。你给它一段文字描述,它就能画出专业的科学图表,甚至生成整个演示文稿。
  • 现状: 虽然 AI 能画出很漂亮的图,但在处理复杂的科学逻辑时,它偶尔会画错(比如把数据比例搞反)。目前它更适合做辅助,而不是完全替代人类设计师。

5. 同行评审:从“挑刺”到“智能助手”

  • 以前的困难: 论文发表前,需要其他专家(同行)来审稿,挑毛病。这过程很慢,而且审稿人也有偏见或疲劳的时候。
  • AI 的魔法: AI 像个**“初筛助手”**。它可以先帮审稿人快速检查论文的逻辑漏洞、格式问题,甚至预测论文会不会被录用。
  • 现状: AI 可以帮忙,但不能代替人类做最终决定。因为科学不仅仅是对错,还涉及创新性和伦理,这些是 AI 目前还无法完全理解的。

⚠️ 重要的警告:这个“超级实习生”也有缺点

论文特别强调,虽然 AI 很强大,但它有几个**“致命弱点”**,科学家必须小心:

  1. 爱撒谎(幻觉): 它可能会编造数据、引用不存在的论文。
  2. 有偏见: 如果它学习的资料里有很多偏见,它也会继承这些偏见。
  3. 缺乏常识: 它可能不知道某个实验在现实中是否安全或可行。
  4. 伦理风险: 如果滥用,可能会导致学术不端(如抄袭、造假),甚至制造“假科学”。

总结

这篇论文告诉我们:AI 不会取代科学家,但它会成为科学家最得力的“副驾驶”。

未来的科学探索,将是**“人类智慧 + AI 算力”**的完美结合。人类负责提出真正有深度的问题、把控伦理方向、做最终的判断;而 AI 负责处理海量数据、提供灵感、自动化繁琐的工作。只要人类保持警惕,不盲目信任 AI,科学发现的速度将会以前所未有的方式加速,造福全人类。