原作者: Ben Bruers, Marilyn Cruces, Markus Demleitner, Guenter Duckeck, Michael Düren, Niclas Eich, Torsten Enßlin, Johannes Erdmann, Martin Erdmann, Peter Fackeldey, Christian Felder, Benjamin Fischer, Stefan Fröse, Stefan Funk, Martin Gasthuber, Andrew Grimshaw, Daniela Hadasch, Moritz Hannemann, Alexander Kappes, Raphael Kleinemühl, Oleksiy M. Kozlov, Thomas Kuhr, Michael Lupberger, Simon Neuhaus, Pardis Niknejadi, Judith Reindl, Daniel Schindler, Astrid Schneidewind, Frank Schreiber, Markus Schumacher, Kilian Schwarz, Achim Streit, R. Florian von Cube, Rod Walker, Cyrus Walther, Sebastian Wozniewski, Kai Zhou
原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 ✨ 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明
技术摘要:面向宇宙与物质研究的资源感知研究:数字化转型中的行动呼吁
问题陈述
本文探讨了宇宙与物质(ErUM)研究不断升级的计算需求与全球为规避气候临界点而必须减少温室气体(GHG)排放的紧迫要求之间的冲突。尽管《巴黎协定》要求在七年内将全球排放量减少 50%,但支持 ErUM 研究的数字基础设施——其特点是来自高能物理、天体物理以及光子/中子科学的海量数据速率——消耗了大量能源。作者指出,目前数据中心约占全球能源消耗的 1%,随着数据量的增长(例如,未来像平方公里阵列这样的设施将达到每秒太比特的数据量),这一数字预计将上升。核心挑战在于,在大幅降低计算、存储和算法处理的碳足迹的同时,保持科学进步和知识获取。
方法论
本研究并非实验性研究,而是基于 2023 年 5 月举行的一次为期三天的研讨会所进行的战略综合,该研讨会汇聚了德国 ErUM-Data 社区的科学家及国际合作伙伴。方法论包括:
- 结构化审议:研讨会由十二个预先 formulated 的问题(详见附录 A)引导,涵盖硬件、数据、算法、能源供应和文化转变。
- 组合开发:参与者分析了当前实践,并在六个具体领域确定了可操作的措施:智能数据转换、软件工程、算法/人工智能、计算基础设施、教育以及机构支持。
- 按可行性分类:根据实施所需的时间和努力,将确定的措施分为:立即/短期、中期(数年)和长期(协调规划)。
- 情境分析:作者整合了现有的能源消耗数据(例如,PUE 值、德国计算中心的具体吉瓦时用量)和排放范围(范围 1、2 和 3),使建议立足于技术现实。
主要贡献
本文提出了一套全面的“措施组合”,以推动 ErUM 研究向可持续发展转型。这些贡献被组织为六个技术和组织领域:
智能数据转换:
- 倡导FAIR 数据(可发现、可访问、可互操作、可重用),以最大化重用并减少冗余处理。
- 提出“基于流模型”,即原始数据在线处理,若无科学价值则丢弃,而非存储所有原始数据。
- 建议优化中间工作流结果(快照)的存储,以平衡存储成本与重新计算所需的能源。
软件工程与数据分析:
- 强调从“意大利面条式代码”向专业、模块化且版本控制的软件过渡,以防止“废弃软件”并确保可重复性。
- 呼吁将能源效率作为与标准基准并列的主要软件质量指标。
- 推荐自动化并行化、向量化以及适应新的 CPU 架构(例如 ARM、RISC-V),以提高每操作能效。
算法与人工智能(AI):
- 强调了生成模型和预训练模型的潜力,以替代计算昂贵的模拟(例如,用快几个数量级的深度生成模型替代 Geant4 探测器模拟)。
- 主张仅在 AI 能带来显著科学效益或资源节约时进行战略性使用,警告避免“反弹效应”,即效率提升导致总消耗增加。
- 强调需要记录机器学习模型训练和推理阶段的 CO2e 足迹。
计算与基础设施:
- 提议将数据中心搬迁至与可再生能源(例如海上风电场)共址的位置,以利用直接电力并减少传输损耗。
- 建议动态工作负载调度,即根据实时可再生能源可用性扩大或缩小计算资源(例如“可变形作业”)。
- 建议在可行情况下延长硬件寿命(超过典型的 5 年),以摊销制造碳足迹(范围 3),并将废热用于区域供暖。
- 呼吁提高电源使用效率(PUE),并实施能源存储解决方案以缓冲可再生能源的间歇性。
教育与文化:
- 指出需要新的课程来培训科学家掌握可持续数字实践,包括资源感知编码和 AI 的伦理影响。
- 倡导文化转变,使研究人员主动平衡知识获取与资源使用。
资金与机构支持:
- 呼吁资助机构支持软件和数据管理的长期职位,并在项目规划中包含碳足迹评估。
结果与拟议行动
本文的主要结果是表 2,这是一份按实施时间线分类的优先“行动呼吁”清单:
- 立即/短期:提高意识、在作业层面监控能源消耗,并在项目规划中考虑碳足迹。
- 中期(数年):实施 FAIR 数据实践、优化软件能效、采用工作流管理,并开发资源监控工具。
- 长期:在可再生能源源附近建立数据中心、开发用于能源感知调度的动态中间件,以及优化硬件生命周期。
本文还提供了具体的技术数据,例如 CERN 能源消耗的细分(55% 用于处理,21% 用于磁盘存储),以及通过时钟速率节流将节点功耗降低 50% 的潜力。
意义与主张
作者声称,ErUM 社区拥有制定减少 CO2e 排放现实计划的工具和专业知识,且无需牺牲科学进步。他们认为,可持续性不仅仅是环境约束,更是算法、软件架构和基础设施管理创新的驱动力。
本文断言,这一转型需要科学界各层级在态度和行为上进行“艰难但不可避免”的转变。它将拟议的措施组合定位为必要的框架,以使 ErUM 研究的数字化转型与《巴黎协定》的目标保持一致。作者总结道,通过有意识地平衡预期的知识获取与资源使用,社区可以实现效率提升,这最终将在保护生命所需行星条件的同时加速科学进步。
您所在领域的论文太多了?
获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。
每周获取最佳 materials science 论文。
受到斯坦福、剑桥和法国科学院研究人员的信赖。
请查收邮箱确认订阅。
出了点问题,再试一次?
无垃圾邮件,随时退订。