Shaping the Digital Future of ErUM Research: Sustainability & Ethics
2025 년 아헨에서 개최된 워크숍 보고서는 데이터 중심 ErUM 연구의 디지털 미래를 형성하기 위해 탄소 배출 감축, FAIR 원칙 강화, 저탄소 인프라 최적화 등 기술적 조치와 함께 AI 윤리, 교육·훈련 체계 구축, 그리고 지속 가능성과 윤리를 일상적 연구 관행으로 정착시키기 위한 커뮤니티 주도적 전략을 종합적으로 제시합니다.
원저자:Luca Di Bella, Jan Bürger, Markus Demleitner, Torsten Enßlin, Johannes Erdmann, Martin Erdmann, Benjamin Fischer, Martin Gasthuber, Gabriele Gramelsberger, Wolfgang Gründinger, Prateek Gupta, JohannesLuca Di Bella, Jan Bürger, Markus Demleitner, Torsten Enßlin, Johannes Erdmann, Martin Erdmann, Benjamin Fischer, Martin Gasthuber, Gabriele Gramelsberger, Wolfgang Gründinger, Prateek Gupta, Johannes Hartl, Maximilian Horzela, Vijay Kartik, Stefan Krischer, Eva Kröll, Thomas Kuhr, Katharina Kürschner, Inga Lakomiec, Valerie Lang, Kristin Lohwasser, Thomas Metcalf, Martin Möller, Saskia Nagel, Susanne Pfalzner, Rebecca Redlin, Christopher Schrader, Kathrin Schulz, Markus Schumacher, Kilian Schwarz, Fabian Sigler, Dwayne Spiteri, Achim Stahl, Judith Steinfeld, Wim Vanderbauwhede, Cyrus Walther, Angela Warkentin, Peter Wissmann, Eoin Woods
설명: 코드를 짜는 과학자들이 에너지를 덜 쓰는 효율적인 프로그램을 만들도록 장려하고, 그 프로그램을 인증해 주자는 제안입니다.
🤖 3. 윤리: "AI 는 조수일 뿐, 운전자는 인간이다"
인공지능 (AI) 이 과학 연구에 많이 쓰이지만, 여기에는 위험이 따릅니다.
책임은 인간에게:
비유: AI 는 훌륭한 비행기 조종 보조 시스템일 뿐입니다. 하지만 비행기가 추락했을 때 책임을 지는 것은 **조종사 (과학자)**입니다.
설명: AI 가 만들어낸 결과물이나 논문이 틀렸다면, 그건 AI 의 잘못이 아니라 그걸 쓴 과학자의 책임입니다. AI 를 맹신하지 않고, 인간이 최종적으로 검증하고 책임져야 합니다.
기술 퇴보 (Deskilling) 의 위험:
비유: 내비게이션만 믿고 운전하는 법을 잊어버린 운전자를 상상해보세요.
설명: AI 가 모든 것을 대신해주면, 젊은 과학자들이 스스로 문제를 해결하는 능력 (비판적 사고, 실험 설계 등) 을 잃을 수 있습니다. AI 는 도구를 써야지, 도구에 의존해서는 안 됩니다.
투명성:
비유: 요리를 할 때 레시피를 공개하는 것처럼, AI 가 어떤 데이터로 학습했는지, 어떤 과정을 거쳐 결론을 냈는지 모두 공개해야 합니다.
설명: AI 가 '블랙박스 (검은 상자)'처럼 작동하면 안 됩니다. 왜 그런 결론이 나왔는지 누구나 이해할 수 있어야 신뢰를 얻을 수 있습니다.
🚀 4. 행동으로 옮기기: "지식만으로는 부족하다"
단순히 "에너지를 아껴야 한다"고 말하는 것만으로는 부족합니다. 사람들이 실제로 행동하게 만들려면 동기가 필요합니다.
인센티브와 칭찬:
비유: 환경 보호를 하면 벌금을 내는 게 아니라, 상장 (상패) 을 주거나 연구 기간을 더 늘려주는 것이 더 효과적입니다.
설명: 에너지를 아껴서 좋은 연구를 한 과학자에게 상을 주거나, 자금 지원을 더 해주는 식으로 "지속 가능한 연구"가 더 유리한 선택이 되도록 만들어야 합니다.
교육과 멘토링:
비유: 어린아이에게 "쓰레기를 줍자"고 말하기보다, 함께 주워보면서 습관을 들이는 것이 중요합니다.
설명: 대학생이나 초보 연구자들에게 일찍부터 "지속 가능한 코딩"과 "AI 윤리"를 가르쳐야 합니다. 선배들이 후배들에게 좋은 예를 보여주고, 함께 배우는 문화가 필요합니다.
소통의 변화:
비유: "지구가 망한다"고 공포를 조장하는 것보다, **"우리가 함께 더 나은 미래를 만들자"**는 희망과 공동체 의식을 자극해야 합니다.
설명: 과학자들도 일반인처럼 다양한 가치관을 가집니다. 서로의 가치를 이해하고, "우리가 함께 하면 더 좋은 연구가 나온다"는 메시지를 전달해야 합니다.
💡 요약: 이 보고서가 말하고 싶은 것
이 보고서는 **"과학의 미래를 위해 컴퓨터 에너지를 아끼고, AI 를 현명하게 쓰자"**고 외치고 있습니다.
기술적 해결: 컴퓨터를 에너지가 풍부할 때만 쓰고, 데이터를 정리하며, 효율적인 프로그램을 쓰자.
윤리적 태도: AI 는 도구일 뿐, 책임은 인간이 져야 한다. 젊은 과학자들이 스스로 생각하는 능력을 잃지 않게 하자.
문화적 변화: 억지로 시키기보다, 칭찬하고 동기를 부여해서 과학자들이 자발적으로 환경과 윤리를 생각하게 만들자.
결국 이 모든 것은 과학이 인류와 지구에 더 오래, 더 건강하게 기여할 수 있도록 하는 길입니다.
Each language version is independently generated for its own context, not a direct translation.
논문 개요
이 보고서는 독일의 우주 및 물질 연구 (ErUM) 데이터 중심 연구 커뮤니티가 2023 년 '자원 인식 연구 (Resource-aware research)'를 위한 행동 호소 이후 이룩한 진전을 평가하고, 지속 가능성 (Sustainability) 과 윤리 (Ethics), 특히 인공지능 (AI) 의 디지털 미래에 대한 워크숍 결과를 정리한 것입니다. 연구는 데이터 집약적 과학의 탄소 배출 감소, 데이터/소프트웨어의 FAIR(검색 가능, 접근 가능, 상호 운용 가능, 재사용 가능) 원칙 준수, 그리고 AI 활용에 따른 윤리적 책임을 다루고 있습니다.
1. 문제 정의 (Problem)
환경적 영향: 데이터 중심 과학 (ErUM) 은 막대한 컴퓨팅 자원과 에너지를 소모하며, 이는 직접적인 운영 배출 (Operation Emissions) 과 하드웨어 제조 및 폐기 시 발생하는 내재적 배출 (Embedded Emissions) 로 이어집니다.
지속 가능성과 효율성의 괴리: 알고리즘 최적화나 하드웨어 효율성 향상이 이루어지더라도, 이를 통해 생성된 데이터 양이 증가하는 '반동 효과 (Rebound Effect)'로 인해 전체적인 에너지 소비는 감소하지 않는 경우가 많습니다.
교육 및 인식 부재: 학생 및 초기 경력 연구자들이 컴퓨팅 자원의 한계와 환경적 영향을 고려하지 않고 비효율적인 코딩 및 워크플로우를 사용하는 경우가 많습니다.
AI 의 윤리적 도전: AI 와 생성형 모델의 도입은 연구 생산성을 높이지만, '블랙박스'화, 편향 (Bias), 책임 소재 불분명, 그리고 연구자의 기술 저하 (Deskilling) 위험을 초래합니다.
2. 방법론 (Methodology)
이 보고서는 2025 년 아헨에서 개최된 워크숍의 결과를 바탕으로 하며, 다음과 같은 접근 방식을 취했습니다:
시간적 범주화: 해결책과 조치를 단기 (S), 중기 (M), 장기 (L) 로 분류하여 실행 가능성과 필요 자원을 평가했습니다.
다학제적 협의: 물리학자, 컴퓨터 과학자, 윤리학자, 교육 전문가 등 다양한 이해관계자 (ErUM-Data Hub, 대학, 연구소 등) 가 참여하여 기술적, 제도적, 교육적 방안을 논의했습니다.
구체적 사례 분석: ATLAS, Belle II, ALICE 등 주요 실험 프로젝트의 사례와 새로운 프로젝트 (SUSFECIT 등) 를 통해 모니터링, 데이터 관리, 워크플로우 최적화 방안을 검증했습니다.
3. 주요 기여 및 핵심 내용 (Key Contributions)
A. 지속 가능성 조치 (Sustainability Actions)
호흡하는 컴퓨팅 센터 (Breathing Computing Centers): 재생 에너지 (태양광, 풍력) 의 가변성에 맞춰 컴퓨팅 작업을 조정하는 개념을 제안했습니다. 실시간 요구가 없는 과학 워크플로우를 에너지 공급이 풍부한 시기에 실행하거나, 작업을 지연/이동 (Workload Shifting) 하여 탄소 배출이 적은 시간대에 처리하는 방식입니다.
데이터 저장 및 재사용 전략:
장기 저장: 원시 데이터 대신 과학적으로 재사용 가능한 파생 데이터 (Science-ready data) 만 저장하거나, 손실 압축 (Lossy compression) 을 통해 저장 공간을 최적화합니다.
재계산 vs 저장: 중간 결과물을 저장할지 재계산할지 결정할 때 FAIR 원칙과 재사용 비용을 고려합니다.
소프트웨어 효율성 인증: 소프트웨어의 에너지 소비를 측정하고 인증하는 체계를 도입하여, 프로젝트 계획 단계에서 에너지 효율성을 고려하도록 유도합니다.
모니터링 및 보고: 작업 단위 (Job level) 및 사이트 단위에서 에너지 소비와 탄소 발자국을 모니터링하고 사용자에게 피드백을 제공하는 시스템을 확대합니다.
B. 교육 및 훈련 (Teaching & Training)
지속 가능한 코딩 교육: 학부 및 대학원생에게 효율적인 알고리즘 사용, 리소스 할당, 그리고 지속 가능한 코딩 관행을 체계적으로 교육합니다.
멘토링 및 코칭: 초기 경력 연구자를 위한 '코드 컨설팅' 프로그램과 지속 가능한 컴퓨팅을 전파하는 '학생 앰배서더' 네트워크를 구축합니다.
커뮤니케이션 역량 강화: 기술적 지식뿐만 아니라 지속 가능성의 중요성을 효과적으로 전달할 수 있는 교수법과 커뮤니케이션 기술을 교육합니다.
C. 윤리 및 AI (Ethics & AI)
책임의 귀속: "기계는 인간의 책임을 면제하지 않는다"는 원칙 하에, AI 가 생성한 결과물에 대한 최종 책임과 검증은 인간 연구자에게 있음을 명시했습니다.
투명성과 설명 가능성: AI 모델의 결정 과정 (블랙박스) 을 설명 가능하게 만들고, 훈련 데이터의 편향을 제거하기 위한 노력과 데이터 공개 기준을 마련해야 합니다.
기술 저하 (Deskilling) 방지: AI 도구의 과도한 의존을 경계하고, 비판적 사고, 실험 설계, 데이터 해석 등 연구자의 핵심 역량을 유지하도록 교육 과정을 개편해야 합니다.
저자 표기: 생성형 AI 는 저자로 인정될 수 없으며, AI 를 사용한 경우 그 사용 내역 (프롬프트, 설정 등) 을 공개적으로 문서화해야 합니다.
D. 인식 제고 및 실행 (Assisting Awareness)
가치 공유와 동기 부여: 단순한 정보 전달을 넘어, 연구자들의 내재적 동기를 자극하고 '손발자국 (Handprint, 긍정적 기여)' 개념을 강조하여 지속 가능성을 일상적인 과학 실천으로 통합합니다.
인센티브 구조: 지속 가능한 연구 프로젝트에 대한 추가 자금 지원, 인증 제도, 그리고 공개된 탄소 발자국 보고를 통해 긍정적인 경쟁을 유도합니다.
4. 결과 및 현황 (Results)
진전 사항:
커뮤니티 내 지속 가능성에 대한 인식 제고 및 'Know your footprint'와 같은 도구 도입.
ATLAS 등 주요 실험에서 작업 단위 탄소 발자국 모니터링 시스템 도입.
오픈소스 라이브러리 사용 증가 및 효율적인 알고리즘 채택.
데이터 FAIRness 및 워크플로우 관리 시스템 (PanDA, PUNCH 등) 의 표준화 노력.
지속적인 과제:
장기적인 데이터 저장 전략과 재계산 비용의 균형.
재생 에너지에 기반한 동적 컴퓨팅 (Breathing Centers) 의 실제 구현과 하드웨어 비용 문제.
연구 계획 단계에 지속 가능성을 통합하기 위한 명확한 자금 지원 및 정책적 가이드라인 부재.
AI 의 환경 비용과 연구적 가치 간의 정량적 평가 어려움.
5. 의의 및 결론 (Significance)
이 보고서는 ErUM-Data 커뮤니티가 디지털 전환의 지속 가능성을 위해 기술적 혁신, 제도적 지원, 교육적 변화가 동시에 필요함을 강조합니다.
기술적: '호흡하는 컴퓨팅 센터'와 같은 혁신적 인프라 개념과 효율적인 소프트웨어 인증 체계는 데이터 중심 과학의 탄소 중립을 위한 핵심 전략입니다.
사회적/윤리적: AI 시대에 연구자의 책임과 윤리적 기준을 재정의함으로써 과학적 무결성과 공공 신뢰를 유지할 수 있습니다.
전략적: 단순한 인식 제고를 넘어, 구체적인 인센티브, 자금 지원, 그리고 '승승 (Win-Win)' 워크플로우 설계를 통해 지속 가능성을 연구의 일상으로 정착시켜야 함을 시사합니다.
결론적으로, 이 보고서는 데이터 집약적 과학이 환경적, 윤리적 책임을 다하면서도 과학적 진보를 이룰 수 있는 구체적인 로드맵을 제시하며, 커뮤니티 전체의 협력과 체계적인 거버넌스가 필수적임을 강조합니다.