Experimental Design for Missing Physics

이 논문은 보편적 미분방정식과 기호 회귀를 결합하여 누락된 물리 법칙을 학습할 때 고품질 데이터를 확보하기 위해 제안된 모델 구조 간 최적 변별 기반의 순차적 실험 설계 기법을 생물 반응기에 적용한 내용을 다룹니다.

Arno Strouwen, Sebastián Micluta-Câmpeanu

게시일 2026-04-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ 1. 문제 상황: "누군가 레시피를 훔쳐갔어요!"

생각해 보세요. 여러분이 아주 맛있는 케이크를 굽고 싶지만, 어떤 재료가 들어가는지, 얼마나 섞어야 하는지에 대한 레시피의 일부가 사라졌다고 가정해 봅시다.

  • 알고 있는 것: 밀가루, 달걀, 설탕의 양 (이건 물리 법칙이나 화학 반응처럼 알려진 사실입니다).
  • 모르는 것 (Missing Physics): "어떤 온도에서 반죽이 가장 잘 부풀어 오르는지"를 설명하는 비밀 레시피.

과학자들은 이 '비밀 레시피'를 찾기 위해 실험을 합니다. 하지만 실험을 할 때마다 재료를 무작위로 섞으면, 정답에 가까운 레시피를 찾아내는 데 시간이 너무 오래 걸립니다.

🤖 2. 해결책: "AI 요리사"와 "해석기"

이 논문은 두 가지 강력한 도구를 조합해서 이 문제를 해결합니다.

  1. 범용 미분 방정식 (UDE) = "만능 AI 요리사"

    • 이 AI 는 레시피의 missing part(비밀 레시피) 를 **신경망 (Neural Network)**이라는 두꺼운 장벽으로 만들어 학습합니다.
    • AI 는 데이터를 많이 보면 "아, 이 정도 온도에서 반죽이 잘 부풀네!"라고 추측합니다. 하지만 AI 는 **"왜?"**라고 설명해주지 못합니다. (블랙박스 문제)
  2. 기호 회귀 (Symbolic Regression) = "해석기"

    • AI 가 추측한 복잡한 패턴을 다시 사람이 읽을 수 있는 간단한 공식으로 바꿔줍니다.
    • 예를 들어, AI 가 "어떤 복잡한 계산"을 했다면, 해석기는 "아, 이건 A×BA \times B구나!"라고 알려줍니다.

🎯 3. 핵심 전략: "가장 궁금한 점을 물어보는 실험"

여기서 이 논문의 가장 창의적인 아이디어가 나옵니다. 보통 실험은 "무작위로" 하거나, "이미 알고 있는 것"을 더 정확히 측정하는 데 집중합니다. 하지만 이 논문은 **"어떤 실험을 하면 가장 많은 정보를 얻을 수 있을까?"**를 계산합니다.

비유: "진짜 레시피 찾기 게임"

  1. 1 단계 (초기 실험): AI 요리사가 처음에 무작위 레시피를 몇 개 만들어 봅니다. (예: "온도가 높을수록 잘 부풀어", "온도가 낮을수록 잘 부풀어" 등 서로 다른 가설들)
  2. 2 단계 (차별화 실험): 이제 과학자는 이 가설들 중 어떤 실험을 하면 서로 가장 확연히 다른 결과가 나올지 계산합니다.
    • 예시: "A 가설은 100 도에서 실패하고, B 가설은 100 도에서 성공할 거야. 그럼 100 도에서 실험하자!"
    • 이렇게 하면 한 번의 실험으로 많은 가설을 탈락시킬 수 있습니다.
  3. 3 단계 (반복): 새로운 데이터를 얻으면 AI 를 다시 훈련시키고, 다시 해석기를 돌려 새로운 가설들을 만듭니다. 이 과정을 반복하면 점점 더 정답에 가까워집니다.

🧪 4. 실제 사례: "생물 반응기 (Bioreactor)"

이론을 실제 실험에 적용해 보았습니다.

  • 상황: 미생물을 키우는 탱크에서 미생물이 자라는 속도를 예측해야 합니다. 하지만 정확한 성장 공식 (모노드 식) 을 모릅니다.
  • 과정:
    1. 처음에는 아무것도 조절하지 않고 데이터를 모았습니다.
    2. AI 와 해석기를 통해 "성장 속도가 계속 증가할까, 아니면 일정하게 유지될까?"라는 두 가지 가설이 나왔습니다.
    3. 지능적인 실험 설계: "두 가설이 가장 크게 갈라지는 조건 (중간 농도)"을 찾아내어, 그 조건에서 미생물을 키우는 실험을 했습니다.
    4. 그 결과, 두 가설 중 하나가 확실히 틀렸다는 것이 증명되었고, 결국 **정답인 '모노드 식' (Monod equation)**을 찾아냈습니다.

🏆 5. 결론: "무작위 실험 vs 지능적 실험"

연구진은 이 방법을 5 번의 무작위 실험과 비교했습니다.

  • 무작위 실험: 정답을 찾지 못했습니다. (운이 없었거나, 중요한 단서를 놓쳤기 때문)
  • 이 논문의 방법 (최적 실험 설계): 3 번의 실험만으로 정답을 찾아냈습니다.

💡 요약

이 논문은 **"알 수 없는 과학 법칙을 찾을 때, 무작위로 실험하는 대신 AI 와 수학을 이용해 '가장 궁금한 점'을 집중적으로 파고드는 실험을 설계하자"**고 제안합니다.

이는 마치 미스터리 소설에서 범인을 잡을 때, 무작위로 모든 사람을 심문하는 대신, 범인의 행동 패턴을 분석해 가장 결정적인 단서가 나올 만한 시간과 장소를 찾아 심문하는 것과 같은 원리입니다. 덕분에 시간과 비용을 아끼면서도 정확한 과학적 진리를 발견할 수 있습니다.