Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

이 논문은 분자 언어 모델, 강화 학습, 몬테카를로 트리 탐색을 통합한 'Trio' 프레임워크를 제안하여, 기존 생성 모델의 한계를 극복하고 결합 친화도, 약물 유사성, 합성 접근성을 모두 향상시키면서도 분자 다양성을 4 배 이상 확장하는 폐쇄 루프형 표적 분자 설계 패러다임을 제시합니다.

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu

게시일 2026-03-12
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"새로운 약을 만드는 과정"**을 훨씬 더 똑똑하고 빠르며 이해하기 쉽게 바꾸는 새로운 인공지능 방법론인 **'Trio(트리오)'**를 소개합니다.

기존의 약물 개발은 마치 거대한 도서관에서 실수로 책 한 권을 뽑아보는 것처럼 비효율적이고, 비용이 많이 들며 실패할 확률이 높았습니다. Trio 는 이 문제를 해결하기 위해 세 명의 전문가가 팀을 이루어 일하는 방식을 도입했습니다.

이 세 명의 전문가를 쉽게 설명해 드릴게요.

1. Trio 의 세 명의 전문가 (핵심 구성 요소)

이 시스템은 세 가지 핵심 기술이 협력하여 작동합니다.

  • 전문가 1: 'FRAGPT' (유능한 건축가)

    • 역할: 약을 만드는 '레고 블록'을 잘 아는 언어 모델입니다.
    • 비유: 기존 AI 들은 약을 만들 때 알파벳 하나하나를 나열하듯 원자 하나하나를 붙였기 때문에, 문법 오류가 나거나 이상한 모양의 분자가 만들어지곤 했습니다. 하지만 FRAGPT 는 이미 완성된 '레고 블록(분자 조각)' 단위로 말을 배우고 만듭니다. 마치 우리가 단어를 조합해 문장을 만들듯, 이 AI 는 이미 검증된 화학 조각들을 조합해 새로운 분자를 만듭니다. 그래서 실제 화학 법칙에 어긋나는 엉터리 분자를 만들 확률이 매우 낮습니다.
  • 전문가 2: 'DPO' (엄격한 품질 관리팀)

    • 역할: 만들어진 분자가 '약'으로서 가치가 있는지 검사합니다.
    • 비유: 건축가가 멋진 건물을 지었더라도, 그 건물이 **사람이 살기 좋은지 (약효), 시공이 가능한지 (합성 용이성)**를 따져봐야 합니다. 이 품질 관리팀은 AI 가 만든 분자가 너무 복잡하거나 독성이 있거나, 실험실에서 만들 수 없는지 체크합니다. 약처럼 잘 작동하고, 실제로 만들 수 있는 분자만 통과시킵니다.
  • 전문가 3: 'MCTS' (전략적 탐험가)

    • 역할: 수많은 가능성 중에서 가장 좋은 길을 찾아내는 지도자입니다.
    • 비유: 새로운 도시를 탐험할 때, 무작정 돌아다니는 게 아니라 지도와 나침반을 사용합니다. 이 AI 는 "이 방향으로 가면 좋은 결과가 나올까?"라고 수만 번 시뮬레이션을 돌려봅니다. 어떤 분자 조각을 먼저 붙여야 병균 (바이러스) 을 가장 잘 잡을지 전략적으로 계산하며, 좋은 방향은 더 깊이 파고들고 (Exploitation), 새로운 가능성은 넓게 탐색합니다 (Exploration).

2. Trio 가 어떻게 작동하나요? (창의적인 비유)

Trio 는 **마치 '마법 같은 요리 대회'**를 연상시킵니다.

  1. 재료 준비 (FRAGPT): 요리사 (AI) 는 수백만 가지의 '완성된 소스'와 '재료'를 기억하고 있습니다. 그는 무작위로 재료를 섞는 게 아니라, 맛있는 조합을 알고 있는 레시피를 바탕으로 새로운 요리를 만들어냅니다.
  2. 맛보기와 수정 (DPO): 요리사가 만든 요리를 맛봅니다. "이건 너무 짜다", "이건 만들기 너무 어렵다"라고 지적합니다. 요리사는 이 피드백을 받아 약처럼 효과 있고, 만들기 쉬운 요리로 다시 만듭니다.
  3. 최고의 메뉴 선정 (MCTS): 이제 수많은 요리 후보들 중에서, 특정 질병 (예: 암세포) 을 가장 잘 공격할 수 있는 메뉴를 찾아야 합니다. AI 는 "이 재료를 추가하면 더 맛있을까? 아니면 저 재료를 빼는 게 나을까?"를 수천 번 시뮬레이션하며 최고의 조합을 찾아냅니다.

3. 기존 방법과 무엇이 다른가요?

  • 기존 방법:

    • 블랙박스: "왜 이 약이 좋은지" 알 수 없었습니다. (마치 요리를 시켰는데 "맛있어"만 하고 레시피는 알려주지 않는 것)
    • 비효율: 수만 가지의 약을 무작위로 만들어서 하나씩 테스트해야 했습니다.
    • 실패: 만들어지는 약 중 실제 실험실에서 만들 수 없는 것들이 많았습니다.
  • Trio 의 장점:

    • 해석 가능 (Interpretability): AI 가 어떤 '레고 블록'을 어떤 순서로 붙였는지 단계별로 보여줍니다. 그래서 과학자들이 "아, 이 부분이 약효를 높이는구나!"라고 이해할 수 있습니다.
    • 높은 성공률: 약효 (Binding Affinity) 는 약 8%, 약처럼 보이는 정도 (Drug-likeness) 는 11%, 실제로 만들기 쉬운 정도 (Synthetic Accessibility) 는 **12%**나 향상되었습니다.
    • 다양성: 기존에 없던 완전히 새로운 형태의 약을 4 배 이상 더 많이 찾아냈습니다.

4. 결론: 왜 이것이 중요한가요?

이 논문은 **"약 개발의 미래"**를 보여줍니다. Trio 는 단순히 약을 '발견'하는 것을 넘어, 과학자가 AI 와 함께 대화하며 (해석 가능), 실제로 만들 수 있는 (품질 관리), 최고의 약전략적으로 찾아내는 (탐색) 새로운 패러다임을 제시합니다.

마치 수천 년 걸리던 약물 개발 과정을, 똑똑한 AI 팀이 도와주어 훨씬 짧고 확실하게 만들어주는 것과 같습니다. 이제 우리는 더 빠르고, 더 안전하며, 더 혁신적인 약들을 만날 수 있게 되었습니다.