MolX: A Geometric Foundation Model for Protein-Ligand Modelling

본 논문은 300 만 개 이상의 단백질 주머니와 500 만 개 이상의 분자 데이터를 기반으로 E(3)-공변성 그래프 트랜스포머 아키텍처를 통해 단백질 - 리간드 상호작용의 기하학적 및 화학적 특성을 통합적으로 학습하고, 다양한 하류 작업에서 최첨단 성능과 해석 가능성을 보여주는 새로운 지각 모델 'MolX'를 제안합니다.

원저자: Liu, J., Pan, T., Guo, X., Ran, Z., Hao, Y., Yang, Y., Ng, A. P., Pan, S., Song, J., Li, F.

게시일 2026-03-01
📖 3 분 읽기☕ 가벼운 읽기
⚕️

이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

🧩 MolX: "약과 열쇠"를 동시에 이해하는 천재 설계사

약 개발에서 가장 중요한 것은 **약 (작은 분자)**이 **표적 단백질 (병의 원인을 만드는 열쇠 구멍)**에 정확히 끼워지는지 확인하는 것입니다. 기존 컴퓨터 프로그램들은 이 두 가지를 따로따로 보거나, 단순히 2 차원 그림처럼만 봐서 정확한 3 차원 공간 관계를 놓치는 경우가 많았습니다.

MolX는 이 문제를 해결하기 위해 태어난 **'3 차원 공간 감각이 뛰어난 천재 설계사'**입니다.

1. 기존 방식 vs MolX 의 차이점

  • 기존 방식 (단순한 나열): 약의 성분 목록 (문자열) 과 단백질의 아미노산 나열 (문자열) 을 따로 읽어서 "이게 맞을 것 같아"라고 추측하는 수준입니다. 마치 레시피만 보고 요리가 어떻게 생겼는지 상상하는 것과 비슷합니다.
  • MolX 방식 (입체적 조립): 약과 단백질을 **3 차원 입체 모형 (레고)**으로 만들어서, 서로 어떻게 맞물리는지, 어떤 모양이 서로를 끌어당기는지 직접 보고 학습합니다. 마치 실제 레고 블록을 손으로 만져가며 맞춰보는 것과 같습니다.

2. MolX 가 어떻게 배우나요? (거대한 도서관과 미션)

MolX 는 약 300 만 개의 단백질 구멍과 500 만 개의 분자 데이터를 바탕으로 공부했습니다. 이 학습 과정은 두 가지 미션으로 나뉩니다.

  • 미션 1: "눈가림 게임" (자기 학습)
    • 분자의 3 차원 좌표나 원자 종류를 일부러 지워버리고, AI 가 "어떤 원자가 어디에 있었지?"라고 맞춰보게 합니다.
    • 비유: 퍼즐 조각의 일부가 사라진 상태에서, 나머지 조각의 모양과 공간감을 보고 어떤 조각이 원래 어디에 있어야 할지 추리하는 훈련입니다. 이를 통해 AI 는 분자의 3 차원 구조를 완벽하게 이해하게 됩니다.
  • 미션 2: "물리 법칙 퀴즈" (지도 학습)
    • 약이 얼마나 기름기 있는지 (LogP) 나 에너지가 얼마나 들었는지 같은 과학적 사실을 정답으로 알려주며 학습시킵니다.

3. 왜 MolX 가 더 잘할까요? (공간 감각의 마법)

MolX 의 가장 큰 특징은 **E(3)-equivariant(입체 대칭성)**라는 기술을 썼다는 점입니다.

  • 비유: 우리가 어떤 물건을 보고 "이건 의자야"라고 알 때, 의자를 뒤집거나 옆으로 눕혀도 여전히 의자인 걸 알죠? MolX 도 마찬가지입니다. 단백질과 약을 3 차원 공간에서 돌리거나 뒤집어도 그 관계와 결합 방식을 똑같이 이해합니다.
  • 기존 모델들은 "순서"만 중요하게 생각했지만, MolX 는 **"거리와 각도"**를 중요하게 여깁니다. 원자 A 와 B 가 얼마나 떨어져 있는지, 어떤 각도로 마주보고 있는지가 결합의 성패를 결정하기 때문입니다.

4. "왜?"에 대한 답을 줍니다 (해석 가능성)

대부분의 AI 는 "정답은 A 입니다"라고만 말하지만, "왜 A 인지"는 말해주지 않습니다. 하지만 MolX 는 **스파르타 (SAE)**라는 장치를 통해 내부 작동 원리를 설명해 줍니다.

  • 비유: MolX 가 "이 약이 잘 들어맞습니다"라고 말할 때, **"왜?"**라고 물으면, "이 약의 **특정 부분 (예: 고리 모양)**이 단백질의 **특정 구멍 (예: 주머니 모양)**과 딱 들어맞기 때문입니다"라고 구체적인 부위를 가리키며 설명해 줍니다.
  • 이는 마치 검은 상자에 들어있는 기계의 톱니바퀴를 하나하나 열어보며, 어떤 톱니가 어떻게 돌아가는지 보여주는 것과 같습니다.

5. 실제로 얼마나 잘하나요?

MolX 는 다양한 테스트 (항체 - 약물 접합체, PROTAC 같은 최신 약물, 일반적인 결합력 예측 등) 에서 기존 최고의 모델들보다 압도적으로 좋은 점수를 받았습니다. 특히, 데이터가 부족한 새로운 종류의 약이나 복잡한 결합 상황에서도 잘 적응하여 범용성을 입증했습니다.

🚀 요약: MolX 가 가져오는 변화

  1. 정확도 향상: 3 차원 구조를 제대로 이해하므로, 약이 단백질에 잘 붙을지 예측하는 정확도가 훨씬 높아졌습니다.
  2. 이해의 폭 확장: 단순히 "맞다/안 맞다"를 넘어, 어떤 구조적 특징이 결합을 결정하는지 과학적으로 설명해 줍니다.
  3. 약 개발 가속화: 실험실에서 수많은 약을 만들어 볼 필요 없이, 컴퓨터 시뮬레이션으로 가장 유망한 후보를 먼저 찾아낼 수 있어 시간과 비용을 아낄 수 있습니다.

결론적으로, MolX는 약 개발의 '눈'이 되어, 보이지 않던 3 차원 세계의 미세한 결합을 선명하게 보여주고 그 이유까지 설명해 주는 차세대 인공지능 도약입니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →