Unlocking Scalable Ligand Residence Time Predictions with Koffee Unbinding Kinetics Simulations
이 논문은 기존 분자 동역학 시뮬레이션보다 3~5 차수 빠른 속도로 GPU 한 대당 약 1 분 만에 물리 기반 리간드 체류 시간을 예측하여 약물 발견 파이프라인의 실패를 줄일 수 있는 새로운 방법론인 'Koffee Unbinding Kinetics'를 제시합니다.
원저자:Madsen, N. K., Ziolek, R. M., Kongsgaard, D., Nielsen, C. F., Norlov, A. D., Dolciami, D., Sacher, J. R., Michelsen, K., Acker, M. G., Berglund, N. A., Christensen, M. H., Gronlund, A., Husted, L., GlMadsen, N. K., Ziolek, R. M., Kongsgaard, D., Nielsen, C. F., Norlov, A. D., Dolciami, D., Sacher, J. R., Michelsen, K., Acker, M. G., Berglund, N. A., Christensen, M. H., Gronlund, A., Husted, L., Gloriam, D. E., Kooistra, A. J., Zinner, N. T.
저자들은 기존 MD 기반 접근법을 대체하여, 비평형 (nonequilibrium) 리간드 해리 과정을 모델링하는 새로운 물리 기반 시뮬레이션 엔진인 Koffee™ Unbinding Kinetics를 개발했습니다.
핵심 원리:
시간 기반 시뮬레이션 대신 에너지 기반 최적화 과정으로 문제를 재정의했습니다.
아레니우스 방정식 (RT∝exp(βΔE‡)) 을 기반으로, 리간드 해리 경로의 활성화 에너지 (ΔE‡) 를 계산하여 RT 를 예측합니다.
활성화 에너지는 결합 상태 에너지 (Ebound) 와 전이 상태 (Transition State, E‡) 에너지의 차이로 정의됩니다.
알고리즘 프로세스:
입력: 단백질 (.pdb) 과 리간드 (.sdf) 구조를 읽습니다.
준비: Amber ff14SB (단백질) 와 GAFF 2.11 (리간드) 힘장을 사용하며, GBn/GBn2 암시적 용매 모델을 적용합니다.
시뮬레이션: 리간드의 탈출 방향을 식별하고, 여러 비평형 해리 경로 (candidate pathways) 를 시뮬레이션합니다.
전이 상태 추출: 완전한 해리가 감지되면 경로 상의 최대 에너지 상태인 전이 상태를 추출합니다.
스코어링: 모든 계산된 경로 중 최소 활성화 에너지를 'Unbinding Kinetics Score'로 사용합니다.
성능: 단일 GPU(NVIDIA T4) 에서 복합체당 약 1 분 만에 시뮬레이션이 완료됩니다. 이는 기존 MD 기반 방법 대비 3~5 차수 (orders of magnitude) 의 속도 향상과 비용 절감을 의미합니다.
3. 주요 기여 및 결과 (Key Contributions & Results)
A. 화학적 다양성과 다양한 결합 부위에 대한 적용성 검증
데이터셋: eIF4E, FAK, HSP90, M3(GPCR), Thermolysin(금속효소), TTK 등 6 가지 서로 다른 표적과 248 개의 리간드로 구성된 다양한 데이터셋을 테스트했습니다.
성능:
대부분의 데이터셋에서 실험적 해리 속도 상수 (koff) 와 높은 상관관계 (R2 및 스피어만 상관 계수 ρ) 를 보였습니다.
특히 eIF4E(거대 분자), M3(깊은 결합 부위), Thermolysin(금속 이온 포함) 과 같은 까다로운 시스템에서도 우수한 예측력을 입증했습니다.
HSP90 예외: HSP90 데이터셋은 리간드 분자량에 강한 의존성을 보여 예측이 어려웠으나, 이는 기존 MD 기반 방법 (τ-RAMD) 도 유사한 어려움을 겪었던 것으로 확인되었습니다.
B. 결합 부위 돌연변이 효과 예측 (M3 Mutants)
M3 무스카린 수용체의 활성 부위 돌연변이 (13 개) 에 대한 리간드 티오프로피움 (tiotropium) 의 해리 거동을 예측했습니다.
기존 연구 (Coricello et al.) 는 12 개 돌연변이 시뮬레이션에 182 GPU 일이 소요되었으나, Koffee 는 약 5 차수 더 낮은 비용으로 유사하거나 더 높은 정확도 (ρ=0.81) 를 달성했습니다.
C. 다양한 표적에 걸친 대규모 스크리닝 및 분류 능력
통합 데이터셋: 8 개의 서로 다른 단백질 표적에 대한 248 개의 복합체를 대상으로 테스트했습니다.
상관관계: 실험적 RT 와 Koffee 스코어 간의 선형 상관관계 (R2=0.60) 와 순위 상관관계 (ρ=0.81) 를 보였습니다.
분류 성능 (Enrichment):
장기간 결합체 (RT > 1 시간) 와 비일시적 결합체 (RT > 1 분) 를 분류하는 ROC 곡선에서 각각 AUC 0.89, 0.91의 높은 성능을 보였습니다.
반면, 리간드 분자량을 기준으로 한 분류는 무작위 수준 (AUC < 0.5) 에 그쳐, 본 방법이 분자량 편향 없이 RT 를 예측함을 입증했습니다.
D. 실제 약물 개발 프로그램 적용 (Delphia Therapeutics 협업)
실제 진행 중인 약물 개발 프로젝트 (20 개의 X-ray 구조, 84 개의 도킹/전망성 리간드) 에 적용했습니다.
결과:
일시적/비결합체와 장기간 결합체를 구별하는 데 탁월한 성능 (AUC 0.98, 0.88, 0.83) 을 보였습니다.
기존 데이터셋에서 관찰되지 않았던 장기간 결합체 (RT > 100 초) 를 전망성 (Prospective) 세트에서 성공적으로 식별하여 (AUC 0.97), 실제 약물 발견 파이프라인에서의 실용성을 입증했습니다.
4. 의의 및 결론 (Significance)
확장성 (Scalability): Koffee Unbinding Kinetics 는 리간드 - 단백질 거주 시간 예측을 고처리량 (High-throughput) 으로 가능하게 하여, 초기 단계의 컴퓨터 약물 발견 파이프라인에 통합할 수 있는 첫 번째 실용적인 솔루션입니다.
비용 효율성: 기존 MD 기반 방법 대비 계산 비용을 획기적으로 줄여 (약 1 분/복합체), 대규모 화합물 라이브러리 스크리닝을 가능하게 합니다.
실용적 가치: 리간드 분자량이나 화학적 구조에 편향되지 않고, 다양한 단백질 패밀리와 리간드 유형에 걸쳐 정확한 RT 예측을 제공함으로써, 약물 개발 실패를 줄이고 후보 물질 선정을 최적화하는 데 기여합니다.
기술적 혁신: 평형 상태 기반의 MD 시뮬레이션을 우회하고, 비평형 해리 과정을 직접 모델링하는 새로운 물리 기반 알고리즘을 제시했습니다.
이 논문은 Kvantify ApS 가 개발한 Koffee™ 기술이 약물 발견 과정에서 거주 시간 (RT) 기반의 의사결정을 가속화하고, 고비용의 실패를 예방할 수 있는 강력한 도구임을 입증했습니다.