Each language version is independently generated for its own context, not a direct translation.
프로테닉스-v2: 생체 분자 설계의 '초능력'을 갖춘 새로운 마법사
이 논문은 ByteDance Seed 팀이 발표한 **'Protenix-v2(프로테닉스 2 버전)'**라는 인공지능 모델에 대한 내용입니다. 이 모델은 우리 몸속의 복잡한 분자들 (단백질, 항체 등) 의 구조를 예측하고, 우리가 원하는 대로 새로운 분자를 직접 '창조'해내는 역할을 합니다.
이 복잡한 내용을 일반인이 이해하기 쉽게, 요리사와 건축가의 비유를 들어 설명해 드리겠습니다.
1. 이 모델은 무엇인가요? (두 가지 역할)
Protenix-v2 는 크게 두 가지 일을 합니다.
- 역할 1: 정교한 구조 예측 (건축가)
- 비유: 마치 낡은 설계도만 보고 건물이 어떻게 생겼는지 완벽하게 재현하는 건축가입니다.
- 내용: 항체 (면역 세포) 가 바이러스나 세균 (항원) 을 어떻게 붙잡는지 그 '결합 부위'의 모양을 아주 정확하게 예측합니다. 이전 버전보다 훨씬 더 정밀해서, 5 번만 시도해도 예전에 1,000 번 시도해야 했던 만큼의 성공을 거둡니다.
- 역할 2: 새로운 분자 디자인 (요리사)
- 비유: "이런 맛의 요리를 만들어줘"라고 주문하면, 레시피가 없어도 처음부터 새로운 요리를 만들어내는 천재 요리사입니다.
- 내용: 특정 질병을 치료할 수 있는 새로운 항체를 처음부터 설계합니다. 특히 기존에 없던 새로운 표적 (바이러스 변이 등) 에도 즉석에서 (Zero-shot) 성공적으로 대응하는 항체를 만들어냅니다.
2. 어떤 놀라운 성과를 냈나요?
🏆 1. 항체와 바이러스의 '맞춤형 열쇠' 만들기 (구조 예측)
- 상황: 항체가 바이러스에 붙는 모양을 예측하는 것은 매우 어렵습니다. 마치 자물쇠와 열쇠의 미세한 홈을 맞추는 것과 같습니다.
- 성과: Protenix-v2 는 이전 모델보다 정확도가 13% 포인트나 향상되었습니다. 이는 마치 열쇠를 만들 때 실수를 거의 하지 않는 수준으로 발전했다는 뜻입니다.
🎯 2. "한 번에 성공"하는 신약 후보 발굴 (디자인)
- 상황: 새로운 약을 만들 때는 수많은 시도를 해야 하는데, 대부분 실패합니다.
- 성과:
- 새로운 표적: 실험실에서 처음 보는 새로운 바이러스나 단백질에 대해, 100% 성공률로 결합하는 항체를 찾아냈습니다.
- 높은 확률: 실험실 테스트에서 **최대 48%**까지 성공하는 항체를 찾아냈습니다. (기존에는 1%~2% 수준이 일반적이었습니다.)
- 어려운 목표: 특히 GPCR이라는, 약을 만들기 매우 까다로운 세포 수용체에서도 **최대 88%**의 성공률을 보였습니다. 이는 마치 미로 같은 복잡한 동굴에서 가장 빠른 출구를 찾아낸 것과 같습니다.
🛡️ 3. '튼튼함'과 '다양성'까지 챙김 (개발 가능성)
- 상황: 약이 효과가 있어도, 몸속에서 쉽게 부서지거나 다른 것과 엉켜서 부작용이 생기면 쓸모가 없습니다.
- 성과: Protenix-v2 가 만든 항체들은 열에 강하고 (100% 통과), 서로 엉키지 않으며 (98% 통과), 다른 물질과 잘못 반응하지도 않습니다 (93% 통과). 마치 튼튼하고 깔끔하게 포장된 선물 상자 같은 것입니다.
🦠 4. 변이 바이러스까지 잡는 '범용 열쇠' (다중 변이 대응)
- 상황: 코로나 바이러스는 계속 변이 (오미크론 등) 를 만들어냅니다. 한 번에 모든 변이를 잡는 약을 만드는 것은 매우 어렵습니다.
- 성과: Protenix-v2 는 **원래 바이러스와 오미크론 변이 바이러스를 동시에 잡을 수 있는 '범용 미니 바인더'**를 설계했습니다. 이는 바이러스가 변이를 일으켜도 약효가 떨어지지 않는 '불변의 열쇠'를 만든 것과 같습니다.
⚗️ 5. 화학적으로도 '안전한' 분자 (리간드 정확도)
- 상황: AI 가 분자를 만들 때, 이론적으로는 맞지만 실제로는 화학적으로 불가능한 형태 (예: 비틀어진 결합) 를 만들 때가 있습니다.
- 성과: Protenix-v2 는 화학 법칙을 철저히 지키는 '안전 가이드'를 적용하여, 실제 실험실에서 합성 가능한 현실적인 분자 구조를 만들어냅니다.
3. 왜 이것이 중요한가요? (결론)
이 논문은 Protenix-v2 가 약물 개발의 속도를 획기적으로 높일 수 있는 도구임을 증명합니다.
- 과거: 새로운 약을 찾으려면 수년 동안 수많은 실험과 시도를 반복해야 했습니다.
- 현재 (Protenix-v2): AI 가 "이런 약을 만들어줘"라고 하면, 적은 비용과 시간으로 실험실에서 바로 검증 가능한 고품질의 후보 물질을 찾아냅니다.
한 줄 요약:
Protenix-v2 는 복잡한 생체 분자의 '지도'를 그리는 것을 넘어, 우리가 원하는 '약'을 처음부터 설계해내는 초고성능 AI 마법사입니다.
이 기술은 앞으로 암, 감염병, 희귀질환 등 다양한 난치성 질환을 치료할 수 있는 새로운 약을 훨씬 빠르고 저렴하게 개발하는 데 기여할 것으로 기대됩니다.
Each language version is independently generated for its own context, not a direct translation.
Protenix-v2 기술 요약
1. 문제 정의 (Problem)
생물분자 모델링의 발전은 구조 예측 및 설계 모델이 해결할 수 있는 문제의 범위를 확장시켰으나, 여전히 다음과 같은 한계가 존재했습니다:
- 정밀한 구조 예측의 부족: 특히 항체 - 항원 복합체와 같은 복잡한 인터페이스의 기하학적 구조를 고정밀도로 예측하는 것은 여전히 어렵습니다.
- 실험적 검증의 비효율성: 기존 생성형 설계 모델들은 새로운 표적 (Novelty) 에 대한 제로샷 (Zero-shot) 히트 발견률이 낮거나, 실험적 검증 (Hit discovery) 을 위해 과도한 수의 시드 (Seed) 나 예산이 필요했습니다.
- 난이도 높은 표적의 한계: GPCR(구체적 단백질 결합 수용체) 과 같이 세포 외 에피토프가 작고 유연한 막단백질에 대한 항체 설계는 기존 방법론으로 매우 어려웠습니다.
- 화학적 타당성 부재: 리간드 (소분자) 결합 자세 예측 시 기하학적 정확도는 높을지라도, 키랄리티 (chirality) 왜곡이나 결합 길이 오류 등 화학적으로 비현실적인 구조가 생성되는 경우가 많았습니다.
2. 방법론 (Methodology)
Protenix-v2 는 구조 예측과 분자 설계를 아우르는 통합 시스템으로, 다음과 같은 방법론적 개선을 거쳤습니다:
- 데이터 및 학습:
- 2021 년 9 월 30 일 이후 공개된 wwPDB 데이터를 배제하여 학습함으로써, 구조 예측 및 제로샷 설계 결과의 편향 (Data leakage) 을 방지하고 진정한 신규 데이터에 대한 성능을 평가했습니다.
- 이전 버전 (Protenix-v1) 대비 아키텍처 정제 및 학습 최적화를 적용하면서도 동일한 입력 - 출력 설정을 유지했습니다.
- 구조 예측 (Structure Prediction):
- 항체 - 항원 인터페이스 예측 성능을 대폭 향상시켰으며, 샘플링 효율성을 극대화하여 적은 수의 시드 (5 개) 로도 기존 모델의 대량 시드 (1000 개) 성능을 초과하도록 설계되었습니다.
- 생성형 설계 (Generative Design):
- 제로샷 항체 설계: 표적 조건부 생성 (Target-conditioned generation) 을 지원하며, 정밀한 에피토프 타겟팅과 사이트 무관 설계를 모두 가능하게 합니다.
- 다양한 포맷 지원: 미니단백질, VHH(중쇄 항체의 가변 도메인), Fv(VH+VL) 등 다양한 항체 포맷을 지원하며, CDR 루프 길이와 프레임워크를 세밀하게 제어할 수 있습니다.
- 리간드 타당성 향상 (Training-Free Guidance, TFG): 키랄리티, 평면성 (planarity), 비틀림 기하학 등에 대한 제약 조건을 inference 시 적용하여 화학적으로 타당한 리간드 구조를 생성하도록 유도합니다.
3. 주요 기여 및 결과 (Key Contributions & Results)
A. 항체 - 항원 구조 예측의 획기적 개선
- 성능 향상: 3 가지 항체 벤치마크 (PXMeter-AB, FoldBench-AB, AF3-AB) 에서 Protenix-v1 대비 DockQ > 0.23 기준 최대 13 포인트의 성공률 향상을 기록했습니다.
- 고정밀도 영역: DockQ > 0.8(고품질) 영역에서도 큰 개선을 보였습니다.
- 샘플링 효율성: 5 개의 시드 (5-seed) 만으로 이전 모델이 1000 개의 시드로 달성했던 성능을 초과하여, 추론 비용 대비 효율성이 비약적으로 향상되었습니다.
B. 제로샷 항체 설계 및 히트 발견 (Zero-shot Antibody Design)
- 솔루블 타겟 (Soluble Targets): 신규성 필터링된 표적에 대해 100% 의 타겟 레벨 성공률을 달성했습니다. BLI(생물층 간섭계) 로 확인된 히트율은 2%
48% 사이였으며, 개발 가능성 (Developability) 테스트 (열안정성, 자가 상호작용, 다중 반응성) 에서 93%100% 의 높은 합격률을 보였습니다.
- 난이도 높은 GPCR 타겟: 에피토프가 작고 유연한 GPCR 표적에 대해 VHH-Fc 및 mAb 포맷으로 성공적인 히트 발견을 이루었습니다.
- 타겟당 16
30 개의 제한된 실험 예산 하에 **VHH-Fc 는 16%88%, mAb 는 최대 50% 의 히트율**을 기록했습니다.
- GPRC5D 타겟의 경우 나노몰 (pM) 수준의 결합 친화도 (KD) 를 보였습니다.
C. 화학적 타당성 및 다중 변이 설계
- 리간드 플러시빌리티 (Ligand Plausibility): TFG(Training-Free Guidance) 기법을 적용하여 리간드의 화학적 타당성을 평가하는 기준을 강화했습니다. Protenix-v2-TFG 는 기존 모델 (Boltz-1x 등) 보다 엄격한 검증 기준 하에서 더 높은 성공률 (약 60%) 을 보이며, 키랄리티 왜곡 및 비평면성 오류를 효과적으로 교정했습니다.
- 크로스-변이 (Cross-variant) 설계: SARS-CoV-2 의 프로토타입 및 오미크론 (Omicron) 변이 RBD 에 모두 결합하는 이중 특이성 미니바인더를 설계했습니다. 4 개의 설계 중 2 개가 나노몰 수준의 결합 친화도를 보이며 바이러스 진화에 대응 가능한 치료제 개발 가능성을 입증했습니다.
4. 의의 및 중요성 (Significance)
Protenix-v2 는 단순한 구조 예측 도구를 넘어, 실제 약물 개발 파이프라인에 직접 적용 가능한 강력한 모델로 자리 잡았습니다.
- 효율성 증대: 적은 실험 예산 (Low-budget) 으로도 고난이도 표적 (GPCR 등) 에서 높은 히트율을 달성하여, 신약 개발의 시간과 비용을 획기적으로 절감할 수 있습니다.
- 범용성 확대: 항체 설계뿐만 아니라 소분자 리간드 모델링의 정확도와 화학적 타당성을 동시에 개선하여, 구조 기반 약물 설계 (SBDD) 의 범위를 확장했습니다.
- 실증적 검증: 다양한 실험적 검증 (BLI, DSF, AC-SINS 등) 을 통해 생성된 분자들의 물리화학적 특성과 결합 능력을 입증함으로써, AI 기반 분자 설계의 신뢰성을 높였습니다.
결론적으로 Protenix-v2 는 구조 예측의 정밀도를 높이고, 제로샷 설계를 통해 실험실에서의 히트 발견을 가속화함으로써, 차세대 생물의약물 개발의 핵심 인프라로 평가됩니다.