Multi-view biomedical foundation models for molecule-target and property prediction

이 논문은 그래프, 이미지, 텍스트 등 다양한 관점을 통합한 'MMELON'이라는 다중 뷰 분자 임베딩 기반 모델을 개발하여, 120 개 이상의 다양한 작업에서 단일 뷰 모델과 견줄 만한 성능을 입증하고 알츠하이머병 관련 GPCR 표적에 대한 강력한 결합체 후보를 발굴했음을 보여줍니다.

Parthasarathy Suryanarayanan, Yunguang Qiu, Shreyans Sethi, Diwakar Mahajan, Hongyang Li, Yuxin Yang, Elif Eyigoz, Aldo Guzman Saenz, Daniel E. Platt, Timothy H. Rumbell, Kenney Ng, Sanjoy Dey, Myson Burch, Bum Chul Kwon, Pablo Meyer, Feixiong Cheng, Jianying Hu, Joseph A. Morrone

게시일 2026-02-27
📖 3 분 읽기☕ 가벼운 읽기
⚕️

이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"약물을 개발하는 데 있어 분자 (작은 화학 물질) 를 어떻게 더 잘 이해할 수 있을까?"**라는 질문에 대한 새로운 답을 제시합니다.

기존의 연구들은 분자를 이해할 때 보통 한 가지 방법만 사용했습니다. 예를 들어, 분자를 '문자열 (텍스트)'로만 보거나, '그래프 (연결된 점)'로만 보거나, '이미지 (그림)'로만 보는 식이었습니다. 하지만 분자는 매우 복잡해서, 한 가지 눈으로만 보면 중요한 정보를 놓치기 쉽습니다.

이 논문은 IBM 연구소와 클리블랜드 클리닉 연구팀이 **세 가지 눈을 동시에 사용하는 새로운 인공지능 모델 'MMELON'**을 개발했다고 발표합니다.

🧐 핵심 비유: "분자를 보는 세 가지 안경"

이 모델은 분자를 볼 때 세 가지 서로 다른 '안경'을 동시에 끼고 봅니다.

  1. 문자 안경 (Text): 분자를 SMILES 라는 화학적 문자열로 봅니다. (예: "C-C-O"처럼 원자들이 어떻게 이어져 있는지 문자로 읽음)
  2. 그림 안경 (Image): 분자를 2 차원 그림으로 봅니다. (예: 원자들이 어떤 모양으로 배치되어 있는지 시각적으로 파악)
  3. 연결도 안경 (Graph): 분자를 점과 선으로 이루어진 네트워크로 봅니다. (예: 원자 (점) 와 결합 (선) 의 구조적 관계를 분석)

기존 모델은 이 중 하나만 선택해서 사용했지만, MMELON은 이 세 가지 정보를 모두 받아서 **"늦은 합성 (Late Fusion)"**이라는 방식으로 섞어줍니다. 마치 요리사가 재료의 맛 (문자), 모양 (그림), 그리고 식감 (구조) 을 모두 고려해서 최고의 요리를 만드는 것과 같습니다.

🚀 이 모델이 한 일 (주요 성과)

1. 2 억 개의 분자를 공부한 '대장' (Foundation Model)
이 모델은 2 억 개가 넘는 분자 데이터를 미리 학습했습니다. 마치 어린아이가 수백만 권의 책을 읽고 세상을 이해하는 것처럼, 이 모델은 다양한 분자 패턴을 스스로 배웠습니다.

2. 120 가지 이상의 다양한 시험에서 만점
이 모델은 용해도, 독성, 체내 대사 등 120 가지 이상의 복잡한 화학/생물학 시험을 치렀습니다. 결과는 놀라웠습니다.

  • 한 가지 안경만 쓴 모델들도 각자 특정 시험에서는 잘했지만, 모든 시험에서 좋은 것은 아니었습니다.
  • 세 안경을 다 쓴 MMELON은 어떤 시험에서도 가장 잘하는 모델과 거의 동급의 성적을 냈습니다. 즉, **"어떤 상황에서도 실수하지 않는 튼튼한 모델"**이 된 것입니다.

3. 알츠하이머병 치료제 후보를 찾아냈다 (실전 적용)
이 모델의 가장 큰 활약은 알츠하이머병과 관련된 단백질 (GPCR) 들을 찾아내고, 그 단백질에 잘 붙는 약 후보 물질을 찾아낸 것입니다.

  • FPR1이라는 단백질에 잘 붙는 물질로 **'아세틸 - 글루타민'**이라는 장내 미생물 대사물질을 찾아냈습니다.
  • ADA2A라는 단백질에는 **'이소소르비드 디니트레이트'**라는 기존 약물도 잘 붙는다는 것을 발견했습니다.
  • 이 발견들은 컴퓨터 시뮬레이션 (분자 도킹) 으로도 검증되어, 실제 약으로 개발될 가능성을 높였습니다.

💡 왜 이것이 중요한가요?

약물 개발은 실패 확률이 매우 높고 비용이 많이 듭니다. 이 새로운 모델은 분자를 더 입체적이고 정확하게 이해함으로써, 실패할 확률을 줄이고 성공할 확률을 높여줍니다.

간단한 요약:

"기존에는 분자를 볼 때 '문자'나 '그림' 중 하나만 봤는데, 이제 '문자 + 그림 + 연결도'를 한 번에 보는 AI를 만들었습니다. 이 AI 는 약 2 억 개의 분자를 공부해서, 알츠하이머병 치료에 쓸 만한 새로운 약 후보들을 찾아냈습니다. 이는 마치 세 가지 감각을 모두 갖춘 명탐정이 사건을 해결하는 것과 같습니다."

이 기술은 앞으로 더 많은 질병을 치료할 새로운 약을 찾는 데 큰 역할을 할 것으로 기대됩니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →