Do Larger Models Really Win in Drug Discovery?A Benchmark Assessment of Model Scaling in AI-Driven Molecular Property and Activity Prediction

본 벤치마크 연구는 약물 발견 분야에서 더 큰 AI 모델이 항상 더 작은 모델보다 우수하다는 가정에 도전하여, 다양한 분자 특성 및 활성 작업에서 대형 파운데이션 모델에 비해 컴팩트하고 전문화된 모델이 종종 더 뛰어나거나 동등한 예측 정확도를 달성함을 보여줍니다.

원저자: Guo, J.

게시일 2026-05-04
📖 3 분 읽기☕ 가벼운 읽기

원저자: Guo, J.

원본 논문은 CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. ⚕️ 이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

새로운 화학 성분이 조리법에서 어떻게 작용할지 예측하려고 한다고 상상해 보세요. 오랫동안 AI 업계의 큰 아이디어는 "크면 클수록 좋다"는 것이었습니다. 모든 것을 학습한 거대하고 전지전능한 AI 뇌 (Large Model) 를 구축하면, 오직 한 가지 특정 작업만을 위해 만들어진 작고 전문화된 도구보다 자동으로 더 똑똑하고 정확할 것이라는 가정이었습니다.

이 논문은 그 가정을 신약 개발 분야에서 시험해 보기로 결정했습니다. 그들은 단순히 추측한 것이 아니라, 분자가 신체와 어떻게 상호작용하는지, 독성이 있는지, 아니면 결핵과 말라리아와 같은 질병을 퇴치할 수 있는지 예측하는 등 167,056 개의 다양한 도전 과제를 포함한 거대한 경주를 진행했습니다.

다음은 그들이 발견한 바를 몇 가지 간단한 비유를 통해 설명한 것입니다:

경주: 거인 대 전문가들

경주 참가자들을 세 가지 유형의 주자로 생각해 보세요:

  1. "전통적인" 주자들: 이들은 전문 기계공과 같습니다. 작고 빠르며, 특정 문제를 해결하기 위해 렌치나 드라이버와 같은 간단하고 검증된 도구 (전통적인 기계 학습 모델이 사용하는 표준 화학 지문) 를 사용합니다.
  2. "그래프" 주자들: 이들은 건물의 부품들이 어떻게 연결되는지 살펴보는 건축가와 같습니다. 분자의 모양과 구조를 살펴보기 때문에 조금 더 복잡합니다.
  3. "거인" 주자들: 이들은 슈퍼히어로 (대형 언어 모델) 입니다. 거의 도서관의 모든 책을 읽었습니다. 그들은 거대하고 강력하며 거의 모든 것에 대해 이야기할 수 있습니다. 그들의 거대한 크기가 화학적 행동을 예측하는 데 가장 뛰어나게 만들 것이라는 기대가 있었습니다.

결과: 작은 주자들이 더 자주 이겼습니다

경주가 시작되자 "거인" 주자들은 압도적인 승리를 거두지 못했습니다. 사실, 결과는 매우 놀라웠습니다:

  • 전문 기계공들이 22 개 경기 중 10 개를 이겼습니다. 그들은 결과를 예측하는 데 가장 정확했습니다.
  • 건축가들이 9 개 경기를 이겼습니다. 그들은 매우 근소한 차이로 뒤졌습니다.
  • 슈퍼히어로 거인들은 3 개 경기만 이겼습니다. 거대한 크기와 방대한 학습 데이터에도 불구하고, 그들은 작고 집중된 모델들을 자동으로 이기지 못했습니다.

"매직 8 볼" 기준선

연구자들은 또한 "규칙 기반" 접근 방식을 테스트했는데, 이는 매우 똑똑하지만 경직된 규칙서 (또는 특정 AI 프롬프트) 에게 이전에 본 패턴을 바탕으로 추측하라고 요청하는 것과 같습니다. 이들은 주요 경주에서 이기지는 못했지만, 예측이 왜 이루어졌는지 설명하는 데는 도움이 되었습니다. 마치 경기 후 분석을 제공하는 코치와 같은 역할이었습니다.

큰 교훈

이 논문에서 얻은 주요 교훈은 크기가 전부가 아니다는 것입니다.

  • 보편적인 승자는 없다: 모델이 거대하고 범용적이라고 해서 모든 특정 작업에서 더 나은 것은 아닙니다.
  • 매치에 달려 있다: 모델이 이기는지는 그 "뇌"가 특정 문제 유형, 사용 가능한 데이터의 양, 그리고 제기된 특정 생물학적 질문에 얼마나 잘 맞는지 여부에 달려 있습니다.
  • 거인들이 빛나는 곳: 이 논문은 거대 모델이 정확한 수치를 예측하는 데는 최선이 아닐지라도, 제로샷 추론(학습 없이 본 적 없는 문제를 해결하는 것), 결과 해석, 그리고 **새로운 아이디어 **(가설)에는 여전히 가치가 있다고 제안합니다.

요약하자면: 약물 분자가 어떻게 작용할지 정확히 예측해야 한다면, 작고 전문화된 도구가 종종 거대하고 범용적인 AI 보다 더 잘 수행합니다. "크면 클수록 좋다"는 규칙은 여기에 적용되지 않습니다; 오히려 특정 작업에 맞는 올바른 도구를 갖는 것이 더 중요합니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →