Lingshu-Cell: A generative cellular world model for transcriptome modeling toward virtual cells

이 논문은 단일 세포 전사체 데이터의 희소성과 비순차적 특성을 직접 반영하여 약 18,000 개의 유전자를 사전 선택 없이 학습하고, 다양한 세포 유형과 교란 조건에 따른 전사체 반응 및 가상 세포 생성을 정밀하게 예측하는 생성형 세계 모델 'Lingshu-Cell'을 제안합니다.

Han Zhang, Guo-Hua Yuan, Chaohao Yuan, Tingyang Xu, Tian Bian, Hong Cheng, Wenbing Huang, Deli Zhao, Yu Rong

게시일 2026-03-27
📖 3 분 읽기☕ 가벼운 읽기
⚕️

이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 기존 기술의 한계: "스냅샷" vs "영화"

지금까지 생물학자들이 세포를 연구할 때 사용한 AI 모델들은 마치 **정적인 사진 (스냅샷)**을 찍는 것과 같았습니다.

  • 기존 모델: "이 세포는 지금 어떤 상태인가?"라고 알려주기는 했지만, "약물을 먹으면 이 세포가 어떻게 변할까?", "유전자를 조작하면 어떤 일이 일어날까?"를 예측하거나 만들어내는 능력은 부족했습니다.
  • 링수-셀의 목표: 이 모델은 정적인 사진이 아니라, **세포의 삶을 보여주는 '영화'**를 직접 찍을 수 있습니다. 즉, 세포가 어떻게 태어나고, 어떤 자극을 받으면 어떻게 반응하며, 어떤 모습으로 변할지 가상 시뮬레이션을 가능하게 합니다.

2. 링수-셀의 핵심 원리: "마스크 게임"과 "레고 블록"

링수-셀은 **'마스크된 이산 확산 모델 (Masked Discrete Diffusion Model)'**이라는 기술을 사용합니다. 이를 일상적인 예로 비유해 보면 다음과 같습니다.

  • 비유 1: 가려진 그림 맞추기 게임

    • 세포의 유전자 정보 (약 18,000 개) 는 마치 거대한 퍼즐 조각들입니다.
    • 기존 AI 는 이 조각들을 하나씩 순서대로 맞추려 했지만 (순차적 모델), 세포의 유전자는 순서가 중요하지 않고 동시에 작용합니다.
    • 링수-셀은 퍼즐의 일부 조각을 가리고 (마스크), 나머지 조각들을 보고 "가려진 부분은 어떤 모양일까?"를 반복해서 추측합니다.
    • 이 과정을 여러 번 거치면, 처음엔 아무것도 없던 빈 화면에 완벽한 세포의 모습이 그려집니다.
  • 비유 2: 레고 블록의 언어

    • 세포의 유전자 발현 데이터는 숫자로 되어 있지만, 매우 희박하고 불규칙합니다.
    • 링수-셀은 이 복잡한 숫자들을 **레고 블록 (토큰)**처럼 단순화합니다.
    • 중요한 점은, 어떤 유전자를 먼저 고를지 미리 정해지지 않았다는 것입니다. 기존 모델들은 '가장 중요한 유전자'만 골라 썼지만, 링수-셀은 18,000 개의 유전자를 모두 한 번에 다뤄서 세포의 복잡한 특징을 놓치지 않습니다.

3. 링수-셀이 할 수 있는 놀라운 일들

이 모델은 단순히 세포를 흉내 내는 것을 넘어, 가상 실험실 역할을 합니다.

  • 🌍 다양한 종과 조직의 재현:

    • 인간의 간, 폐, 심장부터 쥐, 원숭이, 물고기, 심지어 초파리의 뇌까지. 다양한 생물과 조직의 세포를 가상으로 만들어냅니다.
    • 실제 실험실에서 세포를 키우지 않아도, AI 가 만들어낸 가상의 세포 데이터가 실제 데이터와 거의 구별이 안 될 정도로 정교합니다.
  • 💉 약물 및 유전자 조작 예측 (가상 임상 시험):

    • "만약 이 유전자를 끄면 (CRISPR), 세포는 어떻게 변할까?"
    • "이 사이토카인 (면역 물질) 을 주입하면, 면역 세포는 어떻게 반응할까?"
    • 링수-셀은 세포의 정체성 (어떤 세포인지) 과 자극 (약물/유전자) 을 입력하면, 세포가 어떻게 변할지 전체 유전자 발현을 예측합니다.
    • 실제로 '가상 세포 챌린지 (Virtual Cell Challenge)'라는 국제 대회에서 1 등을 차지하며, 기존 방법들보다 훨씬 정확하게 세포 반응을 예측했습니다.

4. 왜 이것이 중요한가? (미래의 비전)

이 기술은 생물학 연구의 패러다임을 바꿀 수 있습니다.

  • 시간과 비용 절감: 실제 실험실에서 수개월, 수년을 걸려야 하는 약물 개발이나 질병 연구 과정을, 컴퓨터 안에서 몇 시간 만에 시뮬레이션할 수 있습니다.
  • 안전한 실험: 위험한 실험이나 윤리적으로 문제가 될 수 있는 실험을 가상으로 먼저 해볼 수 있습니다.
  • 새로운 발견: AI 가 만들어낸 가상의 세포 데이터를 통해, 인간이 아직 발견하지 못한 질병 메커니즘이나 치료법을 찾아낼 수 있습니다.

📝 한 줄 요약

링수-셀은 세포의 유전 정보를 '가려진 퍼즐'처럼 보고, AI 가 그 퍼즐을 맞춰가며 가상의 세포를 창조하고, 약물을 넣었을 때 세포가 어떻게 변할지 미리 보여주는 '초고성능 가상 세포 공장'입니다.

이 기술은 이제 막 시작되었지만, 앞으로 디지털 공간에서 질병을 치료하고 신약을 개발하는 새로운 시대를 열 것으로 기대됩니다.