Leviathan: A fast, memory-efficient, and scalable taxonomic and pathway profiler for (pan)genome-resolved metagenomics and metatranscriptomics

리바이어던은 정렬 기반이 아닌 분류학적 방법과 DNA 공간의 의사 정렬을 결합하여 번역 기반 검색 단계를 우회함으로써 게놈 및 팬게놈 해상도에서 메타게놈과 메타트랜스크립톰의 초고속, 메모리 효율적이며 정확한 분류학적 및 기능적 프로파일링을 가능하게 하는 오픈소스 소프트웨어 패키지입니다.

원저자: Espinoza, J. L., Dupont, C. L., Phillips, A.

게시일 2026-05-28
📖 3 분 읽기☕ 가벼운 읽기

원저자: Espinoza, J. L., Dupont, C. L., Phillips, A.

원본 논문은 CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. ⚕️ 이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

수백만 권의 책이 다양한 저자 (미생물) 에 의해 쓰여진 거대한 도서관을 상상해 보세요. 그리고 특정 더미에 있는 책들이 누가 썼는지, 그리고 그 책들이 어떤 이야기 (기능) 를 전달하는지 알고 싶다고 가정해 봅시다.

오랫동안 이 수수께끼를 풀려던 과학자들은 모든 책의 모든 단어를 하나하나 읽어 일치점을 찾는 방법을 사용했습니다. 이는 놀라울 정도로 정확했지만, 극도로 느렸으며 슈퍼컴퓨터가 전원을 유지하는 것만으로도 필요할 정도로 막대한 자원을 요구했습니다. 이 논문이 다루는 문제가 바로 이것입니다: 기존 도구들은 현재 우리가 보유한 거대한 현대적 미생물 "책" 컬렉션을 처리하기에는 너무 느리고 메모리를 많이 차지했습니다.

이제 이 분석을 위한 "급행 열차"로 설계된 새로운 소프트웨어 도구인 리비어스 (Leviathan) 가 등장했습니다. 간단한 비유를 들어 작동 방식을 설명해 보겠습니다:

1. 속도 트릭: 읽기를 건너뛰기

모든 단어를 읽는 것 (이전 도구들이 했던 일) 대신, 리비어스는 두 가지 교묘한 단축키를 사용합니다:

  • "지문" 스캐너 (분류학): 더미에 누가 있는지 파악하기 위해 실프 (Sylph) 라는 도구를 사용합니다. 이는 전체 이야기를 읽는 대신 책의 바코드를 스캔하거나 고유한 지문을 확인하는 것과 같습니다. 단 한 문장도 읽지 않고도 저자를 즉시 식별합니다.
  • "목차" 확인 (기능): 미생물이 무엇을 하고 있는지 파악하기 위해 살몬 (Salmon) 이라는 도구를 사용합니다. 이전 도구들이 사용했던 "번역 검색 (translated-search)"이라는 느린 과정 (텍스트를 다른 언어로 번역하는 것) 대신, 리비어스는 원래 언어로 직접 "목차" (유전자 카탈로그) 를 확인합니다. 자신이 본 장들을 알고 있는 이야기와 매칭하여 무거운 번역 단계를 완전히 건너뜁니다.

2. 더블 체크 시스템

리비어스는 단순히 추측하지 않습니다. 발견한 모든 이야기에 대해 두 가지 구체적인 점수를 제공합니다:

  • 풍부도 (Abundance): "이 이야기의 복사본이 얼마나 많습니까?" (특정 책을 읽는 사람들이 얼마나 많은지 세는 것과 같습니다).
  • 커버리지 (Coverage): "전체 이야기가 있는지, 아니면 몇 페이지만 있는지?" 미생물 군집이 완전한 대사 경로를 완성하기 위해 필요한 모든 "장" (효소적 단계) 을 가지고 있는지 확인하여 이야기가 처음부터 끝까지 논리적으로 이루어지는지 보장합니다.

3. 결과: 더 빠르고 가볍게

저자들이 리비어스를 현재 금표준 (HUMAnN 이라는 도구) 과 비교하여 테스트했을 때, 결과는 극적이었습니다:

  • 속도: 최대 74 배 더 빠릅니다. 이전 도구가 한 작업을 완료하는 데 일주일이 걸렸다면, 리비어스는 몇 시간 만에 완료할 수 있습니다.
  • 메모리: 컴퓨터 메모리를 14 배 더 적게 사용합니다. 이는 등산용 배낭에 벽돌을 가득 채우고 마라톤을 뛰는 것과 가벼운 재킷만 입고 뛰는 것의 차이와 같습니다.
  • 정확도: 단순히 빨라진 것이 아니라, 특정 미생물과 그들의 유전적 변이 (패닝게놈) 를 식별하는 능력이 향상되어 정확도가 최대 12% 까지 개선되었습니다.

4. 실제 사례

이 논문은 두 가지 구체적인 이야기로 리비어스의 실전을 보여줍니다:

  • 해양 바이오필름: 그들은 해양의 플라스틱 위에서 자라는 미생물을 살펴보았습니다. 리비어스는 바이오필름이 젊은 상태에서 성숙한 상태로 성장함에 따라 "군집 대화"가 어떻게 변하는지, 그리고 그들이 어떻게 먹고 생존하는지에 대한 변화가 드러나도록 도와주었습니다.
  • 치아 우식 연구: 그들은 치아 부패에 있는 박테리아의 "목소리" (유전자 활동) 를 분석했습니다. 박테리아의 특정 유전적 변이를 살펴봄으로써, 건강한 입과 충치가 있는 입을 구별하는 고유한 패턴을 발견했습니다.

요약하자면: 리비어스는 정확성을 희생하지 않으면서도 이전보다 훨씬 빠르게 그리고 더 적은 컴퓨팅 파워로 복잡한 미생물 군집을 분석할 수 있게 해주는 새로운 오픈 소스 도구입니다. 이는 느린 수동 타자기에서 스스로 작업을 확인하는 고속 디지털 프린터로 업그레이드하는 것과 같습니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →