생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.

Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.

아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.

A Cross-Study Multi-Organ Cell Atlas ofMacaca fascicularis Informed by Human Foundation Model Annotation: A Resource for Translational Target Assessment

이 논문은 인간 기반 모델 어노테이션을 활용하여 27 개 장기와 250 만 개 이상의 세포를 통합한 가장 큰 마카크 원숭이 단일 세포 지도를 구축함으로써, 전임상 연구에서 표적 평가의 정확성을 높이고 비인간 영장류 사용을 줄이는 데 기여하는 통합 자원을 제시합니다.

Souza, T. M., Gamse, J. T., Moreno, L., van Rumpt, M., Nunez-Moreno, G., Khatri, I., van Asten, S. D., Khusial, N. V., Baltasar-Perez, E., Adhav, R., Abdelaal, T., Wojtuszkiewicz, A., Calis, J. J. A. (…)2026-03-19💻 bioinformatics

ProteinSage: From implicit learning to explicit structural constraints for efficient protein language modeling

이 논문은 구조적 제약을 명시적으로 통합한 사전 학습 프레임워크인 ProteinSage 를 제안하여, 적은 데이터로 구조적 일반화 능력을 갖춘 단백질 표현을 학습하고 미생물 로돕신과 같은 새로운 단백질 동족체를 성공적으로 발견했음을 보여줍니다.

Shen, L., Chao, L., Liu, T., Liu, Q., Zhou, G., Wang, H., Dong, X., Li, T., Zhang, X., Ni, J.2026-03-19💻 bioinformatics

High Resolution Solvated Models Reveal Mechanisms of Allosteric Activation of mTORC1 by RHEB

이 연구는 딥러닝 기반 AlphaFold-3 모델과 분자 동역학 시뮬레이션을 결합하여 고해상도 용매화 모델을 구축함으로써, RHEB 가 mTORC1 의 구조적 재구성을 유도하여 촉매 활성을 위한 알로스테릭 사전 조직화를 수행하는 분자적 메커니즘을 규명했습니다.

Ghosh, P., Maity, A., Kutti, V. R., Venkatramani, R.2026-03-19💻 bioinformatics

evedesign: accessible biosequence design with a unified framework

이 논문은 단백질 공학의 복잡한 조건부 설계와 다목적 최적화 문제를 해결하기 위해 다양한 머신러닝 모델을 통합하고 실험 데이터와의 반복적 연계를 지원하며 웹 인터페이스를 통해 비전문가도 접근할 수 있도록 설계된 오픈소스 프레임워크 'evedesign'을 제안합니다.

Hopf, T. A., Gazizov, A., Garcia Busto, S., Eschbach, E., Lee, S., Mirdita, M., Orenbuch, R., Belahsen, K., Ross, D., Sander, C., Steinegger, M., d'Oelsnitz, S., Marks, D.2026-03-19💻 bioinformatics

Identification and classification of all Cytochrome P450 deposits in the Protein Data Bank

이 논문은 시스토크롬 P450 의 극심한 서열 다양성과 불일치된 주석으로 인해 PDB 내 모든 P450 구조를 식별하고 분류하는 데 어려움이 있었던 문제를 해결하기 위해, 키워드 검색과 은닉 마르코프 모델, 구조 정렬을 결합한 워크플로우를 개발하여 1,513 개의 PDB 등재물 (674 개 고유 서열) 을 식별하고 5 개의 새로운 아과를 발견하며 표준화된 명명법을 적용한 최초의 엄격하게 큐레이션된 P450 레지스트리를 구축했다고 요약할 수 있습니다.

Smieja, P., Zadrozna, M., Syed, K., Nelson, D., Gront, D.2026-03-19💻 bioinformatics

Super Bloom: Fast and precise filter for streaming k-mer queries

이 논문은 생물학적 시퀀스 스트리밍 k-mer 쿼리를 위해 미니마이저 기반의 슈퍼-k-mer 그룹화와 findere 방식을 결합하여 캐시 효율성을 극대화하고 오탐지를 획기적으로 줄인 'Super Bloom Filter'를 제안하며, 기존 블룸 필터 구현체보다 훨씬 빠른 속도와 정밀도를 입증했습니다.

Conchon-Kerjan, E., Rouze, T., Robidou, L., Ingels, F., Limasset, A.2026-03-19💻 bioinformatics