생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.

Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.

아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.

Baktfold: Sensitive protein functional annotation across the microbial tree of life using structural information

이 논문은 Foldseek 와 ProstT5 모델의 구조 기반 검색을 활용하여 미생물 계통 전반에서 기존 도구보다 훨씬 높은 민감도로 가설 단백질을 기능 주석하는 새로운 Python 기반 소프트웨어인 Baktfold 를 소개하고 그 성능을 검증합니다.

Bouras, G., Lim, S. w., Durr, L., Vreugde, S., Goesmann, A., Edwards, R. A., Schwengers, O.2026-04-01💻 bioinformatics

Amino acid substitutomics: profiling amino acid substitutions at proteomic scale unveils biological implication and escape mechanism in cancer

이 논문은 새로운 질량 분석 도구인 PIPI-C 를 활용하여 암 단백질의 번역 후 아미노산 치환을 대규모로 프로파일링하는 '아미노산 치환체학 (Amino acid substitutomics)' 파이프라인을 제안함으로써, 유전체 및 전사체 데이터로는 포착되지 않는 암의 생물학적 의미와 면역 회피 및 약물 내성 기전을 규명했습니다.

Zhao, P., DAI, S., Lai, S., Zhou, C., Li, N., Yu, W.2026-03-31💻 bioinformatics

Deep representation learning for temporal inference in cancer omics: a systematic review

이 체계적 문헌 고찰은 암 오믹스 데이터에서 시계열적 추론을 위해 딥러닝 표현 학습 (특히 VAE) 을 적용한 기존 연구가 주로 하위 유형 분류 및 예후에 집중하고 있으며, 종단 데이터의 부재로 인해 시간적 역동성을 충분히 반영하지 못하고 있음을 지적하고, VAE 를 생성 모델로 활용하여 암 진행의 시간적 특성을 연구할 것을 제안합니다.

Prol-Castelo, G., Cirillo, D., Valencia, A.2026-03-31💻 bioinformatics

Co-designing sequence and structure of functional de novo enzymes with EnzyGen2

이 논문은 리간드 유도 기능 타겟팅 하에서 서열과 구조를 동시에 설계하는 대규모 단백질 기초 모델 'EnzyGen2'를 소개하며, 이를 통해 기존 방법보다 400 배 빠르게 설계된 새로운 효소들이 자연 효소와 유사하거나 더 높은 촉매 활성을 실험적으로 입증했음을 보고합니다.

Song, Z., Liu, H., Zhao, Y., Yang, Y., Li, L.2026-03-31💻 bioinformatics

CCIDeconv: Hierarchical model for deconvolution of subcellular cell-cell interactions in single-cell data

이 논문은 다양한 조직의 공간 전사체 데이터를 기반으로 학습된 계층적 모델 'CCIDeconv'를 개발하여, 공간 정보가 없는 단일 세포 RNA 시퀀싱 데이터에서도 세포 간 상호작용을 핵과 세포질과 같은 아세포 수준으로 정밀하게 해독할 수 있음을 제시합니다.

Jayakumar, R., Panwar, P., Yang, J. Y. H., Ghazanfar, S.2026-03-31💻 bioinformatics

Modeling gene regulatory perturbations via deep learning from high-throughput reporter assays

이 논문은 전장 유전체 STARR-seq 데이터를 기반으로 재학습 가능한 딥러닝 프레임워크인 BlueSTARR 을 개발하여 비코딩 변이의 조절 효과를 예측하고, 선택 압력 및 약물 처리에 따른 전사 인자 결합 패턴을 규명함으로써 고처리량 레포터 어레이 데이터의 잠재적 신호를 탐지하는 데의 유용성을 입증했습니다.

Venukuttan, R., Doty, R., Thomson, A., Chen, Y., Li, B., Duan, Y., Barrera, A., Dura, K., Ko, K.-Y., Lapp, H., Reddy, T. E., Allen, A. S., Majoros, W. H.2026-03-31💻 bioinformatics