생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.

Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.

아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.

Genome-wide maps of transcription factor footprints identify noncoding variants rewiring gene regulatory networks

이 논문은 FOODIE 기술을 활용한 전장 유전체 전사 인자 발자국 매핑과 AlphaGenome 예측을 통합한 varTFBridge 프레임워크를 개발하여, 적혈구 형질과 관련된 수백만 개의 비코딩 변이 중 GATA1/TAL1 결합을 방해하는 113 개의 고신뢰도 조절 변이와 그 기작을 규명했습니다.

Lin, J., Dong, W., Zhang, J., Xie, C., Jing, X., Zhao, J., Ma, K., Kang, H., Jiang, Y., Xie, X. S., Zhao, Y.2026-03-25💻 bioinformatics

STRmie-HD enables interruption-aware HTT repeat genotyping and somatic mosaicism profiling across sequencing platforms

이 논문은 다양한 시퀀싱 플랫폼에서 헌팅턴병 (HD) 의 CAG 반복 길이, 중단 서열 변이 및 체성 모자이크성을 단일 리드 수준으로 정밀하게 분석할 수 있는 새로운 도구인 STRmie-HD 를 개발하고 검증한 내용을 담고 있습니다.

Napoli, A., Liorni, N., Biagini, T., Giovannetti, A., Squitieri, A., Miele, L., Urbani, A., Caputo, V., Gasbarrini, A., Squitieri, F., Mazza, T.2026-03-25💻 bioinformatics

EvoRMD: Integrating Biological Context and Evolutionary RNA Language Models for Interpretable Prediction of RNA Modifications

이 논문은 종, 장기, 세포 유형 및 세포 내 위치와 같은 생물학적 맥락과 대규모 RNA 언어 모델의 임베딩을 통합하여 단일 부위에서 경쟁하는 RNA 변형 유형을 해석 가능하게 예측하는 새로운 프레임워크인 EvoRMD 를 제안합니다.

Wang, B., Zhang, H., Cui, T., Wang, X., Song, J., Xu, H.2026-03-25💻 bioinformatics

Computational Design and Atomistic Validation of a High-Affinity VHH Nanobody Targeting the PI/RuvC Interface of Streptococcus pyogenes Cas9: A Bivalent Hub Strategy for CRISPR-Cas9 Enhancement

이 논문은 생성형 AI(BoltzGen) 와 분자 동역학 시뮬레이션을 활용하여 SpCas9 의 PI/RuvC 인터페이스에 결합하는 고친화성 VHH 나노바디를 설계하고, 이를 Cas9 활성을 억제하지 않으면서 2 가 결합 허브 (Bivalent Hub) 전략을 통해 CRISPR-Cas9 시스템을 향상시킬 수 있는 안정적인 구조로 검증했다는 내용을 담고 있습니다.

Kumar, N., Dalal, D., Sharma, V.2026-03-25💻 bioinformatics

AI-guided design of candidate BMPR1A-binding peptides for cartilage regeneration: a multi-tool computational benchmarking study

본 연구는 RFdiffusion, BindCraft, PepMLM, RFpeptides 등 4 가지 생성형 AI 도구를 벤치마킹하여 연골 재생을 위한 BMPR1A 결합 펩타이드를 설계하고, 다중 평가 기준을 통해 PepMLM 기반의 우수 후보 (pepmlm_L15_0026) 를 식별함으로써 AI 기반 펩타이드 설계의 실험적 검증을 위한 계산적 프레임워크를 확립했습니다.

Ahmadov, A., Ahmadov, O.2026-03-25💻 bioinformatics

Visualize, Explore, and Select: A protein Language Model-based Approach Enabling Navigation of Protein Sequence Space for Enzyme Discovery and Mining

이 논문은 단백질 언어 모델 임베딩과 계층적 분석을 결합한 'SelectZyme' 프레임워크를 통해 고정된 서열 유사도 임계값에 의존하지 않고 효소 서열 공간을 체계적으로 탐색하고 발견할 수 있는 확장 가능한 방법론을 제시합니다.

Moorhoff, F., Medina-Ortiz, D., Kotnis, A., Hassanin, A., D. Davari, M.2026-03-25💻 bioinformatics

Population-scale interpretation of RNA isoform diversity enabled by Isopedia

Isopedia 는 참조 데이터베이스에 의존하지 않고 증거 기반 빈도 분석을 통해 RNA 스플라이싱의 새로운 변이체를 체계적으로 해석함으로써, 기존 연구에서 과대평가되었던 '새로운' 전사체의 비율을 획기적으로 줄이고 임상 및 기능적 연구에 필요한 인간 전사체 해석의 토대를 마련했습니다.

Zheng, X., Kronenberg, Z., Garcia-Ruiz, S., Layer, R. M., Gustavsson, E. K., Ryten, M., Sedlazeck, F. J.2026-03-25💻 bioinformatics

Compact longitudinal representations derived from mixed-format lifestyle questionnaires outperform static text-derived features for ALS-versus-control classification

이 연구는 ALS 환자와 대조군 분류에서 정적 텍스트 기반 특성보다 질문지의 변화를 압축적으로 인코딩한 종단적 표현이 더 높은 예측 성능을 보이며, 언어 처리의 주요 가치가 정적 특징 확장이 아닌 변화 궤적의 요약에 있음을 입증했습니다.

Radlowski Nova, J., Lopez-Carbonero, J. I., Corrochano, S., Ayala, J. L.2026-03-25💻 bioinformatics

Single-cell Transcriptomic Variance Analysis Reveals Intercellular Circadian Desynchrony in the Alzheimer's Affected Human Brain

이 논문은 새로운 분석 도구인 ORPHEUS 를 개발하여 알츠하이머병 환자의 뇌에서 흥분성 뉴런의 세포 간 일주기 리듬 동기화가 심각하게 손상되었음을 규명하고, 세포 진폭과 동기화를 분리하여 분석할 수 있는 새로운 방법을 제시했습니다.

Hollis, H. C., Veltri, A., Korac, K., Menon, V., Bennett, D. A., Ronnekleiv-Kelly, S., Kim, J., Anafi, R. C.2026-03-25💻 bioinformatics