생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.

Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.

아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.

FM-GPT: Bayesian fine mapping for phenome-wide transcriptome-wide association studies

이 논문은 대규모 페노믹 데이터에서 연관된 표현형 간의 상관관계와 잡음을 고려하여 다중 표현형에 걸친 인과 유전자를 보다 정확하게 식별하기 위해 개발된 베이지안 정밀 매핑 방법인 FM-GPT 를 제안하고, 이를 UK Biobank 데이터를 적용하여 뇌 구조 및 다양한 임상 질환 간의 공유 생물학적 기전을 규명했습니다.

Canida, T., Ye, Z., Wang, S.-H., Huang, H.-H., Pan, Y., Liang, M., Chen, S., Ma, T.2026-04-11💻 bioinformatics

A unified spatial transcriptome profiling of ten mouse organs

이 논문은 뇌, 신장, 폐 등 10 개의 마우스 장기를 대상으로 Stereo-seq 플랫폼을 활용해 고해상도 공간 전사체 데이터와 조직학적 이미지를 매칭한 통합 데이터셋을 구축하여, 공간 전사체 분석 방법론 개발과 벤치마킹을 위한 표준화된 리소스를 제공했습니다.

Ren, X., Lv, T., Liu, N., Shi, C., Fang, J., Zhao, N., Kang, Q., Wang, D.2026-04-11💻 bioinformatics

scMultiPreDICT: A single-cell predictive framework with transcriptomic and epigenetic signatures

단일 세포 멀티오믹스 데이터를 활용한 scMultiPreDICT 프레임워크는 유전자 발현 예측에 전사 및 후성유전적 특징이 기여하는 정도를 체계적으로 비교·분석하여, 대부분의 유전자에서는 전사적 특징이 우세하지만 특정 유전자와 세포 환경에서는 후성유전적 특징의 기여가 중요함을 규명했습니다.

Manful, E.-E., Uzun, Y.2026-04-11💻 bioinformatics

Metabolomic Fingerprinting from Dried Blood Spots Enables Individual Identification Across 1,257 Participants at 94% User-Level Accuracy

이 연구는 1,257 명의 참가자로부터 수집된 18,288 개의 건조 혈액 샘플 (DBS) 을 대상으로 한 대규모 검증을 통해, 배치 간 데이터 누출을 방지하는 메타볼로믹스 분석 파이프라인이 개인 식별에서 94% 이상의 높은 정확도를 달성할 수 있음을 입증했습니다.

Hauguel, P., Anctil, N., Noel, L. P.2026-04-11💻 bioinformatics

Evaluation of somatic variant calling methods on high coverage tumour-only amplicon sequencing data in a clinical environment

이 논문은 임상 환경에서 고커버리지 종양 전용 암시퀀싱 데이터를 기반으로 FreeBayes, MuTect2, Pisces, VarScan 등 6 가지 소머틱 변이 호출기법 (variant callers) 의 성능을 평가하여, FreeBayes 가 가장 많은 변이를 검출했으나 FreeBayes, VarScan, MuTect2, Pisces 가 HD789 참조 표준 데이터를 기준으로 가장 우수한 성능을 보임을 규명했습니다.

Bharne, D., Gaston, D.2026-04-11💻 bioinformatics

RNA Folding Nearest Neighbor Parameters Including the Modification 1-Methyl-Pseudouridine

이 논문은 1-메틸-슈도유리딘을 포함한 RNA 서열의 접힘 안정성을 예측하기 위해 208 개의 광학 용융 실험 데이터를 기반으로 한 새로운 인접 이웃 파라미터를 개발하고, 이를 RNAstructure 소프트웨어에 통합하여 mRNA 치료제 및 자연 발생 RNA 서열의 2 차 구조 모델링 정확도를 향상시켰음을 보고합니다.

Kierzek, E., Shabangu, T. S., Hiltke, O. M., Miaro, M., Arteaga, S., Znosko, B. M., Jolley, E. A., Bevilacqua, P. C., SantaLucia, J., SantaLucia, H. A., Lin, H., Metkar, M., Aviran, S., Soszynska-Jozw (…)2026-04-11💻 bioinformatics

Generative design of intrinsically disordered protein regions with IDiom

이 논문은 3700 만 개의 자연계 내재적 무질서 영역 서열로 학습된 IDiom 이라는 생성형 단백질 언어 모델을 소개하며, 이를 통해 구조적 맥락에 기반하거나 맥락 없이도 생물학적으로 유의미한 무질서 단백질 영역을 설계하고 Reinforcement Learning 을 통해 세포 내 위치 특이성을 부여할 수 있음을 보여줍니다.

Liu, J., Ibarraran, S., Hu, F., Park, A., Dunn, A., Rotskoff, G.2026-04-11💻 bioinformatics

Structural Connectome Analysis using a Graph-based Deep Model for Age and Dementia Prediction

이 논문은 확산 MRI 기반의 구조적 뇌 연결성을 그래프 합성곱 네트워크 (GCN) 기반의 병렬 구조와 '연결성 주의 블록'을 활용하여 학습함으로써, 기존 방법들보다 특히 연령 예측에서 우수한 성능을 보이는 새로운 딥러닝 모델을 제안하고 검증합니다.

Kazi, A., Mora, J., Fischl, B., Dalca, A., Aganj, I.2026-04-10💻 bioinformatics