생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.

Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.

아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.

Developing SCL2205 : A Protein Sequence-based Spatial Modelling Dataset for the Protein Language Model Frontier

본 논문은 데이터 누수를 최소화하고 품질을 강화하기 위해 엄격한 전처리와 수동 라벨 매핑을 거쳐 개발된 고품질 단백질 서열 기반 SCL2205 데이터셋을 소개하며, 이를 통해 기존 최첨단 모델의 성능 과대평가 문제를 지적하고 단백질 서열 공간 모델링의 신뢰성과 재현성을 높이는 데 기여함을 보여줍니다.

Ouso, D., Pollastri, G.2026-03-10💻 bioinformatics

Intrinsic dataset features drive mutational effect prediction by protein language models

본 연구는 단백질 언어 모델의 돌연변이 효과 예측 성능이 모델 아키텍처나 학습 전략보다는 데이터셋 내 부위별 적합도 변이와 같은 고유한 데이터 특성에 의해 주로 결정되며, 기존 벤치마크는 데이터 누출로 인해 모델 성능을 과대평가하고 있음을 규명했습니다.

Vieira, L. C., Lin, S., Wilke, C. O.2026-03-10💻 bioinformatics

Phosphorylation of a tumor-derived ASXL2 epitope remodels 1 peptide-HLA binding affinity and interaction dynamics

본 연구는 암에서 유래된 ASXL2 펩타이드의 인산화가 pHLA 복합체의 결합 친화력을 향상시키고 구조적 유연성을 변화시킨다는 분자 동역학 시뮬레이션 결과를 제시함으로써, 인산화 표적 기반의 정밀 면역치료 전략 개발에 중요한 구조적·동역학적 근거를 제공합니다.

Zhang, J., Lv, L., Chen, B., Yi, X.2026-03-10💻 bioinformatics

STAR Suite: Integrating transcriptomics through AI software engineering in the NIH MorPhiC consortium

이 논문은 NIH MorPhiC 컨소시엄의 확장성 문제를 해결하기 위해 AI 소프트웨어 엔지니어링을 활용하여 STAR 정렬기의 기능을 C++ 소스 코드에 직접 통합한 'STAR Suite'를 개발하고, 이를 통해 고성능 생물정보학 소프트웨어의 빠른 진화를 위한 새로운 패러다임을 제시했다고 요약할 수 있습니다.

Hung, L.-H., Yeung, K. Y.2026-03-10💻 bioinformatics

Ensemble-based genomic prediction for maize flowering-time improves prediction accuracy and reveals novel insights into trait genetic variation

본 연구는 EasiGP 파이프라인을 활용하여 단일 모델의 한계를 극복하고 다양한 유전적 변이 관점을 통합함으로써 옥수수 개화 시간 예측의 정확도를 향상시키고 새로운 유전적 통찰력을 제공한다는 점을 입증했습니다.

Tomura, S., Powell, O. M., Wilkinson, M. J., Cooper, M.2026-03-09💻 bioinformatics

ChatSpatial: Schema-Enforced Agentic Orchestration for Reproducible and Cross-Platform Spatial Transcriptomics

이 논문은 Python 과 R 생태계 간의 호환성 문제와 재현성 부족을 해결하기 위해 사전 검증된 도구 스키마와 도메인 지식을 기반으로 한 LLM 을 활용하여 60 개 이상의 공간 전사체 분석 방법을 통합한 대화형 플랫폼 'ChatSpatial'을 제안하고, 이를 통해 다단계 분석 워크플로우의 결정론적 재현성과 교차 플랫폼 호환성을 입증합니다.

Yang, C., Zhang, X., Chen, J.2026-03-09💻 bioinformatics

singIST: an R/Bioconductor library and Quarto dashboard for automated single-cell comparative transcriptomics analysis ofdisease models and humans

이 논문은 질병 모델과 인간 간의 단일 세포 수준 차이를 정량적으로 비교하고 해석 가능한 결과를 제공하기 위해 개발된 R/Bioconductor 패키지 'singIST'와 이를 시각화하는 대시보드 'singIST Visualizer'를 소개합니다.

Moruno Cuenca, A., Picart-Armada, S., Perera-Lluna, A., Fernandez-Albert, F.2026-03-09💻 bioinformatics

Defining mutational signatures of lung cancer-associated carcinogens through in vitro exposure of human airway epithelial cells

이 연구는 인간 기道上피세포를 이용한 새로운 실험 모델을 개발하여, 폐암 유발 발암물질인 NTCU 가 특정 돌연변이 서명을 생성함을 규명했으나 NNK 는 배경 수준 이상의 뚜렷한 패턴을 보이지 않았음을 보고합니다.

Gurevich, N. Q., Chiu, D. J., Yajima, M., Huggins, J., Mazzilli, S. A., Campbell, J. D.2026-03-09💻 bioinformatics

Benchmarking tissue- and cell type-of-origin deconvolution in cell-free transcriptomics

이 논문은 혈장 세포외 RNA(cfRNA) 의 기원 조직 및 세포 유형을 추정하는 데 있어 방법론과 참조 데이터의 선택이 결과에 큰 영향을 미치며, 조직 수준 추정은 세포 유형 수준 추정보다 훨씬 더 견고하다는 것을 체계적인 벤치마킹을 통해 규명했습니다.

Ioannou, A., Friman, E. T., Daub, C. O., Bickmore, W. A., Biddie, S. C.2026-03-09💻 bioinformatics