생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.

Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.

아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.

BTEXgenie: A curated and user-friendly tool for profile HMM-based substrate-specific annotation of BTEX degradation genes

BTEXgenie 는 기존 데이터베이스보다 호기성 및 혐기성 BTEX 분해에 관여하는 기질 특이적 유전자의 검출 민감도를 현저히 높이기 위해 맞춤형 프로파일 은닉 마르코프 모델을 활용하는 한편, 환경 및 비교 유전체 연구를 위한 통합 경로 및 유전체 시각화 기능을 제공하는 큐레이션된 사용자 친화적 도구입니다.

Qu, J., Garber, A. I., Armbruster, C. R.2026-05-15💻 bioinformatics

TDP-43 regulates chromatin looping and gene transcription through binding and stabilizing DNA G-quadruplex structures

본 연구는 TDP-43 이 크로마틴 루프 앵커에서 DNA G-4 중체 구조에 결합하고 이를 안정화함으로써 유전자 전사를 조절하고 장거리 크로마틴 루핑을 촉진하며, 이로써 TDP-43 기능 부전과 관련된 질환에서의 유전자 조절 이상에 대한 기작적 설명을 제공함을 규명하였다.

Yang, F., Zhang, S., Guo, X., Qiao, Y., Zhang, Y., Sun, H., Chen, X., Wang, H.2026-05-15💻 bioinformatics

A modular Bayesian framework for inferring transmission networks from polyclonal infections, with application to Plasmodium falciparum

본 논문은 다중 유전적 원천과 관찰되지 않은 부모를 수용하여 다클론 감염으로부터 지향성 전파 네트워크를 재구성하고 주요 공중보건 지표를 추정하는 플라스모트랙 소프트웨어를 사례로 들어, 말라리아 원충 (*Plasmodium falciparum*) 에 대한 모듈식 베이지안 프레임워크를 제시한다.

Murphy, M. R., Nielsen, R., Perkins, A., Greenhouse, B.2026-05-15💻 bioinformatics

Viral non-coding RNA structure annotation and API-based data retrieval with Rfam and R2DT

본 논문은 바이러스 비코딩 RNA 주석 자동화를 위한 계산 프로토콜과 Rfam 의 RESTful API 를 통한 Rfam 데이터의 프로그래밍적 검색을 제시하며, 동시에 R2DT 를 활용하여 생정보학 및 머신러닝 워크플로우에 통합할 수 있는 포괄적인 2 차원 구조 시각화를 생성하는 방법을 다룬다.

Muston, P., Triebel, S., Nawrocki, E., Ontiveros-Palacios, N., Jandalala, I., Sweeney, B., Bateman, A., Marz, M., Petrov, A. I., Madrigal, P.2026-05-14💻 bioinformatics

PXN Unlocks the Power of Public Gene Expression Data Through Cross-Technology Integration

본 논문은 마이크로어레이와 RNA 시퀀싱 기술을 포함한 다양한 데이터셋을 통합된 표현으로 매끄럽게 변환함으로써 공개 유전자 발현 데이터의 플랫폼 간 비호환성을 극복하는 확률적 머신러닝 프레임워크인 PXN을 소개하며, 이를 통해 대규모 통합 생물학적 분석의 정확성과 통계적 검정력을 크게 향상시킵니다.

Sui, Z., Yu, D., Erdengasileng, A., Zhang, J., Qiu, X.2026-05-14💻 bioinformatics

Cataloging cysteines in ECOD domains using a protein language model

저자들은 예측된 구조로부터 이황화 결합, 금속 배위, 자유 티올과 같은 시스테인의 기능적 상태를 정확하게 예측하는 단백질 언어 모델 기반 도구인 TriCyP을 개발하여 ECOD 도메인 전반에 걸쳐 270 만 개의 시스테인에 대한 프로테옴 규모의 카탈로그를 구축함으로써 뚜렷한 생물학적 패턴을 드러내고 새로운 금속 결합 패밀리 및 잠재적 단백질-단백질 상호작용을 식별할 수 있게 했습니다.

Yuan, R. D., Durham, J., Cong, Q., Schaeffer, R. D. D.2026-05-14💻 bioinformatics

Protein solubility depends on centrifugation: Aiki-Sol, a per-regime predictor for E. coli

이 논문은 원심분리 조건을 노이즈가 아닌 핵심 특징으로 명시적으로 고려함으로써 기존 모델의 성능 정체 문제를 극복하고, 새로 공개된 엄격성 주석이 달린 대장균 데이터셋에서 유의미한 정확도 향상을 달성한 단백질 용해도 예측 도구인 Aiki-Sol 을 소개합니다.

Rajagopalan, R., Meda, R. S., Shastry, S., Mysore, V.2026-05-14💻 bioinformatics

A Context-Specific, Literature-Supported Framework for Validating Stress Response Differentially Expressed Gene Sets

본 논문은 발현 차이가 있는 유전자로 제한된 단백질-단백질 상호작용 네트워크를 활용하여 스트레스 반응 유전자 집합을 검증하는 맥락별 프레임워크를 제시하며, 생물학적으로 지지되는 "주요 반응" 유전자들이 온도 조건 전반에 걸쳐 유의미하게 상호 연결된 하위 네트워크를 형성함을 입증합니다.

Frishman, B. A., Gonzalez, J. L., Forbes, V. E.2026-05-13💻 bioinformatics