Sensitive and scalable metagenomic classification using spaced metamers, reduced alphabets, and syncmers
이 논문은 간격이 있는 메타머 (spaced metamers), 축소된 아미노산 알파벳, 그리고 싱크머 (syncmers) 기술을 도입하여 메타지노믹 분류의 민감도와 확장성을 크게 향상시킨 최적화된 Metabuli 도구를 제안합니다.
1246 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
이 논문은 간격이 있는 메타머 (spaced metamers), 축소된 아미노산 알파벳, 그리고 싱크머 (syncmers) 기술을 도입하여 메타지노믹 분류의 민감도와 확장성을 크게 향상시킨 최적화된 Metabuli 도구를 제안합니다.
DCS Tools 는 GPU 나 FPGA 와 같은 특수 하드웨어 없이 표준 CPU 만으로 인구 규모 게놈 분석 속도를 16 배 향상시키고 저장 공간을 최대 80% 까지 절감하는 고성능·저비용·확장 가능한 컴퓨팅 솔루션을 제공합니다.
본 논문은 딥러닝 기반 프레임워크인 AI-IDP 를 통해 무질서 단백질의 시퀀스 정보를 실험과 일치하는 입체 구조 앙상블로 변환하고, 이를 통해 무질서 단백질의 구조적·기능적 논리를 규명하여 질병 치료에 활용할 수 있는 실용적 체계를 제시합니다.
Grass Expression Atlas(GExA) 는 4 종의 조류와 함께 보리와 수수를 참조 종으로 포함하여, 다양한 조직 및 조건에 대한 RNA-seq 데이터를 통합한 상호작용형 웹 기반 유전자 발현 자원입니다.
이 논문은 단백질 언어 모델 임베딩과 그래프 신경망을 활용하여 단백질 복합체의 화학량론을 기존 방법보다 빠르고 정확하게 예측하는 새로운 도구인 'Stoic'을 소개합니다.
이 논문은 대조적 정렬을 활용한 잠재 공간 베이지안 최적화 프레임워크인 PepCABO 를 제안하여, 관련 대립유전자의 결합 데이터를 효과적으로 활용하고 사전 학습된 잠재 공간 구조를 통해 제한된 실험 예산 하에서도 다양한 MHC 대립유전자에 대한 펩타이드 결합 최적화의 수렴 속도와 샘플 효율성을 크게 향상시켰음을 보여줍니다.
이 논문은 콜라겐 원섬유의 원자 수준 시뮬레이션을 위해 효소성 교차결합뿐만 아니라 노화와 당뇨 합병증의 핵심 요소인 비효소성 당화최종생성물 (AGE) 교차결합을 통합할 수 있는 ColBuilder 프레임워크의 확장 기능을 개발하고, 이를 통해 AGE 교차결합이 효소성 교차결합과 구별되는 기계적 특성을 가진다는 것을 입증했습니다.
이 논문은 인간 세포의 단백질 항상성 네트워크의 핵심 구성 요소인 유비퀴틴 - 프로테아좀 시스템 (UPS) 과 관련 경로를 포괄적으로 조사하여 약 1400 개의 단백질을 포함하는 이 시스템의 광범위한 범위와 생물학적 중요성을 규명하고, 이를 통해 유전체학부터 질병 연구에 이르는 다양한 분야의 연구를 지원할 수 있는 체계적인 정의를 제시합니다.
이 논문은 항생제 내성 극복을 위한 새로운 치료제인 박테리오파지 라이신 발견을 위해 이질적 서열 특징과 하이브리드 CNN-Transformer 아키텍처를 통합한 재현 가능한 딥러닝 프레임워크 'LysinFusion'을 제안하고, 기존 방법보다 우수한 성능과 생물학적 해석 가능성을 입증했습니다.
이 논문은 2,428 개의 실험적으로 검증된 siRNA 데이터를 기반으로 머신러닝 모델을 개발하여 서열, 구조 및 열역학적 특성을 통합 분석함으로써 siRNA 효능을 기존 방법보다 정확하게 예측하고 생물학적 해석 가능성을 높였으며, 특히 5' 말단의 우라실과 3' 말단의 아데닌이 효능의 주요 결정 인자임을 규명했습니다.