Co-designing sequence and structure of functional de novo enzymes with EnzyGen2
이 논문은 리간드 유도 기능 타겟팅 하에서 서열과 구조를 동시에 설계하는 대규모 단백질 기초 모델 'EnzyGen2'를 소개하며, 이를 통해 기존 방법보다 400 배 빠르게 설계된 새로운 효소들이 자연 효소와 유사하거나 더 높은 촉매 활성을 실험적으로 입증했음을 보고합니다.
768 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
이 논문은 리간드 유도 기능 타겟팅 하에서 서열과 구조를 동시에 설계하는 대규모 단백질 기초 모델 'EnzyGen2'를 소개하며, 이를 통해 기존 방법보다 400 배 빠르게 설계된 새로운 효소들이 자연 효소와 유사하거나 더 높은 촉매 활성을 실험적으로 입증했음을 보고합니다.
이 논문은 기존 방법론의 한계를 극복하고 발현량 변화와 실제 RNA 결합 단백질의 결합 변화 효과를 명확히 구분하여 eCLIP 데이터의 차등 RNA 결합 분석을 위한 정교한 통계적 프레임워크인 'Flipper'를 제안합니다.
이 논문은 WikiPathways 와 KEGG 의 경로 데이터를 그래프 구조로 변환하여 음성 피드백 루프와 같은 조절 특성을 분석하는 R 패키지 'WayFindR'을 소개하고, 현재 데이터베이스에서 이러한 피드백 메커니즘이 체계적으로 누락되어 있음을 규명하여 데이터 큐레이션 및 주석 표준화의 중요성을 강조합니다.
이 논문은 VAE, 신경 ODE, 모멘텀 컨트라스를 통합하고 흐름 매칭으로 정제하는 MoCoO 프레임워크를 제안하여 단일 세포 RNA 시퀀싱 데이터에서 세포 분화 궤적 추론과 표현 학습의 정확도를 획기적으로 향상시켰음을 20 개 데이터셋의 광범위한 벤치마킹을 통해 입증합니다.
이 논문은 단일 세포 RNA 시퀀싱 (scRNA-seq) 데이터에서 환자 계층화를 위해 복잡한 방법론보다 세포 유형 구성 비율을 기반으로 한 해석 가능한 접근 방식이 더 효과적이며, 이를 위한 오픈 소스 R 패키지인 scECODA 를 제안합니다.
이 논문은 단백질 언어 모델 기반의 데코이 생성법이 기존 역순 데코이보다 명확한 검색 성능 향상을 제공하지는 않지만, 시퀀스 수준의 인공적 특징이 적고 벤치마킹 및 진단 도구로서 가치가 있음을 평가했습니다.
이 논문은 GNPS, MetaboLights, Metabolomics Workbench 등의 대규모 데이터베이스를 광범위하게 분석하여 2,857 개의 원자 조성으로 구성된 34,222 개의 고유한 MS/MS 스펙트럼 라이브러리를 구축함으로써, 미지의 카르니틴 화합물을 발견하고 대사·식이·미생물 활동 등 다양한 맥락에서의 역할을 규명할 수 있는 기반을 마련했습니다.
이 논문은 timsTOF DIA 데이터를 직접 학습하여 이온 이동도, 보유 시간, 단편 이온 강도를 정확하게 예측하는 딥러닝 기반의 Carafe2 도구를 개발하고, 이를 통해 기존 DDA 기반 모델이나 실험적 라이브러리보다 우수한 성능으로 고품질의 인실리코 스펙트럼 라이브러리를 생성할 수 있음을 입증했습니다.
이 논문은 고차원 미생물군집 데이터의 희소성과 계산 병목 문제를 해결하기 위해 병렬 처리 아키텍처를 도입한 'Parallel-REM'을 제안함으로써, 기존 R 기반 모델 대비 26.1 배의 속도 향상과 높은 정확도를 보장하여 대규모 네트워크 추론을 가능하게 하고 이를 딥러닝 및 트랜스포머 기반 진단 모델에 효과적으로 통합할 수 있는 인프라를 마련했습니다.
이 논문은 시퀀싱 오류를 보정하기 위해 기존 정렬 도구보다 품질 점수를 더 효과적으로 활용하여 다양한 오류율과 읽기 길이에서 높은 정확도의 바코드-서열 매핑을 제공하는 빠르고 일반적인 도구인 BCAR 을 소개합니다.