evedesign: accessible biosequence design with a unified framework
이 논문은 단백질 공학의 복잡한 조건부 설계와 다목적 최적화 문제를 해결하기 위해 다양한 머신러닝 모델을 통합하고 실험 데이터와의 반복적 연계를 지원하며 웹 인터페이스를 통해 비전문가도 접근할 수 있도록 설계된 오픈소스 프레임워크 'evedesign'을 제안합니다.
769 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
이 논문은 단백질 공학의 복잡한 조건부 설계와 다목적 최적화 문제를 해결하기 위해 다양한 머신러닝 모델을 통합하고 실험 데이터와의 반복적 연계를 지원하며 웹 인터페이스를 통해 비전문가도 접근할 수 있도록 설계된 오픈소스 프레임워크 'evedesign'을 제안합니다.
StrucTTY 는 HPC 환경 및 SSH 세션과 같은 텍스트 기반 터미널에서 실시간으로 단백질 구조를 시각화하고 비교 분석할 수 있도록 설계된 대화형 터미널 네이티브 도구입니다.
이 논문은 시스토크롬 P450 의 극심한 서열 다양성과 불일치된 주석으로 인해 PDB 내 모든 P450 구조를 식별하고 분류하는 데 어려움이 있었던 문제를 해결하기 위해, 키워드 검색과 은닉 마르코프 모델, 구조 정렬을 결합한 워크플로우를 개발하여 1,513 개의 PDB 등재물 (674 개 고유 서열) 을 식별하고 5 개의 새로운 아과를 발견하며 표준화된 명명법을 적용한 최초의 엄격하게 큐레이션된 P450 레지스트리를 구축했다고 요약할 수 있습니다.
이 논문은 SELFIES, 분자 구조, 텍스트 설명, 지식 그래프 기반 생물학적 상호작용 데이터를 통합하여 단일 모달리티 모델보다 우수한 성능을 보이는 다중 모달 분자 표현 학습 프레임워크인 SELFormerMM 을 제안합니다.
이 논문은 생물학적 시퀀스 스트리밍 k-mer 쿼리를 위해 미니마이저 기반의 슈퍼-k-mer 그룹화와 findere 방식을 결합하여 캐시 효율성을 극대화하고 오탐지를 획기적으로 줄인 'Super Bloom Filter'를 제안하며, 기존 블룸 필터 구현체보다 훨씬 빠른 속도와 정밀도를 입증했습니다.
이 논문은 RNA 분자의 이차 구조와 5 가지 체계화된 분류 시스템에서 유래한 계통 발생 주석을 명시적으로 연결하여 비교 및 계통 분석을 용이하게 하는 새로운 메타 데이터베이스 'PhyloRNA'를 소개합니다.
이 논문은 다양한 리보솜 프로파일링 프로토콜에서 발생하는 편향을 명시적으로 고려하여 비정형 ORF(ncORF) 식별의 정확도와 민감도를 획기적으로 향상시킨 확률론적 프레임워크 'RiboBA'를 제안하고, 이를 통해 보존된 ncORF 와 새로운 번역 조절 기작을 발견했음을 보고합니다.
이 논문은 호흡기 미생물군집 데이터와 임상 정보를 결합한 XGBoost 기반 AI 의사결정 지원 도구를 개발하여 중증도 및 사망 위험이 높은 COVID-19 환자를 96% 이상의 정확도로 분류할 수 있음을 입증했습니다.
이 논문은 벌크 및 단일 세포 리보솜 프로파일링 실험에서 유전자 수준의 가정을 넘어 개방형 읽기 프레임 (ORF) 수준의 조절을 정량적으로 분석할 수 있는 새로운 통계 프레임워크인 DOTSeq 를 제안하고, 이를 통해 대규모 번역 조절 사건을 포착하는 종단간 워크플로우를 제공합니다.
이 논문은 110 만 개의 시퀀스 테스트 세트를 분석하고 이해관계자 검토를 통해 '우려 시퀀스'에 대한 과학적 기준을 마련함으로써, 생물안전성 검역 표준 및 정책 개발의 기초를 제공하는 연구 결과를 제시합니다.