The gift of novelty: repeat-robust k-mer-based estimators of mutation rates
이 논문은 반복 서열에 강건한 세 가지 새로운 k-mer 기반 돌연변이율 추정법을 제안하고, 알파 위성 서열을 이용한 실험을 통해 기존 방법들보다 우수한 성능을 입증했습니다.
768 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
이 논문은 반복 서열에 강건한 세 가지 새로운 k-mer 기반 돌연변이율 추정법을 제안하고, 알파 위성 서열을 이용한 실험을 통해 기존 방법들보다 우수한 성능을 입증했습니다.
이 연구는 TCGA LIHC 코호트의 358 명을 대상으로 mRNA, miRNA, DNA 메틸레이션 데이터를 통합한 주의 기반 다중 분기 딥러닝 모델을 개발하여 간세포암 (HCC) 환자의 예후를 기존 모델보다 정확하고 해석 가능하게 예측하는 새로운 프레임워크를 제시합니다.
이 논문은 동물, 식물, 균류를 아우르는 통합 데이터베이스와 모듈형 벤치마크 플랫폼을 결합한 'PanTEon' 프레임워크를 제시하여 전이성 요소 (TE) 분류의 재현성과 표준화를 달성하고, 다양한 계통과 슈퍼패밀리에 따른 분류기 성능 차이를 규명하며 향후 AI 기반 TE 연구의 기반을 마련했습니다.
이 논문은 1,000 개 이상의 인간 암 세포주에 대한 CRISPR 스크린 데이터를 기반으로, 사전 생물학적 주석에 의존하지 않고 기능적 데이터에서 직접 유전자 연결성을 도출하여 유전자 세트 분석 및 유전자 의존성 탐색을 가능하게 하는 무료 웹 애플리케이션 'Correlate'를 소개합니다.
이 논문은 데이터 독립적 획득 (DIA) 프로테오믹스에서 누락된 값을 처리하기 위해 펩타이드의 체류 시간 경계를 추정하고 이를 기반으로 정량 값을 도출하는 'Nettle'이라는 새로운 방법을 제안하여 기존 방법보다 정확한 정량 분석과 낮은 검출 한계를 달성함을 보여줍니다.
CellWHISPER 는 공간적 근접성과 세포 유형별 발현의 교란 효과를 통계적으로 보정하여 대규모 공간 전사체 데이터에서 직접적인 세포 간 통신을 정확하게 추론하고 알츠하이머병 모델 등에서의 새로운 신호 전달 경로를 발견하는 새로운 통계적 프레임워크를 제시합니다.
이 논문은 다양한 생물학적 데이터를 통합하고 생물학적 맥락에 부합하는 평가 방식을 적용하여 잘 연구되지 않은 단백질의 기능 예측 성능을 크게 향상시킨 GATSBI 프레임워크를 제안합니다.
이 논문은 소마틱 변이 데이터를 기반으로 종양을 분류하고 표현 학습을 수행하는 이동 가능한 트랜스포머 기반 소프트웨어 'muat'를 소개하며, Docker 및 Bioconda를 통해 다양한 보안 처리 환경과 고성능 컴퓨팅 시스템에서 재현성 있고 적응력 있게 배포할 수 있음을 보여줍니다.
이 논문은 표적 비설프라이트 증폭체 시퀀싱을 통해 개별 DNA 분자의 연속적인 메틸화 패턴과 에피대립체 이질성을 복원하기 위해 정렬, 메틸화 호출, 위상 시각화 및 정량화를 통합하는 새로운 그래픽 파이프라인인 PANDA 를 제안하고 그 유효성을 입증합니다.
OncoMORPHIA 는 ClinVar, cBioPortal, TCGA 등 10 개 이상의 공개 데이터베이스에서 임상 및 구조적 데이터를 통합하여 전문적인 생정보학 지식이 없어도 암 돌연변이의 3D 구조 시각화, 기능적 주석, 생존 분석 및 AI 기반 해석을 하나의 웹 플랫폼에서 제공하는 무료 도구입니다.