PACMON: Pathway-guided Multi-Omics data integration for interpreting large-scale perturbation screens
PACMON 은 대규모 교란 스크리닝에서 생성된 다중 오믹스 데이터를 기존 생물학적 경로와 정렬된 베이지안 잠재 요인 모델을 통해 통합하여, 교란 효과를 해석 가능하고 확장 가능한 경로 수준 프로그램으로 변환하는 새로운 프레임워크를 제시합니다.
1244 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
PACMON 은 대규모 교란 스크리닝에서 생성된 다중 오믹스 데이터를 기존 생물학적 경로와 정렬된 베이지안 잠재 요인 모델을 통해 통합하여, 교란 효과를 해석 가능하고 확장 가능한 경로 수준 프로그램으로 변환하는 새로운 프레임워크를 제시합니다.
이 논문은 tRNA 유래 작은 RNA(tsRNA) 와 질병 간의 연관성을 예측하기 위해 복잡한 생물학적 특징 상호작용을 명시적으로 모델링하고 음성 샘플링 전략을 개선한 향상된 회전 인수 분해 기법 (ERFMTDA) 을 제안하며, 기존 최첨단 방법들보다 우수한 성능을 입증했습니다.
이 논문은 BLOSUM62 기반의 윈도우 k-mer 임베딩과 FAISS 기반의 근사 최근접 이웃 검색을 결합한 TCRseek 프레임워크를 제안하여, 대규모 TCR 레퍼토리 데이터에서 기존 정밀 검색 방법 대비 3.6~39.6 배의 속도 향상과 높은 민감도를 동시에 달성함을 보여줍니다.
본 연구는 4 천만 개 이상의 전장 유전체 SNP 를 분석하여 ANNOVAR, SnpEff, VEP 등 주요 주석 도구와 유전자 모델 간의 불일치가 단백질 및 경로 수준의 해석에 중대한 영향을 미친다는 사실을 규명하고, 단일 접근법 대신 다중 도구와 모델을 통합하는 전략이 가장 포괄적이고 견고한 유전체 해석을 보장함을 제시했습니다.
dreampy 는 단일 세포 RNA 시퀀싱 데이터의 의사 벌크 차등 발현 분석을 위해 R/Bioconductor 생태계의 dreamlet 프레임워크를 AnnData 및 scverse 생태계와 통합된 Python 환경에 네이티브로 구현한 도구입니다.
이 논문은 16S rRNA 서열을 계통 발생적 관계에 따라 연속 벡터 공간에 임베딩하는 'Micro16S' 모델을 제안하여 미생물군집의 진화적 맥락을 반영한 표현 학습의 가능성을 입증했으나, 현재는 기존 기계학습 기반선보다 분류 성능이 낮아 알고리즘 설계와 클래스 불균형 해결이 향후 과제로 남음을 밝혔습니다.
이 논문은 IARC, KEGG, PharmVar 등 다양한 출처의 데이터를 통합하여 발암물질의 대사 활성화 및 해독 경로, DNA 손상, 유전적 변이를 하나의 대화형 지식 그래프 플랫폼인 'ExposoGraph'로 시각화함으로써 유전 - 환경 상호작용 연구 및 개인화된 암 위험 평가에 기여할 수 있는 프레임워크를 제시합니다.
이 논문은 NIH Bridge2AI 표준 작업 그룹이 제안한 7 가지 핵심 차원 (FAIR 성, 출처, 특성화, 윤리, 사전 모델 설명 가능성, 지속 가능성, 계산 가능성) 을 기반으로 한 생물의학 데이터의 AI 준비성 기준을 정의하고 이를 4 개의 대표 데이터셋에 적용하여 AI 모델링 전 단계에서 과학적 엄격성과 윤리적 무결성을 보장하는 프레임워크를 제시합니다.
본 연구는 인간 T2T 게놈 분석을 통해 140kb 길이의 엔토포폭스바이러스 유사 서열이 인간 염색체의 중심부 및 주위 영역에 약 2.42Mb 규모로 존재하며 활발히 전사됨을 규명했습니다.
이 연구는 유전적 변이가 큰 자연 개체군에서 DNA 메틸화 분석을 위해 RRBS 와 WGBS 라이브러리 준비 전략 및 다양한 매핑 소프트웨어를 평가하여, RRBS 가 기능적으로 관련된 메틸화 차이 탐지에 더 유용할 수 있음을 보여주고 방법론적 개선을 위한 권장 사항을 제시합니다.