STAPLE: automating spatial transcriptomics analysis and AI interpretation
STAPLE 는 공간 전사체 분석의 단편성을 해결하기 위해 세포 유형 분류부터 AI 기반 생물학적 해석 보고까지를 단일 명령어로 자동화하는 통합 모듈형 프레임워크를 제시합니다.
1243 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
STAPLE 는 공간 전사체 분석의 단편성을 해결하기 위해 세포 유형 분류부터 AI 기반 생물학적 해석 보고까지를 단일 명령어로 자동화하는 통합 모듈형 프레임워크를 제시합니다.
이 논문은 유전자 발현, 장기적 임상 검사 데이터 및 치료 이력을 통합한 동적 다중모달 딥러닝 프레임워크를 개발하여 다발성 골수종 환자의 생존을 기존 방법보다 정확하게 예측하고 해석 가능한 생물학적 통찰력을 제공함을 보여줍니다.
이 논문은 유전체 예측에서 데이터 오염으로 인한 예측 오류를 해결하기 위해 데이터 변환, 알고리즘 수정, 하이브리드 접근법 등 다양한 로버스트 랜덤 포레스트 전략을 평가하고, 오염된 데이터 환경에서 순위 기반 방법이 가장 효과적임을 입증하여 실용적인 개선 방안을 제시합니다.
이 논문은 단백질 시퀀스 언어 모델 (ESM-2) 과 구조 기반 그래프 신경망 (GVP) 을 융합하여 접힌 구조와 본질적 무질서 구조를 가진 상분리 단백질 (PSPs) 을 정확하게 예측하고, 그 병리적 변이와의 연관성을 규명한 새로운 딥러닝 모델 'SSPSPredictor'를 제안합니다.
이 논문은 시퀀싱 데이터의 기술적 한계를 극복하고 정밀한 모자이크 STR 변이 검출을 가능하게 하는 머신러닝 기반의 계산 프레임워크 'BulkMonSTR'을 제시하여 노화와 질병 연구에 기여합니다.
본 논문은 OME-Zarr 포맷을 기반으로 Rust 로 개발된 Odon 이라는 초고속 데스크톱 뷰어를 소개하며, 이는 기존 도구들보다 월등히 빠른 로딩 속도와 GPU 기반 렌더링을 통해 대규모 공간 프로테오믹스 및 조직 마이크로어레이 데이터의 효율적인 시각화와 분석을 가능하게 합니다.
이 논문은 3 차원 구조 정보 없이 단백질 언어 모델을 미세 조정하여 단백질 간 결합 친화도를 예측하고, 실험적으로 검증된 인터페이스 잔기에 기반한 설명 가능성을 제공하며 소량의 데이터로도 높은 정확도를 달성하는 확장 가능한 프레임워크를 제시합니다.
이 연구는 단일 세포 RNA 시퀀싱 기반 참조 데이터를 활용하여 신장 세포주와 조직의 전사체 유사성을 평가하는 정량적 방법론과 도구 (CellMatchR) 를 개발함으로써, 신장 연구에서 세포 모델의 정체성 검증 및 실험 결과 해석의 신뢰성을 높이는 체계적인 프레임워크를 제시합니다.
IMMREP25 컨테스트는 기존 데이터가 없는 '미확인' 펩타이드에 대한 TCR:pMHC 결합 예측을 평가한 결과, 구조 모델링을 활용한 최상위 방법들이 무작위 추측을 유의미하게 능가하는 성과를 거두었음을 보여줍니다.
이 논문은 단일 세포 RNA 시퀀싱 데이터에서 생물학적 위상 불일치와 기술적 노이즈를 구분하여 circadian 위상을 추정하고 세포 간 동기화 정도를 정량화하는 확률론적 프레임워크인 scRitmo 를 제안하고, 이를 다양한 조직과 생물 종에서 검증했습니다.