OT-knn: a neighborhood-aware optimal transport framework for aligning spatial transcriptomics data
이 논문은 희소성, 생물학적 이질성, 기하학적 왜곡 등의 도전 과제를 극복하기 위해 국소 이웃 정보를 최적 수송 프레임워크에 통합하여 공간 전사체 데이터를 정렬하는 새로운 방법인 OT-knn 을 제안하고, 이를 다양한 인간, 쥐, 도롱뇽 뇌 데이터셋에서 검증했습니다.
770 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
이 논문은 희소성, 생물학적 이질성, 기하학적 왜곡 등의 도전 과제를 극복하기 위해 국소 이웃 정보를 최적 수송 프레임워크에 통합하여 공간 전사체 데이터를 정렬하는 새로운 방법인 OT-knn 을 제안하고, 이를 다양한 인간, 쥐, 도롱뇽 뇌 데이터셋에서 검증했습니다.
이 논문은 HLA(인간백혈구항원) 를 고려한 세포독성 T 림프구 (CTL) 반응과 가변적 재조합률을 포함하도록 기존 바이러스 시뮬레이션 프레임워크인 wavess 1.2 를 확장하여 숙주 내 바이러스 진화를 더 정확하게 모델링할 수 있음을 제시합니다.
본 연구는 1,800 만 건 이상의 문헌을 분석하여 화학적 프로브가 표적 - 질병 연관성을 기존 지식 베이스보다 1~7 년 앞서 발견하고, 새로운 치료 표적을 발굴하며, 기존 상관관계 데이터를 기능적 검증으로 강화함으로써 초기 약물 개발의 핵심 도구임을 규명했습니다.
이 논문은 제한된 생물의학 이미지 데이터셋에서 머신러닝 모델이 개체 식별과 같은 편향된 패턴을 학습할 수 있음을 SHAP 기반 설명 기법을 통해 규명하고, 이를 통해 편향을 제거하고 데이터가 지원하는 생물학적 의미 (예: 상처 회복 시기) 를 추출할 수 있음을 보여줍니다.
이 논문은 전장 유전체 STR 변이를 활용하여 새로운 방향성 비음수 행렬 분해 (dNMF) 모델을 포함한 다중 모달 프레임워크를 제시함으로써, SNP 보다 우수한 해상도로 인간 집단 구조를 추론할 수 있음을 입증했습니다.
ProteinConformers 는 다중 시드 분자 동역학 전략을 통해 270 만 개의 기하학적 최적화 단백질 입체 구조와 1,370 만 개의 에너지 평가 및 550 만 개의 유사성 주석을 제공하여, 비내재적부터 준내재적 상태에 이르는 연속적인 단백질 입체 구조 지형을 체계적으로 묘사하고 분석할 수 있는 대규모 플랫폼을 구축했습니다.
이 연구는 인간 폐에서 AGTR1 수용체가 폐 주위세포의 새로운 특이적 표지자이자 기능 조절자임을 규명하여, 만성 폐쇄성 폐질환 및 노화와 같은 폐 질환에서 주위세포 거동과 공간적 회복에 대한 안지오텐신 신호 전달의 세포 수준 메커니즘을 제시했습니다.
이 논문은 파ngenome 그래프 파이프라인에서 역위 변이를 식별하기 위한 두 가지 위상적 모티프를 규명하고, 이를 자동 주석하는 도구를 개발하여 시뮬레이션 및 실제 인간 데이터에서 역위 변이 분석의 한계와 파이프라인 간 편차를 평가했습니다.
본 논문은 Arabidopsis thaliana 와 Sisymbrium irio 의 DAP-seq 데이터를 활용하여 DNA 기반 모델 (DNABERT-2, AgroNT, HyenaDNA) 을 평가한 결과, 특히 HyenaDNA 가 기존 방법들보다 식물 전사 인자 결합 부위 예측에서 뛰어난 정확도와 계산 효율성을 보임을 입증했습니다.
이 논문은 공간 전사체 데이터의 분자적 희소성과 노이즈, 그리고 조직 이미지의 해상도 저하가 조직학 이미지 기반의 딥러닝 유전자 발현 예측 성능을 크게 저하시킨다는 사실을 규명하여, 모델 아키텍처 최적화뿐만 아니라 데이터 품질 향상이 예측 모델 개발의 핵심 전략임을 강조합니다.