Towards building a World Model to simulate perturbation-induced cellular dynamics by AlphaCell
이 논문은 고차원 유전체 표현, 고충실도 재구성, 그리고 최적 수송 기반의 조건부 흐름 매칭을 통해 다양한 세포 맥락에서 교란 유발 세포 역학을 제로샷으로 예측할 수 있는 범용 가상 세포 세계 모델인 AlphaCell 을 제안합니다.
1250 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
이 논문은 고차원 유전체 표현, 고충실도 재구성, 그리고 최적 수송 기반의 조건부 흐름 매칭을 통해 다양한 세포 맥락에서 교란 유발 세포 역학을 제로샷으로 예측할 수 있는 범용 가상 세포 세계 모델인 AlphaCell 을 제안합니다.
이 논문은 웨어러블 생체 신호를 활용한 스트레스 감지를 위해 생리학적 지식을 기반으로 한 적응형 위상 구조와 계층적 어텐션 메커니즘을 결합한 PAMG-AT 모델을 제안하여, 높은 예측 정확도와 함께 생리적 신호 간 상호작용에 대한 해석 가능성을 제공합니다.
이 논문은 단일 세포 Hi-C 데이터의 해상도 불일치와 노이즈 문제를 해결하기 위해 관성 좌표계를 도입하고 기하학적 인식을 강화한 트랜스포머 기반 모델 'InertialGenome'을 제안하여, 다양한 해상도에서 기존 방법보다 우수한 3D 염색체 구조 재구성 성능과 기능적 검증 결과를 입증했습니다.
이 논문은 나노포어와 PacBio 등 다양한 롱리드 단일세포 RNA 시퀀싱 플랫폼에서 정확한 아이소폼 수준의 유전자 발현 분석을 위해, 부분 엑손 조합 모델링과 동적 임계값 설정을 통해 기존 방법보다 우수한 성능을 보이는 종단간 파이프라인 'SCOTCH'를 제안합니다.
이 논문은 생물의학 데이터의 AI 적용 준비도, 설명 가능성, 윤리성 및 FAIR 원칙을 보장하기 위해 개발된 FAIRSCAPE 프레임워크의 방법론, 자동 평가 기능, 그리고 대규모 다중 모달 데이터셋에 대한 적용 성과를 제시합니다.
이 논문은 생존 분석을 위한 고차원 매개 분석 프레임워크인 HDMAX2-surv 를 제안하여, 잠재 요인 모델링과 유연한 생존 모델을 통해 췌장암 데이터에서 흡연 노출이 생존에 미치는 영향의 메커니즘을 규명하고 면역 매개 경로를 발견했습니다.
이 논문은 긴 읽기 RNA 시퀀싱 (lrRNA-seq) 데이터를 기반으로 샘플 특이적 및 하플로타입 분해된 단백질 변이체 데이터베이스를 구축하고 질량 분석 (MS) 검색에 통합하는 종단 간 워크플로우를 개발하여, 기존 참조 프로테옴으로는 검출 불가능한 대립유전자 특이적 단백질 변이체와 연결된 변이를 효과적으로 식별할 수 있음을 입증했습니다.
이 논문은 많은 수의 집합으로 구성된 비례 벤 다이어그램의 복잡성을 줄이고 해석을 용이하게 하기 위해, 비어 있는 영역을 고려하여 계산 시간을 단축하고 다양한 플랫폼에서 사용 가능한 새로운 알고리즘 'nVenn2'를 제안합니다.
이 논문은 제 3 세대 시퀀싱 데이터를 활용하여 사전 정의된 변이 모델에 의존하지 않고 정렬 및 어셈블리 기반 증거를 통합함으로써 기존 도구들이 놓치기 쉬운 복잡한 구조적 변이를 민감하게 탐지하는 새로운 도구인 gSV 를 제안하고, 이를 통해 암 관련 유전자 및 인구 규모 연구에서 새로운 변이를 발견할 수 있음을 입증합니다.
이 논문은 AlphaFold 기반의 3D 구조 정보와 진화적 제약을 CLIP 방식의 대비 학습으로 통합하여 다양한 유전자의 변이 효과를 예측하는 다중 모달 임베딩 모델 'EvoStructCLIP'을 제안하고, CAGI7 경쟁을 포함한 다양한 평가에서 뛰어난 일반화 성능을 입증했습니다.