Scaling the PBWT for Long-Range Shared Ancestry Detection in Large Haplotype Panels
이 논문은 대규모 해플로타입 패널에서 생물학적으로 의미 있는 장거리 공유 조상 영역을 효율적으로 탐지하기 위해, 기존 PBWT 기반 방법들보다 빠르고 메모리 효율이 높은 새로운 알고리즘인 PBML(Positional Boyer-Moore-Li) 을 제안합니다.
1246 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
이 논문은 대규모 해플로타입 패널에서 생물학적으로 의미 있는 장거리 공유 조상 영역을 효율적으로 탐지하기 위해, 기존 PBWT 기반 방법들보다 빠르고 메모리 효율이 높은 새로운 알고리즘인 PBML(Positional Boyer-Moore-Li) 을 제안합니다.
이 논문은 고처리량 환경 공분산 행렬을 활용하여 환경별 유전자형의 반응과 방향성 구조를 해석 가능하게 반영하는 베이지안 AMMI 기반의 genotype-by-environment 상호작용 (GEI) 시뮬레이션 프레임워크를 제안하고, 이를 통해 복잡한 환경 조건에서의 유전체 선발 전략을 지원할 수 있음을 입증합니다.
이 논문은 OpenFold 와 TensorRT, MMseqs2-GPU 를 결합하여 AlphaFold2 대비 최대 131 배 빠른 추론 속도를 달성하면서도 정확도를 유지하는 고효율 단백질 구조 예측 가속화 기술을 제안합니다.
이 연구는 콜롬비아산 모기 (*Aedes aegypti*) 를 대상으로 페트린과 람다-사이할로트린이라는 두 가지 피레스로이드 농약의 농도 의존적 노출이 유전자 발현에 미치는 영향을 분석하여, 농약 종류와 농도에 따라 저항성 메커니즘이 (람다-사이할로트린의 경우 미토콘드리아 기능 및 산화 스트레스 대응, 페트린의 경우 표피 강화 및 대사 해독) 상이하게 작동함을 규명함으로써 벡터 방제 전략 수립 시 농약 유형과 농도 고려의 중요성을 강조합니다.
이 논문은 대규모 데이터 업로드 없이 로컬에서 실행되는 모델 컨텍스트 프로토콜 (MCP) 서버를 통해 자연어 기반의 공간 전사체 분석을 가능하게 하여 접근성과 재현성을 높이고 생물학적 발견을 가속화하는 새로운 프레임워크인 stMCP 를 제안합니다.
이 논문은 메타리보솜 프로파일링 (metaRibo-Seq) 데이터의 비특이적 매핑 문제를 해결하고 미생물 군집의 게놈, 전사, 번역 수준에서 통합된 분류학적 및 기능적 통찰력을 추출하기 위해 매칭된 메타게놈 데이터의 커버리지 범위를 활용한 새로운 다중 오믹스 처리 파이프라인 (MOPP) 을 제안하고 그 유효성을 검증한 연구입니다.
이 연구는 난소암의 악성 진행 과정에서 유전자 발현 수준에서는 포착되지 않는 전사체 다양성과 대체 RNA 처리 메커니즘을 규명하기 위해 긴 읽기 시퀀싱을 활용하여 포괄적인 아이소폼 지도를 구축하고, KRAS, TMEM201, FNDC3B 등 임상적 중요성을 가진 특정 아이소폼 변화를 발견했습니다.
이 논문은 기존 방법들의 높은 오탐지율을 해결하고 임상적으로 실용적인 짧은 유전자 목록을 제공하기 위해, 지역 및 전역 그래프 어텐션을 통합한 엔드투엔드 모델 'DisGeneFormer'를 제안하여 질병 관련 유전자 우선순위 선정의 정밀도를 획기적으로 향상시켰음을 보여줍니다.
ProteinMCP 는 38 개의 전문 도구를 통합하고 기존 소프트웨어를 자동으로 MCP 호환 서버로 변환하는 에이전트 AI 프레임워크를 통해 단백질 엔지니어링 워크플로우를 자동화하여 효율성을 극대화하고 기술적 장벽을 해소함으로써 보다 넓은 과학 공동체가 고급 단백질 설계를 활용할 수 있도록 합니다.
이 연구는 오프타겟 결합을 탐지하는 새로운 소프트웨어 도구인 'OPT'를 개발하여 10x Genomics Xenium 기술의 프로브 특이성 문제를 규명하고, 이를 통해 공간 전사체 데이터의 정확성과 생물학적 해석 가능성을 향상시켰음을 보여줍니다.