MAJEC: unified gene, isoform, and locus-level transposable element quantification from RNA-seq
MAJEC 은 RNA-seq 데이터에서 유전자, 아이소폼 및 전이성 요소 (TE) 로커스 수준을 통합적으로 정량화하여 기존 도구들이 겪던 유전자와 TE 간의 중첩으로 인한 오분류 문제를 해결하고 정확도와 속도를 동시에 개선한 새로운 프레임워크입니다.
1235 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
MAJEC 은 RNA-seq 데이터에서 유전자, 아이소폼 및 전이성 요소 (TE) 로커스 수준을 통합적으로 정량화하여 기존 도구들이 겪던 유전자와 TE 간의 중첩으로 인한 오분류 문제를 해결하고 정확도와 속도를 동시에 개선한 새로운 프레임워크입니다.
이 논문은 인간 프로테옴의 단백질 접촉 네트워크를 그래프 머신러닝 기법 (전통적 커널 방법 및 그래프 신경망) 으로 분석하여 효소 활성 및 효소 분류 예측을 수행한 대규모 연구로, 이진 분류에는 커널 방법이, 다중 클래스 분류에는 그래프 신경망이 각각 우수한 성능을 보였음을 입증했습니다.
이 논문은 HUGO 유전자 명명 위원회 (HGNC) 의 구조화된 생물학적 지식을 유전자 유사성 공간에 통합하는 계층 인식 플랫폼을 개발하여 아세타미노펜 유도 간독성 데이터 분석 시 기능적 일관성을 33.8 배 향상시키고, 기존 발현 기반 접근법보다 해석 가능하고 생물학적으로 일관된 독성 모듈을 식별할 수 있음을 입증했습니다.
이 논문은 다양한 단일 세포 약물 반응 예측 모델의 성능을 체계적으로 벤치마킹하여, 현재 모델들이 세포주에서는 잘 작동하지만 조직 샘플에서는 성능이 떨어지고 특히 치료 전 내성 상태를 예측하는 데 근본적인 한계가 있음을 규명함으로써 차세대 임상 관련성 높은 모델 개발의 필요성을 강조합니다.
이 논문은 배치 수준의 레이블을 세포 수준의 교란 효과로 정제하는 HiDDEN 방법론을 Python 및 R 패키지로 구현하고, 다양한 모델링 선택이 성능에 미치는 영향을 분석하여 견고한 세포 수준 교란 분석을 위한 유연한 프레임워크를 제시합니다.
이 논문은 시뮬레이션 기반 베이지안 추론과 심층 학습을 결합하여 단일 세포 시퀀싱 데이터의 복제수 변이 (CNA) 프로파일로부터 종양 내 적응도 지형을 재구성하고 선택 계수를 추정하는 새로운 프레임워크를 제시합니다.
이 논문은 그룹 채팅에서 자연어 요청을 Docker 컨테이너 내에서 실행 가능한 도구 기반 분석으로 변환하여 생명과학 연구의 협업 워크플로우를 혁신하는 'BioClaw'라는 인간 - 봇 협업 생태계를 제안합니다.
이 논문은 AI 코딩 에이전트와 멀티모달 생물학 기초 모델을 결합하여 인간 개입을 최소화하면서 세포 반응 모델을 자동 생성하고 최적화함으로써, 기존 수개월 걸리던 개발 기간을 며칠로 단축하고 전문가 설계보다 우수한 성능을 보이는 '가상 세포' 구축을 위한 자율 AI 시스템인 VCHarness 를 제시합니다.
본 논문은 전사체 유전자 서명의 변이가 배경 발현 구조와 얼마나 직교하는지를 정량화하기 위해 잔차 비율 궤적과 무작위 베이스라인 대비 차이 크기를 주요 지표로 삼는 새로운 감사 프레임워크를 제안하며, 이는 단일 수치 해석의 한계를 극복하고 서명의 기하학적 특성을 보다 정교하게 평가할 수 있게 합니다.
GraphMana 는 파편화된 파일 기반 워크플로우의 한계를 극복하고 샘플 추가 시 재처리가 불필요하며 계보 추적이 가능한 그래프 기반 데이터 관리 시스템을 제안하여, 1000 게놈 프로젝트와 같은 대규모 집단 유전체 분석의 효율성을 획기적으로 향상시켰습니다.