tensorOmics: Data integration for longitudinal omics data using tensor factorisation
tensorOmics는 시계열적 특성과 다중 오믹스 데이터를 동시에 보존하면서, 지도 및 비지도 학습 방식을 통해 생물학적 층위 간의 통합적인 분자 반응을 분석할 수 있는 텐서 분해 기반의 통합 프레임워크입니다.
1260 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
tensorOmics는 시계열적 특성과 다중 오믹스 데이터를 동시에 보존하면서, 지도 및 비지도 학습 방식을 통해 생물학적 층위 간의 통합적인 분자 반응을 분석할 수 있는 텐서 분해 기반의 통합 프레임워크입니다.
SpaDecoder는 적응형 3D 이웃 가우시안 커널을 통해 조직의 3차원 구조와 단일 세포 참조 데이터를 효과적으로 활용함으로써, 여러 시공간적 공간 전사체(ST) 슬라이스에서 세포 유형 비율을 정밀하게 분해(deconvolution)하는 병렬 행렬 분해 기반의 방법론입니다.
이 논문은 CLIP-L 데이터와 하이브리드 어텐션 트랜스포머를 활용하여 이소미르(isomiR)의 변이를 고려한 설명 가능한 마이크로RNA(miRNA) 표적 예측 모델인 'miRXplain'을 개발하였으며, 기존 모델보다 적은 파라미터로도 높은 성능을 보이면서 이소미르의 표적 선택 원리를 규명했습니다.
이 논문은 기존 상분리 단백질(PSP) 예측 모델들이 분류군(taxa)과 무질서도(disorder)의 불균형으로 인해 성능이 왜곡되는 문제를 지적하며, 이를 해결하기 위해 분류군과 무질서도를 고려한 새로운 벤치마크 프레임워크를 제안하고 모델들의 실제 성능을 정밀하게 평가했습니다.
이 논문은 단백질 언어 모델(PLM)과 생물물리학적 파라미터를 활용하여 항체의 비특이적 결합(non-specificity)을 예측하는 두 가지 상호 보완적인 접근법을 제시하며, 특히 중쇄 가변 영역과 등전점(isoelectric point)이 비특이성 예측의 핵심 요소임을 밝혀냈습니다.
이 논문은 흡연이 장내 미생물 불균형과 대사 변화를 유도하고, 특히 CPT2와 같은 종양 억제 유전자의 발현을 억제함으로써 대장암 발생을 촉진한다는 것을 밝혀냈습니다.
이 논문은 희귀 질환 진단의 정확도를 높이기 위해 네트워크 기반 알고리즘과 전역적 분석을 활용하여 기존 유전자-질환 지식의 편향을 보완하고, 새로운 유전자-질환 연관성을 예측하는 정교한 점수 체계를 제안합니다.
PlantMDCS는 프로그래밍 기술 없이도 식물 멀티오믹스 데이터를 효율적으로 관리, 통합 및 분석할 수 있도록 설계된, 보안성이 뛰어나고 사용이 간편한 로컬 배포형 모듈식 데이터베이스 구축 시스템입니다.
이 논문은 단백질 구조 내의 특정 잔기(residue)들이 구조적 안정성에는 불리하더라도 진화적으로 보존된 '좌절(frustration)' 상태를 유지한다는 점을 발견하고, 이러한 지점들이 물리적 제약으로 인해 발생하는 '스팬드럴(spandrel)'처럼 작용하여 이후 기능적 목적으로 전용될 수 있음을 제시합니다.
이 연구는 LC-HRMS와 R 기반의 데이터 분석 워크플로우를 활용하여 해면동물 홀로바이온트(holobiont) 내 미생물 군집으로부터 배양 없이도 다양한 시데로포어(siderophore)를 성공적으로 식별하고 분석하는 전략을 제시합니다.