METRIN-KG: A knowledge graph integrating plant metabolites, traits, and biotic interactions
이 논문은 식물 대사체, 형질, 생물적 상호작용 데이터를 통합하여 생명과학 연구 질문을 촉진하는 지식 그래프 METRIN-KG 를 제안하고 그 활용 사례를 제시합니다.
1235 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
이 논문은 식물 대사체, 형질, 생물적 상호작용 데이터를 통합하여 생명과학 연구 질문을 촉진하는 지식 그래프 METRIN-KG 를 제안하고 그 활용 사례를 제시합니다.
이 논문은 다양한 종, 배율 및 장비 플랫폼에서 투과전자현미경 (TEM) 이미지를 기반으로 신장 초미세 구조를 자동으로 분할하고 정량화하여 전문가 수준의 정확도를 유지하면서도 수동 분석의 부담을 획기적으로 줄여주는 딥러닝 프레임워크 'TEAMKidney'를 제안합니다.
이 논문은 단백질과 소분자 사이의 계산적 공백을 해소하기 위해 1 억 개 이상의 분자로 학습된 'PeptideCLM-2'라는 화학 언어 모델 시리즈를 제안하여 치료용 펩타이드의 특성을 더 정확하게 예측하고 개발 과정을 간소화함을 보여줍니다.
이 논문은 새로운 암 표적에 대해 실험적 구조나 기존 항체 정보 없이도, 핫스팟 추천 및 후보 선정 에이전트를 활용한 계산 워크플로우를 통해 나노몰~서브나노몰 수준의 결합 친화도를 가진 나노바디를 성공적으로 설계하고 실험적으로 검증했음을 보여줍니다.
이 연구는 불확실성 인식 벤치마킹과 확장된 특성 프로파일링을 통해 mRNA 와 lncRNA 분류의 모호성을 규명하고, 분류기 간 불일치 패턴과 반복 서열 기반 특성의 중요성을 제시함으로써 보다 견고한 코딩/비코딩 분류기 개발을 위한 실용적인 지침을 마련했습니다.
이 논문은 단백질체 및 대사체 데이터를 통합하여 개체별 대사 네트워크를 재구성하고, 실험적 증거를 기반으로 한 '오라클 인 더 루프' 추론 방식을 통해 조건별 대사 활동을 해석하고 가설과 확인된 사실을 명확히 구분하는 AI 시스템 'PathwaySeeker'를 제시합니다.
이 논문은 인간 세포 지도 (Human Cell Atlas) 의 대규모 단일 세포 데이터를 품질 관리, 주석 확장, 정규화 및 분석 레이어를 통해 분석 준비가 된 형태로 변환하고, 이를 통해 연구 간 통합 분석을 가능하게 하는 포괄적인 도구이자 자원인 'cellNexus'를 소개합니다.
이 논문은 TCR-pMHC 결합 실험 검증의 높은 비용과 시간을 줄이기 위해 불확실성과 다양성을 결합한 'UDAL'이라는 능동 학습 전략을 제안하여, 제한된 실험 예산으로도 무작위 샘플링보다 효율적으로 예측 모델의 성능을 극대화할 수 있음을 입증했습니다.
이 논문은 편향된 데이터로 인한 HLA 대립유전자 및 코호트 간 불평등을 해결하기 위해 그룹 분산 강건 최적화 (GDRO) 프레임워크인 'FairTCR'을 제안하여, 평균 성능을 유지하면서도 소수 그룹의 예측 정확도를 크게 향상시킨다고 설명합니다.
이 논문은 BLAST 기반의 기존 방법론이 가진 한계를 극복하고, 프로파일 숨은 마르코프 모델 (HMM) 과 재귀적 확장 전략을 활용하여 분해되고 단편화된 반복 요소 모델을 고감도로 자동 복원하고 개선하는 새로운 도구인 'Recursive Repeat Extender (RRE)'를 제안합니다.