Discovery of TDP-43 aggregation inhibitors via a hybrid machine learning framework
이 연구는 그래프 신경망과 전통적 화학 기술자를 결합한 하이브리드 머신러닝 프레임워크를 개발하여 TDP-43 응집 억제제인 베르루브린과 PE859 를 발굴하고, 분자 도킹 및 실험적 검증을 통해 신경퇴행성 질환 치료 후보물질로서의 가능성을 입증했습니다.
1260 편의 논문
생물학 데이터의 거대한 바다를 해석하는 열쇠가 바로 생물정보학입니다. 이 분야는 방대한 유전체 정보를 컴퓨터 과학과 통계학으로 연결하여 생명 현상을 이해하는 새로운 방식을 제시합니다. 복잡한 DNA 서열이나 단백질 구조를 단순히 나열하는 것을 넘어,这些数据가 실제로 어떤 의미를 지니는지 찾아내는 과정이 핵심입니다.
Gist.Science 는 bioRxiv 에 매일 올라오는 최신 생물정보학 프리프린트들을 면밀히 검토합니다. 우리는 전문가가 작성한 기술적 요약을 제공함과 동시에, 비전문가도 쉽게 이해할 수 있는 평이한 설명을 함께 준비하여 연구의 핵심을 명확하게 전달합니다.
아래에는 bioRxiv 에서 선별된 최신 생물정보학 연구 논문들이 나열되어 있습니다.
이 연구는 그래프 신경망과 전통적 화학 기술자를 결합한 하이브리드 머신러닝 프레임워크를 개발하여 TDP-43 응집 억제제인 베르루브린과 PE859 를 발굴하고, 분자 도킹 및 실험적 검증을 통해 신경퇴행성 질환 치료 후보물질로서의 가능성을 입증했습니다.
이 논문은 지연된 보상과 대규모 행동 공간이라는 codon 최적화의 난제를 해결하기 위해, 효율적인 폴딩 피드백과 전문가 시연 기반의 강화 학습 프레임워크인 CodonRL 을 제안하여 기존 최첨단 방법보다 번역 효율, RNA 안정성 및 면역원성 감소 측면에서 우수한 다목적 최적화 성능을 입증했습니다.
이 논문은 화학적으로 변형된 siRNA 의 독성과 오프타겟 효과를 예측하기 위해 다양한 머신러닝 알고리즘을 활용하여 개발된 웹 서버 'TOXsiRNA'를 소개하고, 그 중 단일 뉴클레오타이드 구성 기반의 SVM 모델이 가장 높은 정확도를 보였음을 보고합니다.
본 연구는 Rv0678 변이의 아미노산 서열, 생화학적 및 구조적 특성을 기반으로 머신러닝 모델을 개발하여 결핵균의 베다퀴린 내성 표현형을 높은 정확도로 예측할 수 있음을 입증했습니다.
이 논문은 기계 학습을 활용하여 표적 유전자 침묵을 위한 인공 마이크로 RNA (amiRNA) 의 설계를 최적화하고 실험적으로 검증된 고효율·고특이성 도구를 제공하는 웹 플랫폼 'miRarchitect'를 개발하고 그 유효성을 입증했습니다.
이 논문은 최적의 어핀 갭 (affine-gap) 정렬을 보장하면서도 메모리 효율과 속도를 극대화하여 복잡한 그래프에 긴 시퀀스를 정렬할 수 있는 새로운 알고리즘 'Theseus'를 제안하고, 다중 시퀀스 정렬 및 파angenome 리드 매핑 작업에서 기존 최첨단 방법들보다 월등한 성능을 입증했습니다.
이 논문은 7 가지 암 유형의 276 만 개 세포 데이터를 기반으로 학습된 생성형 사전 훈련 모델인 evoCancerGPT 를 소개하며, 이 모델이 의사시간 (pseudotime) 순서로 배열된 세포 상태 간의 장기 의존성을 학습하여 단일 환자 및 단일 세포 수준에서 암 진행의 미래 유전자 발현 프로필을 제로샷 (zero-shot) 으로 예측하고 기존 방법들보다 우수한 성능을 보임을 입증합니다.
이 논문은 복잡한 데이터 독립형 획득 (DIA) 질량분석 데이터를 분석하기 위해 도메인 특화 모델 대신 제로샷 대형 언어 모델 (LLM) 을 활용한 ChatDIA 워크플로우를 제안하며, 이는 기존 최첨단 소프트웨어와 경쟁력 있는 정확도를 달성하면서도 각 결정에 대한 투명하고 해석 가능한 근거를 제공하는 것을 목표로 합니다.
이 논문은 기존 시뮬레이션이 놓치고 있는 세포 운명의 장기적 의존성을 반영하는 '운명 인식 (fate-aware)' 유전자 발현을 도입한 새로운 단일 세포 계보 시뮬레이션 프레임워크인 LineageSim 을 제안하고, 이를 통해 생성된 데이터가 미래 세포 운명을 예측할 수 있는 잠재적 신호를 포함함을 입증했습니다.
GeneReL은 대규모 언어 모델(LLM) 기반의 정보 추출 기술과 커뮤니티 검증 시스템을 결합하여, 애기장대(Arabidopsis thaliana)의 유전자 조절 네트워크 데이터를 효율적으로 구축하고 제공하는 통합 플랫폼입니다.