CROWN: Curated Repository Of Well-resolved Noncovalent interactions
本論文は、既存のタンパク質 - リガンド複合体データベースの品質と多様性のトレードオフを解決し、自動前処理パイプラインと拘束エネルギー最小化を導入することで、機械学習向けに高品質かつ多様な非共有結合相互作用データセット「CROWN」を構築したことを報告しています。
1238 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、既存のタンパク質 - リガンド複合体データベースの品質と多様性のトレードオフを解決し、自動前処理パイプラインと拘束エネルギー最小化を導入することで、機械学習向けに高品質かつ多様な非共有結合相互作用データセット「CROWN」を構築したことを報告しています。
本論文は、8 種のモデル生物における遺伝子識別子の統一変換、相同遺伝子マッピング、および経路注釈を可能にする包括的な R パッケージ「geneslator」を開発し、既存ツールが抱える不整合や断片化の問題を解決し、データ解釈性と再現性を向上させることを報告しています。
本論文は、分子動力学シミュレーションなどの計算手法を用いて、結腸癌の標的であるグアニル酸シクラーゼ C を認識する scFv におけるリンカー設計が、その構造安定性や抗原結合能に与える影響を解析し、合理的な抗体断片最適化の枠組みを確立したものである。
T-Rex は、プログラミング知識を必要とせず、臨床現場で全エクソームシーケンシング(WES)トリオデータの標準化された解析を可能にするデスクトップアプリケーションであり、高い精度と感度で稀な生殖系列変異の同定を支援します。
本論文は、分散化と品質のばらつきという課題を抱えるオープンソースの科学 AI エージェント生態系「OpenClaw」を体系化し、91 のプロジェクトと 2,230 のスキルを含む初のキュレーションデータセットを構築するとともに、これを基盤とした統合プラットフォーム「Claw4Science」を公開し、科学 AI エージェントの標準化と将来のベンチマーク開発の基盤を提供することを提案しています。
STAPLE は、空間トランスクリプトミクス解析における複数のツールの断絶を解消し、単一コマンドによる自動化と AI 駆動の生物学的洞察レポート生成を実現するモジュール型フレームワークである。
本研究は、遺伝子発現、経時的な検査値、治療履歴を統合する動的なマルチモーダル深層学習フレームワークを開発し、多発性骨髄腫患者の予後を診断時だけでなく治療経過中も高精度に予測可能にしたことを報告しています。
この論文は、ゲノム予測におけるデータ汚染の問題に対処するため、ランダムフォレストの頑健性を高めるための前処理やアルゴリズム改良などの戦略を評価し、特にデータ変換や順位に基づく手法が汚染データ下での予測精度向上に有効であることを示しています。
本論文では、タンパク質の配列情報と構造情報を統合した深層学習モデル「SSPSPredictor」を開発し、相分離タンパク質の高精度な予測、駆動領域の解釈、および疾患関連変異との相関解析を可能にしたことを報告しています。
BulkMonSTR は、機械学習と STR 固有のエラーモデリングを組み合わせることで、バルクシーケンシングデータから高精度にモザイク変異を検出する計算フレームワークであり、老化や疾患への寄与を解明するための基盤を提供する。