How Not to be Seen: Predicting Unseen Enzyme Functions using Contrastive Learning
この論文は、トレーニングデータに存在しない酵素機能の予測を可能にする対照学習アルゴリズム「EnzPlacer」を提案し、未知の酵素配列を既知の機能空間内でより正確に位置づけることで、実験的な機能解析に向けた仮説立案を支援する手法を開発したことを報告しています。
769 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
この論文は、トレーニングデータに存在しない酵素機能の予測を可能にする対照学習アルゴリズム「EnzPlacer」を提案し、未知の酵素配列を既知の機能空間内でより正確に位置づけることで、実験的な機能解析に向けた仮説立案を支援する手法を開発したことを報告しています。
BioGraphX-RNA は、RNA の一次配列を物理化学的相互作用に基づくマルチスケールグラフに変換し、凍結された RiNALMo 埋め込みと統合することで、高い解釈性と汎用性を備えながら、mRNA、miRNA、lncRNA の細胞内局在予測において最先端の性能を達成する新しいフレームワークです。
本論文は、低信号対雑音比環境下でも従来の相関最大化法を上回る精度で分子の向きを推定するベイズ的アプローチ(特に最小平均二乗誤差推定量)を提案し、これが Cryo-EM における 3 次元構造再構成の精度向上と構造的異質性解析の飛躍的改善に寄与することを示しています。
本論文は、ドロップレットベースの単一細胞 RNA シーケンシングデータにおけるバーコード誤り訂正、リードから遺伝子へのマッピング、UMI 解決を統合し、既存手法よりも高速かつ高精度な遺伝子発現定量を実現する新たなアルゴリズム「O_SCPLOWARCANEC_SCPLOW」を提案するものである。
この論文は、クロス・エンベディング・アテンションを介して解釈可能な生物物理学的事前知識を埋め込みモデルに注入する汎用フレームワーク「ProtBFF」を提案し、これにより既存の専門モデルや大規模モデルを上回る精度でタンパク質の安定性変化(ΔΔG)を予測可能にすることを示しています。
本研究は、12 種 8 種類の質量分析計から得られた 1,800 万枚以上のスペクトルを含む包括的なトップダウン質量分析スペクトルリポジトリ「TopRepo」を構築し、タンパク質プロteoform の網羅的解析や深層学習モデルを用いた高精度なスペクトル予測を可能にしたことを報告しています。
この論文は、単一細胞ゲノミクスデータを統合して構築した新しい知識グラフ「scPrimeKG」およびその上で学習されたモデル「CellAwareGNN」を提案し、既存のモデルと比較して自己免疫疾患を含む全疾患に対する薬剤適応症予測の精度と生物学的解釈性を大幅に向上させたことを示しています。
メタトランスクリプトミクスデータにおける複雑な細菌群集の解析向けに、配列リードを単一パスで分類群と発現遺伝子の両方に高精度に割り当てるナノチドアラインメントベースのフレームワーク「MetaTracer」が開発され、シミュレーションおよび実データ(歯垢)を用いた検証でその有効性が示されました。
本論文は、低線量放射線被曝下での時間的変化を捉えるために、RNA シーケンシングデータと細胞ペインティング画像から得られた核形態特徴を結びつける解釈可能な逆モデルを開発し、放射線被曝による核形態の変化に関連する安定した転写産物予測因子を同定する手法を提案しています。
Cellects は、標準的な顕微鏡画像や時系列データから真菌や単細胞生物など多様な生物システムの成長、運動、形態を自動的に定量化し、結果を CSV 形式で出力するオープンソースのユーザーフレンドリーなソフトウェアです。