Co-designing sequence and structure of functional de novo enzymes with EnzyGen2
本論文は、リガンド誘導型の機能ターゲットに基づいてタンパク質の配列と構造を同時に設計する大規模基盤モデル「EnzyGen2」を提案し、その計算機ベンチマークでの卓越した性能と、天然酵素に匹敵する新規酵素の実験的創製成功を報告しています。
768 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、リガンド誘導型の機能ターゲットに基づいてタンパク質の配列と構造を同時に設計する大規模基盤モデル「EnzyGen2」を提案し、その計算機ベンチマークでの卓越した性能と、天然酵素に匹敵する新規酵素の実験的創製成功を報告しています。
この論文は、eCLIP データを用いた RNA 結合タンパク質の結合変化を、発現量の変化と技術的変動を適切に区別・補正しながら統計的に厳密に解析するための新フレームワーク「Flipper」を提案し、既存手法よりも優れた感度と精度を有することを示しています。
本研究では、WikiPathways や KEGG のパスウェイデータをグラフ構造に変換して負のフィードバックループなどの制御特性を計算機解析する R パッケージ「WayFindR」を開発し、既存のデータベースにおいて負のフィードバックが体系的に欠落している現状を明らかにするとともに、動的なシステムレベルの洞察を得るためのデータキュレーションの改善を提言しています。
この論文は、VAE、Neural ODE、Momentum Contrast を統合し、フローマッチングによる後処理を加えることで、単細胞 RNA 配列データから細胞の連続的な分化軌道と離散的な細胞種アイデンティティを同時に高精度に捉える新しいフレームワーク「MoCoO」を提案し、20 のデータセットを用いた包括的なベンチマークでその有効性を実証したものである。
この論文は、単細胞 RNA シーケンシングデータにおける患者層別化が主に細胞構成比の差異によって駆動されることを示し、中心対数比変換を用いた細胞構成比に基づくアプローチが複雑な手法よりも効率的かつ頑健に性能を発揮することを明らかにし、scECODA という解析パッケージを提案しています。
本論文は、タンパク質言語モデルに基づくデコイ生成法を従来の手法と比較評価し、現状では逆転デコイを完全に代替するものではないが、ベンチマークや診断、将来の適応的最適化に向けた調整可能なツールとして価値があることを示しています。
本論文は、複数のメタボロミクスリポジトリから MassQL 診断フラグメントイオンフィルタリングを用いてアシルカルニチンの MS/MS スペクトルを体系的に抽出・解析し、34,222 件のユニークなスペクトルと 2,857 種類の原子組成を含む大規模なライブラリを構築することで、未知のカルニチン類の同定や宿主代謝・食事・微生物活性などとの関連性の解明を可能にしたことを報告しています。
本論文は、timsTOF の DIA データから直接学習する深層学習モデルを用いて、イオン移動度を含む高精度な実験固有のインシリコスペクトラルライブラリを生成する新ツール「Carafe2」を開発し、既存の DDA 学習モデルや実測ライブラリを上回る性能を実証したものである。
本論文は、大規模メタゲノムデータにおける微生物相互作用ネットワーク推論の計算ボトルネックを解消し、R 実装と 99.9% 以上の一致を保ちながら 64 コア環境で 26.1 倍の高速化を実現する並列化 Python パイプライン「Parallel-REM」を提案するものである。
本論文は、配列決定エラーの修正に特化した高速かつ汎用的なバーコードシーケンスマッパー「BCAR」を開発し、既存手法を上回る高精度なバーコードシーケンスマッピングを実現したことを報告しています。