Improving AlphaFold3 by Engineering MSA and Template Inputs
本論文は、多様化および工夫された配列アライメント(MSA)とテンプレート入力を活用することで、タンパク質単量体、複合体、およびタンパク質 - リガンド複合体の構造予測精度を AlphaFold3 のデフォルト設定や AlphaFold2 に対して大幅に向上させる手法を体系的に検証し、その有効性を実証したものである。
1235 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、多様化および工夫された配列アライメント(MSA)とテンプレート入力を活用することで、タンパク質単量体、複合体、およびタンパク質 - リガンド複合体の構造予測精度を AlphaFold3 のデフォルト設定や AlphaFold2 に対して大幅に向上させる手法を体系的に検証し、その有効性を実証したものである。
本論文は、AlphaFold 3 が配列そのものよりも進化的文脈(特に多様なホモログ)に依存して構造を予測しており、その内部表現において共進化情報が圧縮され、構造的制約の位置を特定して構造事前知識を活性化させる極めて敏感なフォールド認識アルゴリズムとして機能していることを初めて体系的に解明したものである。
この論文は、異なる実験条件やプラットフォーム間での絶対値の比較が困難なプロテオミクスデータに対し、変化の方向性(アップ/ダウンレギュレーション)の一致度をネットワーク解析に活用することで、生物学的に意味のある統合分析を可能にする新しいフレームワークを提案し、抗がん剤ドキソルビシン処理と乳がんの進行段階との関連性を明らかにしたことを報告しています。
本研究は、19 のデータセットで既存手法を上回る性能を示し、最大 5 つのオミクスモダリティと 100 万を超える空間位置を処理可能な、不確実性を考慮したスケーラブルかつ汎用的な深層学習フレームワーク「SCIGMA」を提案し、空間マルチオミクスデータの統合における課題を解決するものである。
CHORD は、遺伝子、細胞、細胞種の表現を同時に学習するクロススペシエス統合フレームワークであり、異なる種間の細胞種階層の保存と分化、連続的な表現型変異の比較、および機能的な遺伝子関係の解明を可能にします。
本論文は、構造情報に基づく拡散モデル、エントロピーに基づく選択性スコアリング、細胞表現型検証、および大規模臨床データ(EHR)を統合した「LinkD」という多スケール・エージェント駆動型プラットフォームを開発し、分子から臨床レベルまでの証拠に基づいて体系的な創薬リポジショニングを可能にしたことを報告しています。
BioEngine は、ファウンデーションモデルやキュレーションされたリポジトリを生物学者がブラウザ上で AI エージェントに指示を与えるだけで、あらゆるハードウェア環境で実行・適応・拡張可能にするスケーラブルな実行および適応レイヤーです。
本論文は、ProtTrans のシーケンス埋め込みとプロトタイプ認識対照学習を統合した軽量パイプライン「PEACE」を提案し、EffectorP 3.0 を上回る精度で病原性菌類およびオオミシダのエフェクタータンパク質を高精度に同定できることを示しています。
本論文は、分子とタンパク質の 3 次元構造情報をグラフアテンションと階層的トランスフォーマーを組み合わせて統合的にモデル化する「GTStrDTI」という新規手法を提案し、既存の最先端手法を上回る薬物 - タータン結合親和性の予測精度を達成したことを報告しています。
本論文は、複数のペプチド特性を評価する自動化されたポリシー探索エージェントが、従来の重み付き和スコアや NSGA-II などの手法よりも優れた候補選定順位付けを実現し、湿式実験前の候補絞り込みを効率化する手法を提案したことを報告しています。