FM-GPT: Bayesian fine mapping for phenome-wide transcriptome-wide association studies
大規模な表現型ワイド関連解析(TWAS)において、複数の相関する形質や混合した結果変数から因果遺伝子を特定し、偽陽性を抑制して生物学的メカニズムを解明する新しいベイズ法「FM-GPT」を開発し、UK バイオバンクデータを用いた脳画像および臨床表現型の解析でその有効性を実証しました。
1235 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
大規模な表現型ワイド関連解析(TWAS)において、複数の相関する形質や混合した結果変数から因果遺伝子を特定し、偽陽性を抑制して生物学的メカニズムを解明する新しいベイズ法「FM-GPT」を開発し、UK バイオバンクデータを用いた脳画像および臨床表現型の解析でその有効性を実証しました。
本論文は、10 種類のマウス臓器の 23 枚の組織切片を対象に、Stereo-seq プラットフォームを用いて高解像度の空間トランスクリプトームデータと組織画像を統合的に作成し、細胞タイプ注釈や解像度の比較検証を含む標準化されたリソースを提示したものである。
この論文は、転写とエピジェネティックな調節層の相対的な寄与を遺伝子および細胞文脈ごとに体系的に評価し、遺伝子発現の予測精度を比較する新しい計算フレームワーク「scMultiPreDICT」を提案するものである。
気候変動や病害などの生産脅威に対処するため、カナダの草原地帯における 10 種類の作物の 470 万件以上の収量データを用いて、遺伝・環境・管理の相互作用を考慮した初の大型収量予測モデル「LYM-1」を開発し、収量最適化や品種設計への応用可能性を示しました。
本研究は、家庭で採取された乾燥血液斑(DBS)からの未標的メタボロミクス解析を用いて、1,257 名の参加者からなる大規模コホートにおいて、バッチ漏れを厳密に防止した検証により個人識別の精度が 94% に達することを示し、デジタルツイン構築に向けた実用的な手法を確立した。
臨床環境における高カバレッジの腫瘍単独アンプリコンシーケンシングデータに対して、6 種類のソマティック変異検出ツールを Snakemake パイプラインに統合して評価した結果、FreeBayes、VarScan、MuTect2、Pisces の 4 種が HD789 標準試料において最も優れた性能を示したが、FreeBayes は変異数を多く検出する一方でアーティファクトも多発したことが明らかになりました。
この論文は、mRNA ワクチンの開発で重要な役割を果たす 1-メチル-プソイドウリジンを含む RNA の折りたたみ安定性を推定するための新しい nearest neighbor パラメータを開発し、208 件の光学溶融実験に基づいて RNAstructure ソフトウェアに実装したことを報告しています。
本論文は、AlphaFold データベースから収集した 3700 万の内在性無秩序領域配列で学習された言語モデル「IDiom」を紹介し、構造的な文脈に条件付けられた配列生成や強化学習による細胞内局在の制御を通じて、従来設計が困難だった内在性無秩序タンパク質領域の創出を可能にしたことを示しています。
この論文は、拡散 MRI から得られた脳結合性グラフを入力とし、ノードとエッジに焦点を当てた並列 GCN と接続性注意ブロックを特徴とする深層学習モデルを提案し、PREVENT-AD および OASIS3 データセットを用いた実験で、既存の手法を上回る年齢や認知機能(MMSE)の予測性能を実証したものである。
この論文は、動画拡散モデルの適応的キャッシング手法を流体力学マッチングに基づくタンパク質構造予測モデルに適用し、品質を維持したまま推論速度を最大 14 倍に加速するオープンソース手法「SimpleFold-Turbo」を提案しています。