ARCH3D: A foundation model for global genome architecture
本論文は、DNA・RNA・タンパク質に次ぐ重要な要素であるゲノム構造を包括的に理解し、仮想ゲノムの構築に向けた基盤となる新たな基盤モデル「ARCH3D」を、ゲノム全体の接触プロファイルを活用したマスクされたロイスモデルタスクによって提案するものである。
769 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、DNA・RNA・タンパク質に次ぐ重要な要素であるゲノム構造を包括的に理解し、仮想ゲノムの構築に向けた基盤となる新たな基盤モデル「ARCH3D」を、ゲノム全体の接触プロファイルを活用したマスクされたロイスモデルタスクによって提案するものである。
本研究は、大規模な転写データで事前学習された RNA ファウンデーションモデルを用いることで、従来の手法よりも高い汎用性で子宮内膜症を分類し、かつ安定した遺伝子レベルの解釈を可能にする新しいパイプラインを開発したことを報告しています。
本論文は、系統情報を組み込んだベイズ推定フレームワーク「PhyMapNet」を開発し、ハイパーパラメータの調整なしに信頼性の高い微生物ネットワークを構築できることを示したものである。
造血幹細胞の早期分化を捉えた大規模な縦断的多オミックスデータセットを用いた国際コンペティションを通じて、最先端の予測モデルが生物学的に意味のある遺伝子制御パターンを学習できることを実証し、その成功要因を明らかにすることで、将来の手法開発の指針を提供しました。
本研究は、空間トランスクリプトミクスデータを連続的な遺伝子発現場として解析する新しい数学的枠組み「STRATA」を開発し、正常なヒト皮膚における調節ネットワークの複雑な空間的構造を定量化するとともに、メラノーマではこの構造が均質化されることを明らかにしました。
単細胞データの潜在的な幾何学的構造を学習・評価・診断するための統一的なフレームワーク「TopoMetry」を提案し、標準的な手法よりも信頼性の高い幾何学的保存と生物学的シグナルの発見を実現するとともに、単一のコード行で包括的なレポートを生成可能にするアクセスのしやすさを備えている。
本論文は、メタプロテオミクス解析において、機械学習駆動型の再スコアリングツール「MS2Rescore」を用いることで、ペプチド同定感度と特異性を大幅に向上させ、下流の分類学的注釈の信頼性を高めることを実証したものである。
この論文は、ゲノムグラフへのシーケンスアライメントとネットワークフロー定式化を用いて、従来のリニア参照配列に基づく手法や単純なグラフノード推定よりも精度を大幅に向上させたコピー数バリエーション(CN)推定ツール「Floco」を提案し、その有効性を複数のデータセットで実証したものである。
本論文は、モデル生物から系統発生的に遠い生物まで、ミトコンドリア標的配列予測のみに依存せず、相同性検索や系統解析などの多様な証拠を統合的に評価する新パイプライン「CoMR」を開発し、その高い精度と汎用性を示したものである。
この論文は、ノイズや外れ値に強いベータ発散に基づくオートエンコーダ「RSTG」を提案し、限られた空間トランスクリプトミクスデータから高品質な合成データを生成して細胞位置の回復やノイズ耐性を向上させる手法を報告しています。