Probabilistic coupling of cellular and microenvironmental heterogeneity by masked self-supervised learning
本論文は、マスク自己教師あり学習とトランスフォーマーアーキテクチャを活用した「Mievformer」というフレームワークを提案し、細胞状態と空間的マイクロ環境の確率的な結合を捉えることで、空間オミクスデータにおけるマイクロ環境の表現学習と生物学的発見を可能にすることを示しています。
1235 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、マスク自己教師あり学習とトランスフォーマーアーキテクチャを活用した「Mievformer」というフレームワークを提案し、細胞状態と空間的マイクロ環境の確率的な結合を捉えることで、空間オミクスデータにおけるマイクロ環境の表現学習と生物学的発見を可能にすることを示しています。
Turep は、単一細胞および空間トランスクリプトミクスデータからがん種を超えて腫瘍反応性 T 細胞を高精度に同定し、免疫療法の反応予測や空間的ニッチの解析を可能にする深層学習手法です。
本研究は、1,406 種のアミノ酸使用偏倚(CUB)を「ゲノム方言」として分析し、アミノ酸の物理化学的性質(特に Saier の第二コドン塩基分類)が翻訳の忠実度やタンパク質の安定性という制約下で CUB を決定し、これが系統関係ではなく機能的な「情報アクセント」を形成していることを示しました。
本研究では、確率的サンプリングや既存のサブオプティマル法の問題点を克服し、RNA 二次構造を自由エネルギーの昇順で排他的かつ効率的に列挙する決定論的フレームワーク「反復サンプリング」を開発し、これにより転写中の RNA フォルディングにおける非平衡構造の解析や実験データとの整合性向上を実現したことを報告しています。
本論文は、271 のタンパク質 - ペプチド複合体を用いた体系的なベンチマークを通じて、AlphaFold2 が OpenFold3 よりも全体的に優れた性能を示し、特に信頼性スコアの指標や閾値設定がタンパク質 - タンパク質複合体とは異なる必要があることを明らかにした。
本論文は、グラフニューラルネットワーク(GNN)の解釈可能性を向上させるための視覚化やアテンション機構などの手法、タンパク質言語モデルとの統合、およびハイブリッドアーキテクチャの活用を通じて、創薬におけるタンパク質 - リガンド相互作用の予測精度と生物学的信頼性を高めることを目指す研究を概説しています。
本研究では、経験則に基づく古典的手法とエンドogenous 遺伝子から学習する AI 手法の 2 つのアプローチに基づいて開発されたコードン最適化ツール「OptimWiz 2.1」と「OptimWiz 3.0」が、市販の他のツールを上回るタンパク質発現効率を示し、機械学習を通じてコードン最適化の原理を解明したことを報告しています。
空間トランスクリプトミクスデータに存在するノイズを低減し、生物学的なシグナルを強化する新しい手法「SpaceBender」を開発し、その有効性をシミュレーションや生体内キメラ組織、さらにはサブセルレベルのデータを用いたケーススタディで実証した。
この論文は、大腸癌の空間的組織を解析するためにテンソル分解に基づく類似性ネットワーク枠組みを提案し、実際の腫瘍組織がランダムな配置と比較して空間的制約によって構造化された分子パターンを示すことを実証しています。
本研究は、配列と立体構造の両方を統合的に学習するマルチモーダルフレームワーク「EpiRanha」を開発し、従来の手法では困難だった不連続なエピトープの高精度な類似性検索とオフターゲットリスク評価を実現したことを報告しています。