VarDCL: A Multimodal PLM-Enhanced Framework for Missense Variant Effect Prediction via Self-distilled Contrastive Learning
本研究は、多モーダルなタンパク質言語モデルの埋め込みと自己蒸留対照学習を統合した「VarDCL」という手法を提案し、変異前後の配列・構造情報を動的に捉えることで、既存の 21 手法を上回る精度でミスセンス変異の有害性を予測できることを示しています。
1244 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本研究は、多モーダルなタンパク質言語モデルの埋め込みと自己蒸留対照学習を統合した「VarDCL」という手法を提案し、変異前後の配列・構造情報を動的に捉えることで、既存の 21 手法を上回る精度でミスセンス変異の有害性を予測できることを示しています。
本論文は、タンパク質配列情報とタンパク質相互作用ネットワークの位相的構造を統合したマルチモーダルフレームワーク「RIBEX」を提案し、従来の手法よりも高い精度で標準的な RNA 結合ドメインを持たない領域や本質的に無秩序な領域を含む RNA 結合タンパク質の予測と解釈を可能にすることを示しています。
この論文は、増殖率の連続的な表現型変異を考慮した数理モデルを用いて、腫瘍の成長と治療がどのように増殖率の分布を変化させ、治療抵抗性の進化を駆動するかを解明し、耐性を予測・制御するための進化論的枠組みを提示しています。
本研究では、タンパク質言語モデルと化学特徴を組み合わせた深層学習フレームワーク「Glydentify」を開発し、糖転移酵素のドナー基質を高精度かつ説明可能に予測するとともに、植物由来の未解析酵素に対する予測を実験的に検証しました。
本論文は、複数の GWAS 結果を時間、形質、または条件の軸で統合し、従来の 2D マンハッタンプロットでは困難だった多次元比較を可能にする、ブラウザ上で動作するインタラクティブな 3D 可視化ツール「3D-Manhattan」を提案しています。
本論文は、遺伝子発現の実行のみから細胞の挙動を創発させる「Formal Cell」抽象化に基づく計算ランタイム「BioOS」を提案し、シロイヌナズナの根の発生や開花、光合成など多様な植物現象をハードコードなしで高精度にシミュレーションする新たなアプローチを示しています。
本論文は、機械学習と量子化学を統合した計算手法を用いて、植物病原菌Ralstonia solanacearumの病原性タンパク質を標的とする新規抗菌剤「Solres」を合理的に設計・検証し、抗菌剤耐性問題への解決策を提示したものである。
本研究は、リガンドフォージ(LigandForge)と呼ばれる離散拡散モデルを開発し、従来の構造予測や反復最適化を不要とする単一パス推論により、1 秒あたり 1,000 以上のペプチド配列を生成し、150 種類の受容体ターゲットに対して高親和性結合子を見出すことを可能にしたことを報告しています。
本論文は、従来のマスク言語モデルの欠点を克服し、ELECTRA 方式の置換トークン検出(RTD)を用いて全位置で密な教師信号を得ることで、RNA の構造や機能、相互作用など多様な調節予測タスクにおいて既存モデルを上回る汎用性と解釈可能性を備えた新しい RNA ファウンデーションモデル「RNAElectra」を提案するものである。
NYX は、FASTA や FASTQ などのオミクスデータ形式の構造を考慮した軽量な前処理と OpenZL フレームワークを組み合わせることで、既存の形式固有の圧縮ツールよりも高速かつ高圧縮率を実現する新しい学習ベースの圧縮システムである。