Genome assembly with variable order de Bruijn graphs
本論文は、可変次数 de Bruijn グラフ(voDBG)におけるコンティグの最初の形式的定義である「(ℓ, h)-tigs」を提案し、効率的な列挙アルゴリズムを開発することで、PacBio HiFi データを用いた実験において固定次数グラフよりも高い連続性を達成しつつ、フルスケールのアセンブラに比べて軽量なアセンブリ手法を実現した。
1244 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、可変次数 de Bruijn グラフ(voDBG)におけるコンティグの最初の形式的定義である「(ℓ, h)-tigs」を提案し、効率的な列挙アルゴリズムを開発することで、PacBio HiFi データを用いた実験において固定次数グラフよりも高い連続性を達成しつつ、フルスケールのアセンブラに比べて軽量なアセンブリ手法を実現した。
本論文は、非リボソームペプチドの生物合成遺伝子クラスターと化学構造を確率的にリンクさせるための高精度なフレームワーク「Nerpa 2」を開発し、既存手法を上回る精度で既知化合物の同定や新規化学物質の発見を可能にしたことを報告しています。
本論文は、タンパク質、小分子、金属イオン、脂質、核酸の 5 つのモダリティにまたがる 200 万を超える複合体データを用いて訓練された幾何学的深層学習モデル「ATOMICA」を提案し、分子間相互作用の普遍的な表現を学習することで、暗黒プロテオームにおけるリガンド予測やタンパク質ポケットの機能解析など、多様な生物学的タスクで高い性能を発揮することを示しています。
AlphaFold2 と ESMfold による予測構造データベースを統合・クラスタリングし、メタゲノムデータから多数の未知のドメイン折りたたみ構造や組み合わせを発見することで、タンパク質構造宇宙の未踏領域を解明した研究です。
本研究は、終止コドンの下流にあるイントロン内のポリ腺酸化部位の選択的な利用が、NMD(ノンセンス媒介 mRNA 分解)を回避して遺伝子発現を調節する広範かつ見過ごされてきたメカニズムであることを、ゲノムデータと実験的アプローチによって実証しました。
MetaXtract は、Thermo Fisher 社の RAW ファイルからメタデータを抽出して構造化された形式で提供し、MS データの FAIR 化、ワークフローの最適化、およびリアルタイム品質管理を可能にするオープンソースツールです。
本研究は、ESM-2 とトランスフォーマーを統合した AI 予測モデル「XAMP」を開発し、これを用いて深海微生物から新規抗菌ペプチドを同定・合成・検証することで、多剤耐性菌対策に向けた革新的な創薬アプローチを確立しました。
この論文は、細胞バーコードのペアリングや直接的な特徴対応を必要とせず、単一細胞 RNA シーケンスと空間プロテオミクスデータを統合して空間的ニッチが転写プログラムに与える影響を解明する新しい生成フレームワーク「ARCADIA」を提案し、その有効性を示したものです。
RingNet は、高度なプログラミング知識を必要とせず、複雑なマルチオミクスデータを直感的に可視化し、再現性のある出版用図を生成できるインタラクティブな Web ベースのプラットフォームであり、ネットワーク医学研究の障壁を下げます。
本論文は、極端な配列類似性やコピー数変異に直面する高度に多型な遺伝子ファミリーの遺伝子型決定問題を、自動符号化変分ベイズ(AEVB)を用いた確率的潜在変数モデルとして定式化し、既存手法よりもスケーラビリティと精度を向上させたオープンソースフレームワーク「Neretva」を提案するものである。