Verticall: A fast and robust tool for recombination detection in large-scale bacterial genomic datasets
Verticall は、数百から数千に及ぶ大規模な細菌ゲノムデータセットにおいて、既存のツールよりも効率的かつ高精度に組換え領域を検出し、組換えを除去した系統樹を構築できる新しい非パラメトリック手法である。
766 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
Verticall は、数百から数千に及ぶ大規模な細菌ゲノムデータセットにおいて、既存のツールよりも効率的かつ高精度に組換え領域を検出し、組換えを除去した系統樹を構築できる新しい非パラメトリック手法である。
本論文は、マスク自己教師あり学習とトランスフォーマーアーキテクチャを活用した「Mievformer」というフレームワークを提案し、細胞状態と空間的マイクロ環境の確率的な結合を捉えることで、空間オミクスデータにおけるマイクロ環境の表現学習と生物学的発見を可能にすることを示しています。
本研究は、1,406 種のアミノ酸使用偏倚(CUB)を「ゲノム方言」として分析し、アミノ酸の物理化学的性質(特に Saier の第二コドン塩基分類)が翻訳の忠実度やタンパク質の安定性という制約下で CUB を決定し、これが系統関係ではなく機能的な「情報アクセント」を形成していることを示しました。
本研究では、確率的サンプリングや既存のサブオプティマル法の問題点を克服し、RNA 二次構造を自由エネルギーの昇順で排他的かつ効率的に列挙する決定論的フレームワーク「反復サンプリング」を開発し、これにより転写中の RNA フォルディングにおける非平衡構造の解析や実験データとの整合性向上を実現したことを報告しています。
空間トランスクリプトミクスデータに存在するノイズを低減し、生物学的なシグナルを強化する新しい手法「SpaceBender」を開発し、その有効性をシミュレーションや生体内キメラ組織、さらにはサブセルレベルのデータを用いたケーススタディで実証した。
この論文は、大腸癌の空間的組織を解析するためにテンソル分解に基づく類似性ネットワーク枠組みを提案し、実際の腫瘍組織がランダムな配置と比較して空間的制約によって構造化された分子パターンを示すことを実証しています。
この論文は、異なる実験条件やプラットフォーム間での絶対値の比較が困難なプロテオミクスデータに対し、変化の方向性(アップ/ダウンレギュレーション)の一致度をネットワーク解析に活用することで、生物学的に意味のある統合分析を可能にする新しいフレームワークを提案し、抗がん剤ドキソルビシン処理と乳がんの進行段階との関連性を明らかにしたことを報告しています。
BioEngine は、ファウンデーションモデルやキュレーションされたリポジトリを生物学者がブラウザ上で AI エージェントに指示を与えるだけで、あらゆるハードウェア環境で実行・適応・拡張可能にするスケーラブルな実行および適応レイヤーです。
本論文は、複数のペプチド特性を評価する自動化されたポリシー探索エージェントが、従来の重み付き和スコアや NSGA-II などの手法よりも優れた候補選定順位付けを実現し、湿式実験前の候補絞り込みを効率化する手法を提案したことを報告しています。
REMEDI4ALL コンソーシアムが開発したヒューマン・イン・ザ・ループ型の階層的多エージェント AI システム「RepurAgent」は、仮説生成から実験設計、データ分析、候補化合物の選定に至るまで、創薬リポジショニングの全ライフサイクルを支援し、急性骨髄性白血病や COVID-19、多発性スルファターゼ欠損症の事例において高い精度と効率を実証した。