Efficient Stochastic Trace Generation for Transcription
本論文は、決定論的ドリフト、ガウス変動、および加法的な断続的ジャンプを単一の確率微分方程式モデルに統合し、正確な転写トレースを生成する際に、厳密な確率サンプリングに比べて最大 2 桁高速な計算速度を実現するオープンソースの Python フレームワーク「bcrnnoise」を導入する。
766 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、決定論的ドリフト、ガウス変動、および加法的な断続的ジャンプを単一の確率微分方程式モデルに統合し、正確な転写トレースを生成する際に、厳密な確率サンプリングに比べて最大 2 桁高速な計算速度を実現するオープンソースの Python フレームワーク「bcrnnoise」を導入する。
SaVanache は、GFA ファイルを最適化されたインデックスに前処理し、線形ピボットゲノムに対する構造的変異を強調表示するための特殊なグリフを使用することで、複雑なパンゲノム変異グラフの効率的なリアルタイム探索と直感的な 1 対多比較を可能にする多解像度可視化ツールです。
本論文は、核分割と正則化一般化線形モデルを用いてビンカウントをモデル化し、既存の正規化手法を上回る性能で乗法的なストライプアーティファクトを効果的に除去しつつ大規模な生物学的シグナルを保持する、10x Genomics VisiumHD データ向けの統計的ストライプ除去手法を提案する。
本論文は、タンパク質大規模言語モデルの埋め込みと対比学習を活用して短いリニアモチーフ(SLiM)間の機能的類似性を予測する深層学習モデル「SLiMNet」を導入し、これにより未特徴化のモチーフの機能的注釈を可能にし、研究コミュニティ向けに潜在的な機能対の包括的なアトラスを提供するものである。
ProtSpace は、統合された 3 次元構造表示と多ラベル注釈を通じて従来の配列類似性を超えた複雑な機能および構造的関係を明らかにする、プライバシーを保護するブラウザベースの Web アプリケーションであり、タンパク質言語モデルの埋め込み空間の対話的可視化と体系的な探索を可能にします。
本論文は、次数分布を条件付けることで遺伝子セット解析におけるハブバイアスを補正する新規ネットワーククラスタリング手法MANGOを導入し、従来の過剰表現法や単純なネットワークベースのアプローチに内在する偽陽性を伴わずに生物学的に意味のある空間的自己相関を頑健に検出可能にするものである。
本論文は、階層的なマッチング戦略とオフラインデータベースを用いて大規模なRNA-seqデータにおける遺伝子記号の不一致を解決するRパッケージgeneSyncを導入し、クロスデータセットの統合と特徴量の重なりを大幅に改善することを示している。
本論文は、変異が密集したタンパク質変異体の影響を予測する際、従来のベースライン手法がタンパク質言語モデルと同等かそれ以上の性能を発揮することを示しており、タンパク質設計を効果的に進展させるためには、タンパク質言語モデルを生物物理学的または構造的な事前知識と統合する必要があることを示唆している。
PhenotypeToGeneDownloaderR は、複数の異種生物データベースから表現型関連遺伝子の取得、調和、検証を自動化する軽量かつ再現性の高い R/Python パイプラインであり、高い再現率を達成するとともに、統合された証拠源の相補性が下流の遺伝子解析において有効であることを示しています。
本論文は、大規模なマイクロバイオーム前学習データセットであるAtlasと、Waypoint ファミリーの基盤モデルを導入し、Compass ベンチマークを通じて、自己教師あり前学習が多様なマイクロバイオーム予測タスクにおいて古典的手法や既存のモデルを大幅に凌駕することを示す。