Helicase: Vectorized parsing and bitpacking of genomic sequences
本論文は、SIMD 命令を活用したベクトル化アルゴリズムと有限状態機械を実装した Rust 製ライブラリ「Helicase」を提案し、既存の最速ライブラリを上回る速度で FASTA/Q 形式の高速パースとビットパックを実現することを示しています。
768 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、SIMD 命令を活用したベクトル化アルゴリズムと有限状態機械を実装した Rust 製ライブラリ「Helicase」を提案し、既存の最速ライブラリを上回る速度で FASTA/Q 形式の高速パースとビットパックを実現することを示しています。
この論文は、従来の設計された生物学的特徴を必要とせず、配列情報のみからマイクロRNAの結合部位と遺伝子発現抑制を高精度に予測する新しい深層学習モデル「miRBind2」を開発し、既存の手法を凌駕する性能を実証したものである。
この論文は、コドン言語モデルとタンパク質言語モデルを組み合わせることで、遺伝変異の病原性決定要因が「生成物(タンパク質)」と「プロセス(コドン配列の制御)」の両方に依存し、変異の種類や実験プラットフォームによってその寄与度が異なることを明らかにしたものである。
本研究は、28 の結核遺伝子発現シグネチャと複数のコネクティビティ・スコアリング法を統合する計算ワークフローを開発し、既存の FDA 承認薬 64 種を宿主指向性治療薬として特定するとともに、新たな治療標的となる 12 の遺伝子を同定することで、結核治療における創薬の迅速化と新たな戦略の確立に貢献しました。
本論文は、タンパク質複合体のモデル品質評価において、単一鎖の折りたたみ安定性と鎖間結合特異性を明確に区別するために、3 つの幾何学的視点とインターフェース文脈集積モジュールを組み合わせた新たなトリプルグラフ学習フレームワーク「TriGraphQA」を提案し、既存の手法を上回る高い精度を達成したことを報告するものです。
本研究は、mRNA の化学的安定性を高精度に予測し、合理的な配列最適化を可能にする深層学習フレームワーク「RNASTOP」を提案し、mRNA 治療薬の開発を加速させることを目指しています。
本論文は、分子ドッキングと免疫情報学を用いてマラリア原虫の抗原と T 細胞受容体の相互作用を解析し、PfCyRPA、PfMSP10、PfCSP を有望なワクチン候補として特定したことを報告しています。
本研究は複数の転写オミクスデータセットを統合解析し、ビタミン D 代謝と炎症経路の異常が虚弱の核心的な分子特徴であることを明らかにし、これらを基盤とした新規バイオマーカーが虚弱の早期診断や治療標的の開発に寄与することを示しました。
本論文は、転写オミクス予測における遺伝子レベルの目的関数と経路レベルの解釈の不一致を解消するため、古典的 GSEA の統計的意味を維持しつつ微分可能で計算効率的な「dGSEA」手法を提案し、経路レベルの整合性を向上させることを示しています。
本論文は、Oxford Nanopore シーケンシングを用いてヒトゲノム内の反復配列(リピート)の遺伝的・エピジェネティックな変異を包括的かつ同時に解析するための、ユーザーフレンドリーでスケーラブルなパイプライン「ECHO」を開発したことを報告しています。