anndataR improves interoperability between R and Python in single-cell transcriptomics
この論文は、Python の scverse エコシステムで普及している H5AD 形式の単一細胞トランスクリプトミクスデータを R 環境でネイティブに読み書き・変換可能にするパッケージ「anndataR」を開発し、両言語間の相互運用性を向上させたことを報告しています。
768 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
この論文は、Python の scverse エコシステムで普及している H5AD 形式の単一細胞トランスクリプトミクスデータを R 環境でネイティブに読み書き・変換可能にするパッケージ「anndataR」を開発し、両言語間の相互運用性を向上させたことを報告しています。
この論文は、哺乳類および霊長類の感染性を予測するための遺伝子配列データセットを大幅に拡張・標準化し、機械学習モデルの性能評価において分類タスクの難易度が宿主の分類群の広さや訓練データとテストデータの系統距離に依存することを示すとともに、異なるウイルス科間での予測が現状では困難であることを明らかにしたものである。
MiRformer は、長い mRNA 配列を効率的に処理するスライディングウィンドウ注意機構を備えた双トランスフォーマーアーキテクチャを採用し、mRNA 条件付き miRNA の生成、結合部位の特定、および相互作用予測において最先端の性能と生物学的解釈性を両立する統合生成フレームワークです。
本研究は、生物学的データに内在するノイズや変動を確率的にモデル化し、パラメータ推定、予測、実験設計を効率化するための高速かつ柔軟なオープンソースソフトウェア「Stochastic System Identification Toolkit (SSIT)」を開発し、その機能を酵母および乳がん細胞の単一細胞データを用いて実証したものである。
本論文は、単一細胞 RNA シーケンシングデータにおける細胞周期動態と細胞状態の解析精度と頑健性を大幅に向上させる統合型正弦波・区間線形オートエンコーダ「SPAE」を開発し、がん細胞周期の遷移予測や細胞周期効果の除去を可能にしたことを報告しています。
REMAG は、HyenaDNA 基盤モデルとコントラスト学習を活用して、長リードメタゲノムデータから高品質な真核生物 MAG を効率的に復元する新たなツールであり、既存の手法では困難だった真核生物ゲノムの断片化問題を解決します。
本研究は、GFF3 および GTF 形式の注釈データに基づき、ユーザー定義のオーバーレイ注釈やインタラクティブなレイアウト調整を可能にするコマンドラインおよび Web ベースの可視化ツール「geneSTRUCTURE」を開発し、複雑な遺伝子構造の解析と効果的な結果提示を支援するものである。
この論文は、ラン科初となるテロメア・ツー・テロメア(T2T)レベルの完全ゲノムアセンブリとハプロタイプ解析を通じて、Dendrobium officinale の四倍体化の進化史と、菌根共生に関与する SWEET 遺伝子ファミリーの機能を解明したものである。
この論文は、機械学習および深層学習を用いてゲノムデータから疾患関連遺伝子を特定するパイプラインを提案し、30 種類の表現型に対する高い精度で GWAS 登録 SNP と一致する遺伝子を同定できることを示しています。
この研究は、構造ベースのドラッグディスカバリー手法を用いて、マルブルグウイルスの主要タンパク質(VP35 および NP)に対して、Withaferin A が分子ドッキング、分子動力学シミュレーション、MM-GBSA 解析を通じて安定した結合親和性と多標的阻害活性を示すことを明らかにし、同化合物の抗ウイルス治療薬としての可能性を分子レベルで示唆しています。