A Permutation-Based Framework for Evaluating Bias in Microbiome Differential Abundance Analysis
この論文は、微生物叢の差異発現解析において、負の二項分布に基づく手法が過剰な有意性を示す傾向がある一方で、古典的な統計検定がより信頼性の高い結果をもたらすことを、置換法を用いた包括的な評価を通じて明らかにしています。
768 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
この論文は、微生物叢の差異発現解析において、負の二項分布に基づく手法が過剰な有意性を示す傾向がある一方で、古典的な統計検定がより信頼性の高い結果をもたらすことを、置換法を用いた包括的な評価を通じて明らかにしています。
Ryder は、安定した内部参照領域を活用する 2 段階モデルを採用し、スパイクイン対照の有無を問わず多様なエピゲノムデータに対して技術的変動を補正し、生物学的シグナルの検出精度を向上させる Python パッケージです。
この論文は、Spectral Burrows-Wheeler Transform (SBWT) を基盤とし、可変長の k-mer に対して階層的な特徴注釈を正確かつ損失なく行い、多対一致や新規配列の問題を解決する新たなデータ構造「HKS」を提案し、ヒトゲノムアノテーションにおける高い精度と既存ツールとの同等の処理速度を実証したものである。
本論文は、特許文書に埋もれていた構造化されていない生体活性データを自律的な AI マルチエージェントシステム「HARVEST」によって効率的に抽出・構造化し、既存データベースに存在しない膨大な新規化合物とタンパク質ターゲットを解明するとともに、そのデータを用いた評価により既存モデルの構造的・機能的な一般化限界を明らかにしたものである。
IAV の公衆衛生リスクに対処するため、k-mer 法では失われがちな連結情報を保持し、統計的信頼性をもって混合感染や遺伝子再集合を高精度に検出する新しい確率的フレームワーク「PREMISE」が開発された。
本研究は、追加データや閾値調整を必要とせず、標準的な VCF ファイル上の X 染色体遺伝子型分布に基づいて機械学習モデルを多項式方程式に凝縮し、全ゲノム配列やアレイデータなど多様なデータ形式で高精度かつ効率的に性別判定を行う新しい手法「Zigo」を提案したものである。
この論文は、異なるゲノム数による変動や希少配列の影響を補正し、生態学で用いられるヒル数を用いて色付き圧縮 de ブルイーングラフのノード数を補間・外挿する新たな手法を提案し、パンゲノムの多様性を比較する方法を確立したものである。
本論文は、抗体やナノボディの CDR 領域を入力として、ヒトや犬など 6 種の生物種に特化した mRNA 配列とタンパク質フレームワーク領域を同時に生成するトランスフォーマーベースのモデル「SpeciefAI」を提案し、宿主種での効率的な発現と免疫原性の低減を両立させる手法を確立したものである。
本論文は、パンゲノムグラフが誘導する相同性関係の概念を導入し、異なるグラフモデル間の比較指標や変換手法を提案するとともに、その実装パッケージ「WGAtools」を提供するものである。
本論文は、3 バイト未満の k-mer 当たりという小容量で高速な部分集合ランクデータ構造を設計し、ゲノム解析における k-mer 検索の空間・時間トレードオフを最適化することを提案しています。