Sex Checking by Zygosity Distributions
本研究は、追加データや閾値調整を必要とせず、標準的な VCF ファイル上の X 染色体遺伝子型分布に基づいて機械学習モデルを多項式方程式に凝縮し、全ゲノム配列やアレイデータなど多様なデータ形式で高精度かつ効率的に性別判定を行う新しい手法「Zigo」を提案したものである。
1244 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本研究は、追加データや閾値調整を必要とせず、標準的な VCF ファイル上の X 染色体遺伝子型分布に基づいて機械学習モデルを多項式方程式に凝縮し、全ゲノム配列やアレイデータなど多様なデータ形式で高精度かつ効率的に性別判定を行う新しい手法「Zigo」を提案したものである。
この論文は、異なるゲノム数による変動や希少配列の影響を補正し、生態学で用いられるヒル数を用いて色付き圧縮 de ブルイーングラフのノード数を補間・外挿する新たな手法を提案し、パンゲノムの多様性を比較する方法を確立したものである。
本論文は、離散的な横断データを基に、学習された潜在空間におけるグラフ制約付き最適輸送を用いて、非線形な構造や集団の質量変化を考慮しながら生物学的な進行方向を解釈可能に推定する新しいフレームワーク「GOTFlow」を提案し、子宮内膜リモデリングや乳がんリスク、プリオン病などの多様な生物医学的データでその有効性を実証したものである。
本論文は、抗体やナノボディの CDR 領域を入力として、ヒトや犬など 6 種の生物種に特化した mRNA 配列とタンパク質フレームワーク領域を同時に生成するトランスフォーマーベースのモデル「SpeciefAI」を提案し、宿主種での効率的な発現と免疫原性の低減を両立させる手法を確立したものである。
本論文は、パンゲノムグラフが誘導する相同性関係の概念を導入し、異なるグラフモデル間の比較指標や変換手法を提案するとともに、その実装パッケージ「WGAtools」を提供するものである。
scRGCL は、対照学習におけるクラスターレベルの情報を活用し、ネガティブサンプリングと近隣感知の再重み付け戦略を組み合わせることで、scRNA-seq データの複雑な特性を克服し、従来の手法を上回る高精度な単一細胞クラスタリングを実現する手法です。
本論文は、3 バイト未満の k-mer 当たりという小容量で高速な部分集合ランクデータ構造を設計し、ゲノム解析における k-mer 検索の空間・時間トレードオフを最適化することを提案しています。
本論文は、非漸近領域でランダムなミニマイザーよりも低い密度を保証する「10-ミニマイザー」を提案し、その中でも定数空間・低密度・高速な k-mer 鍵検索を実現する「スペーサー」を開発したことを報告しています。
SpatialFusion は、組織病理像と遺伝子発現データを統合した軽量なマルチモーダル基盤モデルであり、単なる空間的近接性ではなく経路活性化パターンに基づいて生物学的に整合的な微小環境(ニッチ)を同定し、大腸癌や非小細胞肺癌における新たな臨床的意義を持つニッチの発見を可能にします。
InSTaPath は、事前学習された組織画像モデルの埋め込みを離散的な「画像単語」に変換し、遺伝子発現カウントと統合して解釈可能な潜在トピックを学習するマルチモーダルトピックモデルであり、これにより空間トランスクリプトミクスデータにおける空間ドメインの同定精度向上と、遺伝子プログラムと組織形態の間の生物学的に意味のある関係性の解明を実現する。