The Genomic Legacy of Ancient Polyploidy in Crop Domestication
本研究は、22 種の作物を対象とした実証的解析により、古代の全ゲノム重複(WGD)によって生じた遺伝子(パレオログ)が、特に単一コピーに戻ったものが作物の Domestication(家畜化・栽培化)に関わる候補遺伝子群に有意に富化していることを明らかにし、WGD が数百万年後の作物進化においても持続的な基盤を提供していることを示しました。
1246 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本研究は、22 種の作物を対象とした実証的解析により、古代の全ゲノム重複(WGD)によって生じた遺伝子(パレオログ)が、特に単一コピーに戻ったものが作物の Domestication(家畜化・栽培化)に関わる候補遺伝子群に有意に富化していることを明らかにし、WGD が数百万年後の作物進化においても持続的な基盤を提供していることを示しました。
本論文は、計算機科学と実験的検証を統合した新規アプローチにより、リーシュマニア属との交差反応を回避し、特にエピトープ 5 を用いて高感度・高特異性を達成するキタス病の精密血清診断法の開発を可能にしたことを示しています。
本研究では、固定された曲線形状を必要とせず、同調回帰を用いて化学プロテオミクス実験における用量反応データを解析する半パラメトリック統計モデル「MSstatsResponse」を開発し、既存手法よりも高い精度と頑健性でタンパク質と薬剤の相互作用を検出可能であることを示しました。
CDS-BART は、NCBI RefSeq データベースの 9 群の mRNA 数据を用いて事前学習されたオープンソースの BART ベース基盤モデルであり、治療用 mRNA に典型的な約 4kb の長さの配列を分析できるユーザーフレンドリーなツールとして開発されました。
本論文は、非モデル生物におけるトランスポゾンの研究やベンチマークを可能にするため、生物学的忠実性と実験的制御のバランスを調整可能な柔軟なシミュレーションフレームワーク「TEgenomeSimulator」を開発し、その有効性を示したものである。
本論文では、統計力学と情報理論の概念を応用し、生物学的・物理的制約下での拡散過程として進化を記述する新枠組み「DiffEvol」を提案し、SARS-CoV-2 のゲノムデータを用いてその有効性を検証するとともに、変異株の予測や進化動態の解明への応用可能性を示しています。
本論文は、TCR-pMHC-I 複合体の docking 角度の偏りを活用して FFT 回転セットを制限し、GradPose による高速クラスタリングと組み合わせることで、既存ツールに比べて 25〜40 倍高速かつ高精度な構造予測を可能にする新規計算プロトコル「SwiftTCR」を開発したことを報告しています。
この論文は、細菌およびウイルスのメタゲノム解析において、参照ゲノムの選択戦略が分類精度と計算効率に与える影響を評価し、その最適解は解析の目的や生物学的・計算機的環境に応じて異なることを示しています。
本論文は、変数順序戦略と探索中の枝刈り規則の強い一貫性を重視することで、多様なグラフ構造において高い効率性と安定性を発揮し、既存のソルバーを上回る性能を示す新しい部分グラフ同型性探索アルゴリズム「FASTiso」を提案しています。
本論文は、ESM 系列のタンパク質言語モデルを基盤とし、系統発生情報を活用した転移学習フレームワークを提案することで、データが不足している病原体に対する B リンパ球エピトープ予測の精度を飛躍的に向上させる手法を確立したものである。